大数据在金融应用的毫无疑问,我们已经进入了大数据时代,金融和大数据是密不可分的,那么大数据在金融领域的应用是什么呢?
什么是大数据
关于这个,已经在网上已经有了很多比较标准的答案。就不再赘述了,所谓大数据,是指多个不同来源和多种信息格式的大量使用结构化和非结构化分析数据。有两个关键点:
一是大。即数据量要非常多,数量少了我们不叫大数据。在实践中。一般至少要有10TB(1TB等于1024GB,想想你32G的苹果手机,可以装多少数据?)的数据量才能称之为大数据。而在类似苏宁金融等互金巨头,基本都沉淀了PB级(1PB约等于105万GB,相当于3.3万个32G的U盘。截止目前,人类生产的所有印刷材料的数据量也不过200PB)的数据量。
大数据科学家JohnRauser就提到一个简单的定义:大数据就是任何超过了一台计算机处理能力的庞大数据量,定义抢购菠萝毕加索是大数据更是多。比原来的器材商店也不少,算不动,这里的重点很大。
二是通过数据可以来自多种数据源,数据进行种类和格式丰富,不仅需要结构化信息数据。还包括半结构化和非结构化数据,意味着,即便数据量可以很大,但如果没有局限于单个研究领域。也不能因此称之为大数据,因为大数据的一个非常重要影响作用就是我们利用不同来源。不用领域的数据信息进行非线性地分析,用于企业未来的预测。
比如,《大数据时代》在作者Schönberger的对大数据的定义就是,大数据,不是随机样本,而是所有数据。不是精确性,而是混杂性,不是因果关系,而是相关关系, 这里强调了数据的多样性。
有了大数据,自然发展就要有大数据进行技术,即从各种各样不同类型的巨量数据中。快速获取更多有价值信息的技术,强调快。这是大数据分析技术与传统财务数据可以挖掘网络技术的重要区别。
从巨量数据中提取的有价值信息,即是大数据在各个不同领域的具体可以运用,比如基于大数据进行客群的细分。进而发展提供定制化服务,基于大数据模拟现实生活环境,进而
影响进行精准评估和预测。基于大数据技术进行相关产品和模式研究创新,降低公司业务管理成本,提升经营效率等等。
金融大数据数据领域应用逻辑
大数据金融领域应用:一般认为有精准营销和大数据风控两个方面。
精准营销就不说了,基于行为数据去预测用户的偏好和兴趣,继而推荐合适的金融产品。短信群发模式,不知要先进了多少倍,这个大家都容易理解。
而对于大数据风控,其逻辑便在于“未来是过去的重复”,即用已经发生的行为模式和逻辑来预测未来。
统计学规律告诉我们,在实验条件不变的条件下,重复实验多次。随机事件的频率等于其概率,意味着,随着随机事件的大量发生,我们是可以发现其内在规律的。而大数据里面包含的海量数据,就为我们发觉隐藏在随机事件后面的规律提供了条件。
大数据风控的两个应用,信用风险和欺诈风险,背后都是这个逻辑,通过分析历史事件。找到其内在规律,建成模型,然后用新的数据去验证和进化这个模型。
以美国主流的个人信用评分工具FICO信用为例,FICO分的基本思路便是:
把借款人过去的信用历史资料与数据库中的全体借款人的信用习惯相比较,检查借款人的发展趋势和经常违约,随意透支。甚至申请破产的各种陷入财务困境的借款人的发展趋势是否相似。
FICO评分是传统金融机构对大数据的运用,再来看看典型互金机构ZestFinance对大数据的运用,ZestFinance的客群主要就是FICO评分难以覆盖的人群。要么是在FICO得分过低金融机构拒绝放贷的人,要么是FICO得分适中,金融机构同意放贷但利率较高的人。
在ZestFinance的评分模型中,会大量应用到非征信数据(50%-70%左右),在其官方宣传中,提到会用到 3500 个数据项。从中提取 70,000 个变量,利用 10 个预测分析模型,如欺诈模型,身份验证模型,预付能力模型,还款能力模型,还款意愿模型以及稳定性模型。进行集成学习或者多角度学习,并得到最终的消费者信用评分。
和欺诈风险的防控,实质上是通过对历史欺诈的分析,不断梳理和完善风险特征数据库,如远程登录。非使用设备登录等行为,是一种风险信号,建立一系列风险规则判断来预测用户行为背后的欺诈概率..
几个待解决的问题
首先是数据共享的问题, 大数据应用以大数据为前提,在许多金融机构中没有大数据这样的东西。我们知道,用户的二次类别的信用评级。非征信数据起着重要的作用,但是要获得有价值的数据是不容易的。
一般来说,盈利的商业公司和企业不会轻易泄露自己的数据,建模方法和分析过程。这是无可厚非的,但客观上产生了这样的效果,几大互联网巨头陷入了数据黑洞,用户数据进出。可以为企业本身所用,但不能为整个行业或社会所用。此外,散落在税务,公积金,海关,工商和数据梳理和整合,也是一个漫长的过程的其他领域。
以上内容就是对大数据在金融方面中的一些应用。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2020-04-29 17:08:33
2020-05-07 17:21:08
2022-09-08 14:34:41
2022-11-21 15:49:01
2022-11-22 15:11:48
甄选10000+数字化产品 为您免费使用
申请试用
评论列表