本篇文章1122字,读完约3分钟
互联网浪潮袭来,大数据以不可阻挡的势头,与现代同样具有革命意义的最新科技进步,如纳米技术、生物工程、物联网等,拉开了人类新世纪的序幕。 无论在哪个领域,大数据都被多次提及,但在很多情况下,这些大数据仍然感觉如雾如雨,老百姓几乎感受不到大数据的意义。 另一方面,天弘基金使投资者对大数据的梦想成为了现实。 最近,以趣味插图的形式撰写了“余额宝运行一周年数据报告”,对余额宝1亿多顾客的年龄、客单价、地域、招聘习性、交易频率等数据新闻进行了比较。 天弘基金有多家
业内人士表示,普通公司的数据系统只要使用以前流传下来的ioe架构,解决数据量级数千、数亿的数据即可。 10亿级对普通公司来说不容易,也无法保障解决时间,但天弘基金大数据中心可以解决百亿级数据,自己计算大量数据。
ioe是指ibm是服务器提供商,oracle是数据库软件提供商,emc是存储设备提供商,从软件到硬件组成了企业的数据库系统。 由这三辆马车构成的数据库系统占据了世界大多数商用数据库系统的市场份额,在石油、金融领域也被广泛采用,价格昂贵。 然后,天弘基金的云直销系统于去年9月被采用,成为第一个流向ioe的金融样本,今年天弘基金设立的大数据中心也成功上了云。
天弘基金大数据中心主管周卫国告诉记者,截至5月26日,我们《余额宝一周年大数据报告书》分解应用的基础数据为53亿份,基础数据维度为15个,这15个维护包括各种排列组合的交叉分解 例如,地域和年龄的交叉分解、性别交易频率的交叉分解,涉及到多而复杂的多而复杂的模型。 正是因为这次分解应用的基础数据在天弘基金大数据中心有百亿级以上的数据解决能力,我们建立了越来越多的复杂的模型,发散思维,从越来越多的角度分解这些大量的数据,最现实地分解客户的行动路径,到业务上,
例如,在对客户流失这一主题的分析中,除了查看简单的客户转出金额、转出次数、周/月行为规律、取现和费用占比等基础数据外,还建立了客户流失logit模型。 仅该模型就包含17个指标变量、1个目标变量和16个候选输入变量,采用数据比较有效记录数9.6亿个,odps利用odps
这样的模式还有很多。 从不同的立场挖掘、解体,有时使用人口学、社会学、心理学等知识。 顾客是生活中鲜活的个人,绘制真实的全景图既需要海量数据的拆解解决,也需要科学的方法来定义一点模型。 基于生动的个人全样本大数据,为基金投资和业务开展服务是我们不断努力的方向。
大数据的观察、带来的流动性预测功能,已经成为帮助余额宝投资的绝佳利器,但大数据带来的插图也同样精彩。 从7月7日开始,《余额宝运行一周年大数据报告》系列插画以每天一张的速度,陆续在天弘基金的官方微博上展示,精彩依旧。
标题:“天弘基金大数据中心解决能力百亿级,分分钟计算海量数据”
地址:http://www.cywsjsjd.com/cjsj/9671.html