得大数据者得天下,什么是大数据金融( 二 )


在很多情况下,虽然科技部门领头建立了技术体系,但并没有真正的业务落地,现在我们在尝试往实现业务跨越发展的方向转移 。在 2018 年 6 月,中原银行特别成立了一个一级部——数据银行部,这是从信息技术部分离出来的一个部门 。以前我们更多地专注于技术,但现在意识到用技术驱动业务,在营销和风控方面的成本和难度都非常高,且技术并不一定能驱动业务带来收益,从这一点上,我们决定尝试神策数据提供的这一套场景化的方法论和逻辑 。
中原银行在过去几年做了一些技术驱动的改进 。比如,面向全行的集中交付能力优化,包括固定报表和移动报表,自助查询模型等,特别是在过去几年银行业的自助查询比较流行,没有做的银行未来也一定要做,这是一个必经的阶段 。数据分析需求理解:五种模式支持全行应用我认为银行业的数据分析需求可能有五种场景的数据交互模式(如上图) 。
中原银行目前做了一个数据实验室,其实是一套数据湖的系统,就是把以前的仓库、集市这些平台迁到了一个新的计算架构上面,它的主要作用是为了做数据建模和探索性的分析,该平台完全独立于原来的 P2P 平台,且不像以前那样只做报表,也能做一些自助分析、数据建模,以便将来能支持更多建模师的使用 。我们希望这种项目出来成果之后,能做成不同类的业务场景应用 。
不过,有些旧有模式,比如即席查询在中国视角下会一直存在,因为很难从别的应用场景完全替代它 。数据分析平台体系建设中原银行目前规划了一套数据平台体系,但目前这个体系还在演进 。在过去几年,中原银行大概做了将近 1000 张报表、20 多个主题的自助分析以及数据实验室的平台 。这些平台面向的人员有所不同,报表主要面向数据使用人员;自助分析主要面向条线,比如给领导编制报表和往下发布数据的人;数据实验室主要面向一些有科技背景的人员,比如建模师 。
除了上述三大平台,中原银行还建立了一个社区平台,我们把这些统称为一站式分析平台 。数据驱动创新社区的建立是为了引领行业数据驱动的发展,目前,科技部正在主导这个社区的建设 。我们会在该社区大量地发布一些数据驱动的内容,比如,数据分析报告,文章等 。个人认为,像数据驱动这种工作的推动,将来一定是业务牵头的,因为即使技术人员有思路也很难达到盈利,所以需要站到业务角度上去实践,现在,我们会把自己的技术人派遣到业务部门,学习在业务场景下进行分析 。
前面提到的这几种数据分析平台还是比较偏技术方向,不过我始终认为,未来一定是场景化的方向才有发展 。因为场景化的成本更低,比如,更低的使用成本,场景化让业务人员使用更方便;更低的人才成本,场景化的应用不需要招很多技术人员 。面向大数据的综合分析平台架构这是中原银行目前面向大数据的综合分析平台架构,在这方面各行差异不大 。
不过,中原银行集市做的很薄,只有一个贴源的 ODS,以及 4-5 块集市,比如管会、内部运营、营销等,与其他银行相比,中原银行是一个非常轻的架构,从贴源可以直接到集市,有的集市甚至没有指标加工,就直接整合明细,再到自助分析、报表,有的也往实验室里面供 。个人认为,像自助分析和场景化分析、数据湖这样的思路早晚会替代我们之前做的大量报表,T 0 会替代 T 1,这只是时间问题,所以,我们整个架构现在也在往这边迁移 。
分析平台建设实践—性能优化在前几年中原银行对分析平台做了一些性能调优 。一般刚开始从报表转到 BI,肯定会面临性能问题,因为 BI 本身是一种以空间换取灵活性的方式 。我们采用大数据技术支撑计算,用了 30 个物理计算节点,大概有二三十个面向大数据反范式设计的主题模型,也就是宽表模型,因为宽表模型牺牲了很多空间的代价,在这个大数据的平台上一般会跑得比较顺,冗余度高一点,性能会提高 。

推荐阅读