客服热线: 95580 | 信用卡客服:400-88-95580

曲家文:积极探索 大胆尝试,邮储银行快速提升大数据应用能力

发布日期:2016-07-07

邮储银行从2007年成立伊始,即坚持服务“三农”、服务小微、服务社区的定位,承担起“普之城乡,惠之于民”的社会责任,走“普惠金融”的发展道路,努力成为“有特色的大型零售商业银行”。顺应业务发展战略的要求,邮储银行管理层在2014年确立了“科技引领”的信息化战略。在大数据领域,邮储银行采用了全面拥抱分布式、开源大数据技术,借鉴行业发展趋势和领先实践,全面提升大数据治理、管理和应用水平的发展思路。

从2013年邮储银行就已经开始着手大数据平台的技术和方案研究。2015年年底大数据平台成功上线,完成了基于Hadoop集群近百台x86服务器的部署和上线,完成近200个节点数据仓库的建设和投产,总数据容量超过2PB,达到国内金融业的领先水平。该平台不仅仅接入行内各个重要业务系统的客户和交易数据,还积极引入了各种行外非结构化数据。2014年,邮储银行启动了数据治理工作,进行了数据标准体系规划,制定了全行数据管理组织、体系、机制流程。到2016年上半年,邮储银行已经完成了全部10个主题近2000项数据标准的梳理、制定和宣贯工作,并全面开展了数据标准的“落标”工作。2014年邮储银行还成立了数据分析中心,全面整合数据应用、数据分析、数据治理与管理、数据相关技术平台等职能与工作,促进数据价值的转化和大数据的应用。

总体上看,到2016年上半年,邮储银行的数据能力已进入主动管理阶段,并逐步迈入量化管理阶段,大数据的使用已经从技术研究、探索试点进入全面应用阶段。本文结合邮储银行在大数据领域近3年的探索经验和“十三五”大数据规划,谈谈银行业大数据应用的发展思路。

“十三五”期间,银行业大数据应用的将呈现三大趋势。首先,在金融脱媒的大环境下,银行之间,以及银行和跨界竞争对手之间,将发生前所未有的大数据资源争夺和竞争。这是银行业对抗信息脱媒、拒绝被“管道化”的必经之路。其次,大数据应用将向精细化和协同化方向发展。大数据的价值必须通过应用才能体现。经过前期的以“垂直应用”为主的初步应用阶段,下一步大数据的应用将围绕提供更加“精准”的分析结果、以及跨越部门和条线的“协同化”的应用场景展开。再次,随着银行数据分析团队的发展壮大,必将涌现出与大数据应用相匹配的新型的组织运营模式,释放大数据生产力。大数据部门和团队在银行的定位和作用将更加凸显,将具有更高的组织级别和更大的内部授权。

趋势一:多种方式获取和应用更多的外部大数据资源

大数据的特征之一是数据种类繁多(Variety特性),这决定了银行必须大量获取产生于银行系统之外的数据。外部数据有多种不同的分类方式,按照不同的标准,外部数据可划分为多个类别,比如按数据结构、按数据接入方式、按业务主题等。

从外部数据应用的成熟度出发,目前较有参考价值的分类标准是根据应用范围进行划分。应用范围分类模型的优点主要是与数据使用需求的对应关系较为明确,避免重复采购和无效收集导致的资源浪费;路径明确,便于统一外部数据管理工作的开展。根据应用范围,外部数据可分为以下四类。

(1)专业数据供应商。包括财务、信贷、资讯、风险、宏观等领域的专业供应商通过搜集获取专业信息、对数据进行深度的分析、发布,向公众及客户提交有知识产权的专业资讯。这类数据是外部数据的直接来源,主要为定期批量采集;数据量较为稳定,一般在MB~GB级别;数据质量较高;总体获取成本较高。

(2)互联网公开数据。公开数据是广泛分布在网络,无清晰归属和使用限制的数据。可通过爬虫技术自主采集,或通过代理商批量采集,定期推送,在满足隐私保护要求的前提下,可以通过对公开数据的分析来获得情报和知识。这类数据可以通过爬虫工具持续采集,数据量巨大,一般在GB~TB级别;总体质量较差;大部分免费,获取成本较低。

(3)数据开放平台。第三方开放平台通过建立数据标准、交换规则开放数据资源,提供数据服务和应用。企业根据自身需求,对数据进行购买和使用,提升数据应用的整体水平。这类数据的数据量适中,一般在MB~GB级别;数据质量一般也适中;可以按需购买,成本往往也比较适中。

(4)数据合作运营商。在各业务领域通过开放核心运营数据,与其他数据需求机构形成数据交换和共享,达成数据合作运营,推动产品、渠道和业务模式的全面创新。这类数据一般在特定时间对数据进行处理和采集,数据量较小,一般在KB~MB级别;内容为合作运营商的优势业务核心数据,总体质量高;根据协议开放共享或交换数据,成本较低。

由于外部数据的采集、整理、整合和使用是一项系统工作,因此商业银行在获取和使用外部数据时,首先需要统筹规划、统一管理,避免出现各个部门、各个应用各自为政的情况。其次,需要考虑采用共建生态系统的方式,通过加强合作获得高质量、低成本、高时效的外部数据。再次,在应用的时候一定要考虑内外结合,要在统一的银行大数据仓库的架构下提升数据洞察力,并在客户关系、风险控制等领域形成增强应用。最后,应综合考虑数据的业务需求和使用效率,在成本经济、风险可控的条件下发展合适的外部数据使用策略,逐步扩大外部数据的使用范围,满足日渐丰富的应用数据需要。

趋势二:精细化、协同化地发展大数据应用

从国内外的经验看,银行大数据分析业务应用场景可在电子银行部、互联网金融部、信用卡部、零售银行部、小微企业部、信贷管理部等业务部门实现。邮储银行对各种已有和潜在的零售银行的应用场景进行了汇总,见表1。

 

从表1可以看出,大部分大数据应用场景还是条线/部门化的,部分应用还是传统方式下就已经具备的,在大数据的支持下这些应用都需要重构和深化,围绕“精准”做文章。其中最典型的协同化大数据应用是全景客户视图。全景客户视图是几乎所有其他大数据分析场景的基础。在大数据的帮助下建立协同的全景客户视图,就是要结合行内所有数据资源以及可能的行外数据来描述客户的特征和轮廓,基于行内优质的结构化数据和非结构化数据,结合行外跨界合作和交换获得的数据,丰富并完善客户的基本信息、金融信息、行为信息、交互信息等。全景客户视图有12个数据维度,包括客户基本属性、客户交互行为属性、客户消费行为属性、客户态度属性、客户需求属性、客户产品属性、客户交易行为属性、客户关系行为属性、客户心理属性、客户价值属性、客户安全行为属性、客户营销行为属性、客户需求属性。通过全景客户视图,可以清晰地描述客户的特征和轮廓。与传统的统一客户视图不同,全景客户视图包含的主要数据,除了传统的统一客户视图所具有的描述性数据(客户统计信息、客户特征、客户关系、客户自描述信息等)和交易数据(交易、支付历史、使用历史、产品/账户持有情况等)以外,还包括交换数据(E-Mail/在线聊天记录、呼叫中心记录、网上痕迹、客户交流记录等)和扩展属性数据(观点、偏好、需求和倾向等)等方面的数据。

趋势三:采用全新的组织模式运营大数据

Garnter预计,到2017年,全球25%的机构将设置首席数据官,而在银行和保险等监管严格的行业里,这一比例将上升到50%。预计在“十三五”期间,我国将有相当比例的银行设置首席数据官,作为行级领导统筹推进、协调和安排大数据相关的工作。银行的大数据运营组织将出现以下三种模式。

模式一:各业务部门分别建立数据分析团队,培养数据分析人才,独立完成垂直应用的数据分析工作,并在需要时协同工作。这种模式的好处是数据分析与业务的结合最紧密,而且不影响现有的组织架构,实施快。缺点是业务部门之间的合作不易协调,难以实施企业级的数据分析工作。

模式二:单独成立专门职能的数据分析部门。这种模式的缺点是数据分析部门与一线业务隔离,业务部门与数据分析部门跨部门合作进行分析时流程较长,影响分析需求的及时响应;优点是人员和技能集中,容易实现全行的统一视角,易于实施全行统一的数据分析项目。

模式三:参考国外事业部银行创建新型组织模式——分析卓越中心(Analytics Centerof Excellence,ACE)。分析卓越中心是指组织内的一个虚拟或实体化的团队,采用双线甚至多线汇报的方式。这个模式的特点是综合了前两种模式的优点,团队可以跨多个专业完成大数据分析工作。缺点是这种模式对流程化银行运营能力要求非常高,而这正是目前国内银行普遍欠缺的。

邮储银行目前采用了模式二,未来将不断加强数据分析中心的力量,根据不同业务领域、技能要求进行专业化团队建设,统筹完成全行的各种“精准化”的垂直应用和“协同化”的综合分析应用。

“十三五”期间,银行的大数据应用将步入快速发展阶段。邮储银行将继续采用“积极探索、大胆尝试”的方法,在已经初具规模、融合内外部数据源的分布式大数据平台的基础上和已建成的数据治理体系规范下,深入推进,快速提升全行大数据应用的能力。

(摘自:中国金融)

2016年7月7日