数据仓库再造银行业
在金融国际化的趋势下,如何更好地为客户提供差异化服务和产品成为国内外银行关注的焦点,而数据仓库正是一道良方.
目前,国内各个商业银行正面临着前所未有的激烈市场竞争,与此同时,随着中国加入WTO,金融自由化、国际化的速度也正在逐渐加快。不久的将来,国内各商业银行除了彼此之间相互竞争外,还将迎接许多世界级外资银行的挑战。利用先进的数据仓库技术建立集中的、包含详细交易数据的商业智能解决方案,已经成为各大银行对内加强经营管理和决策支持,对外更好地了解客户需求,开发新产品或服务,利用现有渠道对客户进行交叉销售,增加赢利能力,并在特定的业务领域提供差异化服务的重要手段。
与前几年不同的是,目前大家都在谈论企业级数据仓库(EnterpriseDataWarehouse),对于数据集市的定位也基本形成共识,那就是数据集市应该从属于企业级数据仓库。所谓EDW,基本的要求就是整个企业能够共享统一的数据存储模型,为各级业务人员提供一致的信息视图。本文对业界常见的两种EDW架构作了分析,并探讨了银行业数据仓库的应用体系。
两种主要的企业级数据仓库体系架构,集线器与车轮状结构的企业级数据仓库
这种结构也称为“HubandSpoke”,这是因为中央数据库汇集了来自各业务处理系统的数据,同时也负责向各从属数据集市提供信息,看上去像一个Hub(集线器);而业务人员在进行数据分析与信息访问时将根据需要连接到不同的数据集市,这种交叉复杂的连接看上去就像Spoke(车轮辐条)一样。
“HubandSpoke”结构解决了企业内统一数据存储模型的问题,但从实际使用的角度来看仍有比较严重的缺陷:一是业务人员对信息的访问非常不方便,很难进行跨数据集市或跨部门的信息分析;另一个问题是每个数据集市都需要相应的软硬件投入,当数据集市增加时,系统整体投资迅速增加,同时管理的复杂性也随之增加。这些都意味着巨大的整体拥有成本TCO(TotalCostofOwnership)。
为什么不直接访问中央数据仓库而非要设计一个数据集市层呢?主要原因在于当中央数据库保存越来越多的数据、并发用户越来越多时,一般的数据库引擎无法承担这样的负载,只好把它们分解到不同的数据集市。对于“HubandSpoke”结构的数据仓库,GartnerGroup也认为,“数据仓库的HubandSpoke结构,回避了DBMS技术中的弱点,无法提供适当的业务价值来平衡投资成本的显著增加”,“之所以产生这种趋势,是由于对大多数DBMS产品而言,支持复杂的数据模型和并发查询负载都是极大的挑战”。
集中式企业级数据仓库
第二种企业级数据仓库的架构是集中式的,这解决了“HubandSpoke”结构中存在的诸多问题,是一种比较理想的企业级数据仓库系统架构,能够为企业带来真正的业务价值与回报。但由于把详细数据分析、部分的数据转换与清洗等复杂处理均集中在中央数据仓库,从而给作为数据仓库引擎的RDBMS和相应的服务器带来了极大的挑战。选择这种数据仓库基础平台的基本要求是:
1、线性扩展能力。原始数据对任何一个数据仓库来说,都是最主要的负载之一。随着数据量的增长,系统性能会逐渐下降。维持合理的业务查询响应时间,要求数据仓库引擎和相应的数据库服务器具有优良的线性扩展能力。一些系统的扩展能力非常有限,当数据量增长到一定规模时(比如TB级以上),就很难满足日常的业务分析要求了,因而不得不把数据分离到多个小规模的数据集市,形成所谓的“HubandSpoke”结构。
2、并行处理能力。许多业务查询与分析都是动态的,数据库传统的索引技术对动态分析和模糊查询的帮助不大。系统只有具有非常好的并行处理能力,才能满足复杂的、动态的分析需求,并且承担比较复杂的数据转换与清洗工作。
3、简单的系统管理。对于大型的数据仓库应用系统而言,如何能有效而简单地进行系统管理是非常重要的。特别是当数据量不断扩大时,如果没有一种有效而且简单的系统管理措施,那么系统的运行费用将会很高。
数据仓库技术在银行业的应用
数据仓库体系结构属于基础设施的建设,只有稳固的数据仓库基础设施才能支撑灵活多样的数据仓库应用。对于银行业来说,数据仓库的应用面非常广,基本上涵盖了银行经营管理与业务运作的各个方面。现在国内几大商业银行都在着手调研、准备或者尝试实施基于数据仓库技术的各种解决方案。中国工商银行进行了以个人客户关系管理(PCRM)和业绩价值管理(PVMS)为主题的应用试点,中国银行则全面规划了信用卡系统,其中很重要的一个子系统就是基于数据仓库技术的销售和客户服务系统,中国农业银行正在广东分行进行经营分析系统的建设,民生银行也全面启动了客户信息管理(CIM)和企业级数据仓库的建设。
根据国内外银行使用数据仓库的经验,银行业数据仓库应用的体系和分类大体如右图所示。
“平衡计分卡”将绩效评估指标分成四个重要的层面:财务层面、客户层面、流程层面及员工学习与成长层面。
一个效率市场中经营的商业银行必然会面临大幅度的价格波动,这对银行的收益和资产、负债以及一些资本的价值有巨大的影响。如果严重的话,还可能会使银行面临很大的偿付风险。“资产负债管理”模块的主要任务就是帮助银行科学考核和管理自身资产、负债以及由于经营活动而产生的市场风险、外汇与流动性风险,寻找建立在合理风险回报基础上的资本分配方法,从而使银行能够很好地控制经营风险并提高利差的收益回报,在流动性、安全性、盈利性的经营原则中寻找到一个最佳的平衡点。
商业银行经营的最终目标是为了获取最大的利润,而贷款业务是银行最主要的利润来源之一,它的质量和收益对银行的兴衰成败有着至关重要的影响。有效降低信用风险、提高贷款质量,是银行取得利润最大化的关键因素。“信用风险管理”模块通过对全行信贷数据的分析,准确识别、计量和控制信用风险并实现风险的相关分析,从而确定合理的贷款结构和适当的利差,制定有效的贷款政策。
利润贡献度分析的主要目标是帮助银行了解其利润贡献度构成因子的分布状况,使行领导能够从不同角度进行绩效评估,制定相应的经营策略,进一步完善分行及业务部门的自身分析和流程规划。传统的利润贡献度分析是从总账系统出发,通过分摊的方式来进行计算。这种分析太过粗糙,通过实施“利润贡献度分析”应用模块,可以帮助银行建立精确的、全行一致的利润贡献度评估方法论,从而得到关于客户、产品、分行、部门利润贡献的准确信息及影响因素。
“客户关系管理”应用模块通过分析数据仓库中各种数据信息以及相互之间的关联,从多个方面衡量各类客户的忠诚度、满意度、赢利能力、潜在价值、信用度、风险度等关键性指标和需求差异性,为银行制定正确的市场行销策略提供科学的决策支持。实施“客户关系管理”,可以帮助银行各业务部门了解、分析客户,更好地进行客户细分,提高客户行销和服务水平,为客户提供适当的产品和服务,从而增强市场的综合竞争能力,最终实现以产品为中心的经营模式向以客户为中心的经营模式的转变。
数据仓库的实施是一个长期的过程,在基础设施建立完成后,随着应用的逐步开展和深入,其投资回报也逐步增加。在一次数据仓库用户大会上,中国香港东亚银行CTO在演讲时深有体会地谈到,东亚银行花了两三年时间来完善数据仓库的基础设施,现在终于得到了可观的回报。许多同行羡慕其先进的客户关系管理系统及其产生的效益,却往往忽略了东亚银行在前期建设数据仓库基础设施时所耗费的心血和巨大投资。
国内各大商业银行同样需要一定的时间来建立数据仓库基础设施,并在建置的过程中逐步完善数据质量。这个打基础的过程是无法省略的。更为重要的是,在建立数据仓库的过程当中,我们还可以培养一批既懂数据仓库技术、又精通银行业务的高级分析人才,这对于更好地发挥数据仓库价值是非常重要的。(本文作者来自NCR公司)
互联网周刊