前言
2018年5月21日,中国银保监会印发《银行业金融机构数据治理指引的通知》(银保监发〔2018〕22号)通知中明确指银行业金融机构需加强数据治理,提高数据质量,充分发挥数据价值,提升经营管理水平,由高速增长向高质量发展转变。
金融行业大数据、人工智能等技术的持续应用,金融机构数据规模、数据应用范畴、数据质量及其安全评估体系的需求不断发展,数据资产管理的重要性愈加凸显。数据资产管理旨在提升数据的质量和价值,保障数据的安全及合规性,为大数据内部应用或外部运营打下夯实的基础,是实现金融机构数据安全应用和持续、合规服务、符合监管机构要求的重要前提和保障。
并且随着金融行业数据化战略在各业务领域的快速发展,以数据为业务导向的金融大数据、人工智能时代到来,数据在金融机构的重要性不言而喻。在金融机构内部,依靠有效的数据治理体系的建设来支持对数据的使用,保证数据的安全、形成可持续服务的数据智能化应用体系建设。金融数据治理体系的建设将做为支撑金融机构数字化转型、应用智能化转型的基础设施,成为金融机构履行数据安全、管理、治理管控、价值实现、服务、监管职责的重要手段。
随着《银行业金融机构数据治理指引的通知》(银保监发〔2018〕22号),政策的执行,标志着数据资产的管控和应用,已经是行业共识和行业合规性强监管方向,然而现实中,大部分金融机构数据资产的管理和应用还处于摸索阶段,仍然面临诸多挑战。随着数据辅助决策、数据辅助管理优化、研判决策、风险规避、业务拓展、管控成本等业务理念的不断提升,数据治理、数据管控、数据合规、数据安全、数据应用等规划将从“理论、研究”走向“实践、落地”
金融机构中数据应用中面临的问题
在金融数据经济时代,数据的充分应用无疑成为金融机构业务持续发展的重要抓手,“数据价值”在银行经营管理中的地位和作用越发凸显,呈现出由简单的静态数据管理向基于动态数据的综合分析转化,人为经验判断决策向基于数据的模型辅助决策转化,业务分类零散管理向基于数据的体系管理转化。基于数据开展金融业务创新是未来银行创新的方向。但是金融机构在数据应用中往往会面临如下问题:
第一类问题就是数据资产不清晰。现在很多金融机构都无法充分了解自己的数据,企业中到底有多少数据?数据都是什么样的?这些数据到底可以发挥什么作用?数据可应用在什么场景?
第二类问题是缺乏统一数据标准。整体数据流程缺乏统一的数据标准,无法有效避免数据混乱冲突、一数多源、多样多类等问题。
第三类问题是数据业务逻辑规划混乱:内部数据的采集、传输、存储、应用、开放共享等数据交互流程及数据逻辑规划存在不合理现象。
第四类问题是缺乏统一数据视图:跨平台、跨系统、跨数据表应用缺乏全面、准确、完整地数据视图。缺乏统一的数据流、数据逻辑、数据字典、敏感数据分布等一体化的数据视图。
第五类问题是数据脱敏、抽取及处理:数据脱敏、数据采集、数据融合、预处理等业务需求,缺少统一系统进行处理及服务,导致数据集中处理工具不统一、流程、格式、标准、脱敏算法不统一。
第六类问题是数据质量管控。数据应用中,现有数据质量无法达到数据价值应用平台要求,数据缺值、数据格式不规范、数据字典及标识遗漏、噪音数据等数据质量问题无法进行统一数据应用评估和质量管控跟踪。
第七类问题是缺少安全监管势手段和方法。缺乏有效的数据安全管理机制和手段,对敏感信息、隐私信息、保密信息的访问缺乏有效控制使其脱敏脱密合规,对数据使用流程管理、建立数据申请、抽取、脱敏、使用、回收、销毁的全逻辑业务监管手段和方法。
网智天元“金蜂巢“产品助力金融科技数据治理体系建设
通过网智天元“金蜂巢”产品建立科学、合规、可控的数据服务体系,为促进金融机构“数字银行“的标准化数据服务体系构建提供技术支撑。通过标准化数据质量平台体系建设帮助业务部门基于现有的数据环境,通过整合应用、梳理数据资源、数据标准化处理、数据安全保障体系的建设为数据使用者提供合规、安全的服务。从数据的运营角度、业务应用视角考虑数据价值的信息化体现。
网智天元“金蜂巢”数据治理平台体系架构如上图所示,服务体系主要包含合规驱动、风险管控、业务安全、数据质量管理、数据标准化管理、安全措施、治理措施等七大类治理跳线;系统平台包含数据标准管理、数据模型管理、元数据管理、主数据管理、数据质量管理、数据生命周期管理、数据安全管理、数据资产价值视图、数据敏感性管理,安全监控管理、管控执行管理、数据资产管理等12大类功能。
数据标准化
数据质量标准化体系的建设分为两个条线“由下而上”的数据标准化梳理方式和“自上而下“的应用标准体系建设。“由下而上”通常是在现有数据存储结构的基础上,设计企业数据模型,然后归并数据项,形成数据标准。然后“自上而下”进行标准体系的流程贯穿和管控。
数据质量管理
数据资产质量管理,要求能够从数据的准确性、完整性、及时性、一致性等六性的维度,对数据资产的质量进行管理,从数据问题定义、问题发现、问题处理、问题跟踪和问题评估统计5个环节,构建资产质量的闭环管理流程。
数据集成挖掘
通过数据集成把海量的数据管起来,建立元数据的模型,形成资产密度分类,结合已有的的模型体系进行归类和整合。将收集的元数据分类归集到信息模型上,形成多维度的、完整的模型体系,从而贯通业务技术。为数据的使用方提供数据生产线,为数据的收集、转换、清洗、脱敏、存储、探索、可视化等提供方便的工具和研发过程。
总结
数据应用、治理先行,网智天元希凭借多年信息安全、数据安全、数据规范、数据质量管控平台软件的建设实施经验及多家金融机构、政府机构的数据治理体系的建设经验,希望在今后为金融机构数据质量体系建设和服务提供有力的产品及服务支撑。