网易数帆小助手

个人签名

280篇博客

网易数帆×东北证券:金融数据,从“源”治理

网易数帆小助手2022-09-01 10:00

数据被视为当前数字经济创新发展的“石油”,而“石油”的开采和冶炼是一个技术含量极高的工程,数据治理就是其中关键的一环。在近日举办的DataFunSummit2022:数据治理在线峰会上,网易数帆与客户东北证券的专家联袂分享了数据治理最新实践与思考。


网易数帆:长效治理,需要数据治理2.0


网易数帆大数据产品技术负责人郭忆分享了数据治理2.0 的思考与实践。郭忆表示,数据治理是我们把数据推向业务的基石,因为企业在业务人员使用数据的过程中, 面临找不到、看不懂、信不过、管不过以及数据开发效率低、质量差等问题。




然而,传统数据治理1.0的元数据管理、数据标准和数据质量三大件,以及当前金融行业衍生的数据资产化、数据分类分级、数据流通、数据消费等,存在包括数据开发与数据治理脱节、缺少对不同平台的统一管理、忽视数据开发过程中的效率及质量问题、未解决烟囱式数据开发、对数据价值和成本的评估不足、数据治理过程缺少量化的手段以及数据治理的过程缺少持续反馈的闭环等问题,这使得企业数据和组织生产力的提升之间仍然存在巨大的差距。


为了解决此问题,网易数帆将传统数据治理的方法融入数据开发的全生命周期中,基于DataOps全生命周期数据开发底座,采用数据中台架构,结合网易特色的基于ROI的数据资产化实践,形成了数据治理2.0的方法论。




数据治理2.0具有开发与治理一体化、逻辑数据湖、采用DataOps的数据开发底座、数据中台架构解决烟囱式数据开发、基于ROI的数据资产沉淀等五大核心亮点,站在现代数据技术栈的巨人肩膀之上,完美解决了数据治理1.0遗留的问题。


其中,数据开发与治理一体化是数据治理2.0 的核心。郭忆认为,数据治理1.0 重点解决存量数据的问题,对于新增数据没有办法做到有效治理,而通过数据开发和治理一体化,我们可以建立数据治理长效解决方案,对增量数据实施有效的治理——增量数据往往对企业的分析价值更大,在数字化的背景下尤其如此。


数据开发与治理一体化下,流程变为先设计再开发,设计包括了标准制定的过程(即数据标准化)和数据建模两个过程。由于数据标准关联了数据质量的稽核规则,在先定标再建模后开发的流程中,稽核规则可以自动应用到标准模型产出任务上,不再需要数据开发人员人工添加稽核规则。这在从源头保证数据质量的同时,也降低了数据开发的难度。


东北证券:金融数据治理要打“组合拳”


东北证券是网易数帆的深度客户,使用了网易数帆有数产品的全平台工具,从DataOps全链路数据开发平台、数据中台、数据治理,可视化分析BI到机器学习平台,构建了一站式数据智能分析体系。


在本次峰会上,东北证券数据治理负责人李燕分享了金融数据治理实践与思考,重点介绍了数据治理管理域间组合与协同。


01、金融数据治理需要管理域协同


东北证券数据治理的愿景,是“沉淀优质数据资产,激活数据要素潜能,支撑公司数字化转型”。在数字化转型的背景下,金融行业业务参与方较多,各类机构和参与者都面临转型,且要求各不相同。其中既包括金融机构和各位市场主体,也包括监管部门和各类交易所、协会等机构,如何将各参与方协同起来,共同打造治理的基础,这是金融行业数据治理面临的一个痛点和难点。


李燕认为,数据治理各个管理域之间存在协同的力量,单个模块建设效果不佳,核心原因是各个模块能力的组合存在不足。她表示,我们需要根据企业实际情况去选择模块,并把这些模块打造成一种能产生组合力、协同的数据治理工具。以东北证券治理体系为例,需要建设一个集模型设计、元数据管理、研发实施、质量监控、安全管理、数据服务等数据全生命周期的实现流程端到端的一体化管控平台。


数据标准是整个平台管理域间协同的一个核心,包括基础数据标准、指标数据标准和标签数据标准。标准落标在于元数据,包括业务元数据、技术元数据和管理元数据等,两者之间的关联需要一个链接的过程。数据标准落标的核心保障是数据质量,后者负责标准落标检查,检测规则被写到每一个字段、每一条元数据上。增量数据从源头符合标准的保证,则是的数据模型,包括概念模型、逻辑模型和物理模型等,同时数据标准也作为输出为数据模型提供基础支持。数据标准的一个核心理念是分类分级,其规则输出给数据安全,并由元数据来承载这些等级。




02、数据治理管理域落地的核心点


李燕强调,数据治理管理域落地的核心点,包括元数据、数据标准、数据质量、数据安全、数据应用与服务等。


元数据的目标是建立元数据仓库、元数据产品化,它是管理域间的核心抓手,需要业务和技术协同完成。


数据标准的目标是进行统一数据语言,统一约束。只做数据标准,把口径厘清,把一些关键的语言统一出来,固然能产生价值,但如果把数据标准、数据质量的关联关系同时打通,共同协作去做的话,所能发挥的价值将远远大于只做数据标准。




数据质量保证能为数据分析业务提供高质量的数据,保证数据有效性,落地的核心点,一是建立数据质量评分卡;二是从业务端、系统端进行源头的治理,而不仅仅是数仓内处理完的数据;三是数据质量的分级处置,根据不同的数据问题,不同的数据的重要性,预设不同数据处置方案;四是认责机制,保证质量问题的发现、追踪和解决,这也是整个数据治理工作要解决的一个关键问题。


数据模型的目标,是提供数据使用的交换效率和业务的可理解性,对于证券行业核心是SDOM模型的本地化。


数据安全目标是有效保护,合法利用,释放数据流动性和产业价值,核心工作包括数据的分类分级,数据的权限审批,数据的隔离和数据脱敏。

最后的数据应用与服务应当紧扣业务价值,换言之,需要进行数据资源的资产化,并通过数据资产支撑更多的业务场景。


03、数据治理如何“破圈”


如何让数据治理“破圈”,提高业务的参与度,避免成为IT人的自嗨?李燕认为需要从企业角度思考两点,首先是数据资产如何发挥价值,其次要把数据服务的应用和数据治理结合起来。


“治理不是最终目的,只有良好的资产为数据分析、数据挖掘带来价值,才能形成正向的反馈。所以它一定是一套组合拳。”李燕说。


小结


随着行业数字化转型不断深入,数据资产化及治理的价值受到了更多企业的关注。于金融企业而言,监管的需求加重了数据治理的意义。两位专家的分享表明,仅仅依靠事后的治理,已经不足以支撑当前金融企业使用数据、推进数字化转型,数据治理正在深入到数据的产生过程中。数据治理2.0方法论的提出,网易数帆技术体系的建设,以及东北证券的探索,为金融行业数据治理的升级带来了可靠的理论依据、基础平台和实践样板。