企业数字化转型升级过程中的数据治理

导语:本人针对数据治理过程提出自己的见解以供借鉴

数字化、网络化、智能化正在加速制造企业华丽转身,工业数据将成为十四五时期智能制造发展的核心要素。数据赋值企业新的利润增长点如何实现,成为每个企业思考的问题,“用数据支撑,用数据管控、用数据分析,用数据决策”正成为企业管理核心理念,然而在当前企业数字化转型过程中,因信息化过程是螺旋式前进,所以信息孤岛无所不在,各软件平台之间集成困难重重,某企业在实施 PDM、ERPCRM、设备工业互联网平台后发现,数据的价值一直维持在低价值区域,并没有真正转变为高价值的数据资产,各业务系统数据不一致,成为影响该企业信息化水平与管理效率提升的重要瓶颈,难以为公司经营决策提供精准的数据支撑。因此数据治理正成为企业数字化转型升级过程中绕不开的弯。“高处着眼,低处着手”是每个企业数据治理的必修课程。本人针对数据治理过程提出自己的见解,以供借鉴。


1 当前企业的数据现状分析


在企业内部,根据数据的特征可以从多个维度进行分类,如结构化数据和非结构化数据,内部数据和外部数据,原始数据和衍生数据等。结构化中的主数据和元数据是大家重点关注的地方,主数据是最有价值、最可能跨流程、跨系统重复利用的数据,企业主数据管理的好坏直接决定企业的数据能不能作为资产增值。信息孤岛是当前企业普遍存在的问题。信息孤岛是指系统平台间相互不关联或者关联不畅通,基本约束不一致,平台接口不一致,数据无法流动等,其主要表现为系统平台孤岛、数据孤岛、业务流程孤岛、数据采集孤岛等。造成当前的信息孤岛有多种因素,原因不外乎以下几点:


1.1 企业历史


大部分企业在初期信息化投入时重硬件投入、重外部咨询、重快速上线以及重节约资金等工作,轻整体规划、轻系统兼容、轻后期运维更新,导致系统兼容性差,后期运维负担重,使用困难,最终使得系统变成“鸡肋”,投入产出比差。


1.2 软件发展速度


信息技术产业迅速发展,5G、人工智能、互联网平台、区块链等新兴技术日新月异,各软件开发商在做软件接口时,无国际或国家标准为依据,各自为政。企业实施信息化时绝大多数采用“大部分乙方软件流程,小部分个性化调整”模式,企业信息化实施周期短,基础调研粗糙,必然会导致企业信息孤岛存在。


1.3 软件平台数据紧藕合以及接口开放少


纵观整个信息产业链,各个软件供应商提供的软硬件接口均有差异性。没有完全依国家标准提供标准接口,各软件供应商只与自身的上下游平台接口衔接紧密,与其他供应商接口并不友好,比如:三大运营商如西门子、达索、PTC 的研发平台 CADPLM 或PDM 系统,其自身的 CADPLM 系统运行时,从速度至接口均可以实现底层完美衔接,但是异构就存在问题。


1.4 硬件接口和协议


企业早期设备自带接口和协议,因软硬件发展,其设备无法支持新的协议和接口,现有新的设备由于供应商的原因缺乏对所有标准化协议支持,导致设备采集数据困难或需要借助其他工具进行转换。人为产生许多重复性工作或数据冗余,导致企业上 MES 或物联网时,设备采集数据困难。比如常用 PLC 设备有德国西门子、日本三菱、OMRON、施耐德等,其各自支持的协议和接口有一定的差异。


1.5 数据多源点


企业的数据如客户、供应商、物料、生产和设备现场等采集数据,同一数据多源头导致数据重复输入出错,业务链、数据链要么冗余要么断层。无正确的数据支撑。企业整体效率低下。


2 数据治理典型体系框架


当前国际或国内协会制定了很多的数据治理体系框架,最为典型也为大多数企业借鉴的是国际数据管理协会提 出 的DAMADMBOK 数据治理框架模型和国内 DCMM 数据管理能力成熟度评估模型。其中 DAMA-DMBOK 模型总结了数据管理的十大功能,并提出建立数据管理十大功能和七大环境要素之间的对应关系,如图 1、图 2 所示。其十大功能分别是数据治理、数据架构管理、数据开发、数据操作管理、数据安全管理、参考数据和主数据管理、数据仓库和商务智能管理,七大环境要素为目标和原则、活动、主要交付物、角色和责任、技术、实践和方法、组织和文化,其中最核心的位置是数据治理。

图 1 关于 DAMA-DMBOK2.0 的数据管理知识产体系

图 2 DAMA-DMBOK 关于环境要素的描述


国内 2018 年 4 月发布的 DCMM 数据管理能力成熟度评估模型 Data Management Capability Maturity Assessment Model)是我国首个数据管理领域的国家标准,其模型如图 3,按着组织、制度、流程、技术四个方面,包含 8 个数理管理能力域,每个能力域包括若干数据管理领域的能力项共 29 个,同时针对每个能力域给出五级成熟度评估等级(初始级、受管理级、稳建级、量化管理级、优化级)。2018 年 6 月我国发布了 GB/T 34960.5-2018《信息技术服务 治理 第 5 部分:数据治量规范》国家标准 ,2021 年 11月全国信标委大数据标准工作组发布了《数据治理工具图谱研究报告(2021 版)》。无论国际或国内均对“数据治理”给出标准和方向。越来越多的企业借助“数据治理”模型来促成数据高价值实现已达成共识。

图 3 图来自 www.dcmm.org.cn


3 如何实现企业数字化转型的数据治理,建造企业数据中台,为大数据分析搭建基础平台



在当今 5G+ 工业互联网平台风起云涌的时代,数据伴随业务为企业赋值,企业迫切需要推动低价值的数据向高价值、标准化、可转化的资产发展。数据如何转化为资产,其核心就是数据治理、数据分析、数据展现的过程。以数据资产管理为核心,在数据管理和使用层级进行规划、监督和控制,包括数据源、数据标准、数据质量、元数据、主数据、数据生命周期等。通过规划化、标准化管理方式,借助封装、复用等技术实现数据资产管理落地,形成完整的数据资源目录,规范数据治理流程,提升数据质量,保障数据安全合规,促进数据流通,提炼数据价值,展现企业运行状态,预测行业未来,辅助企业决策并提前科学布局。


3.1 顶层设计,创建企业级数据治理体系和数据标准化体系建设


在数字化经济发展模式下,数据作为了一种新的生产要求素,应当成为企业的一种战略资产进行管理,数据来自业务,IT 系统承载,同时服务于业务和决策。数据治理内容上是一项基础性的工作,但管理上确是一项全组织全流程全要素参与的工作,有效的组织管理是保障实施成功的基础, 从战略规范至战术实施落地均需要制度保障。针对当前企业的数据,建立企业级数据资产管理体系,引导、监督、检验数据的质量、安全、可靠是非常必要的。只有数据的质量和安全得到保障,数据分析的结果才能真正可用,数据的价值才会真正的体现。首先构建数据体系架构管理机制和数据资产管理的总目标,明确数据管理职责界面、工作流程、考核机制和保障措施。建立企业级数据治理领导层、管理层和执行层,各层级承担各自的责任和权限,领导层负责整个数据治理战略目标、重大决策和整个方向,面对争议进行裁定,管理层对数据治理制定具体实施方,制定人、财、物保障措施和奖罚方案。执行层则直接参与数据治理工作,处理元数据、主数据、数据标准、数据安全等日常工作,业务充分参与,IT 人员和系统落地实施。建立整个数据管理体系,明确企业整体信息系统架构,数据源管理、数据标准管理、数据服务、数据安全体系。为分步实施落地指明方向和政策保障。


3.2 数据分类,流程梳理;数源唯一,标准先行;构建数据共享平台


(1)流程梳理,数据分类,进度管控


当体系架构明确后,流程梳理过程也同时是数据分类清理过程,数据治理是一个长期性、基础性的工作,需要采用 SMART 原则对数据治理战略目标进行细化和落地。其中“S”为战略目标细化为具体目标的过程,“M”为数据治理必须分阶段,而且目标可考核、可衡量、结果可评估。“A”目标可达成,可实现,以便掌握进度,形成阶段性成果。“R" 是相关性,数据治理目标与当前企业业务和数据看板具有相关性和相互支撑,能够看到组织未来的发展和潜力。“T”为明确每个分阶段的时间截点,明确项目进度,实现进度可控,节点可控,目标可控 [6]。基于该原则,数据治理可以使用常用的甘特图或 WBS 等工具,当前市面上常用的项目进度管理软件:高亚科技的项目进度管理软件不但支持 WBS、项目范围结构、甘特图、关键路径、EVM 等传统管理手段,也支持迭代依赖、现状调查等现代项目管理技术。企业内部最重要是主数据,对主数据明确分类将有助数据治理实施,对当前系统存量厘清、分析,也是数据清理、清洗、分析的前置工作。


(2)“一数一源”,标准先行,确保数据质量。


针对企业的数据,首先区分内外部数据,针对内部数据,需要先区分结构性数据和非结构性数据,外部数据如国家代码、币种、行业代码等,建议直接与国家和行业同步,主数据是参与业务过程的主体,具有高价值跨流程跨系统重复使用的资产。


主数据包括:客户、供应商、产品、组织等,对主数据治理首先要建模分析,建立统一的数据模型,满足非冗余、稳定、一致、易用等特征。一数一源,数据源要保持唯一性、不可再生、可复用。对数据源的约束以标准化的形式落地。每个数据源都应有相应架构、流程、标准、版本及管控部门进行管理。由业务、IT、质量部门共同参与制定相应的标准及管理制度。如某公司在 PDM 系统调研之初,针对物料的编码中规格型号、物料名称、采用的字符、材料的表述等均以标准化的形式约束,针对标准件则完全遵循国家标准,从调研分析、数据建模、制定标准到标准宣贯,花时两个月,经过几年的实践证明,数据源唯一性和规范性多么重要。公司的物料编码“一物多码,一码多物”现象从最初的 60% 降低到 95% 以上,而且其他部门一旦发现重码,更正数据源随之行动,其他系统迅速自动同步更正,同时相关部门的考核随之而来。对于非结构性数据如图像、音频、视频、文档、邮件等多源异构的文件,重点是基于统一语言、语义对其基本特征和内容进行提取,通过元数据的方式实现。对于同源性数据在不同系统中只可使用,不可新增。


(3)主数据清洗、分析,构建数据仓库,搭建数据集成平台实现数据共享


控制好数据源头,主数据封装和复用则需要通过技术角度实现,把紧藕合的软件系统打散成一个小小的“积木”方便复用。制定数据清洗规则包括非空检验、主键重复、非法代码、非法值、数据格式检验。用标准化、规范化方式清洗数据的空缺值、重复值、遗漏点、不一致等脏数据,采用人工检测、聚类、分类、关联规则等方法实现。得到准确、一致、有价值的数据。数据的质量最终决定数据利用的价值及数据服务。数据质量则从数据的完整性、及时性、准确性、一致性、唯一性和有效性去评估和衡量。


随着 5G+ 工业互联网平台的实施,海量数据推动着数据存储技术的发展,当前数据存储多采用分布式数据库模式。搭建数据集成平台,也就是常说的数据中层或数据湖等。


数据治理的核心目标是数据分析和服务。当前实现数据解藕有白盒和盲盒两种方式。最有名的盲盒技术是 2017 年以北京大学梅宏院士团队研发“云 - 端融合系统的资源反射机制及高效互操作技术” 提出颠覆式的数据互操作技术途径——“黑盒”思路,通过揭示信息系统内部基于云 - 端融合特性的计算反射机理,发明了通过系统客户端外部监测与控制实现业务数据和功能高效互操作的整套技术及平台,消除了系统源码、数据库表、后台权限、原开发团队等“白盒”依赖,信息孤岛开放效率得到大幅提升。该方式能够解决当前存量数据解藕问题,开创一套黑盒式外部反射的自动化互操作技术,形成颠覆性的通用解决方案,支持信息系统高效互连互通和融合管理。以低代码方式解决数据存量和增量的问题,为构建数据中层,实现数据互联,数据复用,降低二开成本,消除信息孤岛提供技术支撑。


3.3 数据安全和数据审计


随着国际上对网络安全、数据保护和隐私保护的立法,各国对数据确权、数据隐私体现国家之间对数据价值的认可。企业如何在安全的前提下,分角色分层级共享数据是企业数据治理的必经之路。合规使用数据是从管理制度到管理工具支撑,自上而下贯穿整个组织的完整链条。伴随着大数据、云计算、区块链、物联网、5G 等新技术快速迭代和持续创新。数据安全风险成为企业数据共享最大限度利用数据的“伴生石”。数据安全治理过程从体系建设、制度、标准先行,数据安全落地无论从防外围到防内泄,从制度保障到技术实现均需要全面考虑,比如设备灾备、数据加密,数据脱敏、角色权限管理、数据溯源管理、数据安全审计和预警、数据生命周期管理等。在有限制有保护防泄漏的数据安全管理条件下,实现价值最大化的数据挖掘、数据分析、数据服务。


4 结束语


在当前数字化变革的时代,数据正在或已经成为企业核心的竞争力和战略资源,2020 年政府报告再次提到“全面推进“互联网 +”,打数字经济新优势”。随着 5G+ 互联网的全面深入推进,海量的数据资产和丰富的互联网应用场景,通过数据治理,高效高质利用数据,充分挖掘企业内外部数据的价值成为企业的理想和目标,利用数据资产的价值转化为提升生产效率,赋能企业新的利润增长点,指导企业分析和决策能力,就意味着提升企业市场竞争力和市场占有率。

暂无评论,等你抢沙发

  • 短信登录
  • 密码登录
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
注册
已有账号, 立即登录
登录即代表您同意本网站的 《用户注册协议》
找回密码