工业数字化转型的数据治理实践

导语:随着数字化转型的推进数据已成为企业重要的资产和生产要素数据对于企业未来的生存与发 展至关重要

1 工业大数据简介


1.1 工业大数据概念


大数据是指无法在一定时间内用常规操作软件对内容进行抓取、管理及处理的数据集合。大数据技术是从海量且无规则的数据中快速获取有价值的信息的能力。大数据具有数据体呈大、种类繁多、价值密度低及速度快、时效高的特征。数据已成为—种重要的生产要素,有效利用大数据并转化为企业可用的数据资产将成为企业生产发展的关键因素,并为企业赋能。


工业大数据是工业领域全生命周期的产品与服务的数据总称,包含工业企业在研发设计、生产制造、经营管理、运维服务等重要生产环节所产生和使用的数据,主要来源故障预警、异常告警、产品监测及日常运营等业务场景。


工业数据主要分为操作技术数据和信息技术数据。操作技术数据主要包含生产机器设备、自动化采集系统如时序数据(温度、湿度、里程、车速)或非时序数据(如车辆异常监控数据)。IT数据包含企业资源计划如客户管理、供应链管理;MES包括生产调度、质量及人员管理等数据。工业大数据由于来源控制器众多,数据类型多样,数据量庞大,结构复杂,工业数据具有隔离性、多模态、强关联及高通量等特点。


1.2 工业大数据痛点


随着第四次工业革命的来临,工业大数据已成为工业发展中最宝贵的战略资源,企业的无形资产。相比于互联网行业,工业领域的大数据更加复杂,重点表现在数据采集覆盖范围不全、信息共享欠缺、数据应用场景不够深化等方面。其原因主要来自以下几点:1) 数据来源多样化程度大,既有来自车端上云的数据,还有来自各业务系统的经营数据;2) 数据实时性高,车端上传的数据具有连续性、实时性及海量特点,这就要求数据的ETL处理技术按照不同数据结构进行不同方式的处理;3) 工业机理的复杂程度对模型的构建要求高,需结合产品全生命周期、价值链进行模型特征的构建; 4) 数据结构不统—,在工业领域大数据多以非结构化、时序数据进行上报,因此对数据的存储及处理能力要求高。


1.3 工业大数据价值


1.3.1 创造工业企业的核心价值


在前三次工业革命中, 以发电机、原子能技术、航天技术、电子计算机作为代表的研究展现了人类历史从蒸汽时代到电气时代再到信息时代的演变。以数据为核心的第四次工业革命正在书写历史的篇章。数据将帮助制造企业从传统的整车研发、生产、供应、销售、服务,到工业互联网平台转型,向新型的商业智能模式转型。


1.3.2将数据作为企业核心资产


数据,作为企业的无形资产将为企业数字化转型赋能。第—步:业务线上化,数据留痕。比如帮助企业业务运营的工具:共享办公平台、业务运营平台等。第二步:决策智能化,数据驱动。比如探索数据分析及数据建模如何在业务场景中应用,通过数据反应业务现状,帮助业务进行决策制定,形成业务闭环。第三步:数据赋能业务,实现研发、生产、供应、销售、服务的数字化变革。


1.3.3以数据驱动企业智能制造


工业互联网,是—个将人、数据和机器设备连接起来的庞大、开放的网络,核心包括智能设备、数据分析工具及交互接口。利用智能设备产生的大数据,机器将同构人工智能分析工具得到信息。通过软件建立的智能系统将帮助企业及时发现问题,并快速响应,避免人工维护带来的数据缺失等问题。当收集到足够的信息时,智能决策就应运而生了。通过数据的采集、存储、管理、分析,以数据驱动的数字化供应链就可以进行企业全生命周期的数据监控,管理及服务。


2 工业大数据治理体系


数据治理是通过工具、制度、流程对数据进行获取、处理及使用进行管理,从而对组织目标信息做出有效评估。数据治理是工业数字化转型治理的必经之路,治理工作的意义不仅在千提升数据价值密度,还能更好的提升数据挖掘的精准度,更准确地反映业务真实的经营状况,帮助企业进行有力的决策。数据治理其本质是通过制定数据标准体系对数据的使用和维护进行有效的指导、评估和监督,进而提升数据质量,创造数据价值。数据治理包含元数据、主数据、数据标准、数据质量及数据生命周期管理;为打造统一共享服务体系还包含数据组织、数据安全和数据服务等板块。工业数字化转型将在研发设计、生产制造、经营管理、应用服务等场景,围绕市场需求、研发、设计、工艺、制造、采购、销售、交付、售后、运维等工业生产经营环节和过程中进行,将数据进行采集、传输、存储、应用、共享及赋能。


2.1 元数据管理


元数据定义为“数据的数据”,元数据描述了数据本身(如数据库、数据元素、数据模型)、数据表示的概念(如业务流程、应用系统、软件代码等)以及数据与数据的关系(血缘)。元数据管理能够帮助企业更好地理解自身的数据、系统、流程。通过统—数据口径,明确数据定位、能够帮助进行数据关联性分析,溯源问题原因,提升业务应用质量。在工业领域中,元数据包括技术元数据和业务元数据。技术元数据重点关注技术的实现,如数据处理的过程和关系。


技术元数据包含:1) 物理数据库表名和字段名;2) 字段属性;3) 数据库对象属性;4) 访问权限;5) 物理数据模型(数据表名、键和索引)。业务元数据定义了业务使用到的名称、定义、描述等信息。它能让用户更好地理解和使用企业环境中的数据,比如用户能够通过元数据管理系统,清晰地理解各个指标的含义、计算方法等信息。


2.2 主数据管理


主数据是指满足跨业务部门的核心业务实体状态属性的基本信息。它是管理与协调企业内部一系列规则、应用和技术的核心数据。主数据相对稳定,准确度与可识别度更高。主数据包含调用、同步、即时、资源服务。


1) 主数据调用是为业务系统进行实时调用所提供的服务。2) 同步是确保业务系统的主数据副本与代码库保持同步,确保数据—致。3) 即时服务是确保智能检索、即时调用的服务,减少数据冗余,保证数据的—致性、可靠性。4)主数据资源是通过数据的只读服务满足Bl (Business Intelligence)分析系统的大规模数据展示、调用。主数据应用质呈应在数据的—致性、有效阻完整性方面进行管理,确保数据在各个业务系统的正确使用。


图1 数据治理体系框架


2.3 数据标准管理


数据标准的统—是数据治理的基石,主要由业务定义、技术定义及管理信息构成,包含数据质量标准、数据操作标准、数据应用标准。数据标准可以有效地规范数据格式、数据类型、数据语义,减少数据孤岛、信息不流通、应用繁琐等问题。数据标准是需要公司全体层面共同遵守和维护的业务规则,是公司层面对某个数据的共同理解,一旦被确定,将共同遵守执行。数据标准应满足三个方面。1) 业务视角:统—业务语言,确保名称—致,明确各属性所遵从的业务定义、用途、规则。2)技术视角:对IT实施形成必要约束,包含数据类型、长度等。3) 管理视角:数据标准的建立及实施离不开各管理部门的支持,各业务部门应在数据标准的管理方面承担各自的角色,包括其业务规则、数据维护、数据监控责任主体。


图2 工业元数据管理


图3 工业主数据管理



2.4 数据质量管理


数据质量管理是工业数据治理的重中之重,是数据应用的前提,为企业提供更准确的商质量数据从而为生产运营和企业管理做出更精准的决策。数据质量问题通常包括:数据缺失、数据异常、数据不一致以及无效值。根据以上经验将数据质量分为:


图4 工业数据标准管理


(1) 完整性:指数据在创建、传递过程中无缺失和遗漏,包括实体完整、属性完整、记录完整和字段值四个方面。完整性是数据质量最基础的—项。如车辆VIN不能为空; (2)及时性:指及时地记录和传递柜关数据,满足业务对信息获取的时间要求,数据交付、抽取、展现需及时。如某数据在某系统过长时间未展示; (3) 准确性:指真实、准确地记录原始数据,无虚假数据及信息。数据要准确反应所建模的真实世界实体。如用户年龄必须与身份证上的信息保持—致; (4) 一致性:指遵循统—的数据标准记录和传递数据及信息,主要体现在数据记录是否规范、数据是否符合业务逻辑。如同—VIN码对应不同系统的车系,代码需—致; (5) 唯—性:指数据只能有唯—的标识符。体现在一个数据集中,一个实体只出现一次,并且每个唯—实体有—个键值且该键值只指向该实体。如车辆有且只有—个有效VIN码。根据以上质量问题的分类,企业可根据自身需求进行数据质量评估指标的设计,从而更准确的衡量及管理数据质量。

图5工业数据质量管理


2.5 数据治理工具


举措1:建立数据中台


数据中台是通过自主研发或集成已有的数据ETL、数据开发、数据分析及Bl开发工具,将企业海量、多维的数据资产进行清洗、整合,提供快速、易操作的数据监测与分析服务。它能够使企业快速高效地应对市场多变的需求,帮助实现数字化转型。数据中台将满足及时响应快速变化的用户需求;实现跨系统进行需求、服务及数据的整合;对于数据能够进行治理、分析,提升运营效率。建设以数据资产为核心的数据中台,可以上承业务数据积累,将原始数据加工成数据资产,通过数据资产服务化下启数据应用场景,帮助业务端或管理端实现资产可视化。首先,通过数据加工建设数据资产体系及相应的数据资产管理,实现数据资产的编目归类管理;其次,建设大数据平台,统—数据资产管理,控制带来经济效益的数据资源;最后,建设数据服务能力,实现数据资产的高效利用及运营。


图6 数据中台架构



举措2: 建立数据质量管理平台


在数字化的转型过程中,随着企业级数据量的增大,数据任务繁多,数据质量问题也会随之逐步上升,为了保证数据的可靠性,通过人工处理数据质量问题的方式已经不再能满足企业级数据的使用效率,因此构建企业级数据质呈平台已是大势所趋。通过建设数据质屋管理平台,逐步构建系统性的数据管理能力,可以支撑业务日益增长的数据应用需求。具体建设目标如下。 (1) 建设需求管理模块功能,实现业务方提报需求,实现在线管理; (2) 建设数据检核规则配罢,实现质量指标和范围的自定义化; (3)建设采集清单管理模块,将清单线上化,便于查看、比对; (4) 建设数据质量管理功能,实现数据质量规则在线配置及监控预警,实现数据质量在线监控。


图7 数据质量管理平台架构


举措3:数据指标管理平台


对于企业数据治理来说,实现数据指标的标准化、统—数据指标标准,可以帮助企业规范业务统计分析语言,提升分析应用能力和数据质昼,从而提升企业的数据资产价值。搭建指标管理平台,形成从需求指标维护-开发应用等环节标准化管理,需进行以下步骤。 (1) 建设创建指标需求关联信号功能,实现Can信号、交互埋点清单、业务系统数据对接指标创建功能; (2)建设指标异动监测功能及指标血缘分析功能,实现异常指标监测预警通知; (3) 建立指标查询功能,实现快速查询和展示指标数据; (4) 建设指标质量评分统计功能,对未达到预期的指标进行重点监测预警,提升指标质量;

图8 数据指标管理平台架构


2.6 数据治理组织


在推动大数据的发展中,需要企业加强数据治理工作的研究与宣传,提高对数据治理的专业理解及方法,让企业工作者意识到数据治理的必要性与重要性,充分发挥数据的价值,推动企业数据共享的发展。


举措1: 指定数据全生命周期治理管理的流程


与标准,成立专项小组,形成数据质量闭环机制。首先,针对数据质量问题指定管理流程,形成定位问题到解决问题再到验证数据闭环的管理机制。其次,企业应制定数据质量的相关标准,规范数据采集、存储、管理、使用全生命周期,形成体系化标准化的质呈管理机制。最后,建立工业治理体系组织机构。由企业高层牵头建立企业工业数据治理专责团队,成立数据质量专项任务团队,梳理数据从采集到应用整个数据链路的质呈问题,聚焦数据质呈问题,进行专项推进整改,形成质呈闭环。


举措2: 成立数据质量复盘团队,召开质量问题定期复盘会推进问题整改。复盘会的目标是以数据清洁为目标,以业务为驱动,从数据使用者的角度定义,满足业务、用户需要的数据,提升数据质量。在会议中,可将问题进行完整性、准确性、—致性、及时性、唯一性的分类,统计问题类别。该会议还从数据源、问题原因、问题原因分类进行数据的统计,并通过解决人、解决进度、解决状态进行间题的推进和整改。


3 结束语


大数据具有数据量大,价值密度低的特点。在工业大数据转型的过程中更是面临数据质量差,业务流程不清晰等问题。通过工具及流程化的数据治理,工业企业可以挖掘更多有价值的信息,提升企业的决策分析,嬴得市场竞争。有效地对元数据、主数据、数据标准的管理,不仅能大大提升数据开发的效率也保障了最终的数据分析及产品应用的质量。数据治理可以通过物治和人治。其中,物治可以通过建立数据中台和数据质量管理平台通过关键指标进行质量监控。企业还可以成立数据治理团队,定期对关键问题进行问题溯源、问题追踪形成问题闭环。



作者:重庆长安汽车股份有限公司 邹懿


暂无评论,等你抢沙发

  • 短信登录
  • 密码登录
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
注册
已有账号, 立即登录
登录即代表您同意本网站的 《用户注册协议》
找回密码