ET数据全生命周期治理技术及应用

导语:提出了一套较为完整的工程技术数据治理技术体系及关键支撑技术描述了主要的工程技术数据治理场景最后介绍了工程技术数据及数据治理的应用实践

能源工业覆盖油气、煤炭、电力等产业链,细分行业包括油气、煤炭开采、炼化、化工、火电、核电、新能源等。能源工业作为我国国民经济支柱产业,是实体经济至关重要的组成部分。通过数字化转型,推动能源工业虚实深度融合,对于能源产业发展具有重要意义。


能源工业普遍具有项目投资规模大、资产密集、工艺及设备复杂等特征,因此,除了信息技术 (IT) 数据、操作技术 (OT) 数据外,工程技术 (ET) 数据作为描述实体工厂属性、特征与关联关系等的基础数据,对于能源工业企业的数字化转型具有重要价值。ET数据治理因为保证了数据的质量与可用性,是 ET数据高效应用的保障,而在近些年来受到业界关注。


1 ET数据及数据治理


1.1 ET数据概念


ET数据是以 CAD 设计成果为核心的工程技术的信息表达。典型的 ET数据包括设备三维模型、设备属性、工艺操作参数、工艺操作规程、设备使用说明书等,以及工艺、电气、仪控等各种工业图纸,如图 1 所示。


图 1 能源工业企业常见的 ET 数据类型


1.2 IT、OT 与 ET数据的差异与关联


IT、OT 与 ET数据是能源工业企业实现数字化转型所需的三大数据类型,它们彼此之间存在显著差异。ET数据是描述工厂属性与特征的基础数据,属于工艺与设备主数据;IT、OT 数据是描述工厂状态与行为的业务过程或实时数据。ET数据是小数据,价值密度高;IT、OT 数据是大数据,价值密度低。


IT、OT 数据与 ET数据又是高度关联的。例如,IT 系统在投入使用前通常需要录入大量初始化数据,这些多数是 ET数据;OT 数据则往往需要在各类专题图的背景中才能被理解和使用。


据 Gartner 公司所述,企业必须充分理解 ET数据价值,及与 IT、OT 数据的关联与协同,才能成功实现数字化转型。美国 ARC 顾问公司也提出 “IT 与 OT 数据的高效融合必须发挥 ET数据价值”。


1.3 ET数据价值


ET数据对能源工业企业经营效益有显著影响。高质量、高可用的 ET数据通过驱动业务应用,可以实现增效、提质、降本的价值;反之,低质量、低可用的 ET数据则会造成企业的经济损失。美国国家标准与技术研究院 (NIST) 的报告显示,ET数据可用性差导致美国的工厂业主在工程建造和生产运维过程中的损失高达 91 亿美元 / 年;ARC 顾问公司的报告显示,ET数据质量差导致企业每年的经济损失可高达当年收入的 1.5%。


高质量、高可用的 ET数据是能源工业企业安全生产的有力保障。在抢修期间,资料不准确或无法及时找到相关资料都会导致方案无法执行,而错过最佳抢修时机,造成事故影响扩大,例如日本福岛核电站泄漏事故。


ET数据是能源工业企业工艺、设备主数据。ET数据的质量和可用性会直接影响企业数字化战略和智能技术应用效果。


总而言之,通过对 ET数据的高效治理,以发挥数据价值,对于能源工业企业数字化转型具有不可忽视的价值。


2 ET数据治理的挑战


尽管 ET数据治理对于能源工业企业数字化转型具有重要价值,但现实中也面临着较多挑战。


技术上,缺乏数字建模和模型管理技术,以及对应的软件平台。ET数据治理的关键抓手是物理世界的数字化表达,即一个能够描述物理世界属性状态和行为模式的、含语义的、蕴含工业知识的信息模型,但目前市场缺乏完整且高效的技术、平台及解决方案。提升治理自动化程度是关键,需要 “人工智能 (AI)+ 工业知识” 的双重加持。ET数据治理难在人工治理工作量大和对人员工程技术能力要求过高,只有几何级数提升自动化程度,才能形成切实可行的治理方案。


认知上,业界对于 ET数据治理概念尚不清晰,事实上大数据技术对 ET数据问题基本无效。若采取大数据技术路线,会导致 ET数据治理过程大量依赖于人工和管理手段,治理后的数据质量几乎没有提升。实践证明,大数据技术主要适用于 IT 和 OT 类 “大” 数据,不适合 ET类 “小” 数据。IT 和 OT “大” 数据普遍具有数量巨大但格式种类少、价值密度低、结构化程度高、耦合度低等特点,治理和应用技术的底层逻辑是归纳推理;与之相反,ET“小” 数据具有格式种类多样、价值密度高、非结构化格式占比高、各数据源耦合度高等技术特征,治理和应用技术的底层逻辑是演绎推理。


3 ET数据治理关键环节


ET数据治理是一项系统性的工作,具体实施过程包括数据创建、数据解析、数据融合、数据可视化、数据更新及数据分发等关键环节。数据创建:核心工作是通过专业 CAD 工具进行数字化建模,创建 ET数据。数据解析:解析多源异构 CAD 格式,其中,无损解析私有 CAD 格式是关键。数据融合:将解析过的多源异构 CAD 格式,以对象为中心,构建工厂全量信息模型,形成统一的单一数据源。数据可视化:通过工业渲染技术,实现三维可视化展示。数据更新:ET数据在运营期持续地更新维护能力,需要能够对第三方 CAD 软件成果进行编辑并更新。数据分发:基于数据映射技术,通过数据视图方式向数据应用系统自动推送数据,以最终实现 ET数据的应用。图 2 描述了 ET数据治理的关键环节及核心支撑技术。


图 2 ET 数据治理关键环节及技术


4 ET数据治理技术


ET数据治理技术是一套技术组合,可以将多源异构并且零散的 ET数据,包括三维模型、系统图、属性、文档等,转换为以对象为中心的单一可信数据源;同时,为提升治理的效率,需要导入 AI 技术以大幅提升自动化程度。


ET数据治理技术路线与 IT、OT 数据治理差异显著。IT、OT 数据治理一般采用大数据技术,而 ET数据治理一般采用工程设计 CAD 技术,其支撑技术与工程设计 CAD 高度重叠。ET数据治理的关键支撑技术包括全量信息模型、AI 识图、多源异构 CAD 格式解析、超高性能工业三维渲染等。其中三维渲染技术虽然定位于可视化应用,但广义上可以将其纳入 ET数据治理范畴。


4.1 全量信息模型技术


信息模型技术起步于 20 世纪 60 年代,由 AVEVA、鹰图等应用在炼化、电力等工程设计 CAD 软件中,解决能源工厂在工程设计阶段如何构建单一可信数据源的问题。2002 年,Autodesk 进入工程设计领域,提出了建筑信息模型 (BIM) 技术并大力推广,信息模型技术从此广为人知。


BIM 技术是对象化描述、存储和分发数据的技术。BIM 的基本思想是以对象为中心,基于一定的规则来描述对象的属性、状态及对象间的级联、拓扑等关系,形成一个集成、统一、带语义的数据模型,并通过该模型建立与各类应用场景之间的映射和分发关系,支持相关利益方的信息交换、集成和共享。


为满足 ET数据治理需求,本文构建了元模型驱动的信息模型技术体系,体系结构遵循国际标准化组织 (ISO) 的 ISO15926 和BIM工业基础类 (IFC) 技术标准,具体内容包括:基于元模型的、可扩展的通用数据架构设计和软件实现;多年项目实践积累的,面向行业和机械特征的参考数据标准库;通过多维映射规则支持概念性数据模型向外部模型的分发数据。


4.2 AI 识图技术


ET数据治理的自动化程度高低是治理成功的关键。本文引入 AI 技术提升自动化程度,已经形成了较为全面的 “AI + 工业知识” 的技术体系,应用场景覆盖数据提取、转换、映射、校验、聚合等多个环节,能够有效提升数据治理的自动化水平,大幅降低人工干预工作量。


在研发过程中,本文意识到了传统 AI 在 ET数据治理领域的局限性。一方面,AI 通常基于 “大样本” 训练模型,而 ET数据特征是 “小样本”;另一方面,AI 不擅长解决几何模型推理问题,而工业 ET数据大量存在于图形中。因此,本文在 AI 基础上深度融合了工业知识,用于解决小样本问题,同时弥补 AI 推理缺陷。


4.3 多源异构 CAD 格式解析


结构化程度最高、质量最好的数据源通常都是数字化设计软件的直接成果,也就是各种专业 CAD 软件的格式。主流 CAD 软件格式有两种:公开格式和私有格式。


公开格式包括 IFC、产品模型数据交互规范 (STEP)、标准 ACIS 文本 (SAT) 等,是由 ISO 等国际标准组织或在行业内有影响力的公司发布的标准,其格式定义是完全公开的。主流 CAD 软件几乎都支持输出公开格式,但其数据损失严重,无法支持深度应用需求。


私有格式一般为某软件特有的文件格式,其格式定义并未公开。私有格式通常完整记录了 CAD 数据,因此解析私有格式的技术能力非常关键。覆盖格式更广、对私有格式兼容性更强、能够解析拓扑关系并自动转换语义是多源异构 CAD 格式解析技术的关键指标。


针对应用需求,本文定义了统一的解析与转换框架以及统一的输出格式,所有的 CAD 格式数据源都会以统一的标准格式输出,以便于后续的模型查看、数据治理等工作。


4.4 超高性能工业三维渲染技术


在三维实时渲染技术领域,三维模型复杂度、漫游性能以及真实感三者互相制约,因此,面向消费级和工业级应用场景的厂商之间优化策略差异巨大。


为了满足超高性能工业化应用场景的需求,采用了模型复杂度和性能优先的策略。性能指标包括以下几方面。第一,支持全厂模型的加载查看,模型规模最大支持数百亿面片以及数千万对象;第二,模型完整,粒度精细到零部件级,细节无缺失;第三,复杂场景秒级加载;第四,渲染流畅、操作稳定、帧率不低于 20FPS,操作响应速度低于100ms;第五,硬件采购和运维成本低 (通常控制在 5 - 10万元),同时支持上百并发。


考虑到本地渲染技术的渲染流畅度、完整度受客户端软硬件资源的限制,采用后端渲染技术路线,支持客户端和服务器端两种部署模式。当采用服务器端部署时,该技术将用户在客户端的漫游操作请求网络发送给服务器,服务器端进行模型的渲染计算,再将渲染结果以图片或流媒体形式传输至客户端浏览器。这一过程采用了多项技术来确保响应的实时性和稳定性,如 H264 串流、GPU 硬件加速、AVX 指令加速等算法来减少阶段延时,提升响应速度,采用网络状态实时检测、压缩参数动态调整、弃帧等手段支持网络自适应能力等。


5 ET数据治理关键场景


在工厂全生命周期,ET数据治理主要体现在数字化交付、数字化重建以及运营期数据持续更新维护 3 个关键场景。数字化交付与数字化重建更聚焦阶段性的集中治理,而运营期数据持续更新维护,专注于在阶段性的集中治理后的长期的持续性治理,以保持 ET数据的质量与可用性。


5.1 数字化交付


数字化交付是指在新建工程建设期,同步构建与实体工厂一致的数字孪生体,并在竣工后向业主或者运营方递交的工作。数字化交付也是实体工厂的 ET数据以对象为中心的汇聚及治理的过程。治理前,数据呈现多源异构零散的特征,经过数据解析、聚合、数据校验等一系列治理工作,可构建以对象为中心的单一可信数据源。能源工业是目前国内数字化交付发展最为成熟和核心的市场,包括油气、炼化、化工、电力等细分市场,数字化交付正在成为新建大型项目的标配。同时,经过几年高速发展,目前市场正从以往的概念驱动开始转型为价值驱动,走向健康、良性发展。


5.2 数字化重建


数字化重建主要针对在役工厂的装置、管网等,通过逆向建模方式构建数字孪生体。数字化重建市场正在升温,尤其是在某些细分市场,例如核电行业的数字图纸、炼化行业的数字管网等。整体上,目前国内能源工业正从 “增量” 走向 “存量” 市场,行业数字化转型的关注点将会更多转移至在役工厂,数字化重建也将会受到更多重视。


5.3 运营期数据持续更新维护


在完成数字化交付或数字化重建的工作后,数字化成果会被接收,接收平台也会成为运营期 ET数据底座。由于运营期频繁的 “技改技措” 等,ET数据需要持续地更新与维护,以保持与现场的一致性。目前运营期持续更新维护市场尚处于起步阶段,但发展潜力巨大。能源工厂运营期的时间跨度一般都长达数十年,因此,运营期 ET数据持续更新维护场景的重要性将会越来越凸显。


图 3 智能工厂的 ET 数字底座


6 应用案例


ET数据治理的根本诉求是数据应用。ET数据作为能源工业企业基础数据,具有非常广泛的应用价值,而ET数据治理能充分保证数据可用、好用与易用。


6.1 数字化管道施工管理系统


某央企集团新建能源项目是国家重点建设工程,其中需施工管道总数量超过 8 万根,焊缝数量超过 200 万道,施工工艺复杂,施工量巨大。传统管道施工管理系统由于人工数据维护工作量巨大、现场管理难度大等原因往往导致系统在现场很难应用。


将管道设计成果等 ET数据导入管道施工管理系统,系统可以自动解析 IDF/PCF 文件,并自动构建贯穿业务全流程的管道三维模型,实现 “设计 - 采购 - 施工 - 检验检测” 数据自动流转。以 ET数据为核心的管道施工管理系统保障了施工质量与进度,工作效率大大提升。据本文统计测算,预制设计效率提升 20 倍,试压包划分效率提升 30 倍,资料编制工作量缩减 95%。


数字化管道施工管理系统产生的焊接、阀门安装等信息也可以通过数字化交付递交给业主,为后期运营期检维修管理提供数据支持。


6.2 密封点台账


能源工业企业基于技术管理、法规监管等需求,往往需要编制与维护众多台账。除了基础的设备台账外,会根据自身管理需求,设有密封点台账、阀门台账、压力容器台账、仪表台账等。这些台账需要一线技术人员投入大量时间来编制与维护。以密封点台账为例,密封点台账是企业开展泄漏检测与修复 (LDAR) 工作所必不可少的。密封点台账详细记录了每个密封点的基本信息、工艺属性和设备属性,包括装置、区域或单元、位置、系统图号、密封点类型、公称直径、物料状态、是否属于不可达点等信息。


某化工装置密封点数量约 1.2 万个,每个点约 30 条属性信息,全人工整理约需 100 天,数据录入错误也难以避免。这类台账的核心是 ET数据,如果企业实施 ET数据治理,基于数据底座的数据分发功能可以按需一键自动生成台账,工作效率将得到极大提升。


6.3 智能工厂的 ET数字底座


某化工集团新建项目采取 “数据 + 平台 + 应用” 建设模式构建运营期智能工厂应用。项目在工程建设期已实施了数字化交付,在接收数字化交付成果后,构建了智能工厂应用的 ET数字底座,以为设备管理、安全中心、电气管理、工艺管理、环保管理等第三方建设的核心应用提供单一、全面数据。


如图 3 所示,该项目按照 “双中台” 模式建设数字底座。ET数据底座可视为专门处理 ET数据的数字中台,与更擅长处理 IT、OT 数据的传统数据中台配合,共同承担数据底座的角色。ET数据底座作为企业 ET数据的单一可信数据源,通过数据分发为第三方应用中心的各类业务应用提供数据。


该项目建立了运营期 ET数据可持续治理与运维机制。企业在运营期由于频繁 “技改技措” 等因素,ET数据会发生变更,需要有一套运维机制来持续保证数据与现场一致,变更受控。除 ET数据底座 (即数字工作台) 外,为实现数据变更,该项目应用了专门的二维与三维建模与维护工具。


7 结束语


ET数据全生命周期治理技术应用目前在国内尚处于起步阶段。随着技术的进一步成熟,成功应用实践的积累,在可预见的未来,该技术将在国内能源工业领域拥有很大的应用前景,并助力企业数字化转型



作者:北京互时科技股份有限公司  曹炜 宋楠 谢宏


暂无评论,等你抢沙发

  • 短信登录
  • 密码登录
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
注册
已有账号, 立即登录
登录即代表您同意本网站的 《用户注册协议》
找回密码