2026-05-07
导语:本文提出数据—模型—知识—工具—治理一体化技术架构以工业多模态数据与数字线程为基础结合预训练与参数高效适配方法融入检索增强生成(RAG)与知识组织机制并引入机理约束与工具校核构建面向现场的证据链验证链与责任链
一、背景
制造业生产过程链条长、约束条件复杂且状态波动显著,现场数据呈现多源异构与强时序特征。传统面向单任务的模型往往依赖大量标注样本与相对稳定的数据分布,难以支撑跨任务、跨模态与跨场景的综合应用。通用大模型虽具备语义理解与知识表达优势,但在工业现场必须同时满足可控性、可解释性、实时性以及数据安全与合规等工程要求。直接进行 “模型上车” 易出现工艺违约、证据缺失与责任不可追溯等问题。为了应对上述工程要求,工业大模型可被理解为在大规模工业数据上进行预训练,并能够以少样本或参数高效的方式适配多类工业任务的模型体系。其有效落地需要与企业数据和数字线程、知识和机理约束、工具链集成及治理运营机制进行协同设计,从而形成可审计、可复核、可迭代的工业智能闭环。
围绕上述需求,相关研究主要沿模型能力与系统集成两条主线推进。在模型能力上,工业大模型与智能体被用于需求分析、工艺推理与协同决策等环节,以提升知识复用与流程自动化水平。时间序列基础模型 (TSFMs) 通过跨领域预训练,为零样本或少样本的制造过程预测与状态表征提供了通用方法。检索增强生成 (RAG) 通过 “先检索证据、再生成结论并给出引用” 降低幻觉、增强可解释性,在复杂任务中进一步引入图检索增强生成 (GraphRAG) 等结构化检索方法以支持跨文档汇总与多步推理,并强调检索证据、引用段落与生成结论的留痕,以便进行审计复盘。在系统集成上,数字孪生与互操作标准为跨系统集成与模型可迁移性提供工程基础,数字线程通过贯通设计、工艺、生产与运维数据,为跨阶段推理与闭环优化提供上下文。然而,现有工作仍多聚焦于单点能力或原型验证,对制造企业真实环境中的能力边界、工具受控调用、闭环决策与治理运营一体化设计仍缺乏系统化阐释。基于此,本文提出面向制造业的分层技术架构,构建 “感知 - 理解 - 规划 - 执行 - 评估 - 优化” 的闭环决策机制,总结典型场景的落地范式与评价要点,并给出面向可信与合规要求的治理建议,为制造企业试点验证与规模化推广提供可操作的参考框架与方法体系。
二、面向制造业的工业大模型架构
(一) 制造业工业大模型总体架构
面向制造业 “多源异构数据+强约束流程+高可靠要求” 的特点,本文提出制造业工业大模型架构,如图1所示。以数据与数字线程贯通产品生命周期管理 (PLM)、制造执行系统 (MES)、数据采集与监视控制系统 (SCADA)、质量管理系统 (QMS)、计算机化维护管理系统 (CMMS)、企业资源计划 (ERP) 以及可编程逻辑控制器 (PLC)、传感器等系统与设备,在其上构建可适配的模型能力与可核验的知识与机理,并通过智能体与工具将推理结果转化为可执行动作,最终以治理与运营保障安全、合规与可追溯。该架构旨在保障模型的输出可落地执行,并能被复核检验,而非单纯地追求问答的生成。具体而言,实现任务可分解、证据可引用、工具可受控、结果可回流,优先实现证据链与闭环验证,再逐步扩大自动化范围与执行权限。
在该框架下,工业大模型应被定义为智能协同中枢,用于连接数据、知识与工具,实现任务拆解、工具调用与结果汇聚,从而提升跨系统协同效率。因此,落地应优先完善证据链构建与闭环验证,再逐步扩展自动化范围。
(二) 数据与数字线程层
数据与数字线程层作为工业大模型的 “数据地基”, 解决制造现场数据多源异构、口径不一、难以贯通的问题。该层将研发设计、生产制造、设备侧、质量与运维及供应链数据按统一对象标识与时间基准进行关联,形成可追溯的数字线程,并通过元数据、血缘与质量规则保证数据 “可获得、可理解、可共享”。该层的完备建设是后续检索、推理与跨系统联动获得稳定输入与一致语义基础的前提。
(三) 模型层
模型层提供 “可用的模型能力供给”, 解决通用模型难以直接适配制造场景以及现场部署受限的问题。该层以通用及行业基座模型为底座,面向企业与产线任务构建专用能力。通过多模态预训练与对齐,覆盖文本规程、缺陷图像、点云与时序曲线等数据,再采用 PEFT 等方法实现低成本场景适配,并配合推理加速与边缘部署满足低时延与可靠性要求。该层强调能力边界与版本化管理,使模型由 “能生成” 向 “在现场可稳定复用” 转变。
(四) 知识与机理层
知识与机理层是工业大模型 “可信输出” 的关键,解决大模型幻觉、结论难复核以及工业约束难显式表达的问题。该层将企业知识资产结构化并实现可检索,通过 SOP 及 KG 组织 “设备 - 工艺 - 物料 - 质量” 关系,采用 RAG 将生成结果绑定到可核对证据并保留引用与版本。同时,在安全与质量关键环节引入机理与仿真约束与校核逻辑,形成 “生成 + 校核” 的双通道,据此实现答案可追查、可复核,并将 “经验性建议” 提升为 “有依据的工程结论”。
(五) 智能体与工具层
智能体与工具层将大模型能力嵌入制造流程,解决只会回答而不能办事的问题,该层同时也是实现高价值应用的执行枢纽。该层由智能体负责任务的分解与流程的编排,智能体根据任务需要调用 RAG 能力、仿真工具、优化工具以及控制与执行接口,从而将模型输出转化为可执行的工单、可落地的参数与可采纳的决策建议。执行结果需要反馈至数据层,才能使闭环反馈机制持续完善数据与知识基础。该层建设的关键在于受控调用机制。重要决策应优先交由可验证的仿真模块、优化模块或控制模块执行,模型则承担协同、解释与信息整合等职责,从而在效率与风险之间取得平衡。
(六) 治理与运营层
治理与运营层保障工业大模型 “可控、可审计、可持续运行”, 解决生产级应用中的安全、合规与长期运维问题。该层从数据安全与权限控制出发,延伸到模型安全、风险评估与监控、网络安全与零信任以及合规审计与版本运营,同时以大模型运营管理体系 (LLMOps) 将模型、知识库、提示与工具配置纳入统一运维,建立日志留痕、版本管理、灰度发布与回归测试机制,持续监测引用正确性、越权调用与数据漂移,并提供回滚与应急处置能力。该层是工业大模型试点从 “短期可用” 走向 “长期可用” 的关键,确保输出可追溯且可复核。

图 1 制造业工业大模型架构
三、工业大模型赋能典型制造业应用场景落地范式
本文归纳六类工业大模型落地的典型场景,不同场景的数据与方法不同,其共同要求是输出有证据、建议能验证、过程可追查。工业大模型在制造业的典型应用场景与落地点见表 1。
表 1 工业大模型在制造业的典型应用场景与落地点

(一) 智能设计与工艺规划
在智能设计与工艺规划场景中,约束条件多样且相互耦合,方案验证成本较高。因此,工业大模型的生成式输出要与可核验的证据链和约束一致性检查同步构建,以保障结果的可用性与工程可信度。较为稳健的实现路径是基于 RAG 机制,调用国家与行业标准、企业工艺规范与历史案例等知识依据,由工业大模型形成候选方案与推理说明,同时将关键性能指标与约束条件交由规则引擎、仿真系统或 CAE 工具进行校核,形成 “生成 - 验证 - 修正” 的迭代闭环,从而提升方案的可落地性与可审计性。
(二) 生产计划与调度
生产计划与调度问题具有多约束、强耦合与动态扰动等特征。可利用工业大模型将业务意图与规则描述转化为可执行的计划编排,再结合仿真与优化求解器进行评估、约束校验与参数修正。落地实施的关键在于约束表达应具备可解析性与可追溯性,验证链路应具备可复用与可自动化能力,并与 MES、高级计划与排程系统 (APS) 等系统接口实现贯通,构建端到端的闭环机制,进而在波动环境下持续提升交付稳定性。针对插单、设备故障、物料延迟等典型扰动,可通过工业大模型驱动的智能体触发重排流程,并输出影响范围与原因解释,为生产指挥提供可解释的决策支持。
(三) 质量检测与原因分析
质量检测与原因分析场景,既依赖多模态数据感知,也需要对异常原因给出可解释结论。工业大模型结合多模态学习与少样本方法,有助于提升跨批次、跨产线场景下的泛化能力与稳定性。在实现层面,将质量标准、检验规程与判定阈值纳入知识库,由工业大模型通过 RAG 输出可核对的引用依据,并结合统计分析与因果分析方法进行根因定位,使质量管理从 “结果判定” 进一步走向 “可追溯的持续改进”。同时,工业大模型输出内容宜明确区分 “判定结论” 与 “改进建议”, 并标注所依据的标准条款、数据范围与适用边界,以增强可审计性与可复核性。
(四) 设备运维与可靠性
设备运维与可靠性场景同时包含风险预测与处置指导两类目标。工业大模型可与时序模型协同,时序模型用于预测性维护与故障风险预警,工业大模型则通过 RAG 检索设备手册、维保规范与工单记录,生成步骤化的维修指导与注意事项。为了降低运维风险,该场景下工业大模型中的关键处置动作应设置权限控制与风险校验机制,避免将建议直接映射为高风险操作指令。通过将 “预测 - 指导 - 校验 - 记录” 串联为闭环流程,可有效减少非计划停机并提升运维一致性。此外,可基于工业大模型对工单与备件信息进行自动汇总,形成标准化处置记录与知识沉淀,从而增强经验复用与知识迁移能力。
(五) 供应链协同与风险管理
供应链协同与风险管理需要在数据共享效率与商业机密保护之间取得平衡。数据空间与联邦学习等技术可在不汇聚原始数据的前提下支持跨企业协同建模。工业大模型基于此技术实现需求、交期与库存等协同任务的语义理解、规则对齐与决策辅助。系统仍需在落地过程中系统性解决指标口径统一、接口标准化、权限管理与合规审计等问题,形成制度与技术协同推进的实施机制,以提升协同智能的可复制性与可扩展性。典型协同任务包括需求预测、交期承诺与库存协同优化,但其前提是接口规范与数据定义实现一致性对齐。
(六) 能源与碳管理
能源与碳管理需严格对齐核算标准、边界条件与外部审计要求。工业大模型将核算规则、核算边界、排放因子与数据口径等整理入库,工业大模型通过 RAG 输出可核对、可复现的解释说明,并对关键策略引入约束优化与仿真评估,以量化收益与风险。工业大模型将证据链与计算结果回写至能管系统与生产系统,形成可持续迭代的闭环优化机制。针对外部审计重点关注的指标,工业大模型应保留原始数据、计算过程与版本信息,以满足复核与追溯要求,提升体系的可信度与合规性。
四、实施路径与评价体系
(一) 实施路线
工业大模型落地首先要选择合适的应用场景,企业需要夯实数据基础、系统集成与治理机制。建议企业按 “选场景 - 治数据 - 做适配 - 做验证 - 再运营” 的顺序推进,并在每一步设定可验收的交付物。该路线的目的是将试点建设成为可复制的方法体系,而非一次性项目。
1.选场景
企业在进行场景选择时应先明确业务边界,再推进智能化建设。企业应优先选择闭环清楚、收益可量化、风险可控的任务,并明确输入、输出、权限与责任。对于高风险环节,可先建设 “解释与问答” 能力,再逐步扩展到 “参数建议” 能力,最后考虑 “半自动执行” 能力。
2.治数据
企业需要先使数据与知识具备可用性,再完善可管可控能力。应建立数据资产目录、字段口径、质量规则与标签体系,并建设可检索知识库,纳入标准、手册、规程和案例等内容。应对敏感数据进行分级分类,建设配套脱敏和访问控制机制,保留访问与调用日志。同时,要持续更新企业知识库,不断增加有效案例并清理过期规则,以保证引用内容准确且不失真。
3.做适配
企业在开展模型建设时应先求稳,再求强。多数制造场景不必从零起步训练专用大模型,更可行的做法是选用通用基座模型,再通过低成本适配并叠加 RAG, 使模型先具备知识使用能力,进而形成判断能力。企业对关键任务需同步建设高质量指令样本与评测集,并将提示模板、检索策略和工具接口沉淀为可复用资产。该策略既能帮助企业控制成本,也能降低后期维护难度。
4.做验证
企业在系统集成时需以闭环为目标,不应仅建设对话入口。企业的工业大模型应与 MES、PLM、SCADA 等系统打通,形成 “建议 - 校验 - 执行 - 反馈” 的链路。对涉及安全和质量的动作,企业应设置人工确认机制,配置工具白名单并制定回滚策略,优先采用 “跟跑模式”, 即先跟随运行但不直接下发指令,积累证据后再逐步扩大模型权限。
5.再运营
企业在模型上线后需按产品思路持续运营,建立监控与告警机制,重点关注数据漂移、性能衰减、引用正确性、越权调用和异常输出等信号。在每次更新版本时,均要明确 “模型版本、知识库版本、提示模板与工具版本” 的组合,并支持快速回滚。企业只有将运营建设为制度化流程,试点成果才能沉淀为长期能力。
(二) 工业大模型评价体系
工业大模型评价体系需同时度量模型能力、过程可追溯性、鲁棒性与安全、业务价值以及运行效率与成本,避免仅以通用模型分数替代业务成效。本文按任务效果、证据与可追溯、鲁棒性与安全、业务价值、运行效率与成本五个维度分别给出指标口径与评估要点,详见表 2。
表 2 工业大模型制造业应用的综合评估维度、指标示例与数据口径

1.任务效果
任务效果要贴近业务目标,而不是只用通用文本指标。对于文本类任务,可用准确率、召回率等指标;对于时序预测类任务,可用 MAE、MAPE 等误差指标;对于视觉质检类任务,可用缺陷检出率等场景指标。关键在于将评测样例与真实工况对齐,并加入对抗样例,检验模型在噪声、缺失和异常情况下的稳定性。开展扎实的效果评测,才能支撑后续扩面复制。
2.证据与可追溯
证据与可追溯是工业场景的 “硬门槛”, 应纳入评估。对采用 RAG 技术的系统,应重点评估引用正确性、证据覆盖率和证据一致性,并要求关键结论能追溯到标准、手册或记录。对于智能体流程,还要评估工具调用成功率、约束满足率和闭环收益,防止 “说得对但做不成”。这些评估维度与指标示例可参考表 2, 并按企业数据口径开展本地化映射。
3.鲁棒性与安全
鲁棒性与安全维度关注系统在噪声、缺失、异常输入与对抗干扰下的稳定性,以及在权限、隐私与合规约束下的安全边界。鉴于此,可将幻觉率、对抗鲁棒性、越权调用率、敏感信息泄露风险等作为核心指标,并结合红队测试、权限审计与 DLP 扫描形成可复核证据。在质量与安全关键环节,应设置更高门槛与人工确认覆盖率,通过灰度或影子模式上线,并保持版本可回滚与审计可追溯。
4.业务价值
业务价值要用可审计口径计算,避免只凭主观感受进行评价。建议围绕周期、良率、停机、库存、能耗与碳排等关键指标设定基线,并明确对比窗口、统计范围和排除项。对于排程、维修等影响链条较长的场景,可先用 “节省人时、减少返工、缩短响应时间” 等中间指标作为阶段性目标。价值口径一致,才能形成可复盘的改进闭环。
5.运行效率与成本
运行效率与成本维度用于衡量 “可用性” 与 “可持续运营” 的工程代价。建议企业度量端到端时延、吞吐能力、单位调用成本、资源占用情况与能耗等指标,并区分云侧检索与推理指标口径以及边缘侧低时延推理指标口径。指标体系应与网络条件、边缘算力与业务节拍匹配,避免出现 “效果提升但成本不可控” 的情况。企业对高频任务可优先采用缓存、量化与分层模型组合等手段优化成本。
五、关键挑战与对策建议
工业大模型在制造业规模化应用中面临的共性挑战主要体现在数据流通与主权约束、模型可靠性与持续演进、工业控制环境下的系统安全以及合规与责任边界等方面。针对上述问题,本文从技术与管理两个层面提出对策建议,以支撑试点应用向长期稳定运营转化。
(一) 数据安全、隐私与跨域协同
跨组织协同既要实现数据可用,也要守住数据主权与敏感信息边界。在技术层面,可基于统一对象标识与语义模型完善数据口径,通过访问控制、加密传输、脱敏、匿名化等机制落实最小可用原则。业务存在共享需求且风险较高时,企业可引入数据空间机制、可信执行环境、多方安全计算或联邦学习等隐私保护手段以支撑可控共享,并通过元数据与血缘记录实现可追溯交换。在管理层面,企业应建立数据分级分类与授权体系,明确数据使用目的、范围、保存期限与再共享约束,以数据合约固化权利义务与违约责任。企业对跨园区与跨境流通还应设置合规评估与审批流程,执行数据最小化与目的限制,将审计追责纳入常态化检查。
(二) 模型可靠性风险
制造场景对稳定性、可解释性和可复核性要求高,幻觉、偏差与版本漂移容易直接放大业务风险。在技术层面,关键结论可通过 RAG 实现证据绑定,高风险决策需引入机理约束、仿真、优化校核与工具 “硬检查”, 并设置置信度门限与人工复核。评测体系需建立面向场景的评测集、回归测试与红队用例,配套版本管理、灰度发布与可回滚机制。持续学习应坚持 “先评估、再更新、可对比” 原则,确保更新前后可对比。在管理层面,模型变更需纳入统一的变更管理流程,明确上线准入标准与责任人,对高风险任务实行 “人机协同” 与签核机制,形成问题闭环,并建立运行关键绩效指标 (KPI) 与事故分级处置的流程,确保性能退化、误用与异常输出可被及时发现与纠偏。
(三) 网络与系统安全
工业大模型一旦接入工业控制技术 (OT) 并触达控制接口,风险将从输出错误扩展为控制错误,可能直接引发生产安全与质量事故。在技术层面,需按工控安全要求实施分区分域与网络隔离,采用零信任与最小权限控制。工具调用需建立白名单与接口网关强制鉴权策略以减少越权风险。控制指令需采用多重确认机制,通过限幅策略与可回滚设计降低误操作影响。在管理层面,需明确 OT 侧接入审批机制、变更窗口与应急预案,开展提示注入、越权调用、接口滥用等常态化演练。建立安全基线与默认安全配置制度,并延伸至供应商与第三方组件管理。关键岗位应开展安全培训与权限周期复核,避免出现技术可控但管理失控的情况。
(四) 风险管理与合规
工业大模型的可信应用需要制度化治理,解决能否使用、发生问题后由谁负责以及如何证明合规等问题。在技术层面,需构建全生命周期可追溯体系,对 “数据 - 知识 - 提示 - 工具 - 输出” 进行日志、版本与证据链管理,形成可审计的技术文档与评测记录。高风险场景需设置透明度与可解释输出要求,并将合规控制点前置到设计与上线环节。在管理层面,需对齐企业风险管理与审计体系,参考相关风险管理框架明确组织职责、识别风险场景并建立度量与处置机制。企业还需结合相关国际标准完善风险管理流程,保证治理要求可落地执行。面向国际业务,组织需要依据主要监管要求完善技术文档、透明度要求、数据治理机制与责任边界。闭环治理机制需要覆盖设计、开发、部署、运行与退役等阶段,相关部门应明确分工并落实签核责任,形成可证明合规的持续运营能力。
六、结论
本文面向制造业提出 “数据 - 模型 - 知识 - 工具 - 治理” 一体化工业大模型技术架构,并据此形成从场景落地范式到实施路径、评价体系与对策建议的系统化方法。同时,强调在工业约束条件下将生成能力与证据链、验证链及责任链协同构建,通过 RAG、机理约束与工具校核实现可追溯、可复核的闭环决策,从而提升工业大模型在质量与安全敏感环节的可用性与可复制性。
展望未来,工业大模型的发展将进一步走向可验证、多模态融合与智能体化编排,并在云边端协同部署与标准生态完善的支撑下实现跨工厂与跨供应链的规模化应用。后续建议围绕可共享评测基准、机理与数据协同的验证方法以及数据空间条件下的合规协同学习等方向持续推进,以降低产业试错成本并加速工程落地。
原文刊载于《数字化转型》2026年第4期 作者:中国信息通信研究院 凌大兵 王雪 赵昕 李思桥 李睿
暂无评论,等你抢沙发