导语:本文将从数字底座构建谈起系统梳理小样本+大模型混合架构在工业复杂场景中的实践路径与理性思考
过去十年,江苏太平洋精锻科技股份有限公司(以下简称 “精锻科技”)完成了 PLM、ERP、MES、EAM、QMS 等核心系统建设,实现了从流程驱动到数据驱动的阶段性跨越。然而,站在新的竞争环境下,我们面临的核心问题已从 “业务是否数据化” 转变为 “数据是否真正赋能业务”。
在良率提升空间日趋收窄、交付节奏高度压缩的背景下,传统经验判断与报表分析难以满足精细化运营需求。驱动变革的并非技术浪潮本身,而是市场对质量、效率与响应能力的更高要求。
基于此,我们将转型重心聚焦于 “数据业务化”—— 以人工智能,特别是大模型技术为关键支点,激活沉淀在系统中的海量数据资产。本文将从数字底座构建谈起,系统梳理 “小样本 + 大模型” 混合架构在工业复杂场景中的实践路径与理性思考。
筑基:打破孤岛,构建高韧性数字底座
挑战:异构设备的 “语言障碍”
在转型初期,我们面临的最大拦路虎并非算法,而是数据采集的兼容性。厂区内存在大量不同年代、不同协议的设备(如西门子、发那科、国产定制系统等),形成了严重的 “数据孤岛”。
痛点复盘:早期尝试直接对接 PLC 时,发现协议解析耗时占项目周期的 60%,且老旧设备无数据接口。
解决方案:在多次验证后,我们放弃了单一云端采集路径,选择边缘 + 平台协同架构,通过在设备侧开发轻量级适配插件,统一将多源异构数据清洗为标准化的 MQTT 协议,再上传至工业互联网平台,如图 1 所示。

图 1 智能制造总体架构图
成效:实现了全厂1000+台关键设备的数据实时采集,设备联网率从 10% 提升至 98%,数据采集延迟控制在毫秒级,为上层应用奠定了坚实基础。
治理:从 “数据湖” 到 “数据资产”
数据通了不代表数据可用,我们制定了《主数据管理规范》,如图 2 所示,统一了物料、设备、工艺参数等12类核心主数据标准,清洗了历史遗留的重复、冗余及格式错误数据。

图 2 高质量语料数据收集存储
价值转化:高质量的数据底座使得跨系统分析成为可能,方便模型训练使用、大模型检索、智能体应用调用,并通过不断丰富数据集和提升数据质量,持续增强模型应用效果和准确率。
进阶:场景驱动,从 “感知” 走向 “认知”
在完成数字底座建设之后,我们并未急于引入复杂模型,而是围绕业务核心痛点,逐步构建分层智能化能力体系。
在实践中,我们将智能化能力建设划分为三个阶段:
⑴数据感知能力 - 让生产过程 “透明化”;
⑵预测分析能力 - 让异常风险 “可预见”;
⑶认知辅助能力 - 让复杂问题 “可解释”。
数据感知能力建设:让现场 “看得见”
⑴视觉检测能力升级。
尤其在工业场景中,缺陷样本具有 “小样本、不均衡” 的典型特征 —— 某些关键缺陷出现频率低,但一旦漏检后果严重。传统 CNN 模型往往需要大量标注样本进行训练,数据准备成本高,模型迭代周期长。
我们尝试引入基于 Transformer 架构的视觉模型进行验证。相较于传统卷积网络依赖局部特征提取的方式,在复杂锻件背景下,模型对结构特征的识别能力明显提升,能够更好捕捉复杂背景下的结构信息,在小样本条件下展现出更强的泛化能力。
⑵设备运行状态实时感知。
如图 3 所示,在设备侧,我们通过边缘计算网关实现关键设备数据接入,采集振动、温度、电流等多维运行参数。这一能力的建设,使设备从 “事后故障处理” 模式,逐步转向 “状态可视化管理”。

图 3 设备运行状态
阶段性成果包括:
①全厂关键设备运行状态实时可视;
②异常波动可触发即时提醒;
③数据沉淀为后续预测模型提供基础。
这一阶段的核心意义在于:建立 “可感知” 的生产现场。没有感知能力,预测与智能均无从谈起。
预测分析能力建设:让风险 “早知道”
在感知能力稳定后,我们开始探索预测类模型应用,目标是降低非计划停机与质量波动风险。
⑴设备预测性维护模型。
针对核心加工设备,我们结合数据增强策略进行小范围验证,并持续优化模型参数。
实际价值体现在:提前识别异常趋势、优化维修计划安排、降低突发停机概率。
⑵质量波动趋势识别。
结合 MES 与 QMS 数据,我们建立质量参数波动趋势分析模型,识别关键变量对良率的影响。这一能力并不直接进行自动纠偏,而是为工艺工程师提供趋势参考与决策支持。
其核心目标在于:提高问题定位效率、减少经验判断的不确定性、增强数据支撑能力。
跃迁:大模型(LLM)的深度落地与实践
如果说前期的数字化建设解决了 “数据有没有” 的问题,那么大模型探索解决的则是 “数据能不能用得更聪明” 的问题。我们并未将大模型视为 “成熟工具直接复制”,而是定位为一项需要在工业场景中不断试错、验证与迭代的新能力体系,如图 4 所示。

图 4 智能体平台
构建 “工艺助手”:知识资产活化的第一步
锻造行业的核心竞争力之一,是长期积累的工艺经验与问题处理案例。然而这些知识分散在各种文件资料中。
我们首先做的,并不是训练模型,而是进行知识数字化与结构化梳理。目前阶段,通过文档 OCR 与结构化处理、建立向量数据库、引入私有化大模型构建 RAG 架构及对话式验证问题,主要解决知识检索效率问题,尚未形成参数自动优化能力,我们将其定位为 “工艺辅助参考系统”,而非 “自动决策系统”。
例如工程师可通过自然语言提问(如:“某型号齿轮锻件出现充不满缺陷,历史上有哪几种解决方案?”),系统可以检索相似案例并进行归纳总结,但最终参数调整仍需工程师确认。
这一步探索的意义在于:新工程师能够快速掌握历史经验,复杂问题可快速定位相似案例,知识不再依赖个体记忆。我们认为,这一阶段的价值不在于 “替代专家”,而在于放大专家能力。
设备预测性维护中的大模型融合探索
在设备领域,问题在于:故障样本稀缺、不同设备之间泛化能力弱、异常诊断解释性不足。如图 5 所示,我们开始尝试引入大模型能力做三件事。

图 5 设备维修 AI 智能助手应用
故障知识语义关联:将维修记录与设备参数进行语义关联分析,寻找潜在因果模式。
生成式数据增强:基于正常运行数据生成异常扰动样本,用于扩充训练集,目前仍在小规模验证。
故障解释能力增强:当预测模型提示风险时,大模型可将复杂时序特征转化为 “可读解释”,辅助设备工程师判断,当前阶段更偏向解释增强,而非预测能力突破。
ChatBI:从报表工具到对话助手
在经营管理层面,公司积极探索智能化数据应用,部署了对话式 BI 原型系统,面向管理层开展小范围试用。
该系统基于大模型能力,实现了自然语言转 SQL 查询及基础数据图表自动生成,使管理人员能够通过对话方式快速获取所需经营数据。在实际应用过程中,大模型虽然显著提升了数据分析响应效率,使非技术人员也能便捷开展数据查询与初步分析工作。但与此同时,也存在对复杂业务指标理解存在偏差等问题。
基于当前技术成熟度与应用效果评估,我们将该系统明确定位为 “数据查询助手”,作为辅助工具提升数据获取效率,而非直接承担经营决策职能的核心系统。
代码与自动化:研发效能倍增
在 IT 团队内部,我们引入编程大模型辅助代码编写、接口生成和测试用例生成。目前阶段主要用于前端页面生成、接口样板代码编写、SQL 优化建议等。
整体开发效率提升 20%~30%,但核心架构设计与安全控制仍由工程师完成。
理性认知:大模型应用需回归工业本质
在实践过程中,我们逐步形成了对工业大模型应用的几项理性判断。与消费互联网场景不同,锻造制造属于高风险、高复杂度的工程系统,大模型的应用必须建立在清晰的能力认知与边界控制之上。
大模型无法替代工业专业判断
工业生产具有以下特征:强因果逻辑、多变量耦合、结果不可逆、质量责任刚性,在此类场景中,任何模型输出都必须经过工程验证。
我们始终坚持:大模型是 “认知增强工具”,而不是 “自动决策主体”。在工艺调整、质量判定、设备处置等关键节点,最终决策权仍由专业工程师掌握。
我们更关注的:是否提升问题定位效率、是否缩短知识检索时间、是否增强复杂问题的认知广度,而不是追求 “完全自动化决策”。
RAG 架构是工业落地的必要前提
通用大模型在开放语境下具有创造力,但工业场景强调 “准确性” 和 “可追溯性”。
在早期测试中,我们曾发现:模型回答具备逻辑性,但缺乏事实依据,对专业术语理解存在偏差,在缺少数据支撑时出现 “合理但错误” 的推断。
因此,我们明确采用检索增强生成(RAG)架构:所有回答必须基于企业知识库片段、输出附带来源引用、低置信度回答触发人工确认机制。这一机制将大模型从 “生成型工具” 转化为 “知识增强工具”。
数据治理优先级高于模型能力
在探索初期,我们曾一度将关注点集中在模型效果优化上。但实践证明:
主数据不统一→模型无法稳定识别实体;历史数据缺失→无法构建有效训练集;工艺记录不规范→语义向量质量下降。
这使我们意识到:模型能力的上限,取决于数据治理的下限。只有底座稳定,模型应用才具备持续演进能力。
坚持 “小场景验证” 的渐进策略
在行业热潮中,全面铺开大模型应用看似 “战略积极”,但风险极高。
我们采取的是单点突破→效果量化→风险评估→有序扩展。
目前,大模型应用仍以工艺知识问答、数据查询辅助、运维解释增强为主,尚未进入自动控制或闭环决策领域。
人机协同,而非技术替代
另一个关键观察:技术本身并不会改变组织,应用方式才会。我们避免将大模型定位为 “效率替代工具”,而更强调:
⑴帮助工程师更快找到答案;
⑵帮助管理者更快理解数据;
⑶帮助新员工缩短成长周期。
在内部推广时,我们始终强调:AI 增强的是能力,而不是岗位。
在本阶段,我们对工业大模型的理解已从 “技术兴奋” 逐步回归 “工程理性”。对于锻造行业而言,大模型真正的价值不在于炫目的算法能力,而在于:
⑴能否沉淀企业知识资产;
⑵能否提高复杂问题处理效率;
⑶能否提升决策透明度与可解释性。
这是一条长期演进之路,而非短期革命。
未来展望
下一阶段,我们将继续沿着 “场景驱动、稳步验证” 的原则推进大模型应用:
⑴探索生成式研发工艺设计辅助;
⑵推进多模态模型在缺陷图像 + 工艺参数联合分析中的应用;
⑶构建企业级智能体平台,实现跨系统调用能力;
⑷探索 AI 在质量异常自动归因分析中的应用。
我们坚信,对于传统锻造企业而言,智能化不是一次技术升级,而是一场能力重构。从数字底座到模型驱动,我们仍在路上。精锻科技愿以开放的姿态,与行业同仁共同探索工业大模型的真正边界与价值。
原文刊载于《锻造与冲压》 2026年7月 作者:江苏太平洋精锻科技股份有限公司 宋伟
暂无评论,等你抢沙发