从数字底座到模型驱动:智能化演进与大模型探索

导语:本文将从数字底座构建谈起系统梳理小样本+大模型混合架构在工业复杂场景中的实践路径与理性思考

过去十年,江苏太平洋精锻科技股份有限公司(以下简称 “精锻科技”)完成了 PLMERPMESEAM、QMS 等核心系统建设,实现了从流程驱动到数据驱动的阶段性跨越。然而,站在新的竞争环境下,我们面临的核心问题已从 “业务是否数据化” 转变为 “数据是否真正赋能业务”。


在良率提升空间日趋收窄、交付节奏高度压缩的背景下,传统经验判断与报表分析难以满足精细化运营需求。驱动变革的并非技术浪潮本身,而是市场对质量、效率与响应能力的更高要求。


基于此,我们将转型重心聚焦于 “数据业务化”—— 以人工智能,特别是大模型技术为关键支点,激活沉淀在系统中的海量数据资产。本文将从数字底座构建谈起,系统梳理 “小样本 + 大模型” 混合架构在工业复杂场景中的实践路径与理性思考。


筑基:打破孤岛,构建高韧性数字底座


挑战:异构设备的 “语言障碍”


在转型初期,我们面临的最大拦路虎并非算法,而是数据采集的兼容性。厂区内存在大量不同年代、不同协议的设备(如西门子、发那科、国产定制系统等),形成了严重的 “数据孤岛”。


痛点复盘:早期尝试直接对接 PLC 时,发现协议解析耗时占项目周期的 60%,且老旧设备无数据接口。


解决方案:在多次验证后,我们放弃了单一云端采集路径,选择边缘 + 平台协同架构,通过在设备侧开发轻量级适配插件,统一将多源异构数据清洗为标准化的 MQTT 协议,再上传至工业互联网平台,如图 1 所示。


图 1 智能制造总体架构图


成效:实现了全厂1000+台关键设备的数据实时采集,设备联网率从 10% 提升至 98%,数据采集延迟控制在毫秒级,为上层应用奠定了坚实基础。


治理:从 “数据湖” 到 “数据资产”


数据通了不代表数据可用,我们制定了《主数据管理规范》,如图 2 所示,统一了物料、设备、工艺参数等12类核心主数据标准,清洗了历史遗留的重复、冗余及格式错误数据。


图 2 高质量语料数据收集存储


价值转化:高质量的数据底座使得跨系统分析成为可能,方便模型训练使用、大模型检索、智能体应用调用,并通过不断丰富数据集和提升数据质量,持续增强模型应用效果和准确率。


进阶:场景驱动,从 “感知” 走向 “认知”


在完成数字底座建设之后,我们并未急于引入复杂模型,而是围绕业务核心痛点,逐步构建分层智能化能力体系。


在实践中,我们将智能化能力建设划分为三个阶段:


⑴数据感知能力 - 让生产过程 “透明化”;


⑵预测分析能力 - 让异常风险 “可预见”;


⑶认知辅助能力 - 让复杂问题 “可解释”。


数据感知能力建设:让现场 “看得见”


⑴视觉检测能力升级。


尤其在工业场景中,缺陷样本具有 “小样本、不均衡” 的典型特征 —— 某些关键缺陷出现频率低,但一旦漏检后果严重。传统 CNN 模型往往需要大量标注样本进行训练,数据准备成本高,模型迭代周期长。


我们尝试引入基于 Transformer 架构的视觉模型进行验证。相较于传统卷积网络依赖局部特征提取的方式,在复杂锻件背景下,模型对结构特征的识别能力明显提升,能够更好捕捉复杂背景下的结构信息,在小样本条件下展现出更强的泛化能力。


⑵设备运行状态实时感知。


如图 3 所示,在设备侧,我们通过边缘计算网关实现关键设备数据接入,采集振动、温度、电流等多维运行参数。这一能力的建设,使设备从 “事后故障处理” 模式,逐步转向 “状态可视化管理”。


图 3 设备运行状态


阶段性成果包括:


①全厂关键设备运行状态实时可视;


②异常波动可触发即时提醒;


③数据沉淀为后续预测模型提供基础。


这一阶段的核心意义在于:建立 “可感知” 的生产现场。没有感知能力,预测与智能均无从谈起。


预测分析能力建设:让风险 “早知道”


在感知能力稳定后,我们开始探索预测类模型应用,目标是降低非计划停机与质量波动风险。


⑴设备预测性维护模型。


针对核心加工设备,我们结合数据增强策略进行小范围验证,并持续优化模型参数。


实际价值体现在:提前识别异常趋势、优化维修计划安排、降低突发停机概率。


⑵质量波动趋势识别。


结合 MES 与 QMS 数据,我们建立质量参数波动趋势分析模型,识别关键变量对良率的影响。这一能力并不直接进行自动纠偏,而是为工艺工程师提供趋势参考与决策支持。


其核心目标在于:提高问题定位效率、减少经验判断的不确定性、增强数据支撑能力。


跃迁:大模型(LLM)的深度落地与实践


如果说前期的数字化建设解决了 “数据有没有” 的问题,那么大模型探索解决的则是 “数据能不能用得更聪明” 的问题。我们并未将大模型视为 “成熟工具直接复制”,而是定位为一项需要在工业场景中不断试错、验证与迭代的新能力体系,如图 4 所示。


图 4 智能体平台


构建 “工艺助手”:知识资产活化的第一步


锻造行业的核心竞争力之一,是长期积累的工艺经验与问题处理案例。然而这些知识分散在各种文件资料中。


我们首先做的,并不是训练模型,而是进行知识数字化与结构化梳理。目前阶段,通过文档 OCR 与结构化处理、建立向量数据库、引入私有化大模型构建 RAG 架构及对话式验证问题,主要解决知识检索效率问题,尚未形成参数自动优化能力,我们将其定位为 “工艺辅助参考系统”,而非 “自动决策系统”。


例如工程师可通过自然语言提问(如:“某型号齿轮锻件出现充不满缺陷,历史上有哪几种解决方案?”),系统可以检索相似案例并进行归纳总结,但最终参数调整仍需工程师确认。


这一步探索的意义在于:新工程师能够快速掌握历史经验,复杂问题可快速定位相似案例,知识不再依赖个体记忆。我们认为,这一阶段的价值不在于 “替代专家”,而在于放大专家能力。


设备预测性维护中的大模型融合探索


在设备领域,问题在于:故障样本稀缺、不同设备之间泛化能力弱、异常诊断解释性不足。如图 5 所示,我们开始尝试引入大模型能力做三件事。


图 5 设备维修 AI 智能助手应用


故障知识语义关联:将维修记录与设备参数进行语义关联分析,寻找潜在因果模式。


生成式数据增强:基于正常运行数据生成异常扰动样本,用于扩充训练集,目前仍在小规模验证。


故障解释能力增强:当预测模型提示风险时,大模型可将复杂时序特征转化为 “可读解释”,辅助设备工程师判断,当前阶段更偏向解释增强,而非预测能力突破。


ChatBI:从报表工具到对话助手


在经营管理层面,公司积极探索智能化数据应用,部署了对话式 BI 原型系统,面向管理层开展小范围试用。


该系统基于大模型能力,实现了自然语言转 SQL 查询及基础数据图表自动生成,使管理人员能够通过对话方式快速获取所需经营数据。在实际应用过程中,大模型虽然显著提升了数据分析响应效率,使非技术人员也能便捷开展数据查询与初步分析工作。但与此同时,也存在对复杂业务指标理解存在偏差等问题。


基于当前技术成熟度与应用效果评估,我们将该系统明确定位为 “数据查询助手”,作为辅助工具提升数据获取效率,而非直接承担经营决策职能的核心系统。


代码与自动化:研发效能倍增


在 IT 团队内部,我们引入编程大模型辅助代码编写、接口生成和测试用例生成。目前阶段主要用于前端页面生成、接口样板代码编写、SQL 优化建议等。


整体开发效率提升 20%~30%,但核心架构设计与安全控制仍由工程师完成。


理性认知:大模型应用需回归工业本质


在实践过程中,我们逐步形成了对工业大模型应用的几项理性判断。与消费互联网场景不同,锻造制造属于高风险、高复杂度的工程系统,大模型的应用必须建立在清晰的能力认知与边界控制之上。


大模型无法替代工业专业判断


工业生产具有以下特征:强因果逻辑、多变量耦合、结果不可逆、质量责任刚性,在此类场景中,任何模型输出都必须经过工程验证。


我们始终坚持:大模型是 “认知增强工具”,而不是 “自动决策主体”。在工艺调整、质量判定、设备处置等关键节点,最终决策权仍由专业工程师掌握。


我们更关注的:是否提升问题定位效率、是否缩短知识检索时间、是否增强复杂问题的认知广度,而不是追求 “完全自动化决策”。


RAG 架构是工业落地的必要前提


通用大模型在开放语境下具有创造力,但工业场景强调 “准确性” 和 “可追溯性”。


在早期测试中,我们曾发现:模型回答具备逻辑性,但缺乏事实依据,对专业术语理解存在偏差,在缺少数据支撑时出现 “合理但错误” 的推断。


因此,我们明确采用检索增强生成(RAG)架构:所有回答必须基于企业知识库片段、输出附带来源引用、低置信度回答触发人工确认机制。这一机制将大模型从 “生成型工具” 转化为 “知识增强工具”。


数据治理优先级高于模型能力


在探索初期,我们曾一度将关注点集中在模型效果优化上。但实践证明:


主数据不统一→模型无法稳定识别实体;历史数据缺失→无法构建有效训练集;工艺记录不规范→语义向量质量下降。


这使我们意识到:模型能力的上限,取决于数据治理的下限。只有底座稳定,模型应用才具备持续演进能力。


坚持 “小场景验证” 的渐进策略


在行业热潮中,全面铺开大模型应用看似 “战略积极”,但风险极高。


我们采取的是单点突破→效果量化→风险评估→有序扩展。


目前,大模型应用仍以工艺知识问答、数据查询辅助、运维解释增强为主,尚未进入自动控制或闭环决策领域。


人机协同,而非技术替代


另一个关键观察:技术本身并不会改变组织,应用方式才会。我们避免将大模型定位为 “效率替代工具”,而更强调:


⑴帮助工程师更快找到答案;


⑵帮助管理者更快理解数据;


⑶帮助新员工缩短成长周期。


在内部推广时,我们始终强调:AI 增强的是能力,而不是岗位。


在本阶段,我们对工业大模型的理解已从 “技术兴奋” 逐步回归 “工程理性”。对于锻造行业而言,大模型真正的价值不在于炫目的算法能力,而在于:


⑴能否沉淀企业知识资产;


⑵能否提高复杂问题处理效率;


⑶能否提升决策透明度与可解释性。


这是一条长期演进之路,而非短期革命。


未来展望


下一阶段,我们将继续沿着 “场景驱动、稳步验证” 的原则推进大模型应用:


⑴探索生成式研发工艺设计辅助;


⑵推进多模态模型在缺陷图像 + 工艺参数联合分析中的应用;


⑶构建企业级智能体平台,实现跨系统调用能力;


⑷探索 AI 在质量异常自动归因分析中的应用。


我们坚信,对于传统锻造企业而言,智能化不是一次技术升级,而是一场能力重构。从数字底座到模型驱动,我们仍在路上。精锻科技愿以开放的姿态,与行业同仁共同探索工业大模型的真正边界与价值。



原文刊载于《锻造与冲压》 2026年7月 作者:江苏太平洋精锻科技股份有限公司 宋伟


暂无评论,等你抢沙发

  • 短信登录
  • 密码登录
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
注册
已有账号, 立即登录
登录即代表您同意本网站的 《用户注册协议》
找回密码