从数字底座到模型驱动：智能化演进与大模型探索

宋伟

2026-05-07

AI大模型

导语：本文将从数字底座构建谈起系统梳理小样本＋大模型混合架构在工业复杂场景中的实践路径与理性思考

过去十年，江苏太平洋精锻科技股份有限公司（以下简称 “精锻科技”）完成了 PLM、ERP、MES、EAM、QMS 等核心系统建设，实现了从流程驱动到数据驱动的阶段性跨越。然而，站在新的竞争环境下，我们面临的核心问题已从 “业务是否数据化” 转变为 “数据是否真正赋能业务”。

在良率提升空间日趋收窄、交付节奏高度压缩的背景下，传统经验判断与报表分析难以满足精细化运营需求。驱动变革的并非技术浪潮本身，而是市场对质量、效率与响应能力的更高要求。

基于此，我们将转型重心聚焦于 “数据业务化”—— 以人工智能，特别是大模型技术为关键支点，激活沉淀在系统中的海量数据资产。本文将从数字底座构建谈起，系统梳理 “小样本 + 大模型” 混合架构在工业复杂场景中的实践路径与理性思考。

筑基：打破孤岛，构建高韧性数字底座

挑战：异构设备的 “语言障碍”

在转型初期，我们面临的最大拦路虎并非算法，而是数据采集的兼容性。厂区内存在大量不同年代、不同协议的设备（如西门子、发那科、国产定制系统等），形成了严重的 “数据孤岛”。

痛点复盘：早期尝试直接对接 PLC 时，发现协议解析耗时占项目周期的 60%，且老旧设备无数据接口。

解决方案：在多次验证后，我们放弃了单一云端采集路径，选择边缘 + 平台协同架构，通过在设备侧开发轻量级适配插件，统一将多源异构数据清洗为标准化的 MQTT 协议，再上传至工业互联网平台，如图 1 所示。

图 1 智能制造总体架构图

成效：实现了全厂1000+台关键设备的数据实时采集，设备联网率从 10% 提升至 98%，数据采集延迟控制在毫秒级，为上层应用奠定了坚实基础。

治理：从 “数据湖” 到 “数据资产”

数据通了不代表数据可用，我们制定了《主数据管理规范》，如图 2 所示，统一了物料、设备、工艺参数等12类核心主数据标准，清洗了历史遗留的重复、冗余及格式错误数据。

图 2 高质量语料数据收集存储

价值转化：高质量的数据底座使得跨系统分析成为可能，方便模型训练使用、大模型检索、智能体应用调用，并通过不断丰富数据集和提升数据质量，持续增强模型应用效果和准确率。

进阶：场景驱动，从 “感知” 走向 “认知”

在完成数字底座建设之后，我们并未急于引入复杂模型，而是围绕业务核心痛点，逐步构建分层智能化能力体系。

在实践中，我们将智能化能力建设划分为三个阶段：

⑴数据感知能力 - 让生产过程 “透明化”；

⑵预测分析能力 - 让异常风险 “可预见”；

⑶认知辅助能力 - 让复杂问题 “可解释”。

数据感知能力建设：让现场 “看得见”

⑴视觉检测能力升级。

尤其在工业场景中，缺陷样本具有 “小样本、不均衡” 的典型特征 —— 某些关键缺陷出现频率低，但一旦漏检后果严重。传统 CNN 模型往往需要大量标注样本进行训练，数据准备成本高，模型迭代周期长。

我们尝试引入基于 Transformer 架构的视觉模型进行验证。相较于传统卷积网络依赖局部特征提取的方式，在复杂锻件背景下，模型对结构特征的识别能力明显提升，能够更好捕捉复杂背景下的结构信息，在小样本条件下展现出更强的泛化能力。

⑵设备运行状态实时感知。

如图 3 所示，在设备侧，我们通过边缘计算网关实现关键设备数据接入，采集振动、温度、电流等多维运行参数。这一能力的建设，使设备从 “事后故障处理” 模式，逐步转向 “状态可视化管理”。

图 3 设备运行状态

阶段性成果包括：

①全厂关键设备运行状态实时可视；

②异常波动可触发即时提醒；

③数据沉淀为后续预测模型提供基础。

这一阶段的核心意义在于：建立 “可感知” 的生产现场。没有感知能力，预测与智能均无从谈起。

预测分析能力建设：让风险 “早知道”

在感知能力稳定后，我们开始探索预测类模型应用，目标是降低非计划停机与质量波动风险。

⑴设备预测性维护模型。

针对核心加工设备，我们结合数据增强策略进行小范围验证，并持续优化模型参数。

实际价值体现在：提前识别异常趋势、优化维修计划安排、降低突发停机概率。

⑵质量波动趋势识别。

结合 MES 与 QMS 数据，我们建立质量参数波动趋势分析模型，识别关键变量对良率的影响。这一能力并不直接进行自动纠偏，而是为工艺工程师提供趋势参考与决策支持。

其核心目标在于：提高问题定位效率、减少经验判断的不确定性、增强数据支撑能力。

跃迁：大模型（LLM）的深度落地与实践

如果说前期的数字化建设解决了 “数据有没有” 的问题，那么大模型探索解决的则是 “数据能不能用得更聪明” 的问题。我们并未将大模型视为 “成熟工具直接复制”，而是定位为一项需要在工业场景中不断试错、验证与迭代的新能力体系，如图 4 所示。

图 4 智能体平台

构建 “工艺助手”：知识资产活化的第一步

锻造行业的核心竞争力之一，是长期积累的工艺经验与问题处理案例。然而这些知识分散在各种文件资料中。

我们首先做的，并不是训练模型，而是进行知识数字化与结构化梳理。目前阶段，通过文档 OCR 与结构化处理、建立向量数据库、引入私有化大模型构建 RAG 架构及对话式验证问题，主要解决知识检索效率问题，尚未形成参数自动优化能力，我们将其定位为 “工艺辅助参考系统”，而非 “自动决策系统”。

例如工程师可通过自然语言提问（如：“某型号齿轮锻件出现充不满缺陷，历史上有哪几种解决方案？”），系统可以检索相似案例并进行归纳总结，但最终参数调整仍需工程师确认。

这一步探索的意义在于：新工程师能够快速掌握历史经验，复杂问题可快速定位相似案例，知识不再依赖个体记忆。我们认为，这一阶段的价值不在于 “替代专家”，而在于放大专家能力。

设备预测性维护中的大模型融合探索

在设备领域，问题在于：故障样本稀缺、不同设备之间泛化能力弱、异常诊断解释性不足。如图 5 所示，我们开始尝试引入大模型能力做三件事。

图 5 设备维修 AI 智能助手应用

故障知识语义关联：将维修记录与设备参数进行语义关联分析，寻找潜在因果模式。

生成式数据增强：基于正常运行数据生成异常扰动样本，用于扩充训练集，目前仍在小规模验证。

故障解释能力增强：当预测模型提示风险时，大模型可将复杂时序特征转化为 “可读解释”，辅助设备工程师判断，当前阶段更偏向解释增强，而非预测能力突破。

ChatBI：从报表工具到对话助手

在经营管理层面，公司积极探索智能化数据应用，部署了对话式 BI 原型系统，面向管理层开展小范围试用。

该系统基于大模型能力，实现了自然语言转 SQL 查询及基础数据图表自动生成，使管理人员能够通过对话方式快速获取所需经营数据。在实际应用过程中，大模型虽然显著提升了数据分析响应效率，使非技术人员也能便捷开展数据查询与初步分析工作。但与此同时，也存在对复杂业务指标理解存在偏差等问题。

基于当前技术成熟度与应用效果评估，我们将该系统明确定位为 “数据查询助手”，作为辅助工具提升数据获取效率，而非直接承担经营决策职能的核心系统。

代码与自动化：研发效能倍增

在 IT 团队内部，我们引入编程大模型辅助代码编写、接口生成和测试用例生成。目前阶段主要用于前端页面生成、接口样板代码编写、SQL 优化建议等。

整体开发效率提升 20%~30%，但核心架构设计与安全控制仍由工程师完成。

理性认知：大模型应用需回归工业本质

在实践过程中，我们逐步形成了对工业大模型应用的几项理性判断。与消费互联网场景不同，锻造制造属于高风险、高复杂度的工程系统，大模型的应用必须建立在清晰的能力认知与边界控制之上。

大模型无法替代工业专业判断

工业生产具有以下特征：强因果逻辑、多变量耦合、结果不可逆、质量责任刚性，在此类场景中，任何模型输出都必须经过工程验证。

我们始终坚持：大模型是 “认知增强工具”，而不是 “自动决策主体”。在工艺调整、质量判定、设备处置等关键节点，最终决策权仍由专业工程师掌握。

我们更关注的：是否提升问题定位效率、是否缩短知识检索时间、是否增强复杂问题的认知广度，而不是追求 “完全自动化决策”。

RAG 架构是工业落地的必要前提

通用大模型在开放语境下具有创造力，但工业场景强调 “准确性” 和 “可追溯性”。

在早期测试中，我们曾发现：模型回答具备逻辑性，但缺乏事实依据，对专业术语理解存在偏差，在缺少数据支撑时出现 “合理但错误” 的推断。

因此，我们明确采用检索增强生成（RAG）架构：所有回答必须基于企业知识库片段、输出附带来源引用、低置信度回答触发人工确认机制。这一机制将大模型从 “生成型工具” 转化为 “知识增强工具”。

数据治理优先级高于模型能力

在探索初期，我们曾一度将关注点集中在模型效果优化上。但实践证明：

主数据不统一→模型无法稳定识别实体；历史数据缺失→无法构建有效训练集；工艺记录不规范→语义向量质量下降。

这使我们意识到：模型能力的上限，取决于数据治理的下限。只有底座稳定，模型应用才具备持续演进能力。

坚持 “小场景验证” 的渐进策略

在行业热潮中，全面铺开大模型应用看似 “战略积极”，但风险极高。

我们采取的是单点突破→效果量化→风险评估→有序扩展。

目前，大模型应用仍以工艺知识问答、数据查询辅助、运维解释增强为主，尚未进入自动控制或闭环决策领域。

人机协同，而非技术替代

另一个关键观察：技术本身并不会改变组织，应用方式才会。我们避免将大模型定位为 “效率替代工具”，而更强调：

⑴帮助工程师更快找到答案；

⑵帮助管理者更快理解数据；

⑶帮助新员工缩短成长周期。

在内部推广时，我们始终强调：AI 增强的是能力，而不是岗位。

在本阶段，我们对工业大模型的理解已从 “技术兴奋” 逐步回归 “工程理性”。对于锻造行业而言，大模型真正的价值不在于炫目的算法能力，而在于：

⑴能否沉淀企业知识资产；

⑵能否提高复杂问题处理效率；

⑶能否提升决策透明度与可解释性。

这是一条长期演进之路，而非短期革命。

未来展望

下一阶段，我们将继续沿着 “场景驱动、稳步验证” 的原则推进大模型应用：

⑴探索生成式研发工艺设计辅助；

⑵推进多模态模型在缺陷图像 + 工艺参数联合分析中的应用；

⑶构建企业级智能体平台，实现跨系统调用能力；

⑷探索 AI 在质量异常自动归因分析中的应用。

我们坚信，对于传统锻造企业而言，智能化不是一次技术升级，而是一场能力重构。从数字底座到模型驱动，我们仍在路上。精锻科技愿以开放的姿态，与行业同仁共同探索工业大模型的真正边界与价值。

原文刊载于《锻造与冲压》 2026年7月作者：江苏太平洋精锻科技股份有限公司宋伟

暂无评论,等你抢沙发

特别推荐

对话侯康选：从“抢修”到“预防”，智能IT运维的正确打开方式

中小企业数字化转型框架与总路线图

一周热榜