劳动与演化:具身智能架构与工程实践

导语:具身机器人具身模拟器和具身交互系统都获得了较多的发展拥有更强探索能力的 EAI 系统已经应用于工业服务业军事等诸多领域

一、研究背景


当前, 随着以人工智能技术为核心的新一代信息技术的迅猛发展, 世界各国都在抢占这一高地, 以求在新一轮技术变革中确立引领者的身份。习近平总书记深刻把握世界科技发展大势, 深刻洞察人工智能的战略意义, 指出:“人工智能是引领这一轮科技革命和产业变革的战略性技术, 具有溢出带动性很强的’头雁’效应”“加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题”。在人工智能领域, 各项技术浪潮此起彼伏, 例如大模型、共身智能、通用人工智能等多项概念和技术都对我国制造业发展具有启示意义。其中, 具身智能(EAI)的概念虽然早在多年前已经具备雏形, 但在新一代人工智能及先进信息通信技术的赋能下, 在新一轮信息技术革命中焕发出全新活力。


简而言之, EAI理论挑战了传统认知科学中将认知活动视为大脑独立运作的观点, 强调身体与环境的交互在认知过程中的重要性。该理论认为, 认知并非仅发生在大脑内部, 而是大脑、身体和环境协同作用的结果。受环境影响并从环境中不断学习的EAI也会不断地对外界的环境产生影响。这一思想不仅是人工智能方法中强化学习方法的进一步延伸, 还蕴含着很深刻的哲学思想。结合马克思主义自然辩证法分析, EAI的强大认知能力源于两点:“劳动创造人本身”和”人是一切社会关系的总和”。


“劳动创造人本身”揭示了人类对劳动的作用以及劳动对人类的塑造作用。劳动包含劳动者、劳动对象和劳动资料三个部分, 它是一个反复的、不断进化的过程。在EAI背景下, 劳动者的劳动形式在体力劳动和脑力劳动的基础上拓展出了赛博劳动, EAI也获得了劳动者的身份; 劳动资料则是从机械化、自动化的阶段逐步向着智能化的阶段过渡; 劳动对象则从原来的物理空间对象, 逐步过渡到了赛博空间和物理空间兼具, 甚至可能包含人所在的社会空间的内容, 例如数据就是一种新的、典型的劳动对象。EAI作为劳动者, 使用了新一代人工智能和大语言模型等技术赋能的劳动资料, 对包括数据在内的新型劳动对象开展劳动, 而EAI本身则在这一过程中不断地学习、理解、进化和自组织, 这就是EAI的”劳动创造EAI本身”。


“人是一切社会关系的总和”从社会关系的角度分析了人类存在的复杂性。EAI不仅会和环境, 也会与人类以及其他的EAI发生交互。在和EAI交互的过程中, 人类会不断地将自己的知识灌输给EAI, 而EAI的行为也会对人类的行为方式乃至价值判断产生影响。不同的EAI之间存在的交互、合作或博弈的关系同样也会促进双方的不断进化。每一时刻的EAI都会受到其周围关系的影响, 这就是EAI的”EAI是一切关系的总和”。


从科学角度而言, 如图1所示, EAI的发展受到了较多科学和工程技术的影响。EAI在填补人工智能领域空白的同时, 也可以和当前的人工智能技术集成, 如大语言模型、多模态大模型都可以和EAI开展互操作。将上层的任务分解为可执行的行动, 则依赖于规划、决策等相关技术来实现; 具体的活动执行则需要借助于控制算法、多模态主动感知等基础技术手段的支持。与人类类似, 不同的技术分别对应了系统的不同层次。同时, 为了良好地与环境交互, 对环境中所涉及的大系统也需要进行分析, 如社会系统、赛博—物理系统(CPS)、物理环境和虚拟环境都应当属于EAI的研究范畴。最后, 智能系统如何与环境开展交互, 并且在交互过程中不断地演化, 也是系统的重要研究方向。可见, EAI并非对传统的AI、机器人和认知科学的颠覆, 而是提出了一种有机的集成平台。


随着EAI融入现实世界, 它在缓解劳动性别分工、重复劳作等方面都有着较为突出的作用, 并在进一步打破时空边界、拓展关系网络的同时, 降低了部分合作的门槛。然而, EAI的行动力也会带来权力和责任的分配问题, 如何充分发挥交互中的创造效应而非放大EAI对人类的替代作用, 解放人类的工作热情, 也是非常重要的研讨课题。同时, 让没有情感的EAI在逐步的迭代学习中给予人类真正的温暖, 而不是在纯粹的计算下依赖人类的移情, 或许才是AI系统的一个初衷。


不难发现, 无论是EAI的哲学思想, 还是EAI 的理论和技术, 亦或者是对现实世界产生的影响, 都是一个多领域、多层次的复杂问题, 依赖于系统性的思考和方法。


面对EAI这一复杂的集成系统, 本文首先从科学和技术进步的角度探讨其背景, 并结合自然辩证法探讨了其存在的合理性与价值, 以及对未来可能产生的影响。本文旨在提出一套可以指导工程落地实践的框架, 在支持矿山系统升级部署方案的同时, 提供一套完整且具有可迁移性的架构设计方案。


二、具身智能研究现状


当前, EAI已经在较多行业中得到了充分的应用和发展, 并呈现出诸多不同的形式。拥有智能模块和物理实体的智能机器人, 在不断地与环境交互中学习, 是EAI的一个重要研究方向。例如, 社交机器人Pepper(Softbank Robotics)能够识别情绪并进行自然语言交流; 仿生设计方法也能帮助机器人从结构和行为层次上进行适应。通过如虚拟现实、增强现实、世界模型等技术的支持, EAI也被赋予了更多的能力, 人类作为外部环境中的重要组成部分, 如何在与人类的交互过程中学习和理解, 是EAI进化的重要环节。EAI可以从隐含的指令中推理人类的意图。人类也可能直接参与到EAI体的感知、行动、推理等过程中, 协助EAI体进行交互和进化。不难发现, EAI的范畴不仅仅包含存在于真实世界的实体产物, 也包含存在于虚拟世界的产物。同时, 和外界交互的对象并不局限于物理环境, 也包含了数据等虚拟世界以及同样具有身体的人类。

图 1 EAI 的研究范畴


EAI在具备和外界交互能力的同时, 其自我调节、自主进化能力也是被大家所关注的重要特征。瓦特的蒸汽机离心调速器和人工智能的行为主义学派强调了结构和行为对学习和演化的重要性, 这也正是EAI的一个重要基础。


当前, 针对EAI也有较多的架构性描述和思考。尽管已经有较多理论和技术支持EAI的发展, 但当前研究还存在元模型与体系结构框架的领域化特点突出, EAI系统的层级、结构、行为与演化的关系不明确, EAI系统与环境的交互形式依然没有被完全发掘等诸多顶层逻辑上的问题。因此, 本文旨在从顶层架构上开展对EAI的分析, 希望对EAI的发展和多学科的集成起到支持作用。


三、具身智能的架构推导参考方案


体系结构、方法论、系统建模与系统评价是解决复杂管理技术融合系统认知、分析、设计、集成问题的有效方法。针对复杂系统的认知、集成和互操作问题, ISO/IEC/IEEE 42010:2022《软件、系统和企业体系结构描述》揭示了体系结构描述应当如何定义复杂系统的特性, 并揭示了体系结构的构建和使用方式: 从干系人的关注点出发, 通过多视角的方法构建系统的体系架构描述, 进而形成参考模型, 支持复杂系统的设计与实施。


(一)具身智能的架构构建方法论


结合第二章的论述不难发现, EAI不仅是一个被人类关注的被动实体, 还是一个可以对世界产生影响的主动关注者。因此, 有必要对ISO/IEC/IEEE 42010:2022标准所提出的架构构建方法进行改造, 使其更加适用于EAI环境。


(1)“人—人工智能”双向认知互操作的背景下, 具备不断和环境发生交互并影响环境的EAI, 也可以用ISO/IEC/IEEE 42010:2022标准指导其构建架构。EAI的本体一般是研究聚焦的重点, 对应元架构中的”感兴趣实体”, 即目标实体部分。同时, 鉴于EAI对环境的持续影响性, 其交互环境既可以作为目标实体的一部分, 也可以作为系统外部的环境。此外, 作为EAI需要理解的对象, 人类可能也会作为目标实体出现。


(2)EAI的利益相关者包含两个部分: 一方面是传统利益相关者群体, 如设计者、使用者和其他参与方; 另一方面则是EAI(本体和交互环境)。被关注的EAI能够进行自我演化和发展, 这正是对其自我关注与改造的过程。同时, 不断发展的技术也使EAI具有改造其他EAI的能力, 这是另一种关注和影响。


(3)EAI的环境部分不仅包含物理外界环境和虚拟环境, 还有可能是受其他影响的人类与社会环境以及同类的EAI。此时, 利益相关者、目标实体以及环境三者实现了统一, 验证了所提出的面向人和人工智能双向认知互操作的系统元架构。


(4)EAI具有较多的客观属性。其中一类客观属性呈现出分级特点。无论是EAI的本体, 还是EAI所交互的环境, 均呈现出典型的分级特点。不同层级对应了不同能力, 从群体协同到任务规划, 再到基本的感知控制, 能从不同维度进行支持。


(5)不同利益相关者从不同问题视角审视EAI, 会产生不同的关注点和视角。美国联邦企业架构提供了一种典型的从多个视角维度观察复杂系统的方法。该方法从性能目标、业务逻辑、数据结构、应用服务、基础设施和系统安全六个视角出发, 探究了系统的不同方面。


(6)为了描述EAI这一典型的复杂系统, 需要体系架构的支持。综合上述对核心要点、主观视角和客观维度的分析, 构建了从三个维度描述系统的EAI架构: 首先, 需要描述系统的客观维度, 此角度需要对系统不同的核心要素进行分析, 并对其进行层级维度划分; 其次, 需要从主观视角对不同的核心要素进行从结构、行为到评价的全面描述; 最后, 需要一个环节将不同的要素关联起来, 使其成为一个完整的EAI, 并将这一循环称为具身循环。


本文所提出的EAI架构元模型如图2所示。

图2 人 —AI 双向认知与互操作语境下的 ISO/IEC/IEEE 42010:2022 架构元模型


然而, 仅有体系结构的元模型很难直接指导架构的构建。为了更加明确地描述架构构建的进程, 本研究利用事件驱动的过程链描述了EAI架构的构造过程, 如图3所示。

图 3 EAI 体系架构的构造流程


(1)基于利益相关者提出的关键需求, 对EAI系统开展较为全面的需求关系分析, 进而确定EAI系统中的关键要素。通过关键要素即可确定系统的元模型形式, 从而开展对系统的进一步描述。


(2)基于元模型开始拓展, 结合架构元模型中提出的客观角度和视角, 分析EAI系统所存在的客观层级维度和主观视角, 进而开展详细的分析。同时, EAI系统和环境的交互也是其关键特征, 因此需要分析其与环境交互的关系, 即具身循环。


(3)基于所提出的EAI系统的不同维度, 提出EAI系统的体系架构, 在此基础上, 进一步构建其不同维度的参考模型, 通过与现实系统进行映射和验证, 最终确定架构构建的合理性, 形成完整的体系结构。


由于篇幅所限, 本文的架构推导理论部分只讨论到构建体系结构框架的部分, 而具体架构和参考模型的构建则通过案例进行体现。


(二)具身智能的干系人分析与元模型构建


基于图3所示的流程, 首先分析EAI系统的核心需求。结合第二章的综述部分可知, EAI应当包括: 能够通过行动影响外界环境的本体, 具备认知、理解和决策能力的智能体, 不断和外界环境交互并演化的过程以及流动在环境和EAI系统之间的数据。其关系如图4所示。

图 4 EAI 的基本要素


基于EAI的基本要素, 中国信息通信研究院等机构提出了EAI系统的利益相关者分析, 本研究尝试对其进行整合, 得到如图5所示的利益相关者及关注点分析。从EAI系统的产业链角度分析, 产业链上游主要关注具体的部件技术, 中游关注当前先进信息技术和智能技术的赋能作用, 而下游则直接关注产品的服务和应用场景。在产业链的每个阶段都会涉及技术人员、使用者和管理者等不同的利益相关者。

图 5 EAI 系统的利益相关者和主要关注点分析


结合系统的基本要素, 进一步分析典型干系人和关注点, 本研究提出了如图6所示的EAI系统元模型。

图 6 EAI 系统元模型


(1)EAI具备从环境中感知、理解信息, 通过决策和执行对环境产生影响, 同时利用被影响后的环境进行新一轮迭代的能力, 在这个过程中不断进行自我提升革新。因此, EAI可以分为两个子模块: EAI本体和与EAI发生交互的环境。


(2)EAI的本体具有认知世界、理解世界、改造世界并再次理解世界这一循环往复的能力。因此, EAI的本体必然包括赛博系统。当被改造的世界是物理世界时, EAI的本体则应当是包含了物理系统的CPS。


(3)并非所有的CPS都是一个EAI的本体, 如果这个CPS没有改造和影响外界环境并接收外界环境变化所带来影响的能力, 那么它就不是一个EAI的本体。如一台和电脑相连接的打印机, 就并非一个合理的EAI本体。因为它既不具备能够理解外界环境的能力, 更不会基于环境的变化(卡纸、打印错误)进行自我调节, 但是其物理组件和内部存在的赛博指令都决定了其是一个典型的CPS。


(4)EAI发生交互的环境一般是物理环境, 即人类和物质所存在的环境。但是, 随着技术的不断发展, 如虚拟现实(VR)、增强现实(AR)和数字孪生等技术的应用, 虚拟环境和现实环境间的边界已经逐渐被打破。因此, EAI发生交互的环境不仅可能存在于物理空间, 更有可能存在于赛博空间。


(5)人类作为一个较为特殊的存在, 本身具有认知和改造世界的能力。因此, EAI也会发生和人类的交互, 人类也是EAI的交互”环境”之一。因此, EAI的交互环境应当包含赛博系统、物理系统和社会系统, 其相互之间也可能发生组合, 即其交互的环境是一个赛博—物理—社会系统(CPSS)。


(6)整合EAI的本体和EAI交互的环境不难发现, EAI的本体是CPSS的一个子系统, 而EAI所交互的环境同样是一类CPSS。因此, 二者共同构成的EAI应当是一个特殊的CPSS。


EAI整体是一个典型的CPSS, 而EAI本体也是一个特殊的CPS。因此, 可以使用针对CPS和CPSS的相关理论和技术方法开展分析。


四、具身智能的架构框架


在构建了系统元模型后, 需要分析系统的客观维度和主观视角。在接下来的讨论中, 如无特殊情况, 本研究假设EAI主体是一个包含赛博系统和物理系统的CPS。元模型指出EAI是一个典型的CPSS, 文章针对CPSS分析了系统所存在的层级结构, 包括ISA-95的客观层次结构以及FEAF 2.0的六个主观视图维度。FEAF 2.0的视角可以分为两个部分: 业务架构和技术架构。鉴于系统的行为和结构决定了系统的演化, 而系统的演化结果对系统的结构和行为起到反作用, 不妨将FEAF 2.0的层级维度改造映射为结构(数据、基础设施)、行为(业务、应用)和评价三个视图。


目前, 关于CPS和CPSS的主观视角已经有了较多的研究。在结构层面, 信息物理系统白皮书(2017)指出: CPS分为单元级、系统级和体系级别, 并给出了每个层级内的具体要素; 在功能和行为层级上, 德国工业4.0、美国工业互联网参考体系结构都提出了从业务逻辑到中间的分析处理, 再落实到底层实现的思路; 无论是哪个模块的划分, 它都可以映射到ISA-95提出的CPSS客观层级结构: 控制(LV0-2)、管控集成(LV3)、企业层级(LV4)和行业协同(LV5)。其对应关系如图7所示。不难发现, 对EAI的主观讨论总是需要基于客观层级的划分; 反之, EAI的客观层级研究需要依托于主观视角的分析, 二者共同构成了EAI的架构视点(Aspect)和架构视角(Perspective)。

图 7 EAI 的客观层次和主观视角的关联


客观层级之间存在数据、信息等要素的流动, 从而在和外部环境交互的同时, 指导各层级有条不紊地开展工作; 同时, 主观视角内容也会随着EAI的不断行动而发生演化。这一过程被称为”Embodied Loop”, 即元模型中所提到的, 将环境和EAI主体联系起来的关联性要素。在辨析出元模型、客观层次和主观视角后, 本研究所构建的系统体系结构如图8所示。

图 8 EAI 体系结构框架


首先, 架构中包含了EAI的核心要素, 即EAI 主体和EAI环境。EAI主体承担了基础的感知、执行和控制功能以及进阶的分析和决策功能, 乃至于高级的学习进化能力, 从而实现不断接收环境影响, 并在对吸收内容进行内化的同时, 对外界环境产生新的影响。而EAI环境则需要探讨在不同场景下, 环境对EAI主体的影响作用, 研究环境是如何在EAI主体的作用下产生变化。二者相辅相成, 共同构成了EAI的一对主体。


其次, 架构指出了无论是EAI主体还是EAI环境, 都应当具有三个主观视角的描述: 结构、行为和性能三个层级。结构层级需要对EAI系统的要素及其关联性进行阐述, 阐述EAI系统所涉及的软硬件选型、系统的部署关系、数据和模型的类型等; 行为层级则阐述系统的具体功能和时序逻辑活动, 如机器人的行动任务和活动分解、具身问答的交互状态转换。性能层级一方面对系统提出需求, 另一方面, 为认知和行为效果的判断提供评价依据, 并推动相关智力能力、行为和结构的不断升级。对于系统的评价, 应从三个主要视角进行: 自动化、自主化和智能化。自动化的等级评价体现了一项活动中需要人类参与的程度; 自主性等级评价不仅呈现了脱离人的干预的能力, 更重要的是其超越预设规则的随机应变能力以及对环境的适应性特点; 而智能化则进一步强化了智能体对环境的适应性和预测性要求, 强化了其学习、推理和理解的能力。


不仅如此, EAI的层级结构也是其核心之一。作为典型的CPSS, EAI的层级结构在很多领域都有所体现: 局域网、广域网、互联网范围的计算机/服务器及其集群, 由云(IaaS、PaaS、SaaS)、边、端构成的信息采集、存储和处理框架, 自动飞行系统的空域协同—飞行任务—轨迹控制—姿态控制—单元控制的层级结构以及IEC 62264《企业控制系统集成》对企业—工厂—区域—work center—work unit的划分, 都是典型的CPSS分层实例。本研究将客观层级分为四个等级: LV1, 也叫控制层, 对应IEC 62264的LV0-2层, 对应基础的控制理论和控制方法, 用于分析组件和单元的具体实施; LV2技能级, 对应IEC 62264的LV3管控集成层级, 具有将宏观业务信息转化为具体生产信息的功能, 用于任务分解和指令生成, 如制造执行系统(MES)位于本层级; LV3任务级, 对应IEC 62264的LV4, 主要负责宏观的业务流程规划设计以及任务的定义和规划, 如ERP位于本层级; LV4协同级, 对应企业业务逻辑之上的产业链协同层级, 关注多系统的协同规划和决策运营问题。

图 9 具身循环和典型循环的映射关系


最后, 具身循环将EAI的本体和环境串接起来, 渗透于各个层级和视图中, 将整个系统集成为一个有机的整体。当前, 已经有较多的研究针对系统架构中所存在的循环提出了基本的框架。如图9所示, 在美国国家标准与技术研究院(NIST)的CPS架构中, 通过将系统划分为赛博和物理两个部分, 构建了信息—决策—行动—物理状态的循环体系; 约翰·博依德(John Boyd)针对作战提出的观察(Observation)、判断(Orientation)、决策(Decision)、Action(行动)循环, 在军事和工程领域得到广泛的应用; 计划—执行—检查—处理(PDCA)工作循环是伴随全面质量管理发展和产业应用而得到广泛应用的工作方法, 现已被嵌入日本工业价值链模型中; 在控制领域, 清华大学自动化系的导航、制导与控制课程, 也通过感知、决策、控制、优化的循环来实现智能体的自动化和自主化, 该循环同样适用于具象化具身循环。

图10 EAI 体系结构框架的工程实践表达


为了更加明确地揭示架构的形式, 便于工程技术人员直接使用, 本研究将图8所示的体系结构解耦, 展现为图10所示的形式。为了方便不同领域的工程人员选型, 将EAI的本体拆分为赛博系统和物理系统两个部分, 用于指导具体技术的选择。此时, 本研究将EAI主体拆分为赛博系统和物理系统两个部分, 为算法工程师和硬件工程师在具体问题的选型和开发商分别提供方向; 针对外部环境, 将其分为赛博环境、物理环境和社会环境, 便于社会科学、信息科学和自然科学等方面的研究人员使用和介入。同时, 具身循环依然是渗透在整个框架中的, 图中红色的界面则代表, 具身循环需要穿透的EAI主体与EAI环境的边界。


五、案例分析——智慧矿山层次结构


(一)本体:工程机械


工程机械从运动的角度看, 通常拥有两个重要的系统, 即行走系统和作业系统。


(1)行走系统是工程机械可移动性的物理载体, 实现了工程机械在工程场所内部及工程场所之间的便捷且快速的移动。行走系统具有典型的车辆属性。


(2)作业系统是工程机械实现作业功能的物理载体, 可使工程机械在工程场所完成特定作业任务。作业系统具有典型的机器人/机械臂属性。


工程机械的行走系统和作业系统是两套独立的系统, 可以进行独立操作。两者之间也具有耦合性, 例如在某些特定的作业场景下, 行走系统和作业系统需要进行动态的配合。这种耦合性也往往和工程机械的安全性有关。在特定的情况下, 行走系统和作业系统在动态或者静态条件下, 会在与环境的交互过程中产生倾覆等安全问题。针对工程机械的两个子系统, 其物理和赛博系统层次可以参照IEC 62264的层次划分。LV5级总是与系统之间的协同任务有关, 是保障系统间协同任务完成所需的物理基础。LV4与任务执行相关, 为任务的执行提供了物质条件。LV1是底层的设备、传感器及其数据处理, 相当于ISO 62264的0和1级。LV2是操纵、驱动与控制的硬件条件, 类似于IEC 62264的分布式控制系统所在的第2级。LV3主要实现管理和控制之间的集成, 相当于IEC 62264的第3级MOM。其升级改造方案可以如表1和表2所示。


综合两表可以得到以下结论:


(1)作业系统和行走系统相对独立, 其内部的关联性强于系统之间的耦合性, 但是两个子系统的耦合性在一些特定场合下, 需考量两个子系统在配合方面的问题。


(2)在系统层次方面, 上层主要面向任务管理, 下层主要面向设备和具体的控制功能。上层功能的实现, 需要下层功能的支持。


(3)每一层都有实现其功能所需的特定物理装置。


(4)系统各个层级之间具有关联关系, 具身循环会在层级之间流动。


表1 工程机械的物理系统自主化改造


表2 工程机械的赛博系统自主化改造


(二)外部环境:工程机械作业环境


如图11所示, 工程机械的作业环境是多样化的, 作业环境的层次分解需要依据以下规则:

图 11 矿山作业环境的层次划分示例


(1)上层包括了下层的环境片段, 下层是上层环境的特定区域或者局部。


(2)层次之间具有时间、空间、任务特性等方面的显著区别。


(3)不同层次对CPS的运行和作业有不同的影响, 需要不同层次的智力和体力条件, 需要不同的解决方案。


图11呈现了矿山应用场景的层次划分:


(1)单一工程机械的工作场景, 作为工作环境的基础单元, 为LV1层。


(2)存在两台工程机械协同作业的工作场景, 划分为LV2层, 例如挖掘机和卡车的配合、卡车在运输过程中与其他卡车的配合、传送带与卡车的配合。


(3)覆盖泊挖装运活动中的多个活动场景, 为LV3层。


(4)一个完整的矿山作业场景, 为LV4层。


(5)在该图的语境下, LV5包括矿山与选矿、加工等环节构成的更大的、企业级的应用场景。


(三)具身循环:工程机械自主集成循环


具身循环是CPS呈现自主性、智能性、进化性的核心维度。具身循环流动在不同层次的赛博、物理、环境要素之间, 将赛博、物理和环境关联在一起。如图12所示, 给出了一个自适应的控制框架和算法。尽管这一研究工作不是整个工程机械智能化的展示, 但是从局部可以看出物理机构之间的连接和驱动关系、赛博系统与这些物理机构之间的关系, 最终构成一个控制回路的闭环。

图 12 无人挖掘机系统原理


如图13所示, 其节点功能涉及的赛博层级为技能级, 物理层级为管控集成级, 实现了基本的移动和作业的功能。从图中可以看出, 在赛博系统和物理系统之间及其不同层级之间, 存在赛博循环, 将相关层次的结构要素贯穿在一起。

图 13 挖掘机的基本 SDCO循环


六、总结与讨论


本文针对当前EAI系统这一重要的AI表现形式, 分析了其多学科、多表征形式、多要素和多活动的特点。基于系统工程的思想, 提出了EAI 的元模型与体系架构。在以具身循环的形式串接智能体和环境的同时, 将当前不同科学理论和工程技术嵌入到EAI的开发中。


当前, 针对EAI系统的研究依然存在多种观念和方法。如端到端的方法, 仍是目前机器学习领域解决很多问题的思路。不可否认, 该方法为很多困扰人们的问题提供了一种解决方案, 但分层控制、分层学习并加以协调的方式或许也有其用武之地。这一思想不仅体现在当前对认知架构的研究分析中, 还呈现于类似于机器人开发设计的方法中。未来, 端到端的方法是否会和分层方法达成一致, 形成一个理论的两种表述, 依然未可知。


EAI体在不同活动中的通用化行为依然众说纷纭。无论是具身感知、具身控制, 还是具身交互、具身学习决策, 目前大多还停留于具体的案例层级上。不同活动的层级归属、细节行为等通用化的参考模型, 不仅需要更多的实证与案例研究进行归纳, 也依赖于认知科学、神经科学等领域的发展提供理论上的指引。


最后, 作为和EAI密切交互的主体, 相关人才的培养也是重中之重。如何借鉴其他领域的人才培养方法, 形成我国自主的人才培养体系, 基于多种路径培养, 实现人—EAI良好协作共生、创造更具价值的美好愿景, 也是EAI诞生的目的和初衷之一。


总的来说, EAI依然是一个处在发展中的学科, 无论是其理论还是工程技术都有很大的研究空间。本文提出EAI的元模型和体系结构, 希望帮助不同领域的研究人员参与到EAI的开发研究中, 为多学科的集成提供一种方法。


原文刊载于《数字化转型》2026 年第5期第3卷 作者:瞿盟津 刘魁 李清

暂无评论,等你抢沙发

  • 短信登录
  • 密码登录
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
还没有账号,
登录即代表您同意本网站的 《用户注册协议》
注册
已有账号, 立即登录
登录即代表您同意本网站的 《用户注册协议》
找回密码