这是德国弗劳恩霍夫智能分析和信息系统研究所数据科学家亚历山大·措恩的资料照片。新华社发(受访者供图)
新华社柏林6月10日电 专访|让AI智能体真正“看懂”世界——访德国弗劳恩霍夫研究所数据专家
新华社记者褚怡 杜哲宇
在AI加速融入现实世界的进程中,虚拟空间正逐步成为智能系统发展的重要“试验场”。2025年联合国虚拟世界日活动前夕,德国弗劳恩霍夫智能分析和信息系统研究所数据科学家亚历山大·措恩在接受新华社记者书面采访时说,AI智能体可以构建出一套通用能力体系,使其既能在虚拟环境中高效运行,也能胜任复杂的现实世界任务。
“现实与虚拟的结合极具价值。”他说,通过感知现实环境并在数字孪生中完成还原,AI智能体可以在实际应用之前,先在虚拟环境中进行模拟演练,评估操作的可行性,从而提升整体系统的可靠性。
措恩指出,许多运行在虚拟环境中的AI智能体,其核心算法与控制现实机器人使用的是同一类大语言模型。这意味着,AI智能体在虚拟空间中获得的经验和能力,可以较为顺畅地迁移至现实环境。
作为弗劳恩霍夫智能分析和信息系统研究所自然语言理解团队负责人,措恩长期从事基于大语言模型的机器人控制与自动编程研究。他说,团队开发的AI智能体可通过自然语言与人类交流,并将任务自动拆解为一系列更小的子任务。
“对于每个子任务,系统会自动生成一段通常为Python语言的简洁代码,既用于调用其他AI智能体,也能直接给出机器人或自动化设备的具体控制策略。”他说,当一个子任务执行完毕后,主智能体将对执行结果进行评估,并决定下一步操作,以逐步推进并完成整体目标。
措恩认为,与传统自动化系统相比,AI智能体具备更高的“性价比”。目前,许多中小企业在引入自动化技术时常面临高成本、高技术门槛和环境复杂多变等难题。“基于AI智能体的自动化系统,能够在很大程度上缓解这些问题。”措恩说,该系统依托先进的大型基础模型,具备广泛的通用知识储备,即使没有特定行业经验,也能理解并完成任务。例如,仅凭一句“将苹果和梨分别放入不同的盒子”,AI智能体就可以理解任务意图,识别物体类别,并控制机械臂正确完成动作。
措恩指出,要实现更高程度的自主能力,AI智能体所依赖的基础模型必须具备接收并理解其所处环境的能力,尤其是在涉及现实任务的场景中。“系统要在真实世界中运行,首先得真正‘看懂’这个世界。”他说,将高精度的三维场景数据与多路传感器数据输入模型,以便其在空间中进行推理和判断,是当前人工智能研究的前沿方向之一,但这项工作仍面临诸多挑战。
“目前的大语言模型本质上是为处理文字而设计的,擅长语言理解与生成。”措恩说,“而来自现实世界的感知数据,比如三维点云,只是一些无序的坐标集合,并不自带语义结构。”他表示,要让模型真正“理解”这些数据,必须开发新的数据表示方式和训练机制,将“非语言”信息转化为模型能够真正识别和处理的形式。
措恩还谈到了AI智能体应用过程中最本质的问题——信任。他认为,AI智能体之所以能够获得用户信任,关键在于其决策路径具有高透明性和可审查性。与单一语言模型不同,AI智能体会将复杂问题拆解为多个明确的小任务,每一步都有清晰的逻辑和执行过程,更容易被理解和验证。
“用户可以清楚看到智能体是如何逐步推进任务、规划解决方案的,这有助于增强他们对结果的信心。”他说,在进入现实世界之前,智能体在高度还原真实环境的虚拟世界中先“完成验证”,这种信任感会进一步加深。