我爱免费 发表于 2025-3-30 23:34

AI Agent为何从'代理'升级为'智能体'?智能的内涵是什么? | 思考

作者:微信文章

最近一段时间,和客户交流的全是智能体,以及智能体未来的形态应该是什么样子?是智己×阿里斑马智行开启“No Touch & No App”人车交互的新体验?还是阿里巴巴国际站的 AI 搜索引擎 Accio?亦或是夸克的 AI 超级框?

但最近一直在想一个问题,为何 ‘Agent’ 如今被翻译成了‘智能体’?而非沿用之前的‘代理’或者‘助理’?二者的本质区别何在?借鉴王坚院士在《在线》中的思路,回看历史可以帮助回答上述疑惑,因此概要的借助通义、DeepSeek 、快刀广播站等内容快速梳理了如下要点。学术上对智能体的定义可参考上篇笔记《智能体的本质及结构 | 笔记》。

1. 智能体概念的由来

从思想史维度看,智能体的概念萌芽可追溯至1950年。计算机科学先驱艾伦·图灵(Alan Turing)在论文《Computing Machinery and Intelligence》中抛出划时代之问:‘机器能思考吗?’(Can machines think?)。尽管文中未直接使用‘Agent’一词,但其对‘机器模拟人类思维’的探讨,为后续智能体的‘自主性’研究埋下伏笔。。

不过,那时候连个人计算机都没有,AI的能力也非常有限,只能下下国际象棋、做做简单的数学计算,根本无法完成复杂任务。因此,一些科学家开始思考:有没有可能让软件在不同的计算机或网络环境下,自主行动?如果让多个这样的智能体(Agent)互相协作,能不能完成更复杂的任务?

正是基于这种设想,那个时代开始逐渐发展出Agent智能体和多智能体系统的概念。科学家们希望让计算机程序不仅仅是被动执行命令的工具,而是能够自主决策、协作完成任务的“智能体”。

在1973 年,研究者卡尔·休伊特(Carl Hewitt)提出了“演员模型”(Actor Model,又译“参与者模型”,其核心是并发计算模型)。他把AI想象成一群活跃的“小演员”,它们能够在计算环境中自由发挥,不仅可以接收指令,还可以彼此交流、发送消息、做出反应。这种思想,为后来多智能体系统的研究奠定了基础。

到了1990年,智能体的概念开始逐步完善,一批学者开始尝试给它下定义,并在论文和书籍中进行系统阐述。其中,澳大利亚人工智能研究院的Anand Rao和Michael Georgeff提出了BDI模型,它成为了智能体研究中的重要理论框架。

这个模型由三部分组成:信念(Belief)指的是智能体对世界的基本认知,比如地图、信息库、知识库等,它需要有足够的背景信息才能做出决策;愿望(Desire)是智能体希望达成的目标,比如完成一项任务、实现某种效果;意图(Intention)则是智能体决定采取的具体行动计划,是它在各种可能性中选择的一条执行路径。

再往后,我们就进入了移动互联网时代,从Alexa到Siri,各种“智能个人助理”开始登场。只不过,以今天的标准来看,那时候的个人助理实在是太过基础,远远称不上真正的智能体。它们本质是预设指令的语音交互工具,功能局限于简单问答,甚至难以维持连贯的自然对话。而如今,随着AI能力的进化,智能体终于走到了真正实用的门槛前。

过去一年,GitHub上也冒出了不少这样的项目,比如Auto-GPT、BabyAGI 等,都号称能“自我思考、自我规划”,可以处理一系列复杂任务。虽然我们测试后发现,它们目前仍处于早期阶段,离真正的自主智能体还有差距,但已经足够令人兴奋和期待了。

最近 Manus的爆火,标志着智能体概念进一步升级。以前的智能体,通常需要提前设定好任务和角色,才能投入使用。而现在,Manus就像一个能力超群的全能助手,不管是编程还是绘画,拿到任务就能迅速上手,干得有模有样。

2. Agent 为什么现在被翻译成了智能体而不是沿用之前的代理?

从上述智能体概念的由来看,我想可能是但随着AI技术的复杂化,“代理”一词已难以涵盖其自主决策、学习能力等特性,故采用“智能体”以强调其智能化本质,也就是智能体中强调的“智能”属性:

(1)自主决策与规划:例如AutoGPT通过自我对话拆分任务,斯坦福虚拟小镇(Stanford Virtual Town)通过赋予智能体长期记忆与社会关系,模拟人类协作行为。

(2)持续学习与适应:例如基于强化学习的Agent(如AlphaGo Zero)可通过反馈优化策略,基于向量数据库的长期记忆模块,使GPT-4驱动的智能体可跨会话持续学习。

(3)多模态与环境交互:例如Claude 3 Sonnet可通过API调用工具链完成复杂任务,体现对物理与数字环境的深度理解。

因此,智能体取代代理的核心原因在于:

(1)技术内涵升级:从被动执行到自主决策、多模态交互的质变。

(2)功能边界扩展:覆盖推理、规划、协作等人类核心智能特征。

(3)行业需求驱动:我们需要更精准的术语描述其智能化价值。

总结如下表格做对比:
维度传统代理现代智能体决策模式规则驱动目标驱动+环境感知交互能力单一API调用多模态输入/输出学习机制静态知识库在线强化学习+RAG应用场景自动化流程开放式任务协作
3. 智能体会是大模型发展的新一幕

如下图的材料是最近同客户讨论最多的一页材料,核心观点和内容借鉴了陆奇博士的观点。应该来讲是大模型在知识和能力两个维度的快速进步,已能够支撑“智能”的属性。

页: [1]
查看完整版本: AI Agent为何从'代理'升级为'智能体'?智能的内涵是什么? | 思考