多客科技 发表于 2025-10-22 17:05

AI的进化

作者:微信文章
“我们认为AI代表了十年一遇的机会。”OpenAI首席执行官山姆·阿尔特曼在ChatGPT Atlas浏览器发布会上如是说。就在2025年10月21日,这家AI巨头再次掷出一枚重磅炸弹——推出深度集成AI能力的浏览器ChatGPT Atlas。

这不仅是又一款产品的发布,更是AI进化速度的一个缩影。当我们还在讨论AI能否理解人类语言时,它已悄然渗透到我们数字生活的每一个角落。

01 超越预期的AI进化曲线

当我们谈论AI进化速度时,数据远比形容词更有说服力。2025年3月,METR发布的重磅研究《Measuring AI Ability to Complete Long Tasks》带来了惊人发现。

过去六年中,大型语言模型的智能水平每7个月就翻一番。这种指数级增长趋势如此陡峭,以至于即使绝对测量误差达到10倍,能力到来的时间也仅会改变约2年。

METR团队提出的“任务完成时间视野”指标,精准量化了AI能力的演进速度。该指标测量的是AI能以50%成功率完成的任务,人类通常需要花多长时间。

研究结果显示,2023年前的模型如GPT-2和GPT-3只能完成人类耗时不超过1分钟的简单任务。而到了2025年,最新模型已经可以处理人类需花费数小时甚至十几小时的任务。

AI进步的脚步从不停歇。从谷歌Gemini系列的快速迭代便可见一斑——从初代Gemini的“多模态突破”到Gemini 2.0的“长文本处理优化”,再到即将在2025年12月上线的Gemini 3.0。

02 算力与算法的飞轮效应

AI能力爆发式增长的背后,是算力增长与算法效率提升形成的双重飞轮效应。

根据《2025年人工智能趋势报告》的数据,AI模型训练算力正以每年360%的速度增长(2010-2025)。与此同时,算法改进推动性能年均提升200%。

计算成本呈现两极分化态势。一方面,顶级模型的训练成本持续飙升,2024年已超过1亿美元,较2016年增长2400倍。

另一方面,推理成本却在急剧下降,每百万token推理成本两年内下降了99.7%。

NVIDIA Blackwell GPU的能耗比2014年降了105,000倍。这种计算效率的提升,使得AI应用的大规模普及成为可能。

谷歌产品负责人Logan Kilpatrick在AI工程师世界博览会的演讲中透露,谷歌服务器AI推理任务处理量在过去一年提升了50倍。

03 史无前例的用户增长速度

如果说技术指标是AI进化的“供给面”,那么用户采纳则是衡量其影响的“需求面”。在这方面,AI同样创下了史无前例的纪录。

ChatGPT仅用5天就获得了100万用户,在17个月内达到8亿周活用户,增长达8倍。其用户留存率高达80%,远超谷歌搜索的58%。

在全球渗透方面,ChatGPT上线3年就覆盖了90%的非北美用户,这一速度远超互联网(需23年)。用户使用强度也在急剧增加,日均使用时长在21个月内增长了202%,会话量增长106%。

中国企业级市场同样呈现出爆发式增长。字节跳动旗下火山引擎公布的豆包大模型日均tokens使用量已突破30万亿。

从2024年5月的1200亿到2025年9月的30万亿,在不到一年半的时间里实现了253倍的增长。

04 从工具到智能体的跃迁蜕变

AI不仅在数量指标上快速增长,在能力质上也发生了根本性转变。AI正从被动的工具,进化为主动的智能体。

本·古杰,曾参与开发谷歌浏览器和火狐浏览器的资深员工,现在也加入了OpenAI的Atlas项目。他的参与本身就暗示了浏览器与AI融合的未来方向。

ChatGPT Atlas的“代理模式”彰显了这种能力跃迁。在获得用户授权后,浏览器可基于浏览记录与查询意图,代表用户执行实际操作,包括预订航班、编辑文档、在线购物等。

一位获得抢先体验资格的用户分享了他的体验:“当我沉迷于树脂浇注教程或纸张大理石纹技巧等艺术内容时,我可以直接告诉ChatGPT关闭所有与手工相关的标签页,以便重新集中注意力。”

谷歌同样将“默认具备Agent能力”列为Gemini模型未来的核心发展方向。谷歌产品负责人Logan Kilpatrick指出:“模型正在逐步变成智能体”。

05通往全模态的统一模型

AI正从纯文本模型向全模态统一模型演进。谷歌的路线图显示,Gemini最初就被设想为一个统一多模态模型:音频、图像、视频,全都能处理。

谷歌I/O大会宣布了Gemini的原生语音能力,这些能力已集成到Astro与Gemini Live。同时,谷歌也在推进“Veo”相关能力,它已在多个指标上达到SOTA水平,未来也会并入主线Gemini模型。

多模态融合不仅扩展了AI的应用场景,更提升了其理解现实世界的能力。从GPT-4到谷歌Gemini,多模态交互已成为头部模型的标配。

06从模型到平台的演进

AI进化的另一显著趋势是从封闭模型向开放平台的转变。科技巨头们正努力将AI构建为连接各种服务的统一接口。

阿尔特曼展望未来时谈到:“长远来看,我们认为ChatGPT会演变为‘生活的操作系统’——一个全面互联的枢纽,帮助你管理日常并实现长期目标。”

谷歌同样怀抱着“统一助手”的愿景。Logan Kilpatrick解释说,Gemini正在成为“统一线程”,串联起谷歌所有服务的那条线。

目前大多数AI产品,仍然是“用户主动操作”——你要主动提问,主动请求功能。但下一个阶段将是“主动式AI”——AI主动为你发现问题、提供建议、自动处理任务。

07 尾声

科技巨头们在AI浏览器领域的混战刚刚开始。谷歌Chrome、Perplexity的Comet、OpenAI的Atlas——这些产品在功能上尚未拉开显著差距。

一位试用过Atlas的用户坦言,他可以“通过语音指令让AI帮你预订餐厅、机票,但坦白说,这已经是今年AI浏览器上屡见不鲜的功能了。”

然而,在表面功能趋同的背后,真正的革命正在悄然发生。AI不再仅仅是应答问题的工具,而是成为能主动理解我们需求、代表我们行动的智能体。

当我们站在这个十年一遇的技术拐点上,AI的进化速度已超出想象,但同时也引发了担忧。包括人工智能教父Yoshua Bengio、Geoff Hinton以及苹果联合创始人沃兹尼亚克在内的850多位专家与行业领袖,已联合签署声明,呼吁暂停研发“超级智能”。

他们警告,这种可能在所有认知任务上超越人类的AI,或将带来经济边缘化、自由丧失甚至人类灭绝等极端风险。

一面是AI作为智能体正加速融入日常,另一面是顶尖头脑对其失控的深切警惕。技术的狂奔与理性的呼告,共同勾勒出这个时代最深刻的悖论——我们创造的,究竟是通向未来的引擎,还是无法回头的悬崖?
页: [1]
查看完整版本: AI的进化