【AI的进化】萍聚社区-德国热线-德国实用信息网人工智能

多客科技 发表于 2025-10-22 17:05

AI的进化

作者：微信文章
“我们认为AI代表了十年一遇的机会。”OpenAI首席执行官山姆·阿尔特曼在ChatGPT Atlas浏览器发布会上如是说。就在2025年10月21日，这家AI巨头再次掷出一枚重磅炸弹——推出深度集成AI能力的浏览器ChatGPT Atlas。

这不仅是又一款产品的发布，更是AI进化速度的一个缩影。当我们还在讨论AI能否理解人类语言时，它已悄然渗透到我们数字生活的每一个角落。

01 超越预期的AI进化曲线

当我们谈论AI进化速度时，数据远比形容词更有说服力。2025年3月，METR发布的重磅研究《Measuring AI Ability to Complete Long Tasks》带来了惊人发现。

过去六年中，大型语言模型的智能水平每7个月就翻一番。这种指数级增长趋势如此陡峭，以至于即使绝对测量误差达到10倍，能力到来的时间也仅会改变约2年。

METR团队提出的“任务完成时间视野”指标，精准量化了AI能力的演进速度。该指标测量的是AI能以50%成功率完成的任务，人类通常需要花多长时间。

研究结果显示，2023年前的模型如GPT-2和GPT-3只能完成人类耗时不超过1分钟的简单任务。而到了2025年，最新模型已经可以处理人类需花费数小时甚至十几小时的任务。

AI进步的脚步从不停歇。从谷歌Gemini系列的快速迭代便可见一斑——从初代Gemini的“多模态突破”到Gemini 2.0的“长文本处理优化”，再到即将在2025年12月上线的Gemini 3.0。

02 算力与算法的飞轮效应

AI能力爆发式增长的背后，是算力增长与算法效率提升形成的双重飞轮效应。

根据《2025年人工智能趋势报告》的数据，AI模型训练算力正以每年360%的速度增长（2010-2025）。与此同时，算法改进推动性能年均提升200%。

计算成本呈现两极分化态势。一方面，顶级模型的训练成本持续飙升，2024年已超过1亿美元，较2016年增长2400倍。

另一方面，推理成本却在急剧下降，每百万token推理成本两年内下降了99.7%。

NVIDIA Blackwell GPU的能耗比2014年降了105，000倍。这种计算效率的提升，使得AI应用的大规模普及成为可能。

谷歌产品负责人Logan Kilpatrick在AI工程师世界博览会的演讲中透露，谷歌服务器AI推理任务处理量在过去一年提升了50倍。

03 史无前例的用户增长速度

如果说技术指标是AI进化的“供给面”，那么用户采纳则是衡量其影响的“需求面”。在这方面，AI同样创下了史无前例的纪录。

ChatGPT仅用5天就获得了100万用户，在17个月内达到8亿周活用户，增长达8倍。其用户留存率高达80%，远超谷歌搜索的58%。

在全球渗透方面，ChatGPT上线3年就覆盖了90%的非北美用户，这一速度远超互联网（需23年）。用户使用强度也在急剧增加，日均使用时长在21个月内增长了202%，会话量增长106%。

中国企业级市场同样呈现出爆发式增长。字节跳动旗下火山引擎公布的豆包大模型日均tokens使用量已突破30万亿。

从2024年5月的1200亿到2025年9月的30万亿，在不到一年半的时间里实现了253倍的增长。

04 从工具到智能体的跃迁蜕变

AI不仅在数量指标上快速增长，在能力质上也发生了根本性转变。AI正从被动的工具，进化为主动的智能体。

本·古杰，曾参与开发谷歌浏览器和火狐浏览器的资深员工，现在也加入了OpenAI的Atlas项目。他的参与本身就暗示了浏览器与AI融合的未来方向。

ChatGPT Atlas的“代理模式”彰显了这种能力跃迁。在获得用户授权后，浏览器可基于浏览记录与查询意图，代表用户执行实际操作，包括预订航班、编辑文档、在线购物等。

一位获得抢先体验资格的用户分享了他的体验：“当我沉迷于树脂浇注教程或纸张大理石纹技巧等艺术内容时，我可以直接告诉ChatGPT关闭所有与手工相关的标签页，以便重新集中注意力。”

谷歌同样将“默认具备Agent能力”列为Gemini模型未来的核心发展方向。谷歌产品负责人Logan Kilpatrick指出：“模型正在逐步变成智能体”。

05通往全模态的统一模型

AI正从纯文本模型向全模态统一模型演进。谷歌的路线图显示，Gemini最初就被设想为一个统一多模态模型：音频、图像、视频，全都能处理。

谷歌I/O大会宣布了Gemini的原生语音能力，这些能力已集成到Astro与Gemini Live。同时，谷歌也在推进“Veo”相关能力，它已在多个指标上达到SOTA水平，未来也会并入主线Gemini模型。

多模态融合不仅扩展了AI的应用场景，更提升了其理解现实世界的能力。从GPT-4到谷歌Gemini，多模态交互已成为头部模型的标配。

06从模型到平台的演进

AI进化的另一显著趋势是从封闭模型向开放平台的转变。科技巨头们正努力将AI构建为连接各种服务的统一接口。

阿尔特曼展望未来时谈到：“长远来看，我们认为ChatGPT会演变为‘生活的操作系统’——一个全面互联的枢纽，帮助你管理日常并实现长期目标。”

谷歌同样怀抱着“统一助手”的愿景。Logan Kilpatrick解释说，Gemini正在成为“统一线程”，串联起谷歌所有服务的那条线。

目前大多数AI产品，仍然是“用户主动操作”——你要主动提问，主动请求功能。但下一个阶段将是“主动式AI”——AI主动为你发现问题、提供建议、自动处理任务。

07 尾声

科技巨头们在AI浏览器领域的混战刚刚开始。谷歌Chrome、Perplexity的Comet、OpenAI的Atlas——这些产品在功能上尚未拉开显著差距。

一位试用过Atlas的用户坦言，他可以“通过语音指令让AI帮你预订餐厅、机票，但坦白说，这已经是今年AI浏览器上屡见不鲜的功能了。”

然而，在表面功能趋同的背后，真正的革命正在悄然发生。AI不再仅仅是应答问题的工具，而是成为能主动理解我们需求、代表我们行动的智能体。

当我们站在这个十年一遇的技术拐点上，AI的进化速度已超出想象，但同时也引发了担忧。包括人工智能教父Yoshua Bengio、Geoff Hinton以及苹果联合创始人沃兹尼亚克在内的850多位专家与行业领袖，已联合签署声明，呼吁暂停研发“超级智能”。

他们警告，这种可能在所有认知任务上超越人类的AI，或将带来经济边缘化、自由丧失甚至人类灭绝等极端风险。

一面是AI作为智能体正加速融入日常，另一面是顶尖头脑对其失控的深切警惕。技术的狂奔与理性的呼告，共同勾勒出这个时代最深刻的悖论——我们创造的，究竟是通向未来的引擎，还是无法回头的悬崖？

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI的进化