研究中的一张图表生动地揭示了开发者工作模式的变化。报告解释说:“当允许使用 AI 时,开发者花在主动编码、搜索和阅读信息上的时间减少了,取而代之的是,他们将时间花费在了编写提示、等待AI输出、审查AI结果以及无所事事的空闲上。”
简单来说,AI 改变了时间的分配。原本用于深度思考和创造的时间,被一系列与 AI 交互的“新工作”所占据。这种“增加的隐性工作”正是导致效率下降的关键。许多开发者在一线工作中也有类似的体会:AI 在自动化某些常规任务、或在低风险环境中快速测试新想法时确实很有帮助,但因为你必须花费同样甚至更多的时间去验证代码是否真的有效,所以总的来看并没有节省时间。更重要的是,AI 不会像一个人类实习生那样通过实践获得成长和学习。
换言之,AI 工具或许让编程的某些环节变得更有趣,但并未让整个过程变得更高效。
这并非孤例:更多研究指向相似结论
METR 的研究并非个例,近期其他一些研究和调查也从不同侧面印证了 AI 效能被夸大的可能性:
Qodo 研究:一家名为 Qodo 的 AI 编程公司最近的研究发现,AI 软件辅助带来的一些好处,被核查 AI 代码建议所需的额外工作所抵消。
丹麦经济调查:基于丹麦的数据进行的一项经济调查发现,生成式 AI 对就业或工资尚未产生任何实际影响。
英特尔研究:英特尔的一项研究表明,所谓的 AI PC 反而降低了用户的生产力。
中国某电力公司的呼叫中心:据报道,该中心的员工表示,虽然 AI 辅助可以加速某些任务,但它也会通过创造更多额外工作来拖慢整体进度。
如何客观看待这一研究结论?
尽管研究结果发人深省,但该研究的作者们——Joel Becker, Nate Rush, Beth Barnes, 和 David Rein,也谨慎地强调,这项工作应在非常特定的背景下进行解读。
他们指出:“我们观察到的‘减速’现象,并不意味着当前的 AI 工具无法在其他场景下提高开发者的生产力。我们发现,开发者对代码库的高度熟悉度、以及代码库本身的规模和成熟度,是导致效率下降的共同原因。而这些因素在许多其他的软件开发环境中并不适用。”
例如,对于一个新手开发者,或者在一个全新的、较小的项目中,AI 工具可能依然能提供巨大的帮助。
作者们进一步说明,他们的发现并不意味着当前 AI 系统毫无用处,更不意味着未来的 AI 模型不会做得更好。这只是当前技术水平、在特定实验条件下的一次“快照”。
总而言之,METR 的这项研究为我们敲响了警钟: 在盲目拥抱 AI 带来的生产力革命之前,我们或许需要更冷静、更批判性地审视 AI 工具在真实世界中的表现。对于那些在复杂、成熟项目上工作的资深开发者来说,目前的 AI 助手可能还不是一把削铁如泥的“瑞士军刀”,反而更像一个需要小心翼翼、时刻监督的“实习生”。
技术的进步永无止境,未来的 AI 模型必将更加智能、可靠。但就现在而言,人类开发者的经验、智慧和深刻的上下文理解能力,依然是无可替代的核心价值。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.