AI技术革命:从死记硬背到真正“思考”

新闻 · 发表于 2025-2-3 17:27

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

x

作者：微信文章
这个春节，AI又因为DeepSeek火了一把，关于OpenAI 的 o1 和DeepSeek R1模型的这场技术讨论竟然引发了全球轰动。全球范围内围绕DeepSeek的争论迅速从技术问题扩展到金融投资、世界贸易、地缘政治、社会制度、国家民族、人类社会的各个方面，甚至导致美国股市市值蒸发超万亿美元。

1 月 27 日。在这场大辩论中，不同的人基于不同的意识形态从不同的角度解读和分析 DeepSeek 及相关话题。有人对DeepSeek，对中国的人工智能领域，给予了极高的评价。DeepSeek 的创始人梁文峰一夜成名。网民和媒体的热烈支持不绝于耳，就连《华尔街日报》也对他进行了专题报道。英国《金融时报》甚至派记者前往他广东农村的家乡，报道他回乡过年的情景。相比之下，也有一群批评者认为DeepSeek和中国的人工智能研究一文不值。许多人在没有完全理解一些技术概念的情况下就开始发表自己的意见。

我们普通人想要了解人工智能的这些技术概念，先回忆一下我们日常生活中事情，通常是依赖记忆和经验来应对各种挑战。我们不需要每次都从头开始思考问题，而是通过反复实践和总结经验来快速作出决策。比如，在去上班时，通常不需要每次都重新计算最佳路线，而是依赖之前走过的路和记得的交通状况；在超市购物时，我们习惯通过记忆找到价格合适的商品；教师在日常教学中，也会基于过往经验来快速决策。正如人类在面对熟悉的任务时往往不去重新思考，而是通过重复已知的步骤来完成任务，人工智能的工作逻辑也有相似之处。尤其是基于大规模语言模型（如GPT）的技术，也遵循类似的思维方式。它并不像我们传统理解中的那样进行深思熟虑的推理，而是通过积累大量经验和模式，来快速反应并解决问题。

这个所谓“训练”类似于培养一个超级学霸，但这个过程可不是一蹴而就的，得分成两步走。

第一步，我们叫它“预训练”。这阶段，AI就像个不知疲倦的书虫，疯狂地“啃”各种数据——从网上的海量信息到图书馆里的藏书，甚至是那些尘封已久的数据库，它都不放过。想象一下，这个AI就像是个脑子里塞满了各种知识、八卦、真相和谎言的“万事通”，但它还分不清哪些是精华，哪些是糟粕，更别提什么道德标准了。所以，这时的AI就像是个“知识暴发户”，虽然懂得多，但还上不了台面。

于是，就得进入第二步——“监督微调”。这阶段，AI得像个学生一样，通过做题来学习。训练师会给它出各种题目，并告诉它正确答案是什么，或者哪些答案更靠谱。这样，AI就能慢慢学会怎么用之前学到的知识来解答问题。但这个过程可不便宜，因为每个答案都得由专业人士来把关，确保质量。所以，很多AI公司在这步上都犯了难，毕竟这既费时又费力。不过，有些小公司就想出了个“捷径”——他们用已经训练好的高级AI模型（比如GPT-4）来生成问题和答案，然后直接用这些数据来训练自己的模型。这方法虽然快，但有点像是“偷师学艺”，而且违反了OpenAI的使用规定。不过，由于这些小公司规模不大，OpenAI也就睁一只眼闭一只眼了。但这种方法也有个问题，就是训练出来的AI模型往往超不过上一代的水平，甚至可能越练越差。所以，大多数公司还是得老老实实地结合新旧数据来训练模型。

目前，大多数人工智能模型处于第二训练阶段，采用“监督微调”方法进行训练。

然而，这种趋势在2024年9月12日被OpenAI自己打乱了。这一天，OpenAI发布了两款新模型，叫o1-mini和o1 preview，这些模型采用了全新的训练理念，被称为“推理模型”。这些模型不再只是简单地记忆知识，而是学会了在回答问题前先好好思考一番。这就像是把AI从“死记硬背”的书呆子变成了“会动脑筋”的学霸。

这一创新让AI在数学、编程和逻辑等方面的表现突飞猛进。OpenAI还透露，他们只用三个月就迭代出了更强大的o3模型，这模型简直是个“天才”，但为了安全起见，他们还得再测试一段时间。

至于这个“推理模型”是怎么训练出来的，OpenAI只提到了用强化学习算法，但具体细节就没多说了。这就像是你别人“山那边风景很美”，但没告诉你怎么爬到山那边。

于是，全球的AI公司都开始琢磨怎么“翻山越岭”。其中，DeepSeek 就提出了他们的R1模型，并分享了关键的技术细节——他们用强化学习算法训练模型时，只需要问题和答案，不需要中间的推理过程。这大大降低了训练难度，让更多公司能跟上这波AI发展的潮流。

OpenAI的研究员还特意发文祝贺DeepSeek，说他们的发现与OpenAI的核心思想不谋而合。虽然DeepSeek在工程方面做出了实实在在的创新，但跟OpenAI内部的o3模型比起来，还是稍逊一筹。

从公开的数据看，OpenAI发布的o3 mini模型在性能上明显优于DeepSeek的R1模型，价格还差不多。这下，貌似美国在AI领域的领先地位又稳了。而这场AI竞赛背后，还涉及到了抄袭、专利、侵权、开源、芯片控制、技术突破、产业生态、股票投资、全球竞争等一系列深刻的问题。

账号		自动登录	找回密码
密码			注册

萍聚头条

AI技术革命:从死记硬背到真正“思考”

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。