萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 206|回复: 0

OpenAI AI代理“Deep research”,真的比DeepSeek和Google重要?背后原因几何!

[复制链接]
发表于 2025-2-6 07:40 | 显示全部楼层 |阅读模式
作者:微信文章


点击上方蓝字关注我们



在与中国国产的AI大模型DeepSeek R1竞争中落在下风的OpenAI不甘示弱,近日推出了其新一代AI代理——Deep Research。OpenAI宣称在AI竞争的下一站AI代理中又下一城,实现了领跑。

要命的OpenAI新一代AI代理不但产品的名字与2024年底Google推出的基于Gemini的 Deep Research一样,而且功能也一样,完全拷贝了Google的创意。当然,Gemini Deep Research并不是行业内的第一款AI代理产品,也是拷贝其他的公司的。

OpenAI Deep Research甚至厚颜无耻地承认借鉴的DeepSeek名字中的元素。

而一些专家却想当然的生成,OpenAI Deep research比 DeepSeek和Google Deep Research更重要,因为Deep research是新一代AI Agent,代表着AI发展的趋势,可以基于大模型完成用户提出的相关研究内容或者报告,而DeepSeek R1只是和ChatGPT 和Gemini一样的大模型。



那么OpenAI Deep research是干什么的?

具体而言,OpenAI Deep research是 ChatGPT 中的一项新的AI代理,可以在互联网上独立、自动进行多个步骤的研究,处理复杂的研究任务,形成一份研究报告或者结果。

OpenAI Deep research演示的一个例子,当提出列出重要发达国家和发展中国家智能手机操作系统的市场份额与渗透率需求时,Deep research基于OpenAI

ChatGPT大模型,将研究拆分为几个步骤,如搜集资料、进行归纳,进行推理等,在30分钟内就是完成一份报告,而所需的时间只是人类研究人员所需时间的一小部分。

OpenAI CEO Sam Altman称赞说,Deep Research就像一种具有超能力的按需专家,它可以使用互联网,进行复杂的研究和推理,并给你一份报告,可以完成需要数小时或数天且花费数百美元的任务。

据介绍,Deep Research使用 OpenAI 即将推出的o3模型的优化版本,专门用于网页浏览和数据分析。根据OpenAI的说法,该工具可以从文本、图像和PDF中搜索、解释和综合信息,并根据新发现的见解调整其方法。

Deep Research允许用户提供额外的文件附件。每个输出都包括清晰的引用和推理过程的摘要,适用于金融、科学、政策和工程等领域的用户,以及对主要购买进行深入研究的消费者。

那么,OpenAI Deep research比 Gemini Deep Research更好吗?比DeepSeek R1强吗?

显然不是。

一是在AI的一个发展趋势AI代理上,走在OpenAI前面的公司比比皆是。

随着科技巨头和初创公司之间的AI军备竞赛升温,几乎所有的公司都在AI代理上持续投资。中国的AI公司阿里、腾讯,以及Meta、AWS、Microsoft、OpenAI、Anthropic等都在转向AI代理,即可以代表用户完成复杂的多步骤任务的模型,而不是用户必须引导大模型完成每个步骤。

这里大模型是众多AI代理的基础,帮助AI代更多地了解你周围的世界,提前思考多个步骤,并在你的监督下代表你采取行动。大模型将使我们能够构建新的AI代理,使我们更接近通用助手的愿景。

例如,Anthropic AI代理能够像人类一样使用计算机来完成复杂的任务,其计算机使用功能使其技术能够解释计算机屏幕上的内容、选择按钮、输入文本、浏览网站以及通过任何软件和实时互联网浏览来执行任务。

OpenAI 名为 Operator的代理提供类似功能,自动执行计划假期、填写表格、预订餐厅和订购杂货等任务。

二是在推出时间上,OpenAI Deep research要晚了很多。

在推出综合研究AI代理产品上,OpenAI肯定不是第一家,在其前面推出该代理的公司也很多。

2024年年底,Google推出了一款基于Gemini 大模型的Deep Research代理,应用于学术研究和教育领域,可以在几分钟内搜索数百个网站,并进行推理,生成用户需要的研究报告。其定位非常明显,充当“研究助理,探索复杂的主题并代表你编写报告”。

2024年8月,总部位于日本的Sakana AI 推出了“AI Scientist”——一个使用LLM独立进行研究的系统,从产生想法到撰写和审查论文,每篇论文的成本不到15美元。Sakana AI开创了先河,将AI从被动工具转变为科学研究的主动合作伙伴。

最近,斯坦福大学的研究人员推出了一种多智能体AI架构,旨在模拟跨学科科学家团队。此外,像 o1 这样的工具已经在健康科学等领域发挥着关键作用,协助寻找罕见病的治疗方法。

三是功能上,OpenAI Deep research也没有让人眼前一亮的东西,其实就是大模型+搜索+推理等的组合。

OpenAI Deep research不仅与去年推出的 Google Deep Research 名称相同,而且方法和技术也一模一样。这两个产品都可以承担研究助理功能,能够探索复杂的主题,综合来自多个来源的信息并生成综合报告。

其核心是独立发现、推理和整合来自整个网络的见解。具体而言就是通过大模型将一个复杂的问题,分解成小的需求;搜索我们提供的文件和互联网;在几分钟内进行多步骤推理以创建答案。

OpenAI Deep Research是推理+工具使用的代理。Deep Research是使用需要浏览器和Python等工具的真实任务进行训练的。

而专家认为,OpenAI Deep Research基准测试似乎真的很好,但无法与Google的Gemini Deep Research 相提并论。

Perplexity 首席执行官 Aravind Srinivas 在 X 上比较了这两种工具。与对更常规的搜索有用的 Perplexity Pro 不同,Gemini 的深入研究是为更深入的搜索量身定制的。

Perplexity 和 ChatGPT 搜索之前已经削弱了谷歌的搜索主导地位,但谷歌拥有最多的训练数据(Google Index、YouTube 等)、分销渠道和大量的人工智能人才。

同时,DeepSeek聊天机器人也提供了搜索和推理的能力。当被问到复杂问题时,它也可以进行Web搜索,并经过推理,以提供相关答案。

作为一个开源的大型语言模型,DeepSeek的聊天机器人基本上可以做ChatGPT、Gemini和 Claude等能做的所有事情,包括文本、音频、图像和视频生成。DeepSeek-R1与o1相媲美,专为执行复杂的推理任务而设计,同时生成问题的分步解决方案并建立“逻辑思维链”,在解决问题时逐步解释其推理过程。

现在Anthropic(Claude Haiku)、OpenAI (o1)、DeepSeek (R1 Lite Preview)、Perplexity 等已经提供了LLM中的推理功能,未来,更多的公司也将搜索功能整合到其大模型中。因此,向这种复杂文图研究功能,任何一个大模型都可以进行。

四是在性能测试上,OpenAI deep research暂时占据优势。根据 OpenAI 的数据,深度研究在 Humanity's Last Exam 中取得了 26.6% 的成绩,是之前最好的 o3-mini-high 的两倍多,为 13.0%,优于 DeepSeek R1 和 Gemini Thinking。

但是对于研究人员来说,等几分钟与等10分钟或者20分钟,又有什么关系呢?





最后想说说,为什么DeepSeek突然变得如此重要?

自2023年11月ChatGPT发布以来,美国人工智能公司一直专注于构建更大、更强、更广泛、资源密集型的大型语言模型。OpenAI、Microsoft、Anthropic和Google等公司没有寻求构建更具成本效益和能源效率的LLM,而是按照美国的传统,简单地通过投入大量金钱和资源来解决这个问题,从而简单地以蛮力推动技术的进步。

仅在2024 年,xAI首席执行官埃隆·马斯克(Elon Musk)预计个人将在AI计划上花费超过 100亿美元。OpenAI及其合作伙伴刚刚宣布了一项价值5000亿美元的Stargate项目计划,将大大加快美国各地绿色能源公用事业和AI数据中心的建设。谷歌计划在2025年优先扩展 Gemini平台,预计今年将花费数十亿美元。Meta 在1月中旬宣布,今年将在AI开发上花费高达650亿美元。

DeepSeek只是向世界表明,这些实际上都不是必需的——近几个月帮助刺激了美国经济的“人工智能繁荣”,并使像Nvidia这样的GPU公司成倍地富有,可能只不过是一个骗局——以及随之而来的核电“复兴”。这一发现也让人质疑,尽管美国在过去一年中一再禁止向中国运送领先的GPU,但美国在 AI 方面实际上拥有多大的领先优势。

只需看看 Nvidia 在DeepSeek V3 发布后的几个小时内损失了多少市值。该公司的股价下跌了 17%,并在一个交易日内蒸发了 6000 亿美元。据《福布斯》报道,这是美国股市历史上公司最大的单日亏损——超过了该公司在 2024 年 9 月创下的亏损记录 2790 亿美元。

DeepSeek模型的推出导致投资者质疑美国公司的领先优势、支出金额以及这些支出是否会带来利润(或超支)。如果一家中国初创公司可以在两个月内以不到600万美元的价格构建出与 OpenAI 最新最好的 AI 模型一样有效的 AI 模型,那么 Sam Altman 还有什么用呢?





END

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-2-6 15:02 , Processed in 0.077579 second(s), 16 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表