AI资讯 | Meta 亿元挖角 OpenAI 核心研究员遇挫;腾讯元宝 AI 编程登场;OpenAI“热线电话”技能更新
作者:微信文章AI NEWS
热点速递
腾讯元宝 AI 编程登场
OpenAI“热线电话”技能更新
Cursor推出月费Ultra服务
Meta 亿元挖角 OpenAI 核心研究员遇挫
港科大揭示MLLM正确率瓶颈
01
巨头棋局
AI大咖们的战略博弈
AI COMPANY
🤖 元宝 AI 编程初登场
腾讯元宝上线AI编程模式,支持双栏实时交互生成并预览代码,依托腾讯云CodeBuddy实现多语言免环境运行,在多场景及生态整合上形成差异化优势。
双栏界面实时交互:左侧对话生成代码、右侧同步预览运行效果,修改意见可即时更新。
依托腾讯云 CodeBuddy,支持 Python、C++、Java 等多语言在线运行,无需配置开发环境,代码即写即跑,同时实现 HTML 即时预览。
比 DeepSeek 交互直观,比 Copilot 场景更广,比豆包更适配办公 。
洞察解析
腾讯元宝 AI 编程模式以可视化交互和生态优势,打破传统编程高门槛壁垒,相较于竞品更注重场景拓展与大众普及,或将重构 AI 编程工具竞争格局。
🤖️ 谷歌最强大模型终问世
谷歌发布性价比突出的 Gemini 2.5 系列模型,其中 Flash-Lite 输入价格低至 0.7 元 / 百万 token,性能全面超越前代且支持 100 万 token 长上下文,已接入谷歌 AI 工具及搜索场景。
谷歌发布 Gemini 2.5 系列模型,Flash-Lite 输入 0.7 元 / 百万 token,支持 100 万 token 长上下文。
2.5 系列在编程、数学等任务超越前代,Pro 版 AIME 测试准确率 88%,部分领域稍逊 OpenAI。
基于 TPU v5p 训练,支持多模态,接入谷歌 AI 工具及搜索,Pro 版销量突出。
洞察解析
谷歌Gemini 2.5通过推理能力强化、百万token长上下文技术及Flash-Lite的低价策略抢占市场,与谷歌搜索和AI工具的生态整合加速了企业级应用落地,尽管其编程数学能力领先但图像理解仍弱于OpenAI,且TPU架构的技术闭环需要在商业化推进中平衡生态开放性。
🚀 OpenAI“热线电话”技能更新
OpenAI更新热线电话功能,支持通过WhatsApp短信生成图片,号码1-800-242-8478(T9对应ChatGPT),可链接账户获取更多生图次数,该服务去年12月已在美国推出语音通话,支持多设备且无需OpenAI账号。
功能更新:OpenAI 更新热线电话技能,用户可通过 WhatsApp 向 1-800-242-8478(T9 输入法对应 ChatGPT)发短信生成图片。
账户联动:将 ChatGPT 账户与 WhatsApp 上的 ChatGPT 链接,可获取更多生图次数。
服务回顾:该热线电话去年 12 月在美国推出语音对话功能,支持多类型设备接通,每月免费 15 分钟,可通过下载 App 延长通话,且 WhatsApp 接入无需 OpenAI 账号。
洞察解析
OpenAI 通过将图像生成功能集成至 WhatsApp 及优化热线电话服务,以低门槛交互方式(短信、语音)降低 AI 使用壁垒,推动 ChatGPT 向 “全民可用” 场景渗透,此举既拓展了移动端用户触达范围,也通过账号联动机制增强用户粘性,反映其加速 AI 技术大众化普及的战略方向。
📖 字节跳动+比亚迪:AI为新能源赋能!
字节跳动与比亚迪锂电池的合作通过 AI 技术与高通量实验的融合,加速动力电池核心技术研发,为新能源领域智能化创新提供了跨行业合作的典型范式。
合作共建实验室:字节跳动 Seed 及火山引擎与比亚迪锂电池共建 “AI + 高通量联合实验室”,探索 AI for Science 与高通量实验结合。
聚焦研发方向:针对动力电池的快充、寿命、安全等问题攻关,探索 AI 在电池新材料、新配方发现中的应用。
技术应用案例:比亚迪 “兆瓦闪充电池” 研发中采用字节跳动的电解液 AI 模型框架 BAMBOO,相比传统试错法可快速预测性能、缩小实验配方空间。
洞察解析
字节跳动以 AI 模型技术赋能比亚迪锂电池研发,通过 BAMBOO 框架实现电解液配方的高效筛选,凸显 AI 在材料科学领域缩短研发周期、降低试错成本的价值;双方合作标志着 “AI + 新能源” 跨界融合加速,有望推动动力电池技术突破并为行业研发模式提供智能化范本。
📖Cursor推出月费Ultra服务
AI 编程工具Cursor推出月费 200 美元的Ultra订阅服务,模型使用额度达Pro版20倍且优先体验新功能。
Cursor 推高价订阅:AI 编程工具Cursor推出月费 200 美元的 Ultra 订阅服务,模型使用额度为现有 20 美元 Pro 方案的 20 倍,用户可优先体验新功能,该方案依托与 OpenAI 等模型厂商的多年合作协议。
业务增长强劲:Cursor 年化经常性收入(ARR)已达5亿美元,自2025 年 4 月以来新增 2 亿美元,被英伟达等大企业广泛使用,是史上最快实现 ARR 1 亿美元的公司之一。
行业竞争加剧:OpenAI 收购 Cursor 竞争对手 Windsurf,Anthropic 优化 Claude Code 工具并削减 Windsurf 对其模型的访问权限;Cursor 则加大自有模型研发,5 月推出 “Tab” 模型,支持多文件代码推荐。
洞察解析
Cursor 以高价订阅服务切入重度用户市场,依托与头部模型厂商的合作及自有技术研发实现高速增长,但 AI 编程工具领域正陷入 “模型厂商自研产品+收购竞争” 的混战,Anysphere 需在依赖外部模型与构建自主技术壁垒间寻找平衡,行业未来竞争将聚焦于模型深度整合与企业级服务能力。
🌏 OpenAI将关停GPT-4.5Preview API
OpenAI 因 GPT-4.5 API 高计算成本与战略聚焦需求,将于 7 月 14 日停用该服务并要求开发者迁移。
OpenAI 宣布 7 月 14 日关停 GPT-4.5 Preview API,开发者需在 26 天内迁移模型,该版本仍对个人 ChatGPT 用户开放。
GPT-4.5 API 成本高昂(输入 75 美元 / 百万 tokens),OpenAI 需集中算力推广性价比更高的主力模型(如 GPT-4.1),并通过 o3 API 降价 80% 优化资源。
开发者需重调提示词、重算费用模型,OpenAI 引导迁移至 GPT-4.1,其 400 亿美元融资背后的估值逻辑受模型迭代与算力成本制约。
洞察解析
OpenAI 关停高成本实验性模型,转向 “降本增效+主力模型规模化” 战略,暴露 AI 行业在技术创新与商业化落地间的算力成本矛盾,也倒逼开发者适应模型快速迭代的行业常态。
02
智策前线
AI行业的政策风云与新闻速递
AI POLICIES
🌏 Meta 亿元挖角 OpenAI 核心研究员遇挫
Meta 斥 1 亿美元高薪挖角 OpenAI 人才未果,反映出 AI 领域人才竞争已从薪酬比拼升级为技术愿景与创新文化的较量,凸显使命感在留住核心人才中的关键作用。
Meta 为新成立的超级智能团队,向 OpenAI 等顶尖 AI 研究员开出 1 亿美元签约奖金 + 高额年薪,试图挖角核心成员。
OpenAI CEO 奥尔特曼证实此事,称核心员工因相信其通用 AI 愿景及公司价值潜力,无人接受 Meta 报价。
奥尔特曼认为 Meta 忽视使命感,文化难孕育创新,强调 AI 竞赛需真正突破而非单纯高薪挖角。
洞察解析
AI 行业人才竞争白热化,Meta 以天价薪酬挖角却因缺乏技术使命感遇挫,凸显顶尖人才更看重企业在通用 AI 领域的突破潜力,而非短期经济利益,也揭示技术信仰与创新文化在高科技竞争中的核心价值。
📲 杨杰:AI + 时代硅基生命群体性涌现
中国移动董事长杨杰在 MWC 上海 2025 指出,“AI+” 时代推动硅基生命以智能终端等形态群体性涌现,其数量未来将超越人类并成为社会核心资源,开启碳基与硅基深度融合的文明新形态。
中国移动董事长杨杰在 MWC 上海 2025 演讲中提出,人类社会正从 “互联网+”“5G+” 时代迈入 “AI+” 时代,AI 技术推动硅基生命群体性涌现。
以传感器、处理器等为物理硬件,具备计算 / 感知 / 认知 / 运动智能,可通过智能终端、汽车、机器人等形态融入社会,承担决策、服务等职能。
硅基生命因快速部署、无限复制等特性,数量将超过人类,成为社会劳动力与智力资源的重要组成,形成新 “人口红利” 与 “360 行”。
洞察解析杨杰的观点揭示了 AI 技术驱动下 “碳硅融合” 的文明演进方向,硅基生命的规模化渗透不仅将重构劳动力结构,更可能通过与碳基生命的协同创造新经济形态,反映出科技企业对未来社会生产力变革的前瞻判断,也引发关于人机关系、伦理边界的深层思考。
03
创新纪元
AI研究的前沿进展与技术革新
NEWS
📖港科大揭示MLLM正确率瓶颈
港科大等推出多模态定理证明基准 MATP-BENCH,MLLM 正确率仅 4% 揭示推理瓶颈。
港科大团队推出首个多模态定理证明基准 MATP-BENCH,要求模型结合图像与文本提取隐含前提,覆盖 1056 个高中至竞赛级几何定理,支持 Lean 4、Coq、Isabelle 三种形式化语言。
多模态大模型(MLLM)在 “端到端证明” 任务中表现薄弱,Lean 4 语言下成功率仅 4.26%,但 “定理形式化” 任务成功率达 45.16%,说明模型 “看懂题目” 能力优于 “逻辑证明”。
复杂逻辑推理与辅助线构造是主要障碍。需辅助线的难题中,模型尝试率随难度上升但成功率小于5%;闭源模型常因 “证明步骤无效” 出错,开源模型多现 “变量定义错误” 等基础问题。
洞察解析
MATP-BENCH测试显示,多模态大模型虽能完成定理形式化任务,但在复杂逻辑推导尤其是辅助线构造等核心证明环节表现极差,暴露视觉感知与符号逻辑跨模态转化的重大缺陷,亟需创新训练范式以提升AI的系统性推理能力。
想看更多精彩内容?
扫描下方二维码加入群聊
@本文为AI洞察局原创内容
未经授权, 禁止转载
进群、转载或商务合作联系后台
— 完 —
页:
[1]