我爱免费 发表于 2025-7-20 11:53

AI,这一周发生了什么?

作者:微信文章
OpenAI

◆ 2025-07-18 ChatGPT Agent 正式发布,推动AI进入任务自主执行阶段
OpenAI 宣布推出 ChatGPT Agent,向 Plus、Pro、Team 用户开放,Enterprise 与 Edu 版将于未来几周陆续上线。Agent 能够在虚拟沙盒环境中执行网页浏览、表单填写、代码运行、PPT 生成等多步骤任务,演示任务如“购买鞋子”可在10分钟内高质量完成。
该功能整合了 Operator 视觉代理与 Deep Research 推理能力,在 HLE 基准测试中效率达 41.6%。尽管暂时无法直接访问本地系统,但已实现任务流程“闭环”,标志 AI 工具向“智能体”转型迈出实质一步,对 OpenAI 企业级市场布局意义重大。

◆ 2025-07-17 OpenAI 两位核心架构师被 Meta 挖角,核心人才流失引关注
Meta 于本周挖角 OpenAI 两位核心架构师,加入其“超级智能团队”。这已是近期第4起重要人员流失事件,外界担忧其可能对 OpenAI 技术路线与研发速度造成冲击。
不过,OpenAI 拥有强大品牌影响力与资源平台,或能在未来引入更多新兴人才以缓解短期震荡。

◆ 2025-07-16 OpenAI 宣布采用 Google Cloud 提供算力服务
为了缓解日益严峻的算力压力,OpenAI 宣布与 Google Cloud 合作,未来将在美国、日本、荷兰、挪威和英国部署支持 ChatGPT 的云资源。
这是 OpenAI 多元化供应商策略的一部分,补充现有的 Microsoft、CoreWeave 和 Oracle 架构。此举将进一步提升其服务稳定性及全球部署灵活性。

Meta

◆ 2025-07-15 收购语音AI公司 PlayAI,进军自然语音与可穿戴设备生态
Meta 宣布收购人声克隆初创公司 PlayAI,后者团队将并入 Meta AI 部门,向前 Sesame AI 的核心人物 Johan Schalkwyk 汇报。PlayAI 擅长构建自然语音平台,将助力 Meta 在 Ray-Ban 智能眼镜、音频内容创作、AI 虚拟角色等方面的布局。
此次并购不仅增强了语音交互能力,也是 Meta 抵御 Apple Siri 与 Google Gemini 的关键一环。

◆ 2025-07-17 收购 Scale AI 股权并大规模裁员,重组生成式AI团队
继收购 Scale AI 49% 股权后,Meta 协助后者裁员200名全职员工(占14%)及500名外包承包商,重组原有16个团队为代码、语言、专家等5大核心团队。
重组意图在于提升效率、聚焦盈利项目,同时也响应 OpenAI 和 Google 等大客户需求下降的现实挑战。

◆ 2025-07-16 宣布建设超大规模智能计算集群
Meta 宣布启动“超智能计算集群”计划,旨在为未来AI模型提供顶级训练能力。该计划标志着 Meta 争取在底层AI基础设施方面建立差异化优势。
该举措对 Meta AI 及其元宇宙生态构建具有深远影响,尤其是在训练大语言模型和生成式AI方面。

Amazon / AWS

◆ 2025-07-15 发布 AI 编程平台 Kiro,开启“规范驱动开发”新范式
AWS 推出 AI 编程工具 Kiro 预览版,具备自动生成系统设计图、需求文档、任务列表等能力,首创“规范驱动开发(spec-driven development)”模式,支持代码-文档实时联动。
Kiro 被视为 AWS 推动 Agentic AI 的关键组件之一,或将成为未来 AI 工程师的主力工具。

◆ 2025-07-18 发布 Bedrock AgentCore 平台,布局企业级 AI 代理框架
在纽约峰会上,AWS 宣布推出 Bedrock AgentCore 预览版,集成 7 大 Agent 功能组件(运行时、身份验证、记忆机制、代码解释器等)。该平台为开发端到端 AI Agent 提供底座支撑,并与 Kiro 紧密协同。
标志 AWS 正系统性构建从基础设施到开发环境再到代理执行的完整闭环,为企业客户提供“开箱即用”的Agent平台。

◆ 2025-07-18 宣布裁员,涉及培训与认证部门
AWS 确认裁员,主要波及培训与认证(Training & Certification)部门。该举动显示其在人力资源结构上进行优化调整,以更聚焦资源于高增长业务如 AI Agent 和企业客户服务。

Anthropic

◆ 2025-07-18 发布 Claude 金融分析工具,扩展垂直行业能力
Anthropic 推出 Claude 金融分析解决方案,功能涵盖财务建模、合规审计、投资组合监控等,并接入多家实时数据服务。
这表明 Claude 正从通用 AI 助手向行业专家演进,巩固其在金融科技赛道的竞争力。

◆ 2025-07-16 投资 AI 能源解决方案,推动 AI 可持续化应用
Anthropic 宣布将投资能源优化相关的 AI 项目,探索 AI 在碳中和、电力负载预测、能效管理等场景的落地路径。
此举不仅拓宽其商业边界,也为其争取 ESG 导向企业客户打下基础。

◆ 2025-07-15 调整 API 访问频率,提升开发者接入体验
Anthropic 将 Claude Sonnet 4 API 的调用频率上调一倍以上,涉及 Tier 1 至 Tier 4 所有用户。
此更新回应了开发者反馈,缓解调用容量瓶颈,为 Claude 生态扩展奠定基础。

xAI

◆ 2025-07-18 发布 Grok 4,并登顶日本 App Store
xAI 宣布推出 Grok 4,多模态与推理能力全面升级,集成至 Tesla 车机系统,并新增“AI 伴侣”功能。Grok 在日本 App Store 免费应用榜跃居榜首,展示强劲市场潜力。
Elon Musk 表示未来将支持“个性化数字伴侣”,强化 Grok 在C端生态中的吸引力。

◆ 2025-07-18 获 SpaceX 投资20亿美元,估值升至1130亿美元
SpaceX 宣布参与 xAI 正在进行的50亿美元新一轮融资,单笔追加20亿美元。交易完成后,xAI 与 X(原 Twitter)平台合并估值达1130亿美元。
本次融资反映 Musk 将 xAI 作为未来核心 AI 战略平台的意图,并强化其跨生态整合能力。

Cognition AI

◆ 2025-07-14 收购 Windsurf 剩余资产与团队,构建端到端 AI 编程平台
继 Google 以24亿美元收购 Windsurf 核心团队并获得非独占授权后,Cognition 于7月14日宣布收购其剩余 IP、商标与250人团队。
此次收购使 Cognition 得以整合 Windsurf 产品至其 Devin 编程平台,强化其在 AI 编程领域的市场整合能力。

Mistral AI

◆ 2025-07-17 推出语音理解模型 Voxtral,进军多语言语音交互
Mistral 发布其首个开源企业级音频模型 Voxtral,支持语音内容转录(30分钟)和理解(40分钟),并能生成摘要、执行指令(如调用API)等操作。该模型支持英语、法语、德语、西班牙语、意大利语、印地语等8种语言。
Voxtral 的发布标志 Mistral 正将模型能力拓展至语音交互领域,为其在智能助手、客服等场景提供新增长点。

◆ 2025-07-19 发布开源语音模型 Voxtral,巩固开发者生态
Voxtral 模型进一步通过 GitHub 开源,方便开发者构建语音应用。
这一策略加速 Mistral 在开源社区中的影响力扩张,增强其在语音AI和 Agent 工具链中的技术话语权。

Thinking Machines Lab(TML)

◆ 2025-07-16 完成20亿美元种子轮融资,估值达120亿美元,创历史纪录
由 OpenAI 前 CTO Mira Murati 创立的 TML 宣布完成20亿美元种子轮融资,估值达120亿美元,投资方包括 a16z、NVIDIA、AMD、Accel、Cisco 等。公司专注构建具备人类协作能力的多模态开源 AI 平台,强调模型应像人一样“通过对话、视觉与自然互动方式”进行交流。
TML 的横空出世不仅反映市场对“协作型通用智能”的看好,也凸显顶级AI高管创业自带强大融资能力。

Google / DeepMind

◆ 2025-07-17 推出新架构 MoR(Mixture-of-Recursions),提升推理效率与参数利用率
Google DeepMind 发布 MoR 架构论文,表示该架构可在保持精度的前提下,将推理速度提升至原先的2倍,参数规模减少50%。
MoR 被视为有望替代 Transformer 的下一代高效 LLM 架构,尤其适用于边缘计算与资源受限场景。该突破再次强化 Google 在基础架构研究领域的领导力。

◆ 2025-07-14 收购 Windsurf 核心团队与授权,抢占 AI 编码赛道
在 OpenAI 撤回收购后,Google 迅速以24亿美元获得 Windsurf 团队和其非独占代码技术许可。Windsurf 以 AI 编程工具著称,专注于端到端开发效率提升。
此次收购补强了 Gemini 编程能力,并巩固 Google 在 AI 工程平台领域的战略布局。

Baidu(百度)

◆ 2025-07-18 发布搜索型AI应用 TizzyAI,集成文心大模型4.0
百度发布智能搜索工具 TizzyAI,融合多轮问答、PPT生成、思维导图绘制等功能,主打结构化搜索体验,并支持实时数据分析与个性化推荐。
例如,用户查询“2025新能源汽车推荐”时,可自动生成参数对比表格并接入外部数据源。此举意在正面竞争 Perplexity、Kimi 等AI搜索平台。

◆ 2025-07-15 萝卜快跑与 Uber 达成战略合作,部署自动驾驶 Robotaxi
百度旗下萝卜快跑宣布与 Uber 达成全球合作协议,计划于2025年底前在中东与亚洲主要城市部署数千辆第六代 Robotaxi。车辆将接入 Uber 全球网络,实现用户端无缝叫车体验。
合作标志百度智能驾驶业务正式走向全球,并借助平台生态加速商业化落地。

ByteDance(字节跳动)

◆ 2025-07-18 上线AI短剧平台“咸柠短剧”,剧本生成工具降低60%制作成本
字节跳动推出第三款短剧APP“咸柠短剧”,整合抖音流量与AI生成技术。用户可通过设定角色性格与剧情走向,生成定制化剧情。平台采用AI剧本转镜工具,支持小说自动转化为分镜脚本。
该平台显著降低短剧制作门槛,有望在内容消费领域开辟“AI生成+互动叙事”新范式。

◆ 2025-07-17 曝光轻量化混合现实眼镜开发计划,重量仅127克
据 The Information 报道,字节正在开发一款轻量级混合现实眼镜,主打生产力与娱乐双场景,采用分离式计算模块设计,类比 Meta Orion 路线。研发由 VR 子公司 Pico 负责。
该设备若成功落地,将使字节在智能硬件生态形成新支点,与抖音、短剧等内容平台深度整合。

Moonshot AI(月之暗面)

◆ 2025-07-18 开源Kimi K2大模型,具备1T参数与多模态能力
Moonshot AI 发布 Kimi K2,为国内首个超万亿参数开源模型。该模型重点优化代码与推理能力,在 Alpaca Network 上实现链上代币化机制,允许用户共享模型收益。
Kimi K2 代表国内大模型在开放性与经济模式探索方面的新突破,增强其在开发者社群中的号召力。

Perplexity

◆ 2025-07-14 完成新一轮1亿美元融资,估值升至180亿美元
AI 搜索公司 Perplexity 宣布获得新一轮融资,公司估值跃升至180亿美元。其主打产品“AI浏览器 Comet”已启动封闭测试,目标挑战 Google 传统搜索。
创始人在 YC 公开演讲中表示,团队核心战略为“速度+准确率+极致体验”,不求资源绝对领先,但要策略制胜。

CoreWeave

◆ 2025-07-18 宣布在宾夕法尼亚投资60亿美元建设AI数据中心
英伟达支持的云初创 CoreWeave 宣布将在宾夕法尼亚州建设新一代 AI 数据中心,总投资高达60亿美元。该数据中心将专门服务于 AI 模型训练和推理任务。
此举回应当前算力紧张局面,并进一步巩固其在 OpenAI、Microsoft 等头部客户中的地位。

Soundverse

◆ 2025-07-18 发布面向企业的AI音乐API平台,强化商业创作场景
Soundverse 推出企业级AI音乐生成平台,支持合规的音乐内容创作,提供 API 接入,适用于广告、品牌声音等应用。
该平台主打“伦理AI音乐生成”概念,在原创性与版权合规性方面设立新标准,有望在B端音频市场打开突破口。

Decart

◆ 2025-07-18 发布 MirageLSD,全球首款实时无限视频生成模型
Decart 推出 MirageLSD,可持续生成动态视频内容,具备高帧率、无场景终止限制等特性,号称“视频生成版 GPT”。
该技术预计将在广告、电商、娱乐内容等领域引发新的内容创作潮流。

IBM

◆ 2025-07-17 宣布 Power11 企业服务器将于7月25日全面上市,嵌入AI推理引擎
IBM 表示其 Power11 服务器将搭载 AI 加速器,主打金融、医疗等高可靠场景部署。该产品具备片上 AI 推理能力,有望成为边缘部署新利器。
此举表明 IBM 正通过硬件层强化其 AI 技术整合能力,提升企业基础架构竞争力。
页: [1]
查看完整版本: AI,这一周发生了什么?