全球AI竞赛的新节点,中国AI在悄悄进步
作者:微信文章在人工智能高速发展的背景下,中国AI企业正从“追赶者”迅速转为“挑战者”。
根据报道,中国AI创新正在缩小中美差距。“低成本突破”与“开源战略”成为中国产业独特优势。DeepSeek,Moonshot AI,百度和阿里巴巴等多家公司,成为这一阶段最具代表性的案例。我们自主研发的大语言模型凭借极高性价比在 2025 年初震撼世界,后在年底又以更先进的数据让人们刮目相看。
DeepSeek:以少胜多的成本策略
DeepSeek 于2025 年 1 月推出其R1 模型,据称在芯片和算力受限的情况下,也实现了接近美国顶级模型的表现。没有依赖最先进的芯片,DeepSeek更多聚焦于算法效率、模型架构创新,从而绕开了部分硬件限制。这种策略意味着,AI竞争不再是单纯的“硬件堆叠”,而是效率与架构的比拼。中国AI生态由“资源追赶”转为“能力追赶”,模型创新、算法优化成为突破口。在大模型时代,高投入或许不再是唯一路径,低成本高效模型正打开另一条赛道。
Moonshot AI:开源时代的新力量
中国人工智能初创公司Moonshot AI凭借其Kimi K2 Thinking模型在多个性能基准测试中超越了OpenAI的GPT-5和Anthropic的Claude Sonnet 4.5,颠覆了人们对人工智能发展的预期。
总部位于北京、估值达33 亿美元的Moonshot AI 公司,获得了阿里巴巴集团控股和腾讯控股等科技巨头的支持,于2025年11 月 6 日发布了开源 Kimi K2 Thinking 模型,实现了业内观察人士所称的另一个“ DeepSeek 时刻”。Kimi K2 Thinking 在 Humanity's Last Exam 测试中获得了44.9% 的分数,这是一个大型语言模型基准测试,包含 2500 道涵盖广泛学科的问题,超过了 GPT-5的41.7%。该模型在 BrowseComp 基准测试中也取得了 60.2% 的成绩,该基准测试评估大型语言模型代理的网页浏览能力和信息搜索持久性。在 Seal-0 基准测试中,该模型获得了 56.3% 的成绩,领先于其他模型,该基准测试旨在挑战搜索增强模型在真实世界研究查询方面的能力。模型使用Mixture-of-Experts (MoE) 架构,总参数约 1 万亿(1 trillion)级,推理时激活约 320 亿(32 billion)参数。模型支持极大上下文窗口,高达256000 tokens,采用 INT4 量化技术和高效推理架构,实现相对低成本训练与高推理效率。训练成本仅约460 万美元,远低于传统大模型的投入。模型开源发布,采用 Modified MIT 许可证,具备商用与再开发权限。开源化意味着更多开发者可参与,模型生态碎片化加速。成本与规模的双重突破挑战了“亿级投入才是大模型”的既定印象。这种趋势或将重塑全球AI模型竞争格局:不仅比的是算力,更比的是“用更少资源做更多事”的能力。
百度 ERNIE:多模态AI新篇章
百度最新发布的多模态大模型 ERNIE-4.5-VL-28B-A3B-Thinking,在视觉、图表、工程图、视频语义等关键任务上表现突出。这款模型不仅拥有视觉能力,还能根据理解结果执行任务,为企业带来从感知到行动的智能化转变。在制造、交通、医疗、工程等行业中,大量数据并非文本,而是图像、视频、仪表盘截图等复杂格式。ERNIE 正是为这些非结构化数据而生,它的非文本数据处理更强,能识别复杂的图片、图表和视频信息,帮助企业快速提取关键内容。运行高效、成本更低,虽然模型规模庞大,但推理时只需激活约 30 亿参数,显著降低算力消耗。它还具备执行能力,不仅能分析图片内容,还能调用工具完成搜索、识别或生成结构化结果,真正实现从理解到行动。在多项视觉推理任务中,ERNIE 的成绩全面领先 GPT 和 Gemini:
这些数据表明,ERNIE 在图表解析、数学推理等任务中具有明显优势。ERNIE 在文章中展示了多项可直接映射为企业应用的能力,能够读取各类图表,判断并给出最优数据。能理解电路图并应用不同定律来解题,这表明其在工程技术文档、R&D 说明书上的辅助能力。它能找出图片中所有特定的人或物并返回其坐标,适用于生产线缺陷检测、安保审核等场景。可从企业长视频(培训、会议记录、安全监控)中提取字幕并标注时间戳,支持按时刻检索某一话题或片段。若遇到未知对象,模型可自动触发图像搜索;在复杂问题上可放大图像识别小字;在面对系统错误时可检索内部知识库并生成初步修复建议。
阿里巴巴 Qwen:对AI市场的颠覆
阿里巴巴旗下的通义千问(Qwen)应用在重新上线后一周内下载量突破 1000 万,增速超过 ChatGPT 等海外应用,带动阿里股价上涨超 5%。该应用程序自 11 月中旬起在苹果应用商店和谷歌应用商店上架,它与阿里巴巴的电子商务平台、地图服务和本地商业工具集成,展示了行业分析师所称的“智能体 AI”功能,除了生成内容外,还能执行跨场景任务。近期发布的 Qwen3-Max 模型在全球性能基准测试中位列前三,并在硅谷获得了显著的关注。Airbnb 首席执行官 Brian Chesky 曾公开表示,他的公司“高度依赖 Qwen”,而 NVIDIA 首席执行官黄仁勋也承认 Qwen 在全球开源模型领域日益增长的主导地位。Qwen 的用户增长在中国 AI 应用中极为抢眼,反映出国内用户对本土生成式/对话型 AI 应用的强烈需求,特别是在像 ChatGPT 等西方服务在大陆不可用的背景下。
阿里巴巴目标是打造一个“多用途/多模态”的 AI “助手”和“平台”,能够覆盖从专业工作到日常生活的多种场景。阿里将 Qwen 定位为其“AI-first”的战略核心。Qwen 不仅是单纯聊天机器人,而是未来“消费端 AI + 电商/生活服务整合”的入口,公司计划将其与旗下电商、云服务、办公、内容等业务深度融合。在功能发展上,阿里表示将逐步为 Qwen 加入“agentic AI”特性,即让 Qwen 不仅“回答问题/生成内容”,更能主动帮用户进行购物推荐、预约服务、日程安排等任务。
令人期待的好消息:
2025
值得一提的是,深圳国家高技术产业创新中心为主体搭建运营的粤港澳大湾区算力调度平台即将推出以 MaaS(Model as a Service)为核心的聚合服务,将全面支持包括上述的Qwen、DeepSeek、Kimi、ERNIE等在内的多个优秀国产大语言模型,让更多用户便捷调用这些“中国智造”的AI能力。通过统一接口和按需调用,中小企业、基层单位和个人开发者,都可以以极低门槛用上这些前沿AI模型,真正让领先的模型,走进民众的生活,落实到工作项目中。
2025年初到2025年末,中国AI的崛起不仅是一场技术上的胜利,更是对未来全球AI生态的一次深刻赋能。
我们所展示的高效、低成本和开源精神 ,正为全球科技界提供了一个全新的发展范式:
领先技术不必高不可攀,而是可以普惠共享!
页:
[1]