【AI日报「4月29日」阿里新模型Qwen 3发布,强,有多强?】萍聚社区-德国热线-德国实用信息网人工智能

多客科技 发表于 2025-4-29 09:50

AI日报「4月29日」阿里新模型Qwen 3发布,强,有多强?

作者：微信文章

阿里的Qwen 3新发布了，根据官方信息，简单的说比24年底发布的OpenAI-o1强，比今年3月25日发布的Gemini 2.5-Pro弱。

按照https://artificialanalysis.ai/的榜单，大概在60-68分之间。但是Qwen3是开源的（MoE模型只开源的权重，Dense模型完全开源），而且均是在 Apache 2.0 许可下开源，条件非常宽松。所以，阿里这开源一哥的地位是没跑了。本次开源了：两个 MoE 模型的权重：Qwen3-235B-A22B，一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型，Qwen3-30B-A3B，一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。六个 Dense 模型：包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

Qwen3 强的地方之一：「思考模式/非思考模式」的无缝切换思考模式的输出方式，类似 DeepSeek R1，模型会逐步推理，经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。非思考模式则更类似 DeepSeek V3，提供快速的即时响应，适用于那些简单问题。通过这种方式，用户能够根据具体需求，来控制模型的“思考”的程度，做到效果、成本、时间上的平衡。Qwen3 强的地方之二：多语言Qwen3 模型支持 119 种语言和方言。这一广泛的多语言能力为国际应用开辟了新的可能性，让全球用户都能受益于这些模型的强大功能。Qwen3 强的地方之三：增强的 Agent 能力
优化了 Qwen3 模型的 Agent 和代码能力，同时也加强了对 MCP 的支持。

现在Qwen家族又多一员，人真的是越来越多了，也越来越乱了……

嗯，这是Qwen3之前，阿里已经开源的模型

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI日报「4月29日」阿里新模型Qwen 3发布,强,有多强?