AI日报「4月29日」阿里新模型Qwen 3发布,强,有多强?
作者:微信文章阿里的Qwen 3新发布了,根据官方信息,简单的说比24年底发布的OpenAI-o1强,比今年3月25日发布的Gemini 2.5-Pro弱。
按照https://artificialanalysis.ai/的榜单,大概在60-68分之间。但是Qwen3是开源的(MoE模型只开源的权重,Dense模型完全开源),而且均是在 Apache 2.0 许可下开源,条件非常宽松。所以,阿里这开源一哥的地位是没跑了。本次开源了:两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型,Qwen3-30B-A3B,一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。六个 Dense 模型:包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。
Qwen3 强的地方之一:「思考模式/非思考模式」的无缝切换思考模式的输出方式,类似 DeepSeek R1,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。非思考模式则更类似 DeepSeek V3,提供快速的即时响应,适用于那些简单问题。通过这种方式,用户能够根据具体需求,来控制模型的“思考”的程度,做到效果、成本、时间上的平衡。Qwen3 强的地方之二:多语言Qwen3 模型支持 119 种语言和方言。这一广泛的多语言能力为国际应用开辟了新的可能性,让全球用户都能受益于这些模型的强大功能。Qwen3 强的地方之三:增强的 Agent 能力
优化了 Qwen3 模型的 Agent 和 代码能力,同时也加强了对 MCP 的支持。
现在Qwen家族又多一员,人真的是越来越多了,也越来越乱了……
嗯,这是Qwen3之前,阿里已经开源的模型
页:
[1]