您当前的位置: 首页 >> 业界/市场动态

便宜大碗,阿里云开源Qwen3系列大模型

作者:郑州杰升电子交流圈电子网 日期:2025-04-29 点击数:2

4月29日凌晨,阿里云正式开源Qwen3系列大模型,包括2个MoE模型和6个稠密模型。发布仅2小时,Qwen3已在GitHub收获超16.9k颗Star。

据介绍,旗舰模型Qwen3-235B-A22B在编程、数学、通用能力等基准测试中登顶全球,超越DeepSeek-R1OpenAI o1Grok-3等主流模型。

无标题.jpg

Qwen3系列是全球首个开源的混合推理(混合思考模式)大模型。也就是说它可根据任务自由切换“思考模式”和“非思考模式”,在不同推理深度下优化输出效果和效率。

新一代Qwen3提供8个不同尺寸的模型,覆盖0.6B到235B参数规模,几乎适配从轻量端到旗舰部署的各类应用场景。旗舰模型Qwen3-235B-A22B在推理成本上也显著优化,部署成本仅为DeepSeek R1的三分之一。

此外,在功能扩展上,Qwen3全面支持MCP(模型上下文协议),使大模型能够与外部数据源、工具系统深度集成,提升Agent复杂任务处理能力。

同时,Qwen3模型支持119种语言和方言,进一步强化了全球适配性。

目前,Qwen3系列已在Hugging Face、ModelScope和Kaggle等平台开源,遵循Apache 2.0协议。

本站所有文章、数据、图片均来自网友原创提供和互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知我们删除。邮箱: