阿里Qwen3能否成为下一个DeepSeek？

阿里祭出 AI" 双子星 " 狙击大厂围城

作者／ IT 时报记者毛宇

编辑／孙妍

4 月 29 日凌晨，阿里巴巴旗下通义千问团队正式发布并开源新一代模型 Qwen3。此次发布的 Qwen3 系列涵盖了多个模型类型，包括 2 款参数规模为 30B 和 235B 的混合专家（MoE）模型，以及 6 款参数从 0.6B 到 32B 的密集模型。

作为国内首个混合推理模型家族，一经推出便迅速引发开源圈的激烈讨论：Qwen3 能否成为下一个 DeepSeek？

发布后不久，华为计算官方发文称，昇腾 MindSpeed 和 MindIE 一直以来同步支持 Qwen 系列模型，此次 Qwen3 系列开源后，已在 MindSpeed 和 MindIE 中实现开箱即用，完成了 Qwen3 的 0Day 适配。海光信息方面也表示，其 DCU 迅速完成对全部 8 款模型的无缝适配与调优。

" 发布第二天，我们已经完成了本地化部署 Qwen3-30B-A3B，用了单卡 4090，目前对 C 端用户开放。" 共绩算力 COO 王鹏告诉《IT 时报》记者，目前 Qwen3 部署成本较低，Qwen3-235B-A22B 只需要 4 张 H20，而其小模型的部署成本则更低。亦有算力集群公司的工作人员告诉记者，Qwen3 发布第二天已接到客户订单。

成本较 DeepSeek 大幅下降

仍未解决幻觉问题

与此前的模型相比，Qwen3 有着明显提升。

在架构上，Qwen3 采用混合专家（MoE）架构，以旗舰模型 Qwen3-235B-A22B 为例，总参数量高达 235B，但激活仅需 22B，大大降低了运行时对算力的即时需求。

这一设计使得模型在面对不同复杂程度的任务时，能够灵活调配计算资源，针对简单问题快速响应，复杂问题深度思考，实现 " 快思考 " 与 " 慢思考 " 的结合，兼顾效率与准确性，为模型应用开拓了更广阔的空间，有望改变行业对模型应用场景适配的传统思路。

预训练数据量的提升也是 Qwen3 的一大亮点。官方数据显示，其数据量跃升至 36T，是 Qwen2.5 的三倍之多。多轮强化学习的运用，将非思考模式巧妙融入思考模型，优化了模型的智能处理逻辑，进一步提升了模型在推理、指令遵循、工具调用以及多语言能力等方面的表现。

与 DeepSeek-R1 相比，Qwen3 参数量仅为其 1/3，成本大幅下降。在部署方面，仅需 4 张 H20 即可部署 Qwen3 满血版，显存占用仅为性能相近模型的三分之一。" 这对于中小企业和个人开发者而言，极大降低了使用高性能模型的成本门槛和部署时间。" 王鹏表示。

但也有不少 AI 发烧友实测后在社交平台上指出，Qwen3 在长文本能力上的表现并不算突出，有一定幻觉率，但在生成复杂代码、数学推理等方面，思考模式的表现明显好于非思考模式。《IT 时报》记者使用 Qwen3 网页版尝试生成关于 " 去年五一小长假旅游数据与景区特性关联 " 的报告，Qwen3" 普通 " 模式未能给出准确数据支持，出现了较高的幻觉率，但在 " 深度思考 " 模式下，幻觉率大幅降低，数据更加准确。

祭出 AI" 双子星 " 战略

阿里迫切想在 C 端站稳脚跟

在当下 AI 赛道，科技巨头们的每一步落子都备受瞩目。

近期，一则有关算力抢购的传闻甚嚣尘上，传言腾讯、阿里、字节跳动纷纷下场，重金争抢 GPU 算力资源。虽然字节跳动已出面辟谣，称相关信息不实，但这一传闻本身，足以反映科技大厂对 AI 战略布局的重视与急切。

作为 AI 发展的根基，算力的重要性不言而喻。阿里此前更是公开表态，未来三年将投入超 3800 亿元用于云和 AI 硬件基础设施建设。

当前，阿里集团各个业务板块将 AI 作为重要 KPI，从阿里的整体 AI 战略布局来看，对 AI 的投入持续加大，试图强化通义千问与夸克的 " 双子星 " 格局。通义千问专注于支撑云上智能，夸克则着力打造端侧入口，协同推动阿里 AI To C 战略的落地。

与此前最大的不同是，" 夸克 " 和 " 通义 " 成为 Qwen3 的主要体验入口，这两大 App 所有用户均可免费使用这一最新的开源模型。

" 通义 App 在 C 端并没有打出声量，只能委以夸克重任。" 一位阿里内部人士曾对《IT 时报》记者表示。

通义千问凭借在多模态处理和复杂任务推理方面的技术优势，曾为阿里的 B 端企业服务及开发者生态提供了有力支撑。诸如飞猪旅行借助通义千问多模态模型，实现了用户方言语音规划行程的功能；Rokid AR 眼镜搭载其技术后，能够进行实时翻译。通义千问在大模型开源上跑得很快，但是，其 " 通义 "App 在 C 端应用上并没有使出 " 撒手锏 "。

反倒是夸克突破重围，第三方数据显示，2025 年 3 月，夸克的 MAU（月活跃人数）达到 1.48 亿，登上国内 AI 应用榜首。

2024 年底至 2025 年初，阿里通过一系列组织架构调整和人才布局推进 AI To C 战略，将 AI 应用 " 通义 " 并入智能信息事业群，整合天猫精灵与夸克团队，并聘请顶尖 AI 科学家许主洪负责 AI To C 业务研发。

阿里 AI 战略仍有诸多挑战横亘在前。通义千问在维持技术优势的同时，如何进一步降低使用门槛，满足中小企业多样化的定制需求，成为亟待解决的难题。其 API（应用程序编程接口）价格虽具备一定竞争力，但部分中小企业在技术对接与模型二次开发方面，仍面临诸多困难。夸克同样面临挑战，随着用户数量的快速增长，体验稀释问题逐渐凸显，部分功能在流量增加时响应速度变慢，这就要求夸克必须优化技术架构与服务器性能，以确保用户体验的稳定性。

虽然手握通义和夸克 " 双子星 "，一条腿迈进开源圈，一条腿迈向 C 端用户，但在巨头环伺下，阿里 AI 战略的前路仍充满变数。

排版／季嘉颖

图片／通义东方 IC

来源／《IT 时报》公众号 vittimes

E N D