热搜词:

阿里Qwen3能否成为下一个DeepSeek?

阿里祭出 AI" 双子星 " 狙击大厂围城

作者/   IT 时报记者    毛宇

编辑/  孙妍

4 月 29 日凌晨,阿里巴巴旗下通义千问团队正式发布并开源新一代模型 Qwen3。此次发布的 Qwen3 系列涵盖了多个模型类型,包括 2 款参数规模为 30B 和 235B 的混合专家(MoE)模型,以及 6 款参数从 0.6B 到 32B 的密集模型。

作为国内首个混合推理模型家族,一经推出便迅速引发开源圈的激烈讨论:Qwen3 能否成为下一个 DeepSeek?

发布后不久,华为计算官方发文称,昇腾 MindSpeed 和 MindIE 一直以来同步支持 Qwen 系列模型,此次 Qwen3 系列开源后,已在 MindSpeed 和 MindIE 中实现开箱即用,完成了 Qwen3 的 0Day 适配。海光信息方面也表示,其 DCU 迅速完成对全部 8 款模型的无缝适配与调优。

" 发布第二天,我们已经完成了本地化部署 Qwen3-30B-A3B,用了单卡 4090,目前对 C 端用户开放。" 共绩算力 COO 王鹏告诉《IT 时报》记者,目前 Qwen3 部署成本较低,Qwen3-235B-A22B 只需要 4 张 H20,而其小模型的部署成本则更低。亦有算力集群公司的工作人员告诉记者,Qwen3 发布第二天已接到客户订单。

成本较 DeepSeek 大幅下降

仍未解决幻觉问题

与此前的模型相比,Qwen3 有着明显提升。

在架构上,Qwen3 采用混合专家(MoE)架构,以旗舰模型 Qwen3-235B-A22B 为例,总参数量高达 235B,但激活仅需 22B,大大降低了运行时对算力的即时需求。

这一设计使得模型在面对不同复杂程度的任务时,能够灵活调配计算资源,针对简单问题快速响应,复杂问题深度思考,实现 " 快思考 " 与 " 慢思考 " 的结合,兼顾效率与准确性,为模型应用开拓了更广阔的空间,有望改变行业对模型应用场景适配的传统思路。

预训练数据量的提升也是 Qwen3 的一大亮点。官方数据显示,其数据量跃升至 36T,是 Qwen2.5 的三倍之多。多轮强化学习的运用,将非思考模式巧妙融入思考模型,优化了模型的智能处理逻辑,进一步提升了模型在推理、指令遵循、工具调用以及多语言能力等方面的表现。

与 DeepSeek-R1 相比,Qwen3 参数量仅为其 1/3,成本大幅下降。在部署方面,仅需 4 张 H20 即可部署 Qwen3 满血版,显存占用仅为性能相近模型的三分之一。" 这对于中小企业和个人开发者而言,极大降低了使用高性能模型的成本门槛和部署时间。" 王鹏表示。

但也有不少 AI 发烧友实测后在社交平台上指出,Qwen3 在长文本能力上的表现并不算突出,有一定幻觉率,但在生成复杂代码、数学推理等方面,思考模式的表现明显好于非思考模式。《IT 时报》记者使用 Qwen3 网页版尝试生成关于 " 去年五一小长假旅游数据与景区特性关联 " 的报告,Qwen3" 普通 " 模式未能给出准确数据支持,出现了较高的幻觉率,但在 " 深度思考 " 模式下,幻觉率大幅降低,数据更加准确。

祭出 AI" 双子星 " 战略

阿里迫切想在 C 端站稳脚跟

在当下 AI 赛道,科技巨头们的每一步落子都备受瞩目。

近期,一则有关算力抢购的传闻甚嚣尘上,传言腾讯、阿里、字节跳动纷纷下场,重金争抢 GPU 算力资源。虽然字节跳动已出面辟谣,称相关信息不实,但这一传闻本身,足以反映科技大厂对 AI 战略布局的重视与急切。

作为 AI 发展的根基,算力的重要性不言而喻。阿里此前更是公开表态,未来三年将投入超 3800 亿元用于云和 AI 硬件基础设施建设。

当前,阿里集团各个业务板块将 AI 作为重要 KPI,从阿里的整体 AI 战略布局来看,对 AI 的投入持续加大,试图强化通义千问与夸克的 " 双子星 " 格局。通义千问专注于支撑云上智能,夸克则着力打造端侧入口,协同推动阿里 AI To C 战略的落地。

与此前最大的不同是," 夸克 " 和 " 通义 " 成为 Qwen3 的主要体验入口,这两大 App 所有用户均可免费使用这一最新的开源模型。

" 通义 App 在 C 端并没有打出声量,只能委以夸克重任。" 一位阿里内部人士曾对《IT 时报》记者表示。

通义千问凭借在多模态处理和复杂任务推理方面的技术优势,曾为阿里的 B 端企业服务及开发者生态提供了有力支撑。诸如飞猪旅行借助通义千问多模态模型,实现了用户方言语音规划行程的功能;Rokid AR 眼镜搭载其技术后,能够进行实时翻译。通义千问在大模型开源上跑得很快,但是,其 " 通义 "App 在 C 端应用上并没有使出 " 撒手锏 "。

反倒是夸克突破重围,第三方数据显示,2025 年 3 月,夸克的 MAU(月活跃人数)达到 1.48 亿,登上国内 AI 应用榜首。

2024 年底至 2025 年初,阿里通过一系列组织架构调整和人才布局推进 AI To C 战略,将 AI 应用 " 通义 " 并入智能信息事业群,整合天猫精灵与夸克团队,并聘请顶尖 AI 科学家许主洪负责 AI To C 业务研发。

阿里 AI 战略仍有诸多挑战横亘在前。通义千问在维持技术优势的同时,如何进一步降低使用门槛,满足中小企业多样化的定制需求,成为亟待解决的难题。其 API(应用程序编程接口)价格虽具备一定竞争力,但部分中小企业在技术对接与模型二次开发方面,仍面临诸多困难。夸克同样面临挑战,随着用户数量的快速增长,体验稀释问题逐渐凸显,部分功能在流量增加时响应速度变慢,这就要求夸克必须优化技术架构与服务器性能,以确保用户体验的稳定性。

虽然手握通义和夸克 " 双子星 ",一条腿迈进开源圈,一条腿迈向 C 端用户,但在巨头环伺下,阿里 AI 战略的前路仍充满变数。

排版/ 季嘉颖

图片/  通义   东方 IC

来源/《IT 时报》公众号 vittimes

E N D