阿里云Qwen3-VL 4B/8B版本发布, 在多基准测试中表现强劲

10月15日消息,阿里云正式推出Qwen3-VL的紧凑dense版本,目前有4B和8B参数规模的版本可供选择,每个规模都包含Instruct和Thinking两种变体。

该系列模型具有三大优势:一是显存占用更低,能适配更多硬件环境;二是完整保留了Qwen3-VL的全部能力,多模态任务处理能力不受参数规模缩减影响;三是在各领域都表现出强劲性能。

尽管参数规模较小,但它们在STEM、视觉问答(VQA)、光学字符识别(OCR)、视频理解、智能体任务等多项基准测试中,性能超过Gemini2.5FlashLite和GPT-5Nano等模型,在很多情况下甚至能与六个月前推出的旗舰款Qwen2.5-VL-72B相媲美。

此外,该系列还提供FP8版本,便于高效部署。用户可在HuggingFace、ModelScope平台获取相关资源,也可通过阿里云ModelStudio平台调用Qwen3-VL-8B-Instruct和Qwen3-VL-8B-Thinking的API,同时GitHub上也有相关实战指南(Cookbooks)可供参考。

从附带的基准测试表格来看,在STEM&Puzzle、GeneralVQA等多个任务类别中,Qwen3-VL4B/8B版本的各项指标均优于Gemini2.5FlashLite和GPT-5Nano,部分指标甚至接近Qwen2.5-VL-72B。