阿里云Qwen3-VL 4B/8B版本发布, 在多基准测试中表现强劲

10月15日消息，阿里云正式推出Qwen3-VL的紧凑dense版本，目前有4B和8B参数规模的版本可供选择，每个规模都包含Instruct和Thinking两种变体。

该系列模型具有三大优势：一是显存占用更低，能适配更多硬件环境；二是完整保留了Qwen3-VL的全部能力，多模态任务处理能力不受参数规模缩减影响；三是在各领域都表现出强劲性能。

尽管参数规模较小，但它们在STEM、视觉问答（VQA）、光学字符识别（OCR）、视频理解、智能体任务等多项基准测试中，性能超过Gemini2.5FlashLite和GPT-5Nano等模型，在很多情况下甚至能与六个月前推出的旗舰款Qwen2.5-VL-72B相媲美。

此外，该系列还提供FP8版本，便于高效部署。用户可在HuggingFace、ModelScope平台获取相关资源，也可通过阿里云ModelStudio平台调用Qwen3-VL-8B-Instruct和Qwen3-VL-8B-Thinking的API，同时GitHub上也有相关实战指南（Cookbooks）可供参考。

从附带的基准测试表格来看，在STEM&Puzzle、GeneralVQA等多个任务类别中，Qwen3-VL4B/8B版本的各项指标均优于Gemini2.5FlashLite和GPT-5Nano，部分指标甚至接近Qwen2.5-VL-72B。