智东西作者 李水青编辑 心缘
智东西10月15日报道,今日,阿里通义千问团队推出其最强视觉语言模型系列Qwen3-VL的4B与8B版本,两个尺寸均提供Instruct与Thinking版本,在几十项权威基准测评中超越Gemini 2.5 Flash Lite、GPT-5 Nano等同级别顶尖模型。
▲阿里千问团队公告截图(图源:X平台)
这两个新版本模型实现了以下关键目标:
1、资源门槛更低:尺寸缩减显著降低VRAM的占用。现在,开发者可以在更广泛的硬件设备上部署和运行模型。
2、核心能力不减配:在缩减尺寸的同时,其完整保留了Qwen3-VL的全部核心功能。
3、基准性能优秀:在STEM、VQA、OCR、视频理解及Agent任务等多个权威基准上,其表现不仅超越了Gemini 2.5 Flash Lite和GPT-5 Nano,在许多场景下甚至能与阿里半年前的旗舰模型Qwen2.5-VL-72B相媲美。
如下图所示,在多模态性能方面,Qwen3-VL-8B Instruct在MIABench、OCRBench、SUNRGBD、ERQA、VideoMMMU、ScreenSpot等30项权威基准测评中取得SOTA(行业最佳)成绩,超越了Gemini 2.5 Flash Lite、GPT-5 Nano以及Qwen2.5-VL-72B等顶尖模型。
▲Qwen3-VL-8B Instruct与Qwen3-VL-4B Instruct基准测评情况(图源:Qwen)
Qwen3-VL-4B Instruct也展现出优秀的多模态性能,以更少的参数量,在STEM、VQA、OCR、视频理解及Agent任务等测评中,能与Gemini 2.5 Flash Lite、GPT-5 Nano对打。
在纯文本表现上,如下图所示,Qwen3-VL-8B Instruct和Qwen3-VL-4B Instruct也相比Qwen3-4B Instruct-2507和Qwen3-8B Non-Thinking有整体提高。
▲Qwen3-VL-8B Instruct与Qwen3-VL-4B Instruct基准测评情况(图源:Qwen)
在多模态性能方面,Qwen3-VL-8B Thinking取得了MathVision、MMStar、HallusionBench、MM-MT-Bench、CountBench等23项权威基准测评的SOTA,超越Gemini 2.5 Flash Lite、GPT-5 Nano高版本以及其他同等级顶尖开源模型。Qwen3-VL-4B Thinking同样表现出“以小敌大”的成绩。
▲Qwen3-VL-8B Thinking与Qwen3-VL-4B Thinking基准测评情况(图源:Qwen)
在纯文本表现上,Qwen3-VL-8B Thinking和Qwen3-VL-4B Thinking相比于Qwen3-4BThinking-2507和Qwen3-8B Thinking有整体提高。
▲Qwen3-VL-8B Thinking与Qwen3-VL-4B Thinking基准测评情况(图源:Qwen)
该模型一经发布,就在外网引起了不少开发者关注。不少人对此表示一直在等这个,有人称:“终于,我在16GB的Mac上可以用了。”也有不少人开始催更Qwen3-Max及其他新万博体育:版本模型了。
▲外网用户对新版本Qwen3-VL的评论(图源:X平台)
自9月24日阿里开源Qwen3-VL系列以来,作为Qwen系列中最强的视觉语言模型,该模型在全球AI开源社区中快速收获认可。(《阿里又一大模型开源,手机电脑样样玩的溜,多项测试秒GPT-5》)
在9月底的Chatbot Arena子榜单Vision Arena中,Qwen3-VL位居第二,是视觉理解领域中的全球开源冠军;同时,Qwen3-VL还斩获纯文本赛道(Text Arena)的开源第一(全球第8),成为首个揽获纯文本和视觉两大领域同时开源第一的大模型。
▲在Vision Arena中Qwen3-VL位居第二(图源:Qwen)
并且,Qwen3-VL还在全球知名的大模型API三方聚合平台OpenRouter图像处理榜单上以48%的市场份额跃升至全球第一。
▲Qwen3-VL在OpenRouter图像处理榜单上表现(图源:OpenRouter)
近期,阿里还推出Qwen3-VL Cookbook(使用指南),涵盖图像思维、计算机使用Agent、多模态变成、3D定位、空间推理、视频理解等多种多模态用例,助用户高效上手和深度应用。
模型地址:https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b体验地址:chat.qwen.ai (在模型列表选择Qwen3-VL系列模型)Cookbook地址:https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks
来源:X平台、Hugging Face、通义千问Qwen公众号
《大发投注登录》,《Q8X2R7L1T4J5M9B6W3》必威官方下载
“韦德体育体育APP”
艾弗森代言的BB球赛平台
……
10月16日
“世界杯买球语fc3典tv”韩红:别再做我病危的假新闻了
↓↓↓
10月16日,香江观澜:港人参与国家航天事业空间无限,大嬴家彩票平台官网,凯发娱乐官网网站登录,澳门九五至尊网投网站,188金宝慱手机客户端
10月16日,中国航展馆内军歌嘹亮 引观众集体大合唱,正版拼三张下载,千赢国际官网APP,美高梅注册上分手机版官网,百灵百人牛牛手游官网
10月16日,(新春走基层)宁夏银川:年宵花俏销新春市场,皇冠真人百家乐,万博max手机,扑克王app链接,打十三水技巧
10月16日|浙江启动“415X”重点产业招商年 打造高质量外资集聚地|18博体育|菲律宾亚星开户|真人网娱乐平台|九游会ag正版app
10月16日|北京将加强科技创新和产业创新协同 发展新质生产力|大奖娱乐游戏官方网站|外围足球在哪买|ob体育最新官网入口首页|万豪平台网址
10月16日|首架“亚冬号”主题彩绘机在沪亮相|华纳娱乐网址是多少|易博yb|天博国际app下载|ManBetX万博app官方……
10月16日,2024济南(泉城)马拉松比赛开跑 超3万人参赛,世界杯网上能投注吗,万博官方网站登录,新萄京棋牌个人中心,正规app买球
10月16日,交通部门健全春运应急预案确保旅客安全出行,AG平台官网多少,gd真人线上平台,ag国际真人,英皇体育官网下载
10月16日|找回率超99%背后是2972个团圆故事|抓码王|必博开户|皇马在线开户|m6米乐怎么开户
10月16日,两会受权发布丨十四届全国人大二次会议主席团常务主席第三次会议举行 赵乐际主持,棋牌王真钱斗地主,万博官网app,足球ob平台怎么样,998棋牌
10月16日,童彦婷:在“非遗地图”上架起两岸连心桥,送彩金彩票平台大全,im电竞官网网址,火狐体育在线app,网上AG正规平台有哪些
10月16日,记者手记:在贝尔格莱德看“桥”,ag亚洲官网入口,威尼斯人谁知道网站,vwin德赢登录,合法的买球app
10月16日|突破千元!第八代五粮液出厂价确认上调|BOB综合中国|letou国际|疯狂麻将|沙巴比分
10月16日|香港警方扫毒遇嫌疑人反抗 数名警员受伤|888真人下载地址|网上百老汇网址|火狐体育页面|黄金岛官方下载
10月16日|在热议AI时看见农村|美高梅棋牌游戏|澳门皇冠线上app网址|德州牛仔刷水|新蒲京娱乐官方
从冠军中单到进厂打工人,央视曝光开盒挂人案例|法国东南部遭暴雨袭击已致3人死亡 仍有4人失踪|火狐在线注册|威尼斯人登录官网|天下第一棋牌官方网站|im电竞体育平台
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺