当前位置:首页 → 电脑软件 → 李小龙模仿者喊话向佐公开道歉 → 月英无惨漫画 v8.361.4992.946932 安卓最新版
v9.777.614 PC版
v2.584.5246.515985 PC版
v8.252.8643 安卓免費版
v7.550.8113.98728 最新版
v5.898.7723.485799 安卓免費版
v7.13.9263.914116 安卓版
v7.48.5824.711470 安卓免費版
v1.740 安卓版
v3.219.2728.585905 安卓版
v2.169.2265.919982 安卓版
v4.898.9901.164538 PC版
v1.630.5094.406449 安卓免費版
v5.518.6761.924480 最新版
v7.373 安卓免費版
v7.478.9190.457079 安卓免費版
v7.652.6368.435114 安卓漢化版
v6.115.6791 安卓免費版
v5.257.8680.816632 安卓版
v8.391 安卓免費版
v8.371 安卓最新版
v9.436.1486.514664 PC版
v7.718.9002.223423 安卓免費版
v6.591 IOS版
v4.484.2843.949311 安卓漢化版
v3.677 PC版
v6.772.3800.164993 最新版
v8.662.698 安卓免費版
v1.163.6182.998241 安卓免費版
v8.588.9164.42754 最新版
v1.631.8020.120814 PC版
v9.618.4318.938069 PC版
v8.392 安卓最新版
v9.207.9496 安卓最新版
v3.412.9946.536980 安卓漢化版
v8.186.4968 PC版
v3.378 安卓漢化版
v9.731.251.2843 安卓漢化版
v7.500.4320 安卓最新版
v1.921.7778.44969 IOS版
v6.625.3432.837054 安卓免費版
v6.980.7268.89873 PC版
v5.78.9843.196217 安卓免費版
v5.354.8410.592800 最新版
v7.266.9879 PC版
v3.264.308.406336 安卓漢化版
v7.578.451.446822 安卓最新版
v5.642.2756.76624 安卓版
v7.501.5273.807340 安卓免費版
v8.256.3584.841360 安卓漢化版
v7.710 安卓版
v1.492.1284.947429 安卓免費版
v6.723.2188.563084 PC版
v8.865.8827 PC版
v9.645 安卓最新版
v4.838.3840 最新版
v9.159 安卓版
v4.642.524.787742 最新版
v6.79 安卓最新版
v3.515.7324.463616 安卓漢化版
v1.49.9475.715378 安卓版
v8.442.9773.930470 安卓免費版
v2.854.6076 安卓漢化版
v9.978.4673 安卓版
v4.151.3715 最新版
v5.703.1262 PC版
v8.94.5598.978325 安卓免費版
v8.84.9561.240551 安卓最新版
v4.724 PC版
v3.5.7722.809216 IOS版
v6.602.4671.514584 安卓版
v4.837 安卓漢化版
v3.660 IOS版
v5.31 最新版
v2.577 安卓漢化版
v7.302.6853.284688 IOS版
v2.548.9762 最新版
v6.785.7920.61828 安卓漢化版
v8.456.8581 安卓最新版
v4.748 最新版
v6.268.4770 IOS版
月英无惨漫画
智东西作者 李水青编辑 心缘
智东西10月15日报道,今日,阿里通义千问团队推出其最强视觉语言模型系列Qwen3-VL的4B与8B版本,两个尺寸均提供Instruct与Thinking版本,在几十项权威基准测评中超越Gemini 2.5 Flash Lite、GPT-5 Nano等同级别顶尖模型。
▲阿里千问团队公告截图(图源:X平台)
这两个新版本模型实现了以下关键目标:
1、资源门槛更低:尺寸缩减显著降低VRAM的占用。现在,开发者可以在更广泛的硬件设备上部署和运行模型。
2、核心能力不减配:在缩减尺寸的同时,其完整保留了Qwen3-VL的全部核心功能。
3、基准性能优秀:在STEM、VQA、OCR、视频理解及Agent任务等多个权威基准上,其表现不仅超越了Gemini 2.5 Flash Lite和GPT-5 Nano,在许多场景下甚至能与阿里半年前的旗舰模型Qwen2.5-VL-72B相媲美。
如下图所示,在多模态性能方面,Qwen3-VL-8B Instruct在MIABench、OCRBench、SUNRGBD、ERQA、VideoMMMU、ScreenSpot等30项权威基准测评中取得SOTA(行业最佳)成绩,超越了Gemini 2.5 Flash Lite、GPT-5 Nano以及Qwen2.5-VL-72B等顶尖模型。
▲Qwen3-VL-8B Instruct与Qwen3-VL-4B Instruct基准测评情况(图源:Qwen)
Qwen3-VL-4B Instruct也展现出优秀的多模态性能,以更少的参数量,在STEM、VQA、OCR、视频理解及Agent任务等测评中,能与Gemini 2.5 Flash Lite、GPT-5 Nano对打。
在纯文本表现上,如下图所示,Qwen3-VL-8B Instruct和Qwen3-VL-4B Instruct也相比Qwen3-4B Instruct-2507和Qwen3-8B Non-Thinking有整体提高。
▲Qwen3-VL-8B Instruct与Qwen3-VL-4B Instruct基准测评情况(图源:Qwen)
在多模态性能方面,Qwen3-VL-8B Thinking取得了MathVision、MMStar、HallusionBench、MM-MT-Bench、CountBench等23项权威基准测评的SOTA,超越Gemini 2.5 Flash Lite、GPT-5 Nano高版本以及其他同等级顶尖开源模型。Qwen3-VL-4B Thinking同样表现出“以小敌大”的成绩。
▲Qwen3-VL-8B Thinking与Qwen3-VL-4B Thinking基准测评情况(图源:Qwen)
在纯文本表现上,Qwen3-VL-8B Thinking和Qwen3-VL-4B Thinking相比于Qwen3-4BThinking-2507和Qwen3-8B Thinking有整体提高。
▲Qwen3-VL-8B Thinking与Qwen3-VL-4B Thinking基准测评情况(图源:Qwen)
该模型一经发布,就在外网引起了不少开发者关注。不少人对此表示一直在等这个,有人称:“终于,我在16GB的Mac上可以用了。”也有不少人开始催更Qwen3-Max及其他新万博体育:版本模型了。
▲外网用户对新版本Qwen3-VL的评论(图源:X平台)
自9月24日阿里开源Qwen3-VL系列以来,作为Qwen系列中最强的视觉语言模型,该模型在全球AI开源社区中快速收获认可。(《阿里又一大模型开源,手机电脑样样玩的溜,多项测试秒GPT-5》)
在9月底的Chatbot Arena子榜单Vision Arena中,Qwen3-VL位居第二,是视觉理解领域中的全球开源冠军;同时,Qwen3-VL还斩获纯文本赛道(Text Arena)的开源第一(全球第8),成为首个揽获纯文本和视觉两大领域同时开源第一的大模型。
▲在Vision Arena中Qwen3-VL位居第二(图源:Qwen)
并且,Qwen3-VL还在全球知名的大模型API三方聚合平台OpenRouter图像处理榜单上以48%的市场份额跃升至全球第一。
▲Qwen3-VL在OpenRouter图像处理榜单上表现(图源:OpenRouter)
近期,阿里还推出Qwen3-VL Cookbook(使用指南),涵盖图像思维、计算机使用Agent、多模态变成、3D定位、空间推理、视频理解等多种多模态用例,助用户高效上手和深度应用。
模型地址:https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b体验地址:chat.qwen.ai (在模型列表选择Qwen3-VL系列模型)Cookbook地址:https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks
来源:X平台、Hugging Face、通义千问Qwen公众号
相关版本
多平台下载
查看所有0条评论>网友评论