米乐手机网页登录 干掉同声传译🙍‍♀?阿里又推出一模型🔝,精通18种语言,离线可用 2025-09-24_新万博体育
米乐手机网页登录 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页专题合集 → P6F3X2M7T9QJ8L1B4WZR

干掉同声传译?阿里又推出一模型,精通18种语言,离线可用

干掉同声传译?阿里又推出一模型,精通18种语言,离线可用

智东西作者 王涵编辑 漠影

智东西9月30日消息,刚刚,通义千问推出多语言实时音视频同传模型Qwen3-LiveTranslate-Flash,占据多个中英及多语言语音翻译榜单第一名!

Qwen3-LiveTranslate-Flash实现了覆盖18种语言的离线和实时两种音视频翻译能力,主要有以下5个核心亮点:

1、多语言和方言:支持中文、英文、法语、德语、俄语、意大利语、西班牙语等主要官方语言和普通话、粤语、北京话、吴话、四川话、天津话的方言翻译。

2、视觉增强:首次引入视觉上下文增强技术,Qwen3-LiveTranslate-Flash可以通过识别和利用口型、动作、文字、实体等多模态信息,有效应对嘈杂音频环境以及一词多译词场景下的翻译不准问题。

3、3秒延迟:轻量的混合专家架构与动态采样策略,同传实现最低3秒的延迟。

4、无损同传:该模型采用语义单元预测技术缓解跨语言翻译的调序问题,实现与离线翻译几乎无损的翻译质量。

5、音色自然:该模型使用海量语音数据训练,可以根据原始语音内容自适应调节语气和表现力的拟人音色。

一、超越Gemini-2.5-Flash,同传准确度达94%以上

在公开测试集上,中英及多语言语音翻译榜单中,Qwen3-LiveTranslate-Flash的准确度优于当前主流大模型Gemini-2.5-Flash、GPT-4o-Audio-Preview和Voxtral Small-24B等模型,在除AVG.XX-EN以外的测试中均是第一名。

Qwen3-LiveTranslate-Flash在不同领域和复杂声学环境下的测试成绩也优于Gemini-2.5-Flash等主流大模型。

该模型研发语义单元预测技术来缓解跨语言调序问题,其实时同传可在保持非实时翻译94%以上准确度的同时,显著降低延迟。

视觉增强技术进一步让Qwen3-LiveTranslate-Flash在嘈杂音频、一词多译、专有名词翻译等场景翻译更精准。在实时场景中,视觉信息弥补了语音上下文的缺失,优势更明显。

二、能分清mask和Musk,还有多种不同声色

官方给出了丰富的实例,Qwen3-LiveTranslate-Flash在同传翻译、视觉增强辅助等能力上的表现确实能打,着实为专业翻译工作人员捏了一把汗。

例如将阿里巴巴2023年12月份季度业绩电话会议进行中文同传:

输入音频:

https://oss.zhidx.com/f31009e4395c7deb609debf197a65f7b/68daad00/uploads/2025/09/68dbace08deb2_68dbace08a53d_68dbace08a4ee_%E4%B8%AD%E8%8B%B1%E5%90%8C%E4%BC%A0.mp3

输出效果:

凭借视觉增强辅助语音翻译功能,Qwen3-LiveTranslate-Flash能够识别出来mask(口罩)和Musk(马斯克)的区别:

该模型还可以识别低频专有名词,比如人名:

Qwen3-LiveTranslate-Flash还支持多种语言或方言的不同音色,例如:

1、芊悦,voice参数:Cherry

音色效果:

https://oss.zhidx.com/525060543cfe82f97f67b4028186c137/68daad00/uploads/2025/09/68dbacdf3ba68_68dbacdf38441_68dbacdf3840c_%E8%8A%8A%E6%82%A61.mp3

描述:阳光积极、亲切自然小姐姐。

支持的语种/方言:中文、英语、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语

2、不吃鱼,voice参数:Nofish

音色效果:

https://oss.zhidx.com/f1aa4a9ac56a844e07759883ccfedcb4/68daad00/uploads/2025/09/68dbacdf118a1_68dbacdf0dee0_68dbacdf0dea6_%E4%B8%8D%E5%90%83%E9%B1%BC1.mp3

描述:不会翘舌音的设计师。

支持的语种/方言:中文、英语、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语

3、上海-阿珍,voice参数:Jada

音色效果:

https://oss.zhidx.com/f2a8fc34ae1f8e05143da3b3f18a7295/68daad00/uploads/2025/09/68dbacdf6bbdc_68dbacdf68577_68dbacdf6854c_%E4%B8%8A%E6%B5%B7-%E9%98%BF%E7%8F%8D1.mp3

描述:风风火火的沪上阿姐。

支持的语种/方言:中文(吴语)

4、北京-晓东,voice参数:Dylan

音色效果:

https://oss.zhidx.com/c656142c36e636356d3d45ffff53a8f1/68daad00/uploads/2025/09/68dbacdec7750_68dbacdec35ad_68dbacdec355e_%E5%8C%97%E4%BA%AC-%E6%99%93%E4%B8%9C1.mp3

描述:北京胡同里长大的少年。

支持的语种/方言:中文(北京话)

5、四川-晴儿,voice参数:Sunny

音色效果:

https://oss.zhidx.com/92a224dfc2b4411c099bf760854dbe7e/68daad00/uploads/2025/09/68dbacdfd0fb1_68dbacdfcd890_68dbacdfcd854_%E5%9B%9B%E5%B7%9D-%E6%99%B4%E5%84%BF1.mp3

描述:甜到你心里的川妹子。

支持的语种/方言:中文(四川话)

6、天津-李彼得,voice参数:Peter

音色效果:

https://oss.zhidx.com/1f4e465854e05350ccde9ddb3f05a41e/68daad00/uploads/2025/09/68dbace010fb5_68dbace00829e_68dbace00826a_%E5%A4%A9%E6%B4%A5-%E6%9D%8E%E5%BD%BC%E5%BE%971.mp3

描述:天津相声,专业捧哏。

支持的语种/方言:中文(天津话)

7、粤语-阿清,voice参数:Kiki

音色效果:

https://oss.zhidx.com/e830838613a77c0b3c5d03035d686a19/68daad00/uploads/2025/09/68dbace046bbd_68dbace04354e_68dbace04350f_%E7%B2%A4%E8%AF%AD-%E9%98%BF%E6%B8%851.mp3

描述:甜美的港妹闺蜜。

支持的语种/方言:粤语

8、四川-程川,voice参数:Eric

音色效果:

https://oss.zhidx.com/aee07fc351746e64cc5498d99feceaac/68daad00/uploads/2025/09/68dbacdf97ef6_68dbacdf94087_68dbacdf94056_%E5%9B%9B%E5%B7%9D-%E7%A8%8B%E5%B7%9D1.mp3

描述:一个跳脱市井的四川成都男子。

支持的语种/方言:中文(四川话)

结语:通义千问加速AI音视频翻译落地

Qwen3-LiveTranslate-Flash首次引入视觉上下文增强技术,让音视频AI翻译更上了一个台阶。

通义千问团队称,今后还将持续提升语音翻译的准确性、自然度、情感一致性,拓展新万博体育:语种的覆盖范围,增强在各种复杂语音环境下的翻译鲁棒性。

在语音翻译这个应用面推进技术进步的红海赛道,通义千问这次推出新模型,或将大幅降低全球开发者在实时跨语言交流应用上的创新门槛,加速催生从国际会议、跨境直播到无障碍沟通等场景的下一代产品落地。

相关推荐:华体会登不上 巴黎人注册网址 盈鑫国际

分享: 2025-09-24 22:42:20 共81款

电脑

安卓

苹果

相关合集

网友评论 查看所有评论>>

发表评论

(您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

查看所有0条评论>>