猫眼电影
猫眼电影记者 史泰龙 报道P6F3X2M7T9QJ8L1B4WZR
新智元报道
编辑:KingHZ 艾伦
【新智元导读】DeepSeek最新模型DeepSeek-V3.1-Terminus来了!此前在输出中随机掺入「极」字的问题得到解决,Humanity's Last Exam成绩也较V3.1提升1/3!Terminus这个名字是否在暗示DeepSeek-V4也快要来了?
DeepSeek-V3.1-Terminus来了!
DeepSeek API文档、官方微信均已正式确认本次更新:
此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:
· 语言一致性:缓解了中英文混杂、偶发异常字符等情况;
· Agent能力:进一步优化了Code Agent与Search Agent的表现。
目前,官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。
开源版本下载地址如下:
Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
多项测评胜过Gemini 2.5 Pro
在理能力和智能体工具使用上,本次更新在多个基准上得到提升。
DeepSeek上次更新为8月21日,短短一个月,取得这一成绩来之不易,可喜可贺。
值得一提的是,新模型在Humanity's Last Exam(人类最后的考试)中,成绩提升幅度高达36.48%!
告别「极你太美」
之前,有网友发现:DeepSeek V3.1输出中随机带有「极」字。网友称:
这一Bug已经导致DeepSeek V3.1无法从事编程或对输出结构敏感的相关工作。希望官方早日修复。
这次更新明确已解决「偶发异常字符等情况」,结合「Code Agent优化」,希望这次更新能完美解决DeepSeek无法从事编程或对输出结构敏感的相关工作的Bug。
至于中英文混杂,是LLM的老毛病了,比如OpenAI o3-mini等模型被曝使用中文推理。
在DeepSeek-R1的Nature论文中,DeepSeek坦言:
语言混杂(language-mixing)问题,留待未来更新解决。
这次DeepSeek更新解决了中英文混杂问题。
我们也对之前在网上流传最广的会触发「极你太美」Bug的Prompt进行了测试:
之前,time.Second会被DeepSeek-V3.1在输出中破坏成time.Se极 / time.Se極 / time.Seextreme。
现在,新模型给出了5种定时器实现方法,多处都使用了time.Second。
我们经过多次尝试,均未能复现出该Bug,说明Bug确实可能已经被修复了。
此外,非Agent(Thinking模式)测评中,多项基准测试成绩得到提升:MMLU-Pro、GPQA-Diamond、Humanity's Last Exam。
同时,Agent相关测评也来了。
图源:https://x.com/karminski3/status/1970129020382826758
Agent能力超过Gemini
与DeepSeek-V3.1相比,新模型在工具使用与Agent任务中的表现有较大提升:
BrowseComp:30.0 -> 38.5
SimpleQA:93.4 -> 96.8
SWE-bench Verified: 66.0 -> 68.4
SWE-bench Multilingual: 54.5 -> 57.8
Terminal-bench: 31.3 -> 35.7
DeepSeek上次更新发布了DeepSeek-V3.1,称之为「迈向Agent时代第一步」。
短短一个月,Agent能力再次得到提升,年底的高级Agent还会远吗?
奇怪的是,并非全部基准测试成绩都得到提升,Codeforces、Aider-Polypglot、BrowseComp测评成绩有1%左右的小幅下降。
不过,新模型DeepSeek-V3.1-Terminus总体上进步明显,特别是在Humanity's Last Exam、LiveCodeBench、SimpleQA、SWE-bench Verified评测中,胜过了Gemini 2.5 Pro,补齐了Humanity's Last Exam这块最大的短板。
DeepSeek-V4/R2还远吗?
Terminus这个单词的中文意思是:终点。
在计算机术语中,终端(Terminal)也称终端设备,是计算机网络中处于网络最外围的设备,主要用于用户信息的输入以及处理结果的输出等。
或许,DeepSeek借用Terminus暗指编程能力的提升。
DeepSeek这波更新理所应当地引起了网友的关注。网友在线催更:
DeepSeek-V4什么时候要来?
DeepSeek-R2什么时候要来?
期待DeepSeek-V4和DeepSeek-R2给我们带来更大的震撼!
参考资料:
https://x.com/deepseek_ai/status/1970117808035074215
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
??时事1:天博登录app登录
??09月21日,2023年内蒙古自治区六处遗址考古取得新突破,
“这么神秘?”小不点心中大受触动,他双眼清澈,认真思索了很长时间,觉得长了不少见识。
,188网球比分直播吧。??09月21日,中国渤海首个千亿方大气田累计产天然气突破10亿立方米,
有人喝道,向前冲来,招呼群雄一起抢夺。
,乐虎国际网页版官网,海洋之神590网站,贝博体育平台官网首页下载。??时事2:伟德国际1946官方网
??09月21日,广东加快推进县镇村绿化 义务植树成风化俗,
小不点迅速阻击,但是不止蛟鹏一人出手,还有紫山昆、雷明远两人,也需要严加防备,而且蛟鹏射出的箭过多,很难全部挡下。
,365bet体育滚球官网登录,白鲸鱼平台,ag九游会登入。??09月21日,遇见福建:宁德迎来新年初雪,
您们好,瑞特公司自开业以来,在社会各界朋友们的帮助下,发展和壮大,取得了良好的社会效益和经济效益,给很多的家庭带来健康的同时,也使我们的员工增加了收入改变了自己的生活命运,培养了一大批农民当起了合格的工人。瑞特公司也从最初的起步阶段进入到了一个全面发展的时期,所以当今天我们在享受着累累硕果的时候。首先,我代表公司及全体同仁向您们及您们的家人表示诚挚的问候和衷心的感谢!感谢您们对瑞特的鼎力协助,感谢您们对瑞特的高度信任,感谢您们的韧性与坚持!公司的发展,企业的壮大,无不浸透着各位朋友们的辛勤汗水和默默耕耘。千言万语化作一句话:感谢您们!
,体育投注网站哪个好,沙巴体育平台app,kok登录页面。??时事3:天博官网网站登录
??09月21日,四川省举行向邓小平同志铜像敬献花篮仪式,
这里除却仆人外,共有四名特殊的老人,都是当年曾经威名赫赫的人物,辈分极高,只是犯下了大过,被发配到了这蛮荒苦地。
,金沙足球,英亚体育国际,电竞赛事竞猜app。??09月21日,新疆泽普:“旅游+”助推文旅产业高质量发展,
远处的山林间,小不点一怔,这头虎可不简单,血气旺盛,体内竟生有神秘符文,是一头凶兽。
,申博平台网址,365bet直播网,电子游戏app。??时事4:靠谱的买球平台网站
??09月21日,中国“德企之乡”江苏太仓为第500家德企授牌,
如果消防意识淡薄, 酿成火灾, 将给人民生命财产造成巨大的损失。在 20__ 年的 6 月 10 日,广东省 __ 市华南宾馆发生火灾。大火造成 31 人死亡、3 人重伤。在去年的 9 月 20 日,深圳 __ 区的一歌舞厅发生火灾,一场不过 30 分钟的火 灾,却导致 43 人死亡,88 人受伤。纵观这些夺走无数生命的火灾事 故,有几起不是消防安全意识淡薄、违反消防安全操作规程酿成的恶 果呢? 所以, 我们人人都应具备防火和消防知识, 时时绷紧消防安全这根弦, 防患于未然。作为小学生我们要做到不玩火,不带火柴或打火机等火 种,不随意点火,禁止在易燃易爆物品处用火,不在公共场所燃放鞭 炮,更不允许将点燃的鞭炮乱扔,不接近高压电缆且懂得自我保护, 有的同学为图方便私拉电线,有的同学一时疏忽忘了随手关掉电源, 教室空荡荡,电灯,电扇却仍然开着,消防隐患有时便会暴露出来, 一些意外事故也便有可能发生。 “远离火灾,创造和谐社会”是我们共同的目标,同学们,让我们携起 手来,更加关爱生命,更加关注消防安全,为保护自己和他人的平安 幸福而共同努力吧!
,宝博体育平台,火凤凰棋牌游戏,188备用网址。??09月21日,北京市文联携手门头沟建设“诗画乡村”,
20~~年,~~上下要团结一心,迎接挑战;20~~年,~~全体员工要蓄势待发
,下载od体育,PG电子游戏平台首页,可上分下分的捕鱼游戏。责编:巴菲特——伯克希尔-哈撒韦
审核:肖娜
责编:相·依