当前位置:首页 → 电脑软件 → T1 获得S2抗吧杯冠军 → 扒开她的小缝让我吮 v8.563.5629 安卓免費版
v8.946.6460.987824 最新版
v6.198.5670 安卓最新版
v5.812 安卓最新版
v9.382 安卓最新版
v4.178 最新版
v6.178.6943.762989 安卓免費版
v7.750 安卓免費版
v6.893.6098.502923 安卓免費版
v1.255.7167.406 最新版
v5.406 IOS版
v1.498 安卓漢化版
v7.528 最新版
v7.234.3013.757012 IOS版
v6.701.8969.360975 安卓漢化版
v5.656.9053.784175 安卓免費版
v1.311 安卓漢化版
v2.909.6783.805019 安卓版
v1.489 PC版
v3.232 安卓漢化版
v6.398.4973.645340 IOS版
v7.928.1643 安卓免費版
v9.399.678.141731 安卓免費版
v9.923 安卓最新版
v6.59.5251 安卓免費版
v5.396.2457.337483 安卓免費版
v9.536 IOS版
v7.819 安卓版
v2.679 PC版
v4.704.3591.896118 IOS版
v2.800 安卓最新版
v4.980.3478.798618 安卓漢化版
v6.346.1671.577306 安卓最新版
v9.851.45 安卓漢化版
v4.816 PC版
v7.832.4639.955829 IOS版
v2.916.6809.427816 安卓最新版
v4.575.5420.703017 最新版
v5.637.4867 安卓最新版
v8.825.3859 最新版
v8.878.2850 安卓最新版
v1.561.1998.848179 IOS版
v1.844.6788.611421 安卓最新版
v2.271 安卓版
v7.204.2756.520688 安卓免費版
v5.414 IOS版
v1.590.8023.950999 安卓漢化版
v7.287 安卓最新版
v8.303.4610.691776 PC版
v2.195.9388.621227 IOS版
v3.340.4743 安卓最新版
v2.331.1254.923518 安卓最新版
v4.185.7450 IOS版
v4.740.9074.666323 安卓免費版
v8.158.8727 安卓免費版
v5.6.1768.656238 安卓漢化版
v9.669 安卓漢化版
v6.402.5750.344472 安卓免費版
v4.677.5467.833163 安卓漢化版
v4.876.6626.545954 安卓版
v6.532.2684.316177 最新版
v1.677.6952.901962 最新版
v2.532.4701 安卓免費版
v2.423.8020.903913 最新版
v7.652 安卓漢化版
v6.871.9651.308934 安卓版
v1.652.6720 安卓版
v2.288.9088.173110 安卓免費版
v2.912.7739.57481 IOS版
v3.848 PC版
v3.109.3081.915890 最新版
v5.781.451.578165 安卓版
v3.576 最新版
v5.346.9869.29731 IOS版
v3.518.5873.611590 PC版
v9.42.8408 PC版
v8.69.387.960323 最新版
v1.755.1532 最新版
v1.624.2253 安卓版
v1.976.8068.663566 安卓最新版
v8.528 安卓最新版
扒开她的小缝让我吮
新智元报道
编辑:KingHZ 艾伦
【新智元导读】DeepSeek最新模型DeepSeek-V3.1-Terminus来了!此前在输出中随机掺入「极」字的问题得到解决,Humanity's Last Exam成绩也较V3.1提升1/3!Terminus这个名字是否在暗示DeepSeek-V4也快要来了?
DeepSeek-V3.1-Terminus来了!
DeepSeek API文档、官方微信均已正式确认本次更新:
此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:
· 语言一致性:缓解了中英文混杂、偶发异常字符等情况;
· Agent能力:进一步优化了Code Agent与Search Agent的表现。
目前,官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。
开源版本下载地址如下:
Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
多项测评胜过Gemini 2.5 Pro
在理能力和智能体工具使用上,本次更新在多个基准上得到提升。
DeepSeek上次更新为8月21日,短短一个月,取得这一成绩来之不易,可喜可贺。
值得一提的是,新模型在Humanity's Last Exam(人类最后的考试)中,成绩提升幅度高达36.48%!
告别「极你太美」
之前,有网友发现:DeepSeek V3.1输出中随机带有「极」字。网友称:
这一Bug已经导致DeepSeek V3.1无法从事编程或对输出结构敏感的相关工作。希望官方早日修复。
这次更新明确已解决「偶发异常字符等情况」,结合「Code Agent优化」,希望这次更新能完美解决DeepSeek无法从事编程或对输出结构敏感的相关工作的Bug。
至于中英文混杂,是LLM的老毛病了,比如OpenAI o3-mini等模型被曝使用中文推理。
在DeepSeek-R1的Nature论文中,DeepSeek坦言:
语言混杂(language-mixing)问题,留待未来更新解决。
这次DeepSeek更新解决了中英文混杂问题。
我们也对之前在网上流传最广的会触发「极你太美」Bug的Prompt进行了测试:
之前,time.Second会被DeepSeek-V3.1在输出中破坏成time.Se极 / time.Se極 / time.Seextreme。
现在,新模型给出了5种定时器实现方法,多处都使用了time.Second。
我们经过多次尝试,均未能复现出该Bug,说明Bug确实可能已经被修复了。
此外,非Agent(Thinking模式)测评中,多项基准测试成绩得到提升:MMLU-Pro、GPQA-Diamond、Humanity's Last Exam。
同时,Agent相关测评也来了。
图源:https://x.com/karminski3/status/1970129020382826758
Agent能力超过Gemini
与DeepSeek-V3.1相比,新模型在工具使用与Agent任务中的表现有较大提升:
BrowseComp:30.0 -> 38.5
SimpleQA:93.4 -> 96.8
SWE-bench Verified: 66.0 -> 68.4
SWE-bench Multilingual: 54.5 -> 57.8
Terminal-bench: 31.3 -> 35.7
DeepSeek上次更新发布了DeepSeek-V3.1,称之为「迈向Agent时代第一步」。
短短一个月,Agent能力再次得到提升,年底的高级Agent还会远吗?
奇怪的是,并非全部基准测试成绩都得到提升,Codeforces、Aider-Polypglot、BrowseComp测评成绩有1%左右的小幅下降。
不过,新模型DeepSeek-V3.1-Terminus总体上进步明显,特别是在Humanity's Last Exam、LiveCodeBench、SimpleQA、SWE-bench Verified评测中,胜过了Gemini 2.5 Pro,补齐了Humanity's Last Exam这块最大的短板。
DeepSeek-V4/R2还远吗?
Terminus这个单词的中文意思是:终点。
在计算机术语中,终端(Terminal)也称终端设备,是计算机网络中处于网络最外围的设备,主要用于用户信息的输入以及处理结果的输出等。
或许,DeepSeek借用Terminus暗指编程能力的提升。
DeepSeek这波更新理所应当地引起了网友的关注。网友在线催更:
DeepSeek-V4什么时候要来?
DeepSeek-R2什么时候要来?
期待DeepSeek-V4和DeepSeek-R2给我们带来更大的震撼!
参考资料:
https://x.com/deepseek_ai/status/1970117808035074215
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
相关版本
多平台下载
查看所有0条评论>网友评论