当前位置:首页 → 电脑软件 → 原来这就是相敬如宾啊 → 尼姑师母的三部曲是哪三样 v9.113 安卓免費版
v4.231 最新版
v4.705.4806.916680 安卓免費版
v5.148.2139 安卓最新版
v8.794 最新版
v3.788.8147.851248 最新版
v1.727.9774 PC版
v3.836.1961 安卓最新版
v4.142 安卓最新版
v4.681.3500 安卓版
v1.282.2627.383058 安卓版
v4.503.7550.217273 最新版
v6.199.8251.876936 安卓免費版
v1.664.9127.461109 安卓版
v8.13.5612.936174 PC版
v7.592.9316.770749 安卓最新版
v9.900.4311 安卓版
v3.484.7105.606601 PC版
v5.786.4871.64317 安卓版
v5.535.5160.87746 IOS版
v9.592.1529.236985 安卓版
v4.230 PC版
v2.100 安卓免費版
v1.253.316.256073 安卓最新版
v5.808.2671 安卓最新版
v1.942.7734 安卓版
v5.144.1268.347150 安卓最新版
v9.64.2590 安卓免費版
v2.502 PC版
v7.728.835.939233 安卓漢化版
v1.460.2702.800080 安卓版
v7.773 安卓最新版
v8.650 安卓版
v8.599.7138 PC版
v3.264.1323 安卓免費版
v2.216.5815 安卓最新版
v6.680 IOS版
v1.112.7377.967343 安卓最新版
v5.626 安卓最新版
v5.598.5038 最新版
v7.987.8039.244596 安卓最新版
v9.582.8964.15776 安卓免費版
v2.822.1590 最新版
v2.445.4886.837773 IOS版
v7.9.7121.241535 安卓最新版
v6.266.5564 最新版
v6.953.2200.639388 安卓漢化版
v1.452 安卓漢化版
v2.786 PC版
v3.327 安卓漢化版
v4.496.1417.730961 安卓免費版
v8.478 安卓版
v7.43.445.407745 安卓漢化版
v4.946.8464.998008 安卓版
v7.515.9487.271751 安卓漢化版
v1.709.7868.508932 PC版
v9.672 安卓漢化版
v2.357.62.141901 安卓版
v8.188.2715.272454 安卓最新版
v7.146.8345.98662 最新版
v8.322.6781.396374 安卓版
v3.63 安卓漢化版
v6.361.6573.118325 安卓版
v3.607.8672 IOS版
v5.304.2626.766741 安卓漢化版
v2.102.7365.789332 安卓版
v6.147.9538 PC版
v4.257.5102.832422 安卓版
v6.102.4589.752942 安卓最新版
v6.44.6506.38027 安卓漢化版
v2.473 安卓漢化版
v7.528.3767.992203 安卓版
v2.175 安卓漢化版
v8.525.8247.807625 安卓漢化版
v3.200.4369 最新版
v5.346.637.436994 最新版
v9.286.5299.839289 PC版
v4.860.6816.286128 安卓最新版
v2.539.1974 IOS版
v3.71 安卓漢化版
v9.781 最新版
尼姑师母的三部曲是哪三样
智东西作者 陈骏达编辑 李水青
DeepSeek又更新了!
智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。
官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。
DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。
DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。
而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。
DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。
开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了
今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。
▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)
智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。
不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。
▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug
也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。
▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)
智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”
DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。
二、小球弹跳效果惊艳,还能快速交叉搜索信息
除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。
编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。
这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:
在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。
可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。
结语:DeepSeek-V3.1,迎来终极版?
DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。
也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。
此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。
相关版本
多平台下载
查看所有0条评论>网友评论