当前位置:首页 → 电脑软件 → 感冒后千万别做这3件事 → 被藏獒玩弄尿喷H肉倒刺视频 v7.487.3867.269124 IOS版
v4.500.5982.243260 安卓免費版
v5.131.3126.248990 安卓漢化版
v7.311.4462 PC版
v9.962.1265.713702 安卓最新版
v5.477 安卓免費版
v8.987.577.618986 最新版
v6.676.5290.96125 安卓漢化版
v7.409.9612.476610 安卓版
v2.682.1730.104458 安卓最新版
v3.220.1701.708301 安卓版
v8.262.9936.652853 PC版
v7.808.4030.288583 安卓版
v5.637 PC版
v6.184.8504 最新版
v2.454.9498.197453 安卓最新版
v9.80.9230.50540 安卓免費版
v8.51.567 PC版
v4.143 安卓漢化版
v8.504 安卓免費版
v4.905.9017.672596 安卓版
v9.625 IOS版
v7.701.4101 安卓漢化版
v5.597 IOS版
v2.904 PC版
v8.94 IOS版
v7.741 IOS版
v5.543.4339.993821 安卓版
v8.518.9231.701122 PC版
v5.319.1534.510148 PC版
v5.884.2692.376464 安卓版
v9.352.3582 PC版
v7.636.2110.856582 安卓版
v5.117.19.994505 安卓漢化版
v3.88.1506.381730 PC版
v9.769 IOS版
v3.444.6568 安卓免費版
v2.175.2898.77299 安卓最新版
v9.425.6131.620088 IOS版
v7.899.4466.544398 PC版
v5.122.5960 最新版
v7.907.8553 安卓免費版
v8.743.3515.295914 安卓最新版
v2.695.6963.691296 PC版
v3.687.8876 最新版
v3.909.3125 安卓漢化版
v6.592 安卓免費版
v3.29.1721.898494 安卓最新版
v5.705 安卓漢化版
v7.526.3427 IOS版
v3.49.6562.392894 最新版
v6.934.4829.122386 PC版
v7.209.8609.426095 安卓漢化版
v3.276.5199 IOS版
v1.643 安卓版
v8.704 最新版
v6.256.6881 IOS版
v9.865.6868.787927 PC版
v6.594.1400 安卓漢化版
v8.185 最新版
v9.96.2941.90640 安卓免費版
v6.415 PC版
v1.781.6023.789147 PC版
v1.15.2017.874594 安卓漢化版
v8.194.3732.523572 安卓最新版
v6.528 安卓免費版
v1.283.7615 安卓版
v2.529.1151 安卓版
v5.486.1149.89836 安卓版
v1.71 IOS版
v6.513.3901.438037 PC版
v5.682 IOS版
v4.103.3548.975014 PC版
v9.399.2421.476254 安卓漢化版
v7.261.1439.814869 PC版
v3.796.3323 最新版
v8.747.9585.556692 IOS版
v2.792 IOS版
v4.377 安卓免費版
v8.93.2688 PC版
v6.638.6098.423661 安卓最新版
被藏獒玩弄尿喷H肉倒刺视频
智东西作者 陈骏达编辑 李水青
DeepSeek又更新了!
智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。
官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。
DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。
DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。
而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。
DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。
开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了
今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。
▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)
智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。
不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。
▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug
也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。
▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)
智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”
DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。
二、小球弹跳效果惊艳,还能快速交叉搜索信息
除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。
编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。
这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:
在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。
可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。
结语:DeepSeek-V3.1,迎来终极版?
DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。
也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。
此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。
相关版本
多平台下载
查看所有0条评论>网友评论