当前位置:首页 → 电脑软件 → 在张杰演唱会听上西游记了 → 免费斗牛牛 v5.615.7435.126877 安卓最新版
v9.975.1649 安卓版
v5.147.3935.829367 安卓版
v9.117.2320.435701 安卓版
v6.451.3236 安卓漢化版
v5.531 安卓版
v1.619.1962 安卓免費版
v6.796.3863 安卓漢化版
v7.607.1530.636114 安卓最新版
v2.848 最新版
v5.110.3303.807235 安卓最新版
v1.950.21.145330 安卓漢化版
v1.118.9177.684958 最新版
v2.880.2305.81806 安卓版
v1.170.552.730274 安卓版
v3.406.741 安卓免費版
v7.498.822.896790 最新版
v8.99 安卓漢化版
v5.188 安卓漢化版
v8.675.9029.12841 PC版
v4.908.591.9443 安卓最新版
v4.530 安卓版
v4.32 IOS版
v6.273.4034 安卓最新版
v1.573.2360.486427 安卓最新版
v3.243.3829 IOS版
v7.979 安卓版
v3.922.8798.313183 安卓免費版
v6.197.7290.477649 安卓漢化版
v6.658.3312.646814 IOS版
v1.879 安卓漢化版
v4.928.9058.892472 安卓版
v2.557 最新版
v1.326 安卓免費版
v3.165.412 最新版
v8.152.3585.928774 PC版
v4.744 安卓免費版
v1.710 安卓最新版
v1.513.8982.131093 安卓免費版
v3.186.7564.736580 IOS版
v3.794.124.212874 安卓免費版
v4.589.8632 安卓免費版
v5.997.6663.780892 最新版
v6.265.6722.956710 IOS版
v4.715.1215.1397 安卓最新版
v4.382.8043.615145 IOS版
v8.999.8595.408789 安卓漢化版
v9.514.1229.996392 安卓最新版
v3.874 安卓最新版
v4.529 PC版
v5.704.4199.357866 PC版
v4.635.9182 最新版
v9.546.3790.794522 安卓漢化版
v4.940.8869.819818 PC版
v3.358 安卓最新版
v2.709.1180 PC版
v1.515 PC版
v7.763.4177 安卓免費版
v6.282.246.594864 安卓免費版
v7.559.9831.238653 安卓版
v8.370.4672.525199 安卓免費版
v7.70 安卓漢化版
v8.688.2650.615882 安卓最新版
v5.204 安卓版
v8.625.5458.342264 安卓漢化版
v5.525.2696.90029 安卓最新版
v1.659.4161.480994 安卓免費版
v8.491.5838.860851 最新版
v8.424 PC版
v1.806 安卓免費版
v6.185.0 安卓漢化版
v6.580.3184.712995 最新版
v7.380.2882.168459 安卓漢化版
v7.944.7228.270908 最新版
v5.8.8736.956199 安卓版
v2.626.8624.474506 安卓免費版
v3.332 IOS版
v8.326 最新版
v1.863.1697.573296 PC版
v9.473 IOS版
v2.931 IOS版
免费斗牛牛
智东西作者 陈骏达编辑 李水青
DeepSeek又更新了!
智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。
官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。
DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。
DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。
而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。
DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。
开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了
今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。
▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)
智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。
不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。
▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug
也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。
▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)
智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”
DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。
二、小球弹跳效果惊艳,还能快速交叉搜索信息
除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。
编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。
这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:
在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。
可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。
结语:DeepSeek-V3.1,迎来终极版?
DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。
也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。
此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。
相关版本
多平台下载
查看所有0条评论>网友评论