当前位置:首页 → 电脑软件 → 拜登:特朗普确实是“热门人选” → ayx爱游戏app平台官方下载 v7.65 最新版
v3.806 PC版
v4.654.3317.76489 安卓版
v7.861.9065.847988 IOS版
v3.630.8561.140445 安卓免費版
v3.252.9622.116687 安卓免費版
v8.615 最新版
v4.335 安卓版
v4.947 安卓漢化版
v9.718.8377.87585 安卓最新版
v8.216.7672 最新版
v3.567.6920.698289 安卓版
v4.394.2782.139589 安卓免費版
v7.633 IOS版
v2.122 安卓漢化版
v2.583 安卓漢化版
v5.670.2346.825381 安卓最新版
v7.231.6210.613464 安卓最新版
v3.64.2476.167797 PC版
v2.296.8330.327151 安卓版
v4.529.9747.337555 PC版
v8.358.343.489263 最新版
v3.16.7126.358255 最新版
v3.377.9623.331428 安卓漢化版
v7.890 安卓版
v1.84.9167.795142 安卓漢化版
v7.254 PC版
v4.170.8667 安卓漢化版
v3.710.2811.388068 最新版
v8.198 安卓漢化版
v2.600.8462.798979 安卓版
v9.390.9932 安卓最新版
v8.564.4091.346846 安卓免費版
v8.227.6033.413937 PC版
v3.726 安卓最新版
v3.202.4617.982864 最新版
v8.34.7493.906379 安卓版
v8.286 最新版
v4.123.4164.874594 安卓最新版
v6.674.2228 安卓漢化版
v4.996.444 安卓免費版
v8.180.5299 安卓漢化版
v2.166.4013.881286 最新版
v5.221.444 安卓漢化版
v3.617.310.203205 IOS版
v8.528 PC版
v4.100.6034.992417 安卓免費版
v8.752.6449.887856 PC版
v1.256.2785.670776 安卓免費版
v8.901 安卓版
v2.160.3589 安卓版
v6.686.3548.764138 安卓版
v1.759 IOS版
v1.539 安卓最新版
v6.871.6636.375523 安卓漢化版
v8.74.1585.384502 安卓漢化版
v3.387.6193 安卓版
v5.128 IOS版
v8.468.8773.411344 安卓最新版
v6.162.3517.958814 安卓免費版
v1.949 安卓最新版
v3.666 安卓漢化版
v4.570.2741.625021 安卓版
v4.900.1805.828314 IOS版
v4.157 IOS版
v5.847.4623.355358 IOS版
v4.402 安卓漢化版
v7.501.9603.662358 安卓最新版
v4.96.5541.975768 IOS版
v4.157.8804.975832 安卓免費版
v7.21.3949.887688 最新版
v2.902 安卓版
v9.693.5564.726438 IOS版
v8.354.9595.163335 安卓最新版
v7.464.1590.584730 最新版
v2.353.2421.978937 安卓漢化版
v1.174.6136 安卓免費版
v6.99.1588.138126 安卓版
v4.663.513 安卓漢化版
v4.251 安卓版
v2.207 安卓版
ayx爱游戏app平台官方下载
智东西作者 陈骏达编辑 李水青
DeepSeek又更新了!
智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。
官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。
DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。
DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。
而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。
DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。
开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了
今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。
▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)
智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。
不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。
▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug
也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。
▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)
智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”
DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。
二、小球弹跳效果惊艳,还能快速交叉搜索信息
除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。
编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。
这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:
在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。
可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。
结语:DeepSeek-V3.1,迎来终极版?
DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。
也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。
此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。
相关版本
多平台下载
查看所有0条评论>网友评论