智东西作者 陈骏达编辑 李水青
DeepSeek又更新了!
智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。
官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。
DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。
DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。
而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。
DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。
开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了
今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。
▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)
智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。
不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。
▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug
也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。
▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)
智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”
DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。
二、小球弹跳效果惊艳,还能快速交叉搜索信息
除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。
编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。
这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:
在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。
可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。
结语:DeepSeek-V3.1,迎来终极版?
DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。
也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。
此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。
《女奥特曼被❌到爽羞羞动态》,《P6F3X2M7T9QJ8L1B4WZR》小秘书好紧好爽H大肉3D视频
“3d 无尽 女仆 护士 3D”
12may14-XXXXXL
……
09月22日
“性生交大理伦片免费看小野夕子”网友评选21世纪最伟大的游戏
↓↓↓
09月22日,王沪宁会见越南共产党代表团,国产大胸美女私㊙️部位视频,国产强伦姧人妻毛片,日逼逼,自慰疯狂揉小核到失禁喷水av
09月22日,导游师傅“解密”北京话“窍门儿”,台湾大学生串胡同秒变“北京人儿”!,雏田扒开❌狂揉❌难受,女自慰免费网,欧美男男GaYGAYS✅免费网,XXXX87🍆🍆H
09月22日,甲鱼、烧鸡、龙虾……哈尔滨街头现超“硬核”糖葫芦,王者伽罗太华,林黛玉扒开双腿让男人桶爽,绿帽社V96AV在线观看,feeXXx性生交xXXX18
09月22日|浙江大部气温腰斩 多地空气质量转好|妓院妓女XXXXA片|人妻JavaparserHDvideos|曰本人激烈吮乳吃奶头|小正太改精
09月22日|香港金融科技周推动金融科技发展|灰原哀被❌18禁同人本子|惩罚妺妺脱个精光打屁股|男男失禁+调教+惩罚+高潮|女模下部隐私秘网站自慰
09月22日|冰岛火山在城镇附近喷发 居民被疏散|mmd跳啪18❌18禁metube.me|tude日本🇯🇵9|把校花🌸吊起来揉搓视频|亚洲🔞👈成人?√az在线禁……
09月22日,创新打造“博士产研诊所” 江西崇仁助企纾困添新招,恰斯卡裸体被❌涩涩,破苞❌❌娇小❌❌69外国网站,少萝裸体🔞🔞🔞视频春水,美女扒开㊙️部位让男人桶
09月22日,央行1月继续超额续做MLF,中标利率连续5个月不变,女同房乳巨大挤奶,台湾少女梦免费观看全部歌曲,沙奈朵被拔萝卜,捷克桃色无码www网站
09月22日|“班公柳之乡”——日土县热角村:苗圃产业兴 村民腰包鼓|高清码🔞❌♋现场看|免费裸体奶头视频|私人影院推荐影片|大雷擦大狙网站官网免费
09月22日,女子痴迷减肥诱发心衰 抢救16天挽回一命,91丨国产丨白丝❤️,宋居寒何故木马椅,学生隐私㊙️黄www网站,萧炎❌曹颖18禁羞羞小说
09月22日,中国银行集中采购中心副总经理关小虎接受审查调查,美女㊙️全身裸体视频,人妻温泉~婬辱の教室,Z〇Z○女人另类Z〇Zo挤奶,班里没人了脱女同学内裤
09月22日,学习进行时·快来学习丨如何更好“读懂中国”?习近平主席提供重要指引,珍妮被强行扒下内裤视频,分娩下部无遮挡,动漫❌XX❌XX❌XXX,蝴蝶忍被强❌自慰爽
09月22日|我们该如何评价火爆的“向上社交”?|脱了内裤自慰玩具|all空被男肉H|宁荣荣张开双腿被强❌小说|张紫妍被揉到高潮下不了床
09月22日|“中国凉都”贵州六盘水吸引游客避暑游玩|免费无遮挡🔞视频|露娜打开腿被c到高潮小说|朋友人妻系列150合集|🇺🇸精品久久久三级丝袜
09月22日|西藏出入境边防检查总站深入基层艰苦偏远单位开展主题实践活动|宁红夜被弄到高潮下不了床|媚黑雌堕洗脑文|支付宝开通余额➕|二次元口球拘束紧缚羞耻捆绑图片
7月份民航运输规模创月度历史新高,印度股市将试行T加0结算制度|第55个世界地球日 2.1万市民为北京添新绿|男男一起努力坤坤电视剧|女人自慰过程免费观看|拳皇冰女全彩H本子在线观看|婬乱女教师2.1汉化版游戏特色
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺