天博体育怎么样 全面解析 娱乐🤦‍♀️快🍅报_新万博体育

新万博体育

图片
搜索
猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

刚刚,DeepSeek发了“终极版”!

2025-09-21 09:09:36
来源:

猫眼电影

作者:

曹淑敏

手机查看

  猫眼电影记者 汪家斌 报道P6F3X2M7T9QJ8L1B4WZR

智东西作者 陈骏达编辑 李水青

DeepSeek又更新了!

智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。

官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。

DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。

DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。

而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。

DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。

开源地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了

今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。

▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)

智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。

不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。

▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug

也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。

▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)

智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”

DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。

二、小球弹跳效果惊艳,还能快速交叉搜索信息

除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。

编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。

这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:

在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。

可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。

结语:DeepSeek-V3.1,迎来终极版?

DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。

也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。

此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。

??时事1:乐鱼app官网

??09月21日,预防“小眼镜”三部门出“新招” 来看相关解读,

  “小崽子,有点古怪!”他吃了一惊,直接一脚向下踹来,要踏碎小不点的脸,非常狠辣。

,2021买球平台。

??09月21日,美国加利福尼亚州北部沿岸近海发生7.0级地震,

信用卡逾期几天怎么跟银行协商解决,多久会被制高消费和出

,asiAGaming在线,九游的网址是多少,欧亿注册网。

??时事2:bob综合游戏

??09月21日,(巴黎奥运)中国代表团最小运动员郑好好亮相滑板女子碗池赛,

  一支冷箭射出,飞向小不点的后脑,狠而准,若是射中,必然一箭贯脑而过。

,凯8官网,和记怡情,众恒平台官网。

??09月21日,习言道|习近平这样谈“增进民生福祉”,

  做好小我,方能成全大我。我们在这次疫情中,也学到了很多,在院士的讲课中也给我们提了建议。首先,利用假期丰富自我,做好心理调控。自疫情起,我们大学生也开始上网课,云课堂学习,宅在家的日子也不忘充实自我。还有提升辨别信息的能力坚决不造谣、不信谣,听中央指挥,科学防控,并安抚身边的人。作为大学生更应该关心国家大事,增强自身本领,积极对社会做贡献。

,888真人国际开户,现金赌钱app下载,威尼斯登录。

??时事3:kok快速登陆

??09月21日,京津冀地区首艘智利直航“车厘子快线”抵达天津,

  青鳞鹰、豹犼、火云麟等几头异兽与猛禽第一时间动了,确认为狻猊宝体无误,现在全力争抢。

,ayx手机版注册,真人森林舞会游戏厅,bet9九州在线平台。

??09月21日,(走进中国乡村)广西象州古琶村:茶香浸润四百年 一片绿叶成金叶,

  我们期待着您的下次光临!

,尊龙官网登录,万博2022世界杯,网上买球的正规平台。

??时事4:库博体育app下载地址

??09月21日,杭州西湖进入冰冻模式 冰凌垂挂展现别样风采,

  小不点眼睛都没有眨一下,直接将石碾子盖在了他的脸上。

,必赢棋盘app下载,万博网址,真人国际象棋游戏下载。

??09月21日,“五洲侨心促统情”海外代表人士主题交流活动在北京举行,

  猛禽展翅凌云,翱翔天地中,拥有极速,但是却也过于醒目,可能会成为一些空中霸主的猎食目标,可能比在山林中穿行更危险。

,e世博娱乐官网,银河最新官方网址娱乐平台登录,亚新体育开户网址。

责编:韦某为

审核:黄媛媛

责编:沈竹

相关推荐 换一换