爱游戏彩票官[方 DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路 09月25]日_新万博体育

新万博体育

图片
搜索
猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路

2025-09-25 03:17:01
来源:

猫眼电影

作者:

叶大利

手机查看

  猫眼电影记者 肖淑芬 报道P6F3X2M7T9QJ8L1B4WZR

作者 | 周一笑邮箱 | zhouyixiao@pingwest.com

AI圈,不同的公司似乎都有着自己独特的发布节奏,比如OpenAI和Google喜欢相互“狙击”,在国内被津津乐道的,可能要属DeepSeek的“节前上新”。

一张流传颇广的Hugging Face留言截图,就精准吐槽了DeepSeek这种总是在法定节假日前几天发布新产品的习惯。这次,DeepSeek同样遵循这个规律,在国庆前夕带来了最新的模型DeepSeek-V3.2-Exp。

新模型的后缀“Exp”代表实验性(Experimental)的定位,核心是引入了一项名为DeepSeek Sparse Attention(DSA)的新架构。DSA首次实现了细粒度稀疏注意力机制,几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。DeepSeek也同步大幅下调了其API服务的价格,在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

1

DSA:通向下一代模型的阶梯?

根据DeepSeek的官方描述,V3.2-Exp并非一个全新的模型系列,而是其迈向下一代架构的一个“中间步骤”。它以前代模型V3.1-Terminus为基础,通过“持续训练”(continued training)的方式,核心目的在于引入并验证其最新的DeepSeek稀疏注意力(DSA)机制。官方将其定位为一次针对长文本训练与推理效率的“探索性优化和验证”。

为了更好的理解这次更新,需要从DSA入手。在Transformer架构中,传统的注意力机制是“稠密的”,处理长文本时成本会呈指数级增长。DSA则提供了一种更高效的“稀疏”方案,让模型学会在处理每个字时,只关注那些与它最相关的少数关键信息,从而在理论上大幅提升效率。

要实现这种高效的“稀疏”,DeepSeek做了一些工程选择,例如新架构用一个更精简的128维FP8精度Lightning Indexer(闪电索引器),替代了过去相对臃肿的注意力机制。这个索引器本身不携带复杂信息,只作为快速查找工具。查找过程用的是低成本的FP8精度,而进行核心计算的重要信息,则依然保持完整的FP16全精度处理。这种在不影响最终质量的地方“极致压缩成本”的思路,是能够将注意力成本降低近9倍的关键。

DeepSeek投入资源研发DSA,最直接的原因可能是提升效率、降低成本。此外,根据一位行业从业者在与硅星人交流中的观点,这背后有更深层的技术考量。随着上下文窗口越来越长,传统注意力机制可能会遭遇性能上的“注意力悬崖”(attention cliff),即在某个长度节点之后,模型处理信息的能力会突然大幅下降。因此,DSA的真正目标,是为未来更长的上下文场景,探索一种能从根本上避免这个问题的架构解决方案。这次发布,也是对这个解决方案的一次大规模公开验证。

一项提升效率的技术,必须考虑是否以牺牲性能为代价。DeepSeek公布了详尽的基准测试数据。数据显示,在与前代模型V3.1-Terminus的严格对齐比较中,V3.2-Exp在各项核心能力上都保持了基本持平的水准。例如,在代码生成(HumanEval)、数学推理(GSM8K)和通用知识(MMLU)等多个公开评测集上,二者的得分都非常接近,差距基本在1%以内。至少在基准测试上,DSA的应用在很大程度上实现了一次“效率换挡,性能不减”的优化。

对新架构的信心,也体现在其市场策略上。在发布V3.2-Exp的同时,DeepSeek对其API服务进行了一次大幅降价,涵盖了从V2到V3.1等多个主力模型。该大模型行业人士对此评论,DeepSeek更像是一种“以价换量”的策略,不只是用户量,更是对新架构的海量“验证量”。通过一个极具吸引力的价格体系,鼓励海量开发者在真实场景中调用其服务,这也为正在进行公开测试的V3.2-Exp提供了压力测试数据和环境。

DeepSeek的这次发布,也在Reddit、Hacker News等技术社区引发了讨论。

最普遍的感受是惊喜。一些用户在测试中取得了不错的效果,一位Reddit网友的评论“创新速度如光速,佩服得五体投地”。新万博体育:讨论则聚焦于其极致的性价比,有用户证实V3.2的推理成本显著降低,但“性能各方面却非常相似”。这种“性能不降,费用降低”的组合拳,被普遍认为是模型服务走向普惠的一步。

当然,讨论也并非全是赞誉。有用户反馈,在自己的某些特定测试上,新版本的表现反而不如旧版。同时,新万博体育:DSA稀疏注意力机制是否会牺牲部分上下文性能的技术辩论,也在社区持续进行。此外,也有评论对DeepSeek的低价策略能否持续表示观望。

1

国产AI生态联动

DeepSeek此次发布还让一个相对小众的国产编程语言获得了关注。

为了方便开发者更好地利用其新架构,DeepSeek开源了DSA中部分关键组件的CUDA算子。而在其技术文档中,一个名为TileLang的工具被提及。这是一种由北大团队研发的新型编程语言,专为简化高难度的GPU算子开发而设计。根据相关资料,对于一些复杂的算子,原本需要500行左右的CUDA代码,使用TileLang可能只需50行就能实现,极大地降低了底层优化的门槛和研发成本。

TileLang此前已被微软等国际厂商在其AI框架中采用。但DeepSeek的这次“引流”,让新万博体育:人看到了其在另一层面的价值,对国产硬件生态的适配。目前,TileLang不仅支持英伟达的CUDA,也已支持华为昇腾等国产芯片。

DeepSeek V3.2-Exp模型发布后,华为昇腾和寒武纪均第一时间宣布完成了适配工作。也就是说以DeepSeek为代表的国内大模型公司,在进行算法和架构创新的同时,也在客观上推动和验证了国产AI软硬件生态的协同发展。包括上层的模型架构,到中间层的编译语言,再到底层的计算芯片。

1

DeepSeek公开的“实验”

不久前,Google也发布了其最新轻量级模型Gemini 2.5 Flash-Lite。与V3.2-Exp类似,它同样追求极致的性价比。但二者实现路径有所不同。Gemini的更新更侧重于通过模型蒸馏等方式进行参数和性能的优化,而DeepSeek则选择了从更底层的注意力机制入手,进行架构层面的革新。路径有区别,但目标一致,都在致力于提供更普惠的高性能AI。解决“效率”和“成本”这两个基础问题,已经成为全球顶尖玩家的共识,这与单纯的“价格战”有着本质区别。

这种由底层架构创新带来的成本结构变化,对行业的长期影响可能更为深远。它让新万博体育:开发者和中小企业能够以更低成本使用到顶尖水平的大模型,也势必会影响闭源模型的利润空间和策略。这也证明了由算法和架构创新驱动的AI“摩尔定律”继续。当价格不再是阻碍时,真正的应用创新才可能发生。

通过DSA这项技术实验,DeepSeek传递出其仍在智能前沿进行持续探索的信号,也很可能让我们提前看到了V4架构的雏形,这是一个清晰的、正在进行中的过程。而这个进程的速度,将决定我们何时能看到DeepSeek V4和R2。

点个“爱心”,再走 吧

??时事1:188即时比分直播

??09月25日,我和总书记面对面丨全面提升新兴领域战略能力,

  骨剪看起来并不锋锐,甚至摸起来感觉光滑无比,但是在对战中却可怕的惊人,将山峰都可以轻易截断。

,888集团电子游戏网址。

??09月25日,航拍北岳恒山:云雾缭绕宛如人间仙境,

  质量就是学校的生命,我们必须理直气壮的抓好教育质量,因此,一直以来,学校对毕业班老师的安排可谓煞费心机,在座的各位毕业班老师都是学校的骨干教师,是学校的中流砥柱。初三毕业班是初中阶段的关键时刻,其教学质量在初中阶段中占有特殊的地位,毕业班工作是学校整体教学水平的集中体现,是我们学校对外的窗口,对内的榜样。中考成绩更是直接关系到学校的名声、地位和发展,抓好初三教学管理与毕业班的工作非常重要,学校非常重视初三毕业班的工作,今天召开毕业班教师动员会,就是根据期初学校工作部署而召开的,旨在统一,统一步调,明确目标,确定措施,增添信心,为20xx年我校再次取得中考的胜利吹响进攻的号角。 下面我从三个方面向各位汇报一下九年级的情况。

,千赢国际最新官网下载,环球在线登录,亚新体育投注登录。

??时事2:万赢国际网址是多少

??09月25日,安徽淮南:舞龙欢度“二月二”,

  “好强!”蛟鹏咬牙,露出不可思议的目光,这次真的太丢脸了,居然被一个还在吃奶的娃给镇住了,脸上火辣辣。

,凯发娱乐登录界面在哪里,体育买球官网,太阳集团娱乐网址平台。

??09月25日,应急管理部启动地震三级应急响应 派出工作组赶赴新疆震区指导抗震救灾工作,

  新年伊始,万象更新,又是一个生机蓬勃的春天向我们走来。回顾走过的一年,凭借着大家积极进取、艰苦奋斗的精神,我们科利尔·立胜走到今天已出具规模。值此辞旧迎新之际我谨代表科利尔·立胜向大家表示衷心的感谢,感谢在各个工作岗位上勤勤恳恳努力工作的全体员工,正是有你们的长期关心与支持,才会有科利尔·立胜的不断成长。祝愿大家在新的一年里身体健康、合家幸福、事业有成、大展宏图!

,欧宝网址ob8558com,乐动体育快速开户,bet体育在线登陆。

??时事3:蛋蛋pc官网

??09月25日,【巴黎奥运会】张雨霏:希望下届奥运会中国队男女混合泳接力登顶世界第一,

企业开张典礼领导讲话 篇11

,bwin登录,188bet亚洲登录,买球平台下载。

??09月25日,“五一”假期西宁市人民公园游客突破51万人次,

  我们这次工作会议的中心议题之一就是研讨我院完全学分制的实施。学分制改革可以说是时代的要求,进入新世纪,中国高等教育面临着空前的机遇和挑战,高等教育事业的改革和发展也越来越为世人关注,同样,高等美术教育的发展也处于一个前所未有的重要时期。实施学分制改革则是深化教育改革,优化教育结构,合理配置教育资源,提高教育质量和管理水平,全面推进素质教育的重大举措。在我院推行学分制改革不仅是市教委的决定,而且也是我院师生的迫切要求。20xx年秋季将在我院开始实施的学分制改革是院党委的重要决定,党委希望,这一步能走得扎实,走得成功。

,大发体育在哪开户,K8凯发在线开户,乐鱼体育官方首页。

??时事4:取款宝

??09月25日,已故大师“复现”,数智人大学还远吗,

  我们真诚的期望:通过入住嗨喽酒店,能进一步加深您对我们的了解,增进我们之间的深厚友谊,使我们能时刻以您的需求为出发点,更好的为您提供优质、快捷、高效的服务;同时,也期盼您对本酒店的服务和管理提出宝贵的意见和建议,我们将不胜感激!

,滚球体育网,巴黎人在线下载,米乐m6官方网站。

??09月25日,兴凯湖进入候鸟南迁高峰期 日均过往候鸟达3.5万只,

  金狼部落距离苍莽山脉四万里,这群人除了必要的休息外,全力驰骋,骑独角兽的人在第四日返回栖居地。

,沙龙体育app下载,皇冠官方下载,综合体育网站有哪些。

责编:秦富

审核:黄牙

责编:龚莉

相关推荐 换一换