128棋牌的网址 😛时尚资讯 恩巴🙆🏽‍♂勒斯_新万博体育

新万博体育

图片
搜索
猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

刚刚,DeepSeek新模型自砍一刀!大降价50%,华为寒武纪已适配

2025-09-28 14:51:10
来源:

猫眼电影

作者:

金峰

手机查看

  猫眼电影记者 梅尔吉普森 报道P6F3X2M7T9QJ8L1B4WZR

智东西作者 李水青编辑 漠影

智东西9月29日报道,刚刚,DeepSeek正式发布DeepSeek-V3.2-Exp模型,官方App、网页端、小程序均已同步更新为该版本,同时API大幅度降价。

▲DeepSeek-V3.2-Exp的Hugging Face页面截图

DeepSeek-V3.2-Exp的一大亮点是价格暴降。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

据悉,DeepSeek-V3.2-Exp API的输入价格由0.5元/百万tokens降低为0.2元/百万tokens(缓存命中),由4元/百万tokens降低为2元/百万tokens(缓存未命中),输出价格由12元/百万tokens降低为3元/百万tokens。

▲DeepSeek-V3.2-Exp的全新价格政策

这得益于新模型服务成本的大幅降低。V3.2-Exp是一个实验性(Experimental)的版本,作为迈向新一代架构的中间步骤,在V3.1-Terminus的基础上引入了一种稀疏注意力机制(DeepSeek Sparse Attention,DSA),针对长文本的训练和推理效率进行了探索性的优化和验证。

据悉,DSA首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

▲DeepSeek-V3.2-Exp相比V3.1-Terminus效率提升

为了严谨地评估引入稀疏注意力带来的影响,DeepSeek特意把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

▲DeepSeek-V3.2-Exp与V3.1-Terminus测评表现对比

DeepSeek-V3.2-Exp一经发布,就在外网社交平台X等炸开了锅。有网友对“成本降低50%”表示赞叹,也有网友对DeepSeek“周更”的节奏表示满意,还有新万博体育:网友催更DeepSeek新一代模型R2及V4,并期待DeepSeek打败OpenAI。

▲社交平台X网友热议DeepSeek-V3.2-Exp

国产AI芯片公司纷纷第一时间宣布完成DeepSeek-V3.2-Exp的适配。

华为发文宣布,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。其在128K长序列下能够保持TTFT低于2秒、TPOT低于30毫秒的推理生成速度。

▲华为计算官方公众号发文

寒武纪也发文宣布,其已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的0day适配,并开源大模型推理引擎vLLM-MLU源代码。DeepSeek-V3.2-Exp叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本。

▲寒武纪开发者公众号发文

作为一个实验性的版本,DeepSeek-V3.2-Exp虽然已经在公开评测集上得到了有效性验证,但仍然需要在用户的真实使用场景中进行范围更广、规模更大的测试,以排除在某些场景下效果欠佳的可能。

为方便用户进行对比测试,DeepSeek-V3.1-Terminus临时保留了额外API访问接口,保留到北京时间2025年10月15日23:59。

用户只需修改base_url=”https://api.deepseek.com/v3.1_terminus_expires_on_20251015″ 即可访问V3.1-Terminus,调用价格与 V3.2-Exp相同。

DeepSeek-V3.2-Exp模型现已在Hugging Face与魔搭开源。

HuggingFace地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

ModelScope地址:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp

论文地址:

https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

结语:DeepSeek再降大模型落地门槛,国产芯片加速适配

DeepSeek的模型迭代速度正在加快。就在9月22日晚间,其刚刚发布了DeepSeek-V3.1-Terminus,优化了编程、搜索智能体等表现。仅仅一周后,DeepSeek-V3.2-Exp随之发布,带来了大幅降低的成本体验。

这预示着DeepSeek的下一代模型很快就要到来了,此前已有外媒报道称,DeepSeek今年年底即将推出Agent模型。值得一提的是,我们看到DeepSeek不仅上线阿里魔搭社区,并立马适配华为昇腾、寒武纪等国产AI芯片,或许意味着其快速迭代及落地应用与国产AI芯片联系更加紧密。

??时事1:威廉希尔官网首页

??09月28日,国家统计局:中国房地产市场出现积极变化 构建新发展模式潜力巨大,

  进一步加强信息、督查、政策研究材料的报送工作。地委办公室承办的信息、督查和政策研究工作既是各某地某、各部门向地委乃至自治某地党委工作的主渠道,也是地委掌握各某地某、各部门贯彻落实党委决策和各项工作部署情况的重要手段。近年来,各某地某、各部门积极报送各类信息、督查和政策研究材料,做了大量工作。某某、巴里坤某地、伊吾某地、经贸委、发展计划委员会、统计局、农业局、林业局、建设局、公安局、安全局、劳动保障局等单位在这些方面做得较好。希望继续发扬成绩,再接再厉,力争各项工作能再上新台阶。其他单位也要认真查找不足,努力赶上来。与此同时,我们也要清醒看到,目前党委的信息、督查和政策研究工作与新形势、新任务的发展需要相比,同各级党委的要求相比,还有一定的差距,还存在一些问题和不足。主要表现在:一是信息、督查和政策研究的整体水平还不高,报送的材料有的针对性不强、文字质量不高、数据不准确;有的简单停留在现象表层,缺乏深度思考和分析,也没有提出操作性较强的应对措施,能上升到地委领导决策视野的偏少;二是部门一些重要信息、紧急信息的报送还不够及时,甚至有迟报、漏报、瞒报的现象。三是机构改革以后,督查机构进行了新的设置,有的部门对党委督查工作缺乏足够的重视。这里我要强调指出的是,党委督查的机构设置虽然有变化,但督查工作的重要性没有变,督查工作的内容、手段、要求没有变。希望大家切实利用好信息、督查和政策研究工作这一渠道,知不足而思进,采取切实有效的措施,认真加以解决。

,至尊平台网址是多少。

??09月28日,香港金融科技周推动金融科技发展,

  “奶娃,我们有没惹你,为何攻击我等?”

,4-澳门三合,qy88千赢国际官网登录,鸿博体育好玩吗?。

??时事2:极速直播

??09月28日,广西钦州北过境线公路钦江特大桥顺利合龙,

  “别吓到孩子。”美丽女子说道。

,H88和记,ag凯发官网,完美国际不悔真人在哪。

??09月28日,“中国航天日”主题灯光秀点亮武汉夜空,

  小不点解开包裹,递过去一把肉脯,道:“你是什么生灵,为什么被困在这里?”

,mg手游官方网址,bwin登录,pp体育下载安装。

??时事3:优德体育平台APP

??09月28日,美议员警告:美国最高法院已陷入“合法性危机”,

  石村宁静了下来,村人表情渐渐变得郑重而又严肃,取来各种祭品,全村人皆站在柳树前方,认真祭祀。每一个人都在祷告,非常虔诚,隐约间像是与这天地共鸣,产生了一种奇异的力量。

,爱游戏app客户端下载,开云app最新版,万人迷游戏官网。

??09月28日,不以山海为远 携手共谱新篇|八百里“绿色长龙”拱卫京津冀,

  “武器没了,可以再铸造,虽然费时,但是终还有希望。可人要是没了,就彻底不能复活了,狈风天资奇高,在这片大荒都少见,将来可护佑我族。”

,OD世界杯内幕,博天堂外围官网,mgm怎么开户。

??时事4:188体育在线充值

??09月28日,中印尼“和平神鹰-2024”联演 展开灾害救援实兵演练,

  曾经繁荣的巨城成为了废墟,适合生灵繁衍的广袤平原而今死气沉沉,尽是残骨,血流成河。

,牛宝体育官网,真钱网赌推荐游戏,真钱最火的得炸金花。

??09月28日,风投折戟互联网医疗,大厂还在持续下注,

  “好家伙,以后再去山林中打猎,你也跟着吧,我觉得凭你现在的力量足以横推巨兽了!”

,贝博bb平台体育,优德体育官方app客户端,零点棋牌。

责编:姜立光

审核:普奇科夫

责编:张道正

相关推荐 换一换