v7.238 IOS版
v9.388.3095 PC版
v4.701.8560.138235 IOS版
v4.485.6003.102747 PC版
v6.517 安卓漢化版
v3.688.1843.487588 最新版
v5.935 安卓免費版
v7.569.4074.430997 安卓免費版
v9.762 IOS版
v1.526.4331 IOS版
v2.334.3099 最新版
v1.77.8877.491711 PC版
v9.707 安卓漢化版
v5.129 安卓免費版
v8.187.9764 IOS版
v4.44.8167.75480 安卓漢化版
v6.808 安卓漢化版
v3.803 安卓免費版
v2.67.9802 PC版
v5.649.111.700645 安卓最新版
v5.708.6447 IOS版
v4.672.7697.876869 PC版
v5.415.7875.851096 最新版
v8.789 安卓漢化版
v2.760.8966 安卓最新版
v5.759.2183.504810 安卓版
v7.323.2370.796163 PC版
v7.774.3946 PC版
v2.523.7147.394911 安卓最新版
v2.818.9354.296027 IOS版
v1.156.5396.816290 安卓版
v8.74 安卓版
v5.888.5354 安卓免費版
v9.172.8538 安卓漢化版
v3.398.9837.168532 安卓漢化版
v7.299.3736 IOS版
v4.806.6258.899840 安卓漢化版
v3.310.6784.98243 安卓免費版
v5.139.8601.727013 IOS版
v7.635.3796.63136 安卓版
v3.196.9019 安卓漢化版
v4.603.4808.539729 最新版
v3.582.8209.130161 安卓最新版
v1.99.4867.246218 最新版
v3.449.8245 安卓漢化版
v4.363.9518.50252 安卓免費版
v9.460 最新版
v2.329.4891.85286 最新版
v9.608.1865.322986 安卓免費版
v2.840 安卓版
v4.134.7396.636535 最新版
v9.359.1544 安卓版
v4.680.1569.928958 安卓漢化版
v3.256.7389.541414 安卓版
v5.642.4429.210678 IOS版
v5.682.9324 最新版
v9.193.5440.79073 最新版
v6.386 安卓免費版
v1.543.9960.298376 PC版
v8.334.8516.257688 安卓最新版
v9.780.8381 PC版
v5.876.9755.842977 安卓漢化版
v4.0.5878 安卓最新版
v6.506.4103 安卓漢化版
v9.394.1494.903091 IOS版
v7.294 最新版
v5.683.2961.576104 最新版
v3.42.7836 安卓最新版
v5.368 最新版
v2.234.8122.892421 IOS版
v1.67.8793 IOS版
v6.915.5589 安卓免費版
v8.698 安卓最新版
v4.166.150.173358 安卓漢化版
v8.563 IOS版
v4.793.1925.774095 PC版
v7.718.7898.111127 最新版
v1.305.8206.645402 安卓漢化版
v1.151.8430 IOS版
v2.139 PC版
og平台
智通财经APP获悉,9月29日,深度求索正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。模型引入稀疏注意力架构,针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时API大幅度降价,有效降低开发者调用DeepSeek API的成本。
据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了一种稀疏注意力机制——DeepSeek Sparse Attention(DSA),针对长文本的训练和推理效率进行了探索性的优化和验证。
DSA首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏注意力结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
为了严谨地评估引入稀疏注意力带来的影响,DeepSeek团队特意把 DeepSeek-V3.2-Exp 的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。
得益于新模型服务成本的大幅降低,官方API价格出现了大幅下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。
相关版本
多平台下载
查看所有0条评论>网友评论