当前位置:首页 → 电脑软件 → 村支书醉驾被免职 被指扶植儿子继任 → 强力打造免费在线 v1.407.8673.459828 安卓免費版
v7.793.6041.503036 PC版
v2.520.1707.569733 最新版
v8.157.9215 安卓版
v8.391 安卓免費版
v7.135.9943 安卓版
v2.328.4878 安卓最新版
v6.810.2712.857799 安卓版
v6.609 安卓版
v6.307.1364.591566 安卓版
v7.489.1665.998858 PC版
v6.724 最新版
v1.183.4055.715817 最新版
v4.326.9485.627277 安卓漢化版
v9.674.1668.252779 最新版
v6.802.4996 安卓版
v1.398.4812.787069 安卓免費版
v3.553.6779.90487 安卓漢化版
v3.268.2487 PC版
v5.203.988.457847 安卓漢化版
v5.793.6160.963537 IOS版
v9.69 安卓版
v4.783.9591.827598 PC版
v3.712.6297.476502 安卓免費版
v7.501.1528 安卓免費版
v7.434.86 安卓最新版
v4.914.3157.969201 IOS版
v2.0.5128.380056 安卓最新版
v8.502.4361.822082 IOS版
v3.226.889 安卓漢化版
v3.939.4790.471388 安卓免費版
v7.160.8380.30702 IOS版
v4.39.6577.431178 最新版
v9.869.3752.978115 IOS版
v9.995 安卓漢化版
v5.3.8444.573927 安卓免費版
v9.112.2297 IOS版
v4.507.8498.400833 安卓最新版
v8.825.9186.8538 安卓漢化版
v1.192 IOS版
v6.174.7042 安卓漢化版
v5.38.9091.624087 安卓免費版
v9.77.6000.853013 安卓最新版
v3.848.2708 安卓漢化版
v8.259.3792 安卓最新版
v6.133.4549 PC版
v6.608.553.305716 安卓免費版
v7.723.2506 IOS版
v1.85.2748.48331 最新版
v5.428.7752.378694 IOS版
v1.596.7671.431114 安卓版
v8.377.222 安卓版
v7.801.7890 安卓免費版
v3.236 最新版
v3.719.6176 安卓漢化版
v1.382.7912.686524 安卓版
v4.973 安卓最新版
v9.609.8552.406580 安卓免費版
v8.162.1059.497334 IOS版
v7.518.3104.889634 安卓最新版
v6.247.8798.748465 PC版
v6.264.7663.226474 最新版
v8.920.5830.500729 安卓免費版
v4.49 IOS版
v6.772.3650.206102 IOS版
v2.104.5964.192228 安卓版
v6.200.6554 安卓免費版
v3.277.5682 PC版
v3.946.1781 安卓版
v8.613.1554.715691 安卓最新版
v2.957.3842.398132 安卓版
v3.833.4797.230272 PC版
v2.747.4790.925774 安卓版
v9.631.1410 最新版
v7.482.4735 安卓免費版
v9.601.9875.618812 最新版
v7.399.8986.722275 PC版
v6.278.6961.796698 安卓漢化版
v5.881.2196 PC版
v9.528.6397 最新版
v6.954.3537.99363 安卓漢化版
强力打造免费在线
编辑部 发自 凹非寺量子位 | 公众号 QbitAI
刚发V3.1“最终版”,DeepSeek最新模型又来了!
DeepSeek-V3.2-Exp刚刚官宣上线,不仅引入了新的注意力机制——DeepSeek Sparse Attention
还开源了更高效的TileLang版本GPU算子
目前,官方App、网页端、小程序均已同步更新,同时还有API大减价:5折起
这波DeepSeek国庆大礼包,属实有点惊喜了。
新注意力机制
DeepSeek-V3.2-Exp基于上周刚更新的DeepSeek-V3.1-Terminus打造,核心创新是引入了DeepSeek Sparse Attention(DSA)稀疏注意力机制
DSA首次实现了细粒度注意力机制,能在几乎不影响模型输出效果的前提下,实现长文本和推理效率大幅提升。
与前不久更新的DeepSeek-V3.1-Terminus对比,在各领域公开测评集上,DeepSeek-V3.2-Exp和V3.1-Terminus基本持平。
V3.1-Terminus是在 DeepSeek-V3.1基础上的一个强化版本,在稳定性、工具调用能力、语言一致性、错误修正等方面进行迭代改进。
另外,论文提到,使用DSA的模型在处理128K长上下文时,推理成本显著低于DeepSeek-V3.1-Terminus,尤其在解码阶段。
TileLang & CUDA双版本算子开源
DeepSeek还表示,在新模型研发过程中,需要设计和实现很多新的GPU算子。
他们使用高级语言TileLang进行快速原型开发,并在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本
因此,V3.2开源的主要算子包括TileLang和CUDA两种版本。
官方还附上一句:
我们建议社区在进行研究性实验时,使用基于TileLang的版本以方便调试和快速迭代。
官方API的价格也顺势来了个5折起,新价格即刻生效。
这还等什么…朋友们国庆整起来吧。
指路↓
HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-ExpModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp论文:https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf
One More Thing
除了DeepSeek-V3.2之外,据说智谱的GLM-4.6也在路上了。
从下拉菜单可以看到,他们已经把GLM-4.5标成了“上一代旗舰模型”。
下午还刚在GitHub上刷到这张“国庆是休息日,请给我们关注的同学一点时间”的图:
好好好,为了放假,都打算在节前卷了是吧(手动狗头)。
相关版本
多平台下载
查看所有0条评论>网友评论