日碰,独特的视觉设计与流畅的操作体验,让人爱不释手_新万博体育
日碰 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页电脑软件王者荣耀动画荣耀之章 → 日碰 v7.679.6422 PC版

日碰

日碰

  • 电脑版下载
猜你喜欢
标签: 日碰 骚逼少妇黑丝被操
详情
介绍
猜你喜欢
相关版本

日碰截图Q8X2R7L1T4J5M9B6W3

内容详情

日碰

作者 | 周一笑邮箱 | zhouyixiao@pingwest.com

“这是又一次DeepSeek式的辉煌时刻吗?开源软件再次超越闭源软件。”

2025年11月6日,Hugging Face 联合创始人 Thomas Wolf 在 X 上的感慨,精准概括了Kimi K2 Thinking模型发布后所引发的讨论。

Kimi K2 Thinking在多个基准测试中取得了亮眼的成绩,追平、乃至超过了SOTA的闭源模型。例如,在HLE(Humanity's Last Exam)text-only子集的基准上,其工具增强版得分达到44.9%,超过了GPT-5的41.7% 。

Kimi K2 Thinking是基于 Kimi K2 模型训练而来的,专注于提升Agentic能力和推理能力。这是一个拥有1万亿总参数的混合专家模型(Mixture-of-Experts, MoE),每次推理激活约320亿参数,支持256k的上下文窗口,并采用了原生INT4量化技术。设计思路是在保持巨大模型规模的同时,想办法控制计算成本和训练成本。据CNBC援引知情人士的报道,该模型的训练成本仅为460万美元。作为对比,DeepSeek披露的 V3训练成本(租赁价,正式训练阶段)是560 万美元,R1为29.4万美元。这里主要考虑的是GPU预训练费用,不包括研发、基础设施等投资。

Kimi K2 Thinking的一个核心特性是Agent能力,官方宣称它能够连续执行200-300次工具调用来解决复杂问题。Grok-4等闭源阵营广泛采用RL提升工具使用与长程规划,但在开源模型中看到如此的实现还是第一次。它表明开源社区正在快速跟上智能体技术的前沿,同时也对模型托管服务提出了更高的要求。

Kimi K2 Thinking目前还没有发布技术报告,仅有技术博客、使用文档,未披露它的训练数据、RL细节或配方。模型发布后不久,技术社区的新万博体育:模型架构本身的讨论也开始出现。在X和Reddit上,一张将其与DeepSeek模型并排比较的架构图又开始流传,引发了新万博体育:其技术渊源的讨论。

在DeepSeek的R2“难产”已久、社区翘首以盼的背景下,Kimi带着一个架构存在继承关系且同样是开源SOTA推理模型的模型出现,让人恍惚以为Kimi是替DeepSeek把R2发了。

1

架构的“继承”与工程的“魔法”

LLM研究工程师Sebastian Raschka对此进行了详细的分析,他在threads指出了两者间的具体异同:

?每个MoE层的专家数量增加约1.5倍(384 vs 256)

?更大的词汇表(160k vs 129k)

?K2每个token激活约320亿参数(DeepSeek R1为370亿)

?MoE之前的密集FFN块更少

“简而言之,Kimi K2本质上就是一个规模上略作调整的 DeepSeek V3/R1。它的改进主要体现在数据和训练配方上。”

Raschka的分析指出了一个关键事实,Kimi K2 Thinking对DeepSeek核心架构的“继承”是显而易见的,包括MoE机制、MLA(多头潜在注意力)等设计。这是在一个已被验证的基座上,根据自身的目标进行了针对性的调整和优化。例如,减少注意力头和激活参数量,旨在降低推理成本;而增加专家数量和词汇表,则是为了增强模型的知识容量和表达能力。这种“站在巨人肩膀上”的做法,是开源精神最直接的体现。

除了对DeepSeek架构的继承,Kimi K2 Thinking的成果也离不开对整个开源生态成果的广泛“化用”。从底层用于加速注意力计算的FlashAttention,到K2技术报告中提到的、为解决训练不稳定性而改进的MuonClip优化器,再到各种数据处理和后训练方法论,都整合了开源社区的集体智慧。

如果说架构和开源技术决定了模型的骨架,那么让其血肉丰满的,则是月之暗面自身的工程实现能力。这主要体现在三个方面:

1、训练稳定性:在长达15.5万亿tokens的预训练过程中,Kimi K2 Thinking实现了“零loss spike(损失尖峰)”。这意味着训练过程极其稳定,无需因模型崩溃而进行成本高昂的回滚。这对于万亿参数规模的模型来说,是一项重要的工程成就。

2、原生量化推理:Kimi K2 Thinking支持原生INT4量化推理,据称能在极小的性能损失下,将推理速度提升约2倍,并显著降低部署所需的GPU显存。这是将大参数模型从实验室推向广泛应用的关键。

3、长程任务执行:模型能够稳定执行200-300轮工具调用,这不仅考验了模型的推理能力,也检验了其系统鲁棒性。在长达数百步的交互中,模型必须能处理各种异常,背后需要一套复杂的工程机制。

Kimi团队在选择和整合这些开源技术时的具体决策,及其工程团队最终的执行能力,共同构成了Kimi K2 Thinking取得当前成果的基础。这种技术路线和成功范式,让许多人联想到了当初R1发布时的情景。它承接DeepSeek 的 MLA+MoE高效架构与“可验证任务优先”的数据/奖励取向,用工程手段(如 MuonClip、长上下文、工具链)把能力做稳。不同点在于K2 Thinking的开放形态与目标更偏应用交付。

1

SOTA之外的取舍

对Kimi K2 Thinking的全面审视,不能只停留在Benchmark的分数上。一个绕不开点是其Benchmark成绩的来源。Kimi K2 Thinking在技术博客中展示的许多SOTA分数,是基于一个特殊的“Heavy”模式获得的。根据官方在Hugging Face上的说明,这个模式通过并行运行多达8个推理然后通过反思性地聚合所有输出来生成最终结果。这种做法在学术界和模型竞赛中很常见。在今年7月9日的Grok 4的发布会上,xAI公布Grok 4 Heavy的HLE得分为44.4 %,text-only 子集得分50.7%。

这种heavy模式也带来一些问题,一是资源消耗巨大,普通用户通过API或本地部署几乎不可能复现这种性能,二是它造成了Benchmark分数与模型单实例真实能力之间的差距。用户实际能体验到的标准模式,与榜单上的“野兽模式”不是一回事。

对效率的追求,也体现在模型底层的工程决策中,而这些决策往往遵循着性能与成本的交换原则。例如,模型采用的原生INT4量化,虽然官方宣称性能损失极小,但从FP16到INT4的精度压缩是巨大的。这种量化在标准评测集上可能表现良好,但在更长、更复杂的推理链条中,精度损失的累积效应是否会影响任务的最终成功率,仍有待更广泛的实际应用检验。

同样,将注意力头从128个减少到64个,也是Kimi团队为降低内存带宽和计算开销做出的主动选择。但K2技术报告也承认,新万博体育:的注意力头通常能带来更好的模型质量。这意味着,Kimi K2为了更高的推理效率,在模型能力上做出了一定的妥协。

Kimi K2 Thinking对Agent能力的押注,也带来了其他维度的局限性。官方公布的基准测试显示,K2 Thinking 在"智能体推理"和"智能体搜索"两项指标上超越了 OpenAI 与 Anthropic 的顶级模型(GPT-5 和 Sonnet 4.5 Thinking),但在“编程能力”方面尚未登顶。

在前沿模型纷纷将多模态作为标配的今天,Kimi K2 Thinking仍然是一个纯文本模型。这种差异在处理涉及视觉或空间推理的任务时尤为明显。例如,在生成一个“鹈鹕骑自行车”的SVG图像这类任务上,纯文本模型可能会因为缺乏对物理世界的基本视觉理解而存在一些问题:

Kimi K2 Thinking生成的SVG

Kimi K2 Thinking的发布,给人的感觉就像是开源AI社区又一次集体狂欢。它站在DeepSeek这样所有优秀开源成果之上,想明白了自己此阶段最重要的性能目标,对细节进行改进,对训练效率进行提高,得到一个可以在今天最关键方向上超过闭源最强模型的新开源模型。然后这个模型也给开源社区带来反馈和启发,同时它也是Kimi下一代更大更完整模型的一块拼图——也许下一次DeepSeek时刻不远了,而且它可能真的不需要由DeepSeek自己带来。

点个“爱心”,再走 吧

相关版本

    多平台下载

    查看所有0条评论>网友评论

    发表评论

    (您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

    查看所有0条评论>>

    相关软件
    狼友视频首页网站 毛片免费播放无码不卡无遮挡 综合v日韩 国内自拍电影 在线免费毛片基地 一级a性色生活片免费 rion揉尽神 黄色av电影网站 亚洲日韩在线综合一区视频 欧美激情一区二区在线 成人 高潮片免费本子 南山兵1609图片高清 美女挑战50厘米长的黑人 日韩高清h视频 99ri精品 99久久国产国语精品精精品 欧美巨大视频 3D布洛妮娅台球篇免费观看 快色视频黄app 入口 欧美永久免费在线 女人添荫蒂视频观看 亚韩欧美永久中文字幕视频 欧美性交久久 理论精品视频在线观看无码 成人做爰A片免费看网站网豆传媒 原神涩涩× 黄游下载 三级网站www 日韩福利在线观看 让你下面流水的视频 狠狠色色综合网站 你懂的在线观看免费网站 99re这里有精品视频 国产99视频精品 精品国产专区98精品 亚洲强奸视频的网站 天天狠天天透天干天天女人网 国产啊区 亚洲精品区一 临沧五一吃瓜事件 欧美黄色视频-国产农村一级A片免费观看一啊慢点太深了国产在线视频 亚洲    XXXX141 A片一级在线观看1024视频 genshin 18╳禁 a片网址在线 91在线视精品在亚洲 uygurlar skixix 昭和背德儿媳妇的老公是谁照片 黄色在线精品 日本老熟女肏屄视频 黑人大群体交免费视频 中文字幕国产一级片 欧美老妇女日逼视频 99riav入口 性色AV 色综合无码 亚洲色网视频网站 55yese.com 66yese.com 人人操人人搽 另类小说视频图片 女生被插啊啊啊 芥川爆炒中也(肉) 大肚子孕妇高潮呻吟 特级毛片在线大全免费播放 锕锵锵锵铜铜铜铜好大 激情小說激情图片 最近更新 - iGAO视频网_为爱搞点激情!!! 性视频A片 国产黄色网站www 成年人小电影网站 国产女人爆浆抽搐白浆视频 艹逼色色视频 男女A片 久久91精品久久久久久bn www.啪啪.com 亚洲国模私拍人体GOGO图片 亚洲制服久久精品一区 美拍分享美好 欧美网站免费观看在线 www.黄色观看 黄色网站18禁止入内 欧美一区裸体视频网站APP 日本调教鞭打屁股 早乙女由依LOL十大经典歌曲 porhnb下载 做受   高潮AAAA图片动漫 日韩视频在线观看国产 亚洲综合色一区二区三区91 男女网址 欧乱色国产精品兔费视频 www.一级黄色网站一区二区三区 色影音先锋AV资源噜噜 首页 国产精品入口 老师穿双开旗袍做运动 不要啊好大啊啊啊好痛 日韩一二三区无码视频 国产一区最新免费在线 绝区艾莲疯狂揉 3d动漫video 综合视频在线看精品 黄色毛片网站视频 18禁 网站 日本ⅩXXXXXXXXX62 手机看片免费1024 国产精品每日在线观看 免费看裸体 社区 黄色片九九视频 自拍偷拍亚洲视频2020 凹凸黄色视频免费观看 a级免费性交毛片 在线短视频费观看视频 久久免费免费视频 亚洲h视频网站大全 在线免费av不卡国产 将军安慰部下cg插画 欧美性爱亚洲色图影视 heyzo高无码综合伊人精品 一级免费黄片插插插 毛片a视频 gay2022.gay撸射无套入口 激情综合社区 国产对白在线观看
    热门网络工具