168手机版登录,一款汇聚潮流与创新的应用,带你领略科技与生活的完美融合_新万博体育

新万博体育

图片
搜索
猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

Kimi K2思考模型来了!实测3分钟做精美网页,IMO数学题翻车

2025-11-03 07:14:39
来源:

猫眼电影

作者:

买空

手机查看

  猫眼电影记者 唐城 报道Q8X2R7L1T4J5M9B6W3

智东西作者 云鹏编辑 李水青

智东西11月6日消息,刚刚,月之暗面正式发布了Kimi-k2 thinking模型,其为具有通用Agentic能力和推理能力的思考模型,擅长深度推理,可以通过多轮工具调用,解决各类复杂的难题。

▲月之暗面官方发布页面

Kimi K2首次发布是在7月11日,该模型总参数10000亿,激活参数320亿。Kimi K2-0905于9月5日发布,其核心升级了Agentic Coding能力、支持256K上下文、API支持60-100Token/s的输出速度、支持Claude Code。

价格方面,kimi-k2-thinking每百万tokens的输入价格(缓存未命中)为4元、输出价格为16元;“高速版”kimi-k2-thinking-turbo每百万tokens的输入价格(缓存未命中)为8元、输出价格为58元,适用于需要深度推理和追求极致高速的场景。

▲Kimi K2系列模型价格

在实际体验环节,我们主要测试了Kimi-k2 thinking在编程、数学和逻辑推理能力三个方面的表现。

在编程方面,我们令其生成一个开源模型分享网站的HTML网页原型,包括顶部导航栏、主体展示区、设计风格要求,还要求其构思两个特色功能。

从生成结果来看,我们对网页主要部分提出的要求都可以很好地被执行,包括导航栏有哪些部分、主题展示区由哪些模块组成,简洁现代的设计风格也有较好体现,一键复现、模型对比这两个特色功能也做了出来。

▲网页编程

整体网页的完成度是比较高的,并且不论是搜索框、按钮、筛选标签都是可以实际选中交互操作的,点击后会有对应的提示,比如点击上传模型,会提示需要准备的问题件、文件大小限制等信息。

▲网页按钮功能说明

生成网页项目的tokens总计消耗为9K,大约花费了3分钟左右的时间。不过在尝试多次生成结果时,偶尔会遇到崩溃状况。

在数学能力方面,今年国际数学奥林匹克竞赛(IMO)第六题被认为最具挑战性:

Kimi-k2 thinking在解题过程中,思考过程有21188字,经过4分钟左右时间,给出了错误答案4048块,正确答案为2112块。

▲Kimi-k2 thinking解答2025 IMO数学竞赛题第六题

这一过程总共消耗了23.5K的tokens。

在切换为高速版kimi-k2-thinking-turbo后,模型仍然给出了同样的4048错误答案,花费时间明显缩短至2分钟左右,但tokens消耗数却提升至38.5K。

▲Kimi-k2 thinking-turbo解答2025 IMO数学竞赛题第六题

对于另一道IMO数学竞赛题,Kimi-k2 thinking在经历了10多分钟的深度思考后,最终停止了思考,思考过程47684字,但并未给出答案。再次尝试后,思考过程同样卡住在了47940字上,未能给出答案。

▲Kimi-k2 thinking解答2025 IMO数学竞赛题第四题

由于Kimi-k2 thinking不支持图片输入自动识别公式,因此一些复杂的数学题目很难输入。

在常识逻辑推理方面,对于一般的问题,Kimi-k2 thinking可以很快给出答案,并且可以轻松绕开逻辑陷阱。

▲Kimi-k2 thinking解答逻辑推理问题

对于更进一步的逻辑推理考察题目,Kimi-k2 thinking也可以在1分钟左右的时间内给出答案,准确率较高,消耗tokens为16.6K。

▲Kimi-k2 thinking解答逻辑推理问题

结语:“思考”模型之战愈发焦灼

11月4日,阿里刚刚发布了Qwen 3系列中最强推理模型Qwen3-Max-Thinking早期预览版,Kimi今天就发布了自家K2系列的思考模型,同样主打深度推理能力。

在Agentic AI成为主流趋势之下,模型的思考推理能力愈发受到重视,这也是模型能否解决复杂现实问题的关键。

??时事1:欧宝线路检测

??11月03日,最高法:知识产权侵权代价和违法成本显著提高 2023年适用惩罚性赔偿判赔金额超11.6亿元,

  “狈村的杂种你们全部去死吧!”石林虎怒吼。

,mgm2022世界杯。

??11月03日,台湾“首来族”青年:要把宝贵的交流经验带回台湾,

  “族长不能啊!”一群壮年男子眼泪差点掉下来,他们知道,族长拼命拦他们,是不想他们死掉,而自己却要去拼命。

,优德体育网官网入口,韦德体育体育APP,欧洲杯球队资料。

??时事2:世界杯视频直播网站

??11月03日,李强抵达惠灵顿开始对新西兰进行正式访问,

  要知道,一座灵山也只能生长一株灵药而已,它爬了多少座灵山?恐怕也唯有这等染有凰血的地方才能有这么多灵山吧。

?第一百九十三章 鼻祖,纬来体育app下载,威斯尼斯人娱乐官方网站登录,凯发娱乐手机版登录地址。

??11月03日,8大类家电新增10.2万种,家电新品种你用过吗?,

  “呜呜……”

,凤凰彩票快速注册,葡京官网开户,天博注册彩金。

??时事3:168体育官方

??11月03日,拂影·2024第十一季SIUF国际超模大赛总决赛在深圳举办,

  数日后,百族战场传来消息,那头成年貔貅摧枯拉朽,浴血而狂,横扫浩瀚战场,无人是其对手。

,亚星注册,环球真人,华纳国际平台官网。

??11月03日,【和谐共生】习言道|生态兴则文明兴,

  远远望去,那个方向散发着冲霄的光芒,波动如海,宛若有一座永恒的神炉在天地间燃烧,如同神明出世,照亮了四方。

,威斯尼斯人娱乐官方进入,手机上网赌怎么玩,凯时官网APP。

??时事4:火狐体育官网下载app

??11月03日,珠江流域北江将发生特大洪水 水利部将洪水防御应急响应提升至Ⅲ级,  尽管中国并未采取集中清缴清欠税收等行动,但随着税收大数据广泛应用,网状、系统性税收风险分析取代了此前个人经验点对点分析,税收征管力度事实上在不断强化,税收征收率在不断提高。以前企业偷漏税可能不容易被发现,但近些年通过税收大数据,税务部门会收到企业风险提示,并跟企业确认,不少企业需要依法补缴税款。,电子游戏注册官网,凯发APP下载,威尼斯人注册页面在哪。

??11月03日,大熊猫卖萌憨态可掬,

  二、树“三自”理念为中心,创湖工活动新品牌

,大发在线试玩,万博首页,立博注册彩金。

责编:麦克·桑托

审核:罗伯塔·L·杜伊夫

责编:刘辰乔

相关推荐 换一换