美团发布并开源高效推理模型LongCat-Flash-Thinking
9月22日,美团LongCat团队正式发布全新高效推理模型LongCat-Flash-Thinking。此前的9月1日,美团曾发布首个大模型LongCat-Flash-Chat。官方称,在保持了LongCat-Flash-Chat极致速度的同时,此次全新发布的LongCat-Flash-Thinking更强大、更专业。
综合评分显示,LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。
具体来看,在通用推理能力方面,LongCat-Flash-Thinking在ARC-AGI基准测试中以50.3分超越OpenAI o3、Gemini2.5 Pro等顶尖闭源模型。在HMMT和AIME相关基准测试中,超越OpenAI o3,和Qwen3-235B-A22B-Thinking等领水平相当。
在LiveCodeBench上,LongCat-Flash-Thinking以79.4分超越参与评估的开源模型,并与闭源模型GPT-5表现相当。在OJBench基准测试中也以40.7的得分接近Gemini2.5-Pro的水平。
智能体能力方面,LongCat-Flash-Thinking 在τ2-Bench上以74.0分刷新开源SOTA成绩,并在包括SWE-Bench、BFCL V3和VitaBench等基准测试中展现出竞争力。
同时,LongCat-Flash-Thinking还扩展了形式化定理证明能力,被认为是国内首个同时具备「深度思考+工具调用」与「非形式化+形式化」推理能力相结合的大语言模型。
目前, LongCat-Flash-Thinking已在HuggingFace、Github全面开源,并在官网可体验。
值得一提的是,此前有媒体爆料称,LongCat-Flash最大的亮点是其训练并非在英伟达GPU上完成,而是在国产加速卡上进行。但由于一些原因,真正的硬件厂商具体名字不方便透露。对此,官方未公开回应。
本文系观察者网独家稿件,未经授权,不得转载。
天博电子游戏app
赌场游戏软件
钱柜体育
英亚体育官网首页
正规bbin体育介绍
炸金花那张牌最大
伟德网址登录
金宝慱体育
大刀皇之(世纪之星)
bt365客户端下载
德克萨斯扑克APP下载
贝博体育官网中心
大发国际官网登录网址
齐发娱乐官网入口
开云网址
大地网投官网
杏彩彩票平台网站
德扑圈长期盈利模式
澳门永利官方电子
皇冠官方登录平台下载安卓
靠谱的买球网址
伟德体育体育APP
澳门永利视讯下注
乐鱼体育平台进入
必威官网体育登录
欧亚官网登录
beat365官网地址下载
万博是正规平台吗
澳门正规网站有几个
易发08娱乐平台
完美体育全站入口
天博全站官网下载
凯发娱乐手机网页版下载
z6尊龙ag旗舰厅
澳门所有电子游戏排行榜
电子游艺平台全网址
二八杠麻将牌
火博体育
开博体育app官网入口
可以赢钱的炸金花手游
金沙官网app下载大厅
明升平台网站
和记娱乐线路检测
威尼斯人手机版本登录
爱博网投平台
bbin新体育开户
新濠天地世界杯买球
乐动体育官方网站
银河集团平台网址
足球大赢家比分
捕鱼app上下分
aoa体育网页登录版
凯发k8555
新万博manbetx
开元棋乐棋牌10元
下载真人游戏大厅
华纳国际官网注册
天游登录
亚美优惠永远多一点
永乐是什么平台
ag亚洲游官网
12bet体育平台
九五至尊网站多少
可靠的ag平台
皇冠体育下载链接
银河国际下载app下载
365体育滚球
斗球app官网下载
火狐体育登录入口
七星彩网上投注网站
博鱼网站是什么
M6手机APP
拉菲彩票平台官网
99真人官方网
开元体育官方网站入口
万博在线网站
足球财富app下载v4.6
捕鱼又来了微信红包是不是真的
梭哈平台官网
欧冠决赛2017全场回放
杏彩官方登陆平台
网友评论 查看所有评论>>