美团发布并开源高效推理模型LongCat-Flash-Thinking
9月22日,美团LongCat团队正式发布全新高效推理模型LongCat-Flash-Thinking。此前的9月1日,美团曾发布首个大模型LongCat-Flash-Chat。官方称,在保持了LongCat-Flash-Chat极致速度的同时,此次全新发布的LongCat-Flash-Thinking更强大、更专业。
综合评分显示,LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。
具体来看,在通用推理能力方面,LongCat-Flash-Thinking在ARC-AGI基准测试中以50.3分超越OpenAI o3、Gemini2.5 Pro等顶尖闭源模型。在HMMT和AIME相关基准测试中,超越OpenAI o3,和Qwen3-235B-A22B-Thinking等领水平相当。
在LiveCodeBench上,LongCat-Flash-Thinking以79.4分超越参与评估的开源模型,并与闭源模型GPT-5表现相当。在OJBench基准测试中也以40.7的得分接近Gemini2.5-Pro的水平。
智能体能力方面,LongCat-Flash-Thinking 在τ2-Bench上以74.0分刷新开源SOTA成绩,并在包括SWE-Bench、BFCL V3和VitaBench等基准测试中展现出竞争力。
同时,LongCat-Flash-Thinking还扩展了形式化定理证明能力,被认为是国内首个同时具备「深度思考+工具调用」与「非形式化+形式化」推理能力相结合的大语言模型。
目前, LongCat-Flash-Thinking已在HuggingFace、Github全面开源,并在官网可体验。
值得一提的是,此前有媒体爆料称,LongCat-Flash最大的亮点是其训练并非在英伟达GPU上完成,而是在国产加速卡上进行。但由于一些原因,真正的硬件厂商具体名字不方便透露。对此,官方未公开回应。
本文系观察者网独家稿件,未经授权,不得转载。
ag捕鱼平台的小窍门
必博网址是多少
彩票官方平台
龙8国际好玩吗?
胜博发登陆
金沙电子登入
奇亿娱乐平台下载
678体育
赌博线上
k8凯发
沙巴体育娱乐网址
太阳集团注册送38
百老汇入口登录
火狐最新版下载
澳博竞彩官网
88体育app官网下载
手机体育下载
威趣游戏官方下载
B体育不能提款
ag真人官网下载
365亚洲版网址
赢咖4注册平台
万博mantex是什么
安全的博彩app
华体会上不去了
雷速体育app官网
巴黎人捕鱼
米乐m6娱乐可靠吗
打鱼娱乐
体育在线投注金莎
永乐国际乐在其中录
好乐国际棋牌斗地主真人游戏下载安装
特新报A
上葡京视讯游戏
kaiyun登录入口登录官网
龙8网页版手机登录
pg电子游戏麻将胡了
kk体育平台app官方下载
宝马会竞彩官网
mg游戏在线网站
莆田棋牌游戏下载
千亿官网网页版
火狐体育安卓版ap
鸿博体育官方网站介绍
威尼期人线路检测
ODapp下载
威尼斯人电竞平台正规吗
鲨鱼机
欧亚国际网上娱乐
球探网足球比分老板本
wns888app
雷速体育比分在线篮球
乐鱼平台登陆
澳门新葡jing
牛牛抢庄越抢庄牌越大
永乐国际平台官网
AG永乐国际官网
微信真钱牛牛
环宇娱乐官网首页
真钱线上下载app
m5彩票官网
宝马会在哪里玩
39999开元棋盘app官28278
od体育在线登录
bet体育官网下载
口袋足球游戏
和记体育
云顶国际app链接
888集团电子网址最新
杏彩平台客户端
ob体育在线登录
新mg
kok下载官方
葡京体育真人百家乐
万博官网网页版首页登录入口登不上
半岛在线体育入口网站
尊龙人生就是博d88
为什么国家不封AG平台
乐动体育平台首页
威廉希尔足球官网
ag捕鱼王3d投注
网友评论 查看所有评论>>