美团发布并开源高效推理模型LongCat-Flash-Thinking
9月22日,美团LongCat团队正式发布全新高效推理模型LongCat-Flash-Thinking。此前的9月1日,美团曾发布首个大模型LongCat-Flash-Chat。官方称,在保持了LongCat-Flash-Chat极致速度的同时,此次全新发布的LongCat-Flash-Thinking更强大、更专业。
综合评分显示,LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。
具体来看,在通用推理能力方面,LongCat-Flash-Thinking在ARC-AGI基准测试中以50.3分超越OpenAI o3、Gemini2.5 Pro等顶尖闭源模型。在HMMT和AIME相关基准测试中,超越OpenAI o3,和Qwen3-235B-A22B-Thinking等领水平相当。
在LiveCodeBench上,LongCat-Flash-Thinking以79.4分超越参与评估的开源模型,并与闭源模型GPT-5表现相当。在OJBench基准测试中也以40.7的得分接近Gemini2.5-Pro的水平。
智能体能力方面,LongCat-Flash-Thinking 在τ2-Bench上以74.0分刷新开源SOTA成绩,并在包括SWE-Bench、BFCL V3和VitaBench等基准测试中展现出竞争力。
同时,LongCat-Flash-Thinking还扩展了形式化定理证明能力,被认为是国内首个同时具备「深度思考+工具调用」与「非形式化+形式化」推理能力相结合的大语言模型。
目前, LongCat-Flash-Thinking已在HuggingFace、Github全面开源,并在官网可体验。
值得一提的是,此前有媒体爆料称,LongCat-Flash最大的亮点是其训练并非在英伟达GPU上完成,而是在国产加速卡上进行。但由于一些原因,真正的硬件厂商具体名字不方便透露。对此,官方未公开回应。
本文系观察者网独家稿件,未经授权,不得转载。
相关推荐:博鱼体育官网网址 凯发娱乐登录界面在哪里 千赢国际平台首页
打鱼注册送分18元
纬来体育赌场网站
捕鱼王充值网投
旺球体育官网下载
马会传真-会员报
宝盈体育下载
老街华纳国际网址
亚盈体育官网在线
K8凯发手机登录
bob官方体育世界杯
伟德体育平台网址
欧宝登录
爱游戏平台下载
金沙手机登录
188金宝搏在哪下载
电玩竞技场
js6633
银河盘口官网
大发平台网站怎么找
爱博在线开户
优信彩票官网
尊龙客户端下载
足球即时比分90vs
M6直播视讯
云顶娱乐手机登陆网页版
闪讯官网
酷游平台地址ku112
爱博最新地址
利来国际真人娱乐老牌
欧博下载
买球在哪买app
bbin体育协会
比分球探网
同乐城
体彩网上投注站
大发怎么注册
国际彩票平台
必威平台网站是多少
12博国际
正规AG线上真人
赌博送体验金的平台
足球外围在哪儿买
三人扑克牌玩法大全
正规平台斗牛游戏
fun88是哪个国家的
金宝搏188备用网
欧博网页登陆
AG亚洲国际游戏官的网址
欧冠赛事比分预测
永利皇宫app软件下载
福至心灵
伯爵官网网址大全
爱玩捕鱼大圣归来漏洞
手机如何玩彩票
mgm在线注册
威尼斯人官网网页登录
威廉希尔官网网站
ag8真人官网
万人牛牛怎么开庄
bg真人官方网站
皇冠入口登录
太阳城体育APP
四虎网站是多少
12bet官方网站
万博手机版
ManBetX万博平台网址
千亿棋牌qy711
优博网址平台
8868体育app下载平台
香港内幕传真
AOAAPP安卓
ayx官网地址
18新利平台登录
万博官方登录入口
大红鹰注册
热博rb88体育入口
澳门永利集团304am官方入口
mg官网app
k1体育下载
手机彩票app下
麻将大三元
网友评论 查看所有评论>>