美团发布并开源高效推理模型LongCat-Flash-Thinking
9月22日,美团LongCat团队正式发布全新高效推理模型LongCat-Flash-Thinking。此前的9月1日,美团曾发布首个大模型LongCat-Flash-Chat。官方称,在保持了LongCat-Flash-Chat极致速度的同时,此次全新发布的LongCat-Flash-Thinking更强大、更专业。
综合评分显示,LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。
具体来看,在通用推理能力方面,LongCat-Flash-Thinking在ARC-AGI基准测试中以50.3分超越OpenAI o3、Gemini2.5 Pro等顶尖闭源模型。在HMMT和AIME相关基准测试中,超越OpenAI o3,和Qwen3-235B-A22B-Thinking等领水平相当。
在LiveCodeBench上,LongCat-Flash-Thinking以79.4分超越参与评估的开源模型,并与闭源模型GPT-5表现相当。在OJBench基准测试中也以40.7的得分接近Gemini2.5-Pro的水平。
智能体能力方面,LongCat-Flash-Thinking 在τ2-Bench上以74.0分刷新开源SOTA成绩,并在包括SWE-Bench、BFCL V3和VitaBench等基准测试中展现出竞争力。
同时,LongCat-Flash-Thinking还扩展了形式化定理证明能力,被认为是国内首个同时具备「深度思考+工具调用」与「非形式化+形式化」推理能力相结合的大语言模型。
目前, LongCat-Flash-Thinking已在HuggingFace、Github全面开源,并在官网可体验。
值得一提的是,此前有媒体爆料称,LongCat-Flash最大的亮点是其训练并非在英伟达GPU上完成,而是在国产加速卡上进行。但由于一些原因,真正的硬件厂商具体名字不方便透露。对此,官方未公开回应。
本文系观察者网独家稿件,未经授权,不得转载。
澳门赌盘网开户
BoB体育官网登录
火凤凰棋牌游戏
皇冠体育注册游戏
新濠天地手机下载
澳门十三第网站首页
开博体育官方下载app
bob综合体育app下载官网
开云官网登录
蒲京娱乐
美高梅在线开户
斗牛怎样洗牌才能赢钱
新濠通下载
球探网即时比分007
manbetx体育版
long8唯一官方网站
一分钟快彩票
有在ag捕鱼输了几十万的吗
手机赢钱游戏
手机app澳门星际
火狐全站官网
万博手机APP
360速发app
新宝ggapp链接
最正规的娱乐游戏平台
币游国际的网站是多少
华纳游戏平台
凯时kb88官网网址
mg的网站都有哪些
英皇体育入口
十大棋牌游戏平台排行榜
彩票app
金宝博网站
滚球体育官方
九州电子网投
十大足球买球网推荐
188bet金宝搏可靠吗
永利皇宫登入口
90比分直播滚球
电子竞技菠菜app
亚美体育官网服务热线
威尼斯人官网首页入口
娱乐城论坛
金牌德州官网app
葡京导航站
香港六合皇A
ManBetX万博娱乐官网
新必赢亚洲官方网站登陆
万赢网址官网入口
鸿博体育体育外围
澳门威斯尼斯人6130app下载
新普京在线
亚星登陆平台
真人真钱抢庄牛牛
皇冠足球竞猜
尊龙APP安卓
bg大游官网
BOB官网买球
888真人娱乐平台
足球365比分网站
ag线上站
澳门永利皇宫游乐场网址
beplay登录不了联系客服
永利博体育在线网
澳门永利真正网址
永乐是正规的平台吗
AG真人下载
ayx网站是什么
杏耀注册平台官网
网站送彩金平台
澳门游戏注册证网
欧陆娱乐在线登录
必赢亚洲手机版官网登录
ag九游会登陆j9
亚美注册
优德赌场网站
立博网页版
博狗游戏网站网址
世界杯预选赛赛制
bbin糖果独立APP下载安装
澳门电投合法吗
网友评论 查看所有评论>>