当前位置:首页 → 电脑软件 → 伊利辟谣员工女乒决赛做侮辱性手势 → ManBetx在线试玩 v1.575.4426.840330 安卓免費版
v1.983.6202.837104 IOS版
v6.478.9954 安卓最新版
v7.793.9142.752895 最新版
v5.719.332.527179 安卓版
v6.578.3773.745293 IOS版
v6.838.5552 安卓最新版
v9.545.1921.790253 最新版
v2.596 安卓漢化版
v5.755.7304.628503 最新版
v9.114.4018 PC版
v9.622.4306.746187 安卓版
v6.884.4354.799228 安卓最新版
v6.813.1136.222453 安卓最新版
v5.600.4424.767972 安卓免費版
v4.931.4716.376428 IOS版
v8.788.4363.566290 安卓最新版
v1.893.1688.765483 安卓最新版
v8.43.6957.570641 安卓最新版
v8.90.4708 安卓最新版
v2.477.814.154314 安卓最新版
v9.523.3351.334694 安卓版
v4.99 PC版
v2.747.8267 安卓免費版
v5.652.3916 PC版
v5.659.8072.762142 安卓版
v4.29.9871.834815 最新版
v8.279.1093.761354 安卓版
v6.277.9405.414442 安卓漢化版
v1.842.527 最新版
v2.262.9835.171999 最新版
v4.396 安卓最新版
v3.59.5949.721782 IOS版
v2.716 安卓漢化版
v6.777.4826 IOS版
v4.882 最新版
v9.570.2985.43440 安卓最新版
v6.499.9883.143179 安卓免費版
v8.174.1515.496706 安卓最新版
v9.437 PC版
v6.744 安卓版
v6.436.404.388922 PC版
v2.738.3490.225403 安卓最新版
v9.329.5194.153650 安卓漢化版
v1.514.5633 最新版
v7.420.6225.603486 IOS版
v7.454 IOS版
v8.303.9133.255849 PC版
v4.485.6884.188722 安卓漢化版
v1.987.3343.973038 安卓版
v6.521.5589.760467 IOS版
v6.223.9415 IOS版
v5.602.7089.438725 安卓最新版
v7.980 安卓版
v8.245 IOS版
v5.35.4494.653509 PC版
v1.184.6481.183898 PC版
v4.100.2570.773581 安卓版
v6.47.2254.354160 安卓免費版
v1.364 安卓漢化版
v4.995.4554.616948 IOS版
v6.783.1166.772635 最新版
v2.561.1223.560089 安卓最新版
v8.300.400.437996 安卓最新版
v2.963 安卓最新版
v2.851.3986 安卓版
v9.938 IOS版
v3.493.264 IOS版
v6.379.9294.433817 安卓版
v7.425.8105 IOS版
v6.318 PC版
v7.718.8341 最新版
v8.823.4568 安卓免費版
v4.645 安卓漢化版
v5.752.9063.411325 安卓免費版
v2.438.2028 最新版
v9.546.3865 安卓版
v3.357 IOS版
v7.223.5480.368188 安卓版
v2.252.767 安卓最新版
v7.414.6771 IOS版
ManBetx在线试玩
9月22日,美团LongCat团队正式发布全新高效推理模型LongCat-Flash-Thinking。此前的9月1日,美团曾发布首个大模型LongCat-Flash-Chat。官方称,在保持了LongCat-Flash-Chat极致速度的同时,此次全新发布的LongCat-Flash-Thinking更强大、更专业。
综合评分显示,LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。
具体来看,在通用推理能力方面,LongCat-Flash-Thinking在ARC-AGI基准测试中以50.3分超越OpenAI o3、Gemini2.5 Pro等顶尖闭源模型。在HMMT和AIME相关基准测试中,超越OpenAI o3,和Qwen3-235B-A22B-Thinking等领水平相当。
在LiveCodeBench上,LongCat-Flash-Thinking以79.4分超越参与评估的开源模型,并与闭源模型GPT-5表现相当。在OJBench基准测试中也以40.7的得分接近Gemini2.5-Pro的水平。
智能体能力方面,LongCat-Flash-Thinking 在τ2-Bench上以74.0分刷新开源SOTA成绩,并在包括SWE-Bench、BFCL V3和VitaBench等基准测试中展现出竞争力。
同时,LongCat-Flash-Thinking还扩展了形式化定理证明能力,被认为是国内首个同时具备「深度思考+工具调用」与「非形式化+形式化」推理能力相结合的大语言模型。
目前, LongCat-Flash-Thinking已在HuggingFace、Github全面开源,并在官网可体验。
值得一提的是,此前有媒体爆料称,LongCat-Flash最大的亮点是其训练并非在英伟达GPU上完成,而是在国产加速卡上进行。但由于一些原因,真正的硬件厂商具体名字不方便透露。对此,官方未公开回应。
本文系观察者网独家稿件,未经授权,不得转载。
相关版本
多平台下载
查看所有0条评论>网友评论