LongCat-Flash-Thinking
MeituanOpen WeightMIT · Commercial OK
説明
LongCat-Flash-Thinking is Meituan's reasoning model built on the LongCat-Flash foundation with 560B total parameters (MoE, ~27B activated). It introduces a training pipeline specifically tuned for advanced reasoning, featuring Re-thinking Mode that delivers parallel reasoning paths for sophisticated decision-making. Achieves strong performance on mathematical reasoning, agentic tool use, and formal theorem proving benchmarks.
リリース日
2025-09-22
パラメータ
560.0B
コンテキスト長
—
モダリティ
text
能力レーダー
80
general
70
coding
90
reasoning
68
science推定
70
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 8 | 74.0 | LS |
| Reasoning | 59 | 62.0 | LS |
ベンチマークスコア (LLM Stats)
Agents
BFCL-v3
74.4%自己申告
Biology
GPQA
81.5%自己申告
Code
LiveCodeBench
79.4%自己申告
SWE-Bench Verified
59.4%自己申告
Communication
Tau2 Telecom
83.1%自己申告
Tau2 Retail
71.5%自己申告
Tau2 Airline
67.5%自己申告
Finance
MMLU-Pro
82.6%自己申告
General
MMLU-Redux
89.3%自己申告
Math
MATH-500
99.2%自己申告
AIME 2024
93.3%自己申告
AIME 2025
90.6%自己申告
Reasoning
ZebraLogic
95.5%自己申告
ARC-AGI
50.3%自己申告
AA評価指数
AA評価データがありません
LLM Statsカテゴリスコア
Language90
Math90
Biology80
Chemistry80
Finance80
General80
Healthcare80
Legal80
Physics80
Reasoning80
Structured Output70
Tool Calling70
Agents70
Code70
Communication70
Frontend Development60
Spatial Reasoning50
Vision50
価格設定
価格データがありません
速度
速度データがありません
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません