メインコンテンツへスキップ

LongCat-Flash-Thinking

MeituanOpen WeightMIT · Commercial OK

説明

LongCat-Flash-Thinking is Meituan's reasoning model built on the LongCat-Flash foundation with 560B total parameters (MoE, ~27B activated). It introduces a training pipeline specifically tuned for advanced reasoning, featuring Re-thinking Mode that delivers parallel reasoning paths for sophisticated decision-making. Achieves strong performance on mathematical reasoning, agentic tool use, and formal theorem proving benchmarks.

リリース日
2025-09-22
パラメータ
560.0B
コンテキスト長
モダリティ
text

能力レーダー

80
general
70
coding
90
reasoning
68
science推定
70
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools8
74.0
LS
Reasoning59
62.0
LS

ベンチマークスコア (LLM Stats)

Agents

BFCL-v374.4%自己申告

Biology

GPQA81.5%自己申告

Code

LiveCodeBench79.4%自己申告
SWE-Bench Verified59.4%自己申告

Communication

Tau2 Telecom83.1%自己申告
Tau2 Retail71.5%自己申告
Tau2 Airline67.5%自己申告

Finance

MMLU-Pro82.6%自己申告

General

MMLU-Redux89.3%自己申告

Math

MATH-50099.2%自己申告
AIME 202493.3%自己申告
AIME 202590.6%自己申告

Reasoning

ZebraLogic95.5%自己申告
ARC-AGI50.3%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Language
90
Math
90
Biology
80
Chemistry
80
Finance
80
General
80
Healthcare
80
Legal
80
Physics
80
Reasoning
80
Structured Output
70
Tool Calling
70
Agents
70
Code
70
Communication
70
Frontend Development
60
Spatial Reasoning
50
Vision
50

価格設定

価格データがありません

速度

速度データがありません

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク