LongCat-Flash-Chat
MeituanOpen WeightMIT · Commercial OK
説明
LongCat-Flash-Chat is Meituan's first open-source foundation model, a 560B parameter Mixture-of-Experts (MoE) model that dynamically activates 18.6B-31.3B parameters (~27B average) based on contextual demands. It features Zero-Computation Experts for efficient routing and supports 128K context. Optimized for conversational and agentic tasks, it shows competitive performance across reasoning, coding, instruction following, and domain benchmarks with particular strengths in tool use and complex multi-step interactions. Achieves over 100 tokens per second on H800 GPUs.
リリース日
2025-08-29
パラメータ
560.0B
コンテキスト長
—
モダリティ
text
能力レーダー
80
general
60
coding
80
reasoning
60
science推定
70
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 86 | 40.0 | LS |
| Reasoning | 11 | 89.0 | LS |
ベンチマークスコア (LLM Stats)
Agents
Terminal-Bench
39.5%自己申告
Biology
GPQA
73.2%自己申告
Code
HumanEval
88.4%自己申告
SWE-Bench Verified
60.4%自己申告
LiveCodeBench
48.0%自己申告
Communication
Tau2 Telecom
73.7%自己申告
Tau2 Retail
71.3%自己申告
Tau2 Airline
58.0%自己申告
Finance
MMLU
89.7%自己申告
MMLU-Pro
82.7%自己申告
General
IFEval
89.6%自己申告
CMMLU
84.3%自己申告
Math
MATH-500
96.4%自己申告
DROP
79.1%自己申告
AIME 2025
61.3%自己申告
Reasoning
ZebraLogic
89.3%自己申告
AA評価指数
AA評価データがありません
LLM Statsカテゴリスコア
Structured Output90
Finance90
Healthcare90
Instruction Following90
Language90
Legal90
General80
Math80
Tool Calling70
Biology70
Chemistry70
Communication70
Physics70
Reasoning70
Code60
Frontend Development60
Agents40
価格設定
入力価格$0.3 / 1M tokens
出力価格$1.2 / 1M tokens
混合価格(3:1)$0.525 / 1M tokens
速度
速度データがありません
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Meituan | 300K | 1.2M |