メインコンテンツへスキップ

LongCat-Flash-Chat

MeituanオープンウエイトMIT · 商用利用可

説明

LongCat-Flash-Chat is Meituan's first open-source foundation model, a 560B parameter Mixture-of-Experts (MoE) model that dynamically activates 18.6B-31.3B parameters (~27B average) based on contextual demands. It features Zero-Computation Experts for efficient routing and supports 128K context. Optimized for conversational and agentic tasks, it shows competitive performance across reasoning, coding, instruction following, and domain benchmarks with particular strengths in tool use and complex multi-step interactions. Achieves over 100 tokens per second on H800 GPUs.

リリース日
2025-08-29
パラメータ
560.0B
コンテキスト長
モダリティ
text

能力レーダー

80
general
60
coding
80
reasoning
60
science推定
70
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力104
40.0
LS
推論11
89.0
LS

ベンチマークスコア (LLM Stats)

Agents

Terminal-Bench39.5%自己申告

Biology

GPQA73.2%自己申告

Code

HumanEval88.4%自己申告
SWE-Bench Verified60.4%自己申告
LiveCodeBench48.0%自己申告

Communication

Tau2 Telecom73.7%自己申告
Tau2 Retail71.3%自己申告
Tau2 Airline58.0%自己申告

Finance

MMLU89.7%自己申告
MMLU-Pro82.7%自己申告

General

IFEval89.6%自己申告
CMMLU84.3%自己申告

Math

MATH-50096.4%自己申告
DROP79.1%自己申告
AIME 202561.3%自己申告

Reasoning

ZebraLogic89.3%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Instruction Following
90
Language
90
Legal
90
Structured Output
90
Finance
90
Healthcare
90
Math
80
General
80
Physics
70
Reasoning
70
Biology
70
Chemistry
70
Communication
70
Tool Calling
70
Frontend Development
60
Code
60
Agents
40

価格設定

価格データがありません

速度

速度データがありません

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク