Passer au contenu principal

LongCat-Flash-Chat

MeituanOpen WeightMIT · Usage Commercial

Description

LongCat-Flash-Chat is Meituan's first open-source foundation model, a 560B parameter Mixture-of-Experts (MoE) model that dynamically activates 18.6B-31.3B parameters (~27B average) based on contextual demands. It features Zero-Computation Experts for efficient routing and supports 128K context. Optimized for conversational and agentic tasks, it shows competitive performance across reasoning, coding, instruction following, and domain benchmarks with particular strengths in tool use and complex multi-step interactions. Achieves over 100 tokens per second on H800 GPUs.

Date de sortie
2025-08-29
Paramètres
560.0B
Longueur du contexte
Modalités
text

Radar de capacités

80
general
60
coding
80
reasoning
60
scienceest.
70
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Capacité agentique104
40.0
LS
Raisonnement11
89.0
LS

Scores de benchmarks (LLM Stats)

Agents

Terminal-Bench39.5%Aut.

Biology

GPQA73.2%Aut.

Code

HumanEval88.4%Aut.
SWE-Bench Verified60.4%Aut.
LiveCodeBench48.0%Aut.

Communication

Tau2 Telecom73.7%Aut.
Tau2 Retail71.3%Aut.
Tau2 Airline58.0%Aut.

Finance

MMLU89.7%Aut.
MMLU-Pro82.7%Aut.

General

IFEval89.6%Aut.
CMMLU84.3%Aut.

Math

MATH-50096.4%Aut.
DROP79.1%Aut.
AIME 202561.3%Aut.

Reasoning

ZebraLogic89.3%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Instruction Following
90
Language
90
Legal
90
Structured Output
90
Finance
90
Healthcare
90
Math
80
General
80
Physics
70
Reasoning
70
Biology
70
Chemistry
70
Communication
70
Tool Calling
70
Frontend Development
60
Code
60
Agents
40

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes