Saltar al contenido principal

LongCat-Flash-Chat

MeituanOpen WeightMIT · Uso Comercial

Descripción

LongCat-Flash-Chat is Meituan's first open-source foundation model, a 560B parameter Mixture-of-Experts (MoE) model that dynamically activates 18.6B-31.3B parameters (~27B average) based on contextual demands. It features Zero-Computation Experts for efficient routing and supports 128K context. Optimized for conversational and agentic tasks, it shows competitive performance across reasoning, coding, instruction following, and domain benchmarks with particular strengths in tool use and complex multi-step interactions. Achieves over 100 tokens per second on H800 GPUs.

Fecha de lanzamiento
2025-08-29
Parámetros
560.0B
Longitud del contexto
Modalidades
text

Radar de capacidades

80
general
60
coding
80
reasoning
60
scienceest.
70
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Capacidad agéntica104
40.0
LS
Razonamiento11
89.0
LS

Puntuaciones de benchmarks (LLM Stats)

Agents

Terminal-Bench39.5%Aut.

Biology

GPQA73.2%Aut.

Code

HumanEval88.4%Aut.
SWE-Bench Verified60.4%Aut.
LiveCodeBench48.0%Aut.

Communication

Tau2 Telecom73.7%Aut.
Tau2 Retail71.3%Aut.
Tau2 Airline58.0%Aut.

Finance

MMLU89.7%Aut.
MMLU-Pro82.7%Aut.

General

IFEval89.6%Aut.
CMMLU84.3%Aut.

Math

MATH-50096.4%Aut.
DROP79.1%Aut.
AIME 202561.3%Aut.

Reasoning

ZebraLogic89.3%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Instruction Following
90
Language
90
Legal
90
Structured Output
90
Finance
90
Healthcare
90
Math
80
General
80
Physics
70
Reasoning
70
Biology
70
Chemistry
70
Communication
70
Tool Calling
70
Frontend Development
60
Code
60
Agents
40

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas