LongCat-Flash-Chat
MeituanOpen WeightMIT · Commercial OK
Описание
LongCat-Flash-Chat is Meituan's first open-source foundation model, a 560B parameter Mixture-of-Experts (MoE) model that dynamically activates 18.6B-31.3B parameters (~27B average) based on contextual demands. It features Zero-Computation Experts for efficient routing and supports 128K context. Optimized for conversational and agentic tasks, it shows competitive performance across reasoning, coding, instruction following, and domain benchmarks with particular strengths in tool use and complex multi-step interactions. Achieves over 100 tokens per second on H800 GPUs.
Дата выхода
2025-08-29
Параметры
560.0B
Длина контекста
—
Модальности
text
Радар способностей
80
general
60
coding
80
reasoning
60
scienceоцен.
70
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Agents & Tools | 86 | 40.0 | LS |
| Reasoning | 11 | 89.0 | LS |
Оценки бенчмарков (LLM Stats)
Agents
Terminal-Bench
39.5%Сам.
Biology
GPQA
73.2%Сам.
Code
HumanEval
88.4%Сам.
SWE-Bench Verified
60.4%Сам.
LiveCodeBench
48.0%Сам.
Communication
Tau2 Telecom
73.7%Сам.
Tau2 Retail
71.3%Сам.
Tau2 Airline
58.0%Сам.
Finance
MMLU
89.7%Сам.
MMLU-Pro
82.7%Сам.
General
IFEval
89.6%Сам.
CMMLU
84.3%Сам.
Math
MATH-500
96.4%Сам.
DROP
79.1%Сам.
AIME 2025
61.3%Сам.
Reasoning
ZebraLogic
89.3%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Structured Output90
Finance90
Healthcare90
Instruction Following90
Language90
Legal90
General80
Math80
Tool Calling70
Biology70
Chemistry70
Communication70
Physics70
Reasoning70
Code60
Frontend Development60
Agents40
Цены
Цена ввода$0.3 / 1M tokens
Цена вывода$1.2 / 1M tokens
Смешанная цена (3:1)$0.525 / 1M tokens
Скорость
Нет данных о скорости
Доступные провайдеры
(Внутренние единицы LS)| Провайдер | Цена ввода | Цена вывода |
|---|---|---|
| Meituan | 300K | 1.2M |