LongCat-Flash-Thinking
MeituanOpen WeightMIT · Commercial OK
Описание
LongCat-Flash-Thinking is Meituan's reasoning model built on the LongCat-Flash foundation with 560B total parameters (MoE, ~27B activated). It introduces a training pipeline specifically tuned for advanced reasoning, featuring Re-thinking Mode that delivers parallel reasoning paths for sophisticated decision-making. Achieves strong performance on mathematical reasoning, agentic tool use, and formal theorem proving benchmarks.
Дата выхода
2025-09-22
Параметры
560.0B
Длина контекста
—
Модальности
text
Радар способностей
80
general
70
coding
90
reasoning
68
scienceоцен.
70
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Agents & Tools | 8 | 74.0 | LS |
| Reasoning | 59 | 62.0 | LS |
Оценки бенчмарков (LLM Stats)
Agents
BFCL-v3
74.4%Сам.
Biology
GPQA
81.5%Сам.
Code
LiveCodeBench
79.4%Сам.
SWE-Bench Verified
59.4%Сам.
Communication
Tau2 Telecom
83.1%Сам.
Tau2 Retail
71.5%Сам.
Tau2 Airline
67.5%Сам.
Finance
MMLU-Pro
82.6%Сам.
General
MMLU-Redux
89.3%Сам.
Math
MATH-500
99.2%Сам.
AIME 2024
93.3%Сам.
AIME 2025
90.6%Сам.
Reasoning
ZebraLogic
95.5%Сам.
ARC-AGI
50.3%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Language90
Math90
Biology80
Chemistry80
Finance80
General80
Healthcare80
Legal80
Physics80
Reasoning80
Structured Output70
Tool Calling70
Agents70
Code70
Communication70
Frontend Development60
Spatial Reasoning50
Vision50
Цены
Нет данных о ценах
Скорость
Нет данных о скорости
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров