LongCat-Flash-Thinking
MeituanОткрытые весаMIT · Коммерческое использование
Описание
LongCat-Flash-Thinking is Meituan's reasoning model built on the LongCat-Flash foundation with 560B total parameters (MoE, ~27B activated). It introduces a training pipeline specifically tuned for advanced reasoning, featuring Re-thinking Mode that delivers parallel reasoning paths for sophisticated decision-making. Achieves strong performance on mathematical reasoning, agentic tool use, and formal theorem proving benchmarks.
Дата выхода
2025-09-22
Параметры
560.0B
Длина контекста
—
Модальности
text
Радар способностей
80
general
70
coding
90
reasoning
68
scienceоцен.
70
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Агентные возможности | 7 | 74.0 | LS |
| Рассуждения | 64 | 62.0 | LS |
Оценки бенчмарков (LLM Stats)
Agents
BFCL-v3
74.4%Сам.
Biology
GPQA
81.5%Сам.
Code
LiveCodeBench
79.4%Сам.
SWE-Bench Verified
59.4%Сам.
Communication
Tau2 Telecom
83.1%Сам.
Tau2 Retail
71.5%Сам.
Tau2 Airline
67.5%Сам.
Finance
MMLU-Pro
82.6%Сам.
General
MMLU-Redux
89.3%Сам.
Math
MATH-500
99.2%Сам.
AIME 2024
93.3%Сам.
AIME 2025
90.6%Сам.
Reasoning
ZebraLogic
95.5%Сам.
ARC-AGI
50.3%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Language90
Math90
Legal80
Physics80
Reasoning80
Finance80
General80
Healthcare80
Biology80
Chemistry80
Structured Output70
Agents70
Code70
Communication70
Tool Calling70
Frontend Development60
Spatial Reasoning50
Vision50
Цены
Нет данных о ценах
Скорость
Нет данных о скорости
Рейтинг цен провайдеров
Нет данных провайдеров