Перейти к основному содержанию

LongCat-Flash-Thinking

MeituanOpen WeightMIT · Commercial OK

Описание

LongCat-Flash-Thinking is Meituan's reasoning model built on the LongCat-Flash foundation with 560B total parameters (MoE, ~27B activated). It introduces a training pipeline specifically tuned for advanced reasoning, featuring Re-thinking Mode that delivers parallel reasoning paths for sophisticated decision-making. Achieves strong performance on mathematical reasoning, agentic tool use, and formal theorem proving benchmarks.

Дата выхода
2025-09-22
Параметры
560.0B
Длина контекста
Модальности
text

Радар способностей

80
general
70
coding
90
reasoning
68
scienceоцен.
70
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Agents & Tools8
74.0
LS
Reasoning59
62.0
LS

Оценки бенчмарков (LLM Stats)

Agents

BFCL-v374.4%Сам.

Biology

GPQA81.5%Сам.

Code

LiveCodeBench79.4%Сам.
SWE-Bench Verified59.4%Сам.

Communication

Tau2 Telecom83.1%Сам.
Tau2 Retail71.5%Сам.
Tau2 Airline67.5%Сам.

Finance

MMLU-Pro82.6%Сам.

General

MMLU-Redux89.3%Сам.

Math

MATH-50099.2%Сам.
AIME 202493.3%Сам.
AIME 202590.6%Сам.

Reasoning

ZebraLogic95.5%Сам.
ARC-AGI50.3%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Language
90
Math
90
Biology
80
Chemistry
80
Finance
80
General
80
Healthcare
80
Legal
80
Physics
80
Reasoning
80
Structured Output
70
Tool Calling
70
Agents
70
Code
70
Communication
70
Frontend Development
60
Spatial Reasoning
50
Vision
50

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки