메인 콘텐츠로 건너뛰기

LongCat-Flash-Chat

Meituan오픈 웨이트MIT · 상업적 사용 가능

설명

LongCat-Flash-Chat is Meituan's first open-source foundation model, a 560B parameter Mixture-of-Experts (MoE) model that dynamically activates 18.6B-31.3B parameters (~27B average) based on contextual demands. It features Zero-Computation Experts for efficient routing and supports 128K context. Optimized for conversational and agentic tasks, it shows competitive performance across reasoning, coding, instruction following, and domain benchmarks with particular strengths in tool use and complex multi-step interactions. Achieves over 100 tokens per second on H800 GPUs.

출시일
2025-08-29
파라미터
560.0B
컨텍스트 길이
모달리티
text

능력 레이더

80
general
60
coding
80
reasoning
60
science추정
70
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
에이전트형 역량104
40.0
LS
추론11
89.0
LS

벤치마크 점수 (LLM Stats)

Agents

Terminal-Bench39.5%자체 보고

Biology

GPQA73.2%자체 보고

Code

HumanEval88.4%자체 보고
SWE-Bench Verified60.4%자체 보고
LiveCodeBench48.0%자체 보고

Communication

Tau2 Telecom73.7%자체 보고
Tau2 Retail71.3%자체 보고
Tau2 Airline58.0%자체 보고

Finance

MMLU89.7%자체 보고
MMLU-Pro82.7%자체 보고

General

IFEval89.6%자체 보고
CMMLU84.3%자체 보고

Math

MATH-50096.4%자체 보고
DROP79.1%자체 보고
AIME 202561.3%자체 보고

Reasoning

ZebraLogic89.3%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Instruction Following
90
Language
90
Legal
90
Structured Output
90
Finance
90
Healthcare
90
Math
80
General
80
Physics
70
Reasoning
70
Biology
70
Chemistry
70
Communication
70
Tool Calling
70
Frontend Development
60
Code
60
Agents
40

가격

가격 데이터가 없습니다

속도

속도 데이터가 없습니다

공급자 가격 순위

프로바이더 데이터가 없습니다

외부 링크