LongCat Flash Lite

LongCat오픈 웨이트MIT · 상업적 사용 가능

설명

LongCat-Flash-Lite is a lightweight MoE model from Meituan with 68.5B total parameters and only 2.9B-4.5B activated per token. It explores N-gram embedding expansion as a new scaling direction, supporting 256K context length via YaRN. Optimized for agent tooling and programming tasks, achieving 500-700 tokens per second inference speed while maintaining strong performance on coding, math, and agentic benchmarks.

출시일

2026-01-28

파라미터

68.5B

컨텍스트 길이

—

모달리티

text

능력 레이더

general

coding

reasoning

science추정

agents

multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인	#순위	점수	소스
에이전트형 역량	114	34.0	LS
코딩 랭킹	321	26.0	AA
종합 랭킹	231	45.0	AA
과학	283	40.0	AA

벤치마크 점수 (LLM Stats)

Agents

Terminal-Bench

33.8%자체 보고

Biology

GPQA

66.8%자체 보고

Code

SWE-Bench Verified

54.4%자체 보고

SWE-bench Multilingual

38.1%자체 보고

Communication

Tau2 Retail

73.1%자체 보고

Tau2 Telecom

72.8%자체 보고

Tau2 Airline

58.0%자체 보고

Finance

MMLU

85.5%자체 보고

MMLU-Pro

78.3%자체 보고

General

CMMLU

82.5%자체 보고

Math

MATH-500

96.8%자체 보고

AIME 2024

72.2%자체 보고

AIME 2025

63.2%자체 보고

AA 평가 지수

Intelligence Index

17.2

Tau2

0.8

Gpqa

0.6

Ifbench

0.4

Scicode

0.3

Lcr

0.3

Terminalbench Hard

0.1

Hle

0.1

LLM Stats 카테고리 점수

Language

Legal

Math

Finance

General

Healthcare

Physics

Reasoning

Biology

Chemistry

Communication

Tool Calling

Frontend Development

Code

Agents

가격

입력 가격무료

출력 가격무료

혼합 가격 (3:1)무료

속도

토큰/초0.0

첫 토큰 지연0.00s

첫 응답 지연0.00s

공급자 가격 순위

1개 공급자

공급자입력출력

1Meituan

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크

LLM Stats Artificial Analysis