메인 콘텐츠로 건너뛰기

Kimi Linear 48B A3B Instruct

KimiKimi
출시일
2025-10-30
파라미터
컨텍스트 길이
262K
모달리티
image, text, video

능력 레이더

23
general
34
coding
37
reasoning
26
science추정
50
agents
80
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
코딩 랭킹285
31.0
AA
종합 랭킹432
22.0
AA
수학 추론235
37.0
AA
과학412
24.0
AA

벤치마크 점수 (LLM Stats)

Agents

WideSearch79.0%자체 보고
DeepSearchQA77.1%자체 보고
BrowseComp74.9%자체 보고
PaperBench63.5%자체 보고
Terminal-Bench 2.050.8%자체 보고
SWE-Bench Pro50.7%자체 보고
CyberGym41.3%자체 보고
FrontierSWE26.0%자체 보고

Biology

GPQA87.6%자체 보고
SciCode48.7%자체 보고

Code

SWE-Bench Verified76.8%자체 보고
SWE-bench Multilingual73.0%자체 보고
OJBench (C++)57.4%자체 보고

Economics

FinSearchComp T2&T367.8%자체 보고

Finance

MMLU-Pro87.1%자체 보고

General

LiveCodeBench v685.0%자체 보고
MMMU-Pro78.5%자체 보고
SimpleVQA0.71 / 100자체 보고
LiveBench69.1%자체 보고
LongBench v261.0%자체 보고

Healthcare

VideoMMMU86.6%자체 보고

Image To Text

OCRBench92.3%자체 보고

Long Context

LongVideoBench79.8%자체 보고
LVBench75.9%자체 보고
AA-LCR70.0%자체 보고

Math

AIME 202596.1%자체 보고
HMMT 202595.4%자체 보고
MathVista-Mini90.1%자체 보고
MathVision84.2%자체 보고
IMO-AnswerBench81.8%자체 보고
Humanity's Last Exam50.2%자체 보고

Multimodal

InfoVQAtest92.6%자체 보고
OmniDocBench 1.588.8%자체 보고
Video-MME87.4%자체 보고
MMVU80.4%자체 보고
CharXiv-R77.5%자체 보고
MotionBench70.4%자체 보고
WorldVQA46.3%자체 보고
ZEROBench0.11 / 100자체 보고

Reasoning

Seal-057.4%자체 보고

AA 평가 지수

Math Index
36.3
Intelligence Index
8.5
Mmlu Pro
0.6
Gpqa
0.4
Livecodebench
0.4
Aime 25
0.4
Ifbench
0.3
Lcr
0.3
Scicode
0.2
Terminalbench Hard
0.1
Hle
0.0
Tau2
0.0

LLM Stats 카테고리 점수

Language
90
Legal
90
Finance
90
Image To Text
80
Long Context
80
Math
80
Multimodal
80
Frontend Development
80
Video
80
Vision
80
Physics
70
Reasoning
70
Search
70
Structured Output
70
General
70
Healthcare
70
Biology
70
Chemistry
70
Agents
60
Code
50
Tool Calling
50
Safety
40

가격

입력 가격무료
출력 가격무료
혼합 가격 (3:1)무료
캐시 읽기 가격$0.1 / 1M 토큰

속도

토큰/초0.0
첫 토큰 지연0.00s
첫 응답 지연0.00s

공급자 가격 순위

프로바이더 데이터가 없습니다

외부 링크