Saltar al contenido principal

Kimi Linear 48B A3B Instruct

KimiKimi
Fecha de lanzamiento
2025-10-30
Parámetros
Longitud del contexto
262K
Modalidades
image, text, video

Radar de capacidades

23
general
34
coding
37
reasoning
26
scienceest.
50
agents
80
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación285
31.0
AA
Ranking general432
22.0
AA
Razonamiento matemático235
37.0
AA
Ciencia412
24.0
AA

Puntuaciones de benchmarks (LLM Stats)

Agents

WideSearch79.0%Aut.
DeepSearchQA77.1%Aut.
BrowseComp74.9%Aut.
PaperBench63.5%Aut.
Terminal-Bench 2.050.8%Aut.
SWE-Bench Pro50.7%Aut.
CyberGym41.3%Aut.
FrontierSWE26.0%Aut.

Biology

GPQA87.6%Aut.
SciCode48.7%Aut.

Code

SWE-Bench Verified76.8%Aut.
SWE-bench Multilingual73.0%Aut.
OJBench (C++)57.4%Aut.

Economics

FinSearchComp T2&T367.8%Aut.

Finance

MMLU-Pro87.1%Aut.

General

LiveCodeBench v685.0%Aut.
MMMU-Pro78.5%Aut.
SimpleVQA0.71 / 100Aut.
LiveBench69.1%Aut.
LongBench v261.0%Aut.

Healthcare

VideoMMMU86.6%Aut.

Image To Text

OCRBench92.3%Aut.

Long Context

LongVideoBench79.8%Aut.
LVBench75.9%Aut.
AA-LCR70.0%Aut.

Math

AIME 202596.1%Aut.
HMMT 202595.4%Aut.
MathVista-Mini90.1%Aut.
MathVision84.2%Aut.
IMO-AnswerBench81.8%Aut.
Humanity's Last Exam50.2%Aut.

Multimodal

InfoVQAtest92.6%Aut.
OmniDocBench 1.588.8%Aut.
Video-MME87.4%Aut.
MMVU80.4%Aut.
CharXiv-R77.5%Aut.
MotionBench70.4%Aut.
WorldVQA46.3%Aut.
ZEROBench0.11 / 100Aut.

Reasoning

Seal-057.4%Aut.

Índices de evaluación AA

Math Index
36.3
Intelligence Index
8.5
Mmlu Pro
0.6
Gpqa
0.4
Livecodebench
0.4
Aime 25
0.4
Ifbench
0.3
Lcr
0.3
Scicode
0.2
Terminalbench Hard
0.1
Hle
0.0
Tau2
0.0

Puntuaciones por categoría LLM Stats

Language
90
Legal
90
Finance
90
Image To Text
80
Long Context
80
Math
80
Multimodal
80
Frontend Development
80
Video
80
Vision
80
Physics
70
Reasoning
70
Search
70
Structured Output
70
General
70
Healthcare
70
Biology
70
Chemistry
70
Agents
60
Code
50
Tool Calling
50
Safety
40

Precios

Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Precio de lectura caché$0.1 / 1M tokens

Velocidad

Tokens/seg0.0
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas