Saltar al contenido principal

K2-V2 (high)

MBZUAI Institute of Foundation Models
Fecha de lanzamiento
2025-12-05
Parámetros
Longitud del contexto
Modalidades

Radar de capacidades

33
general
60
coding
77
reasoning
43
scienceest.
72
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación216
45.0
AA
Ranking general230
45.0
AA
Razonamiento matemático88
79.0
AA
Ciencia239
45.0
AA

Puntuaciones de benchmarks (LLM Stats)

No hay datos de benchmarks disponibles

Índices de evaluación AA

Math Index
78.3
Intelligence Index
14.2
Mmlu Pro
0.8
Aime 25
0.8
Livecodebench
0.7
Gpqa
0.7
Ifbench
0.6
Lcr
0.3
Scicode
0.3
Tau2
0.3
Terminalbench Hard
0.1
Hle
0.1

Puntuaciones por categoría LLM Stats

No hay datos de puntuación por categoría disponibles

Precios

Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis

Velocidad

Tokens/seg0.0
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas