Olmo 3.1 32B Think
Allen Institute for AI
Fecha de lanzamiento
2025-12-12
Parámetros
—
Longitud del contexto
—
Modalidades
—
Radar de capacidades
31
general
33
coding
74
reasoning
38
scienceest.
0
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 321 | 22.0 | AA |
| General Ranking | 271 | 39.0 | AA |
| Math Reasoning | 95 | 78.0 | AA |
| Science | 267 | 40.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
No hay datos de benchmarks disponibles
Índices de evaluación AA
Math Index77.3
Intelligence Index13.9
Coding Index9.8
Aime 250.8
Mmlu Pro0.8
Livecodebench0.7
Ifbench0.7
Gpqa0.6
Scicode0.3
Hle0.1
Lcr0.0
Terminalbench Hard0.0
Tau20.0
Puntuaciones por categoría LLM Stats
No hay datos de puntuación por categoría disponibles
Precios
Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Velocidad
Tokens/seg0.0 tokens/s
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles
Fuentes externas
No hay enlaces externos disponibles