Hermes 4 - Llama-3.1 405B (Reasoning)
Nous ResearchLlama
Fecha de lanzamiento
2025-08-27
Parámetros
—
Longitud del contexto
131K
Modalidades
text
Radar de capacidades
37
general
35
coding
70
reasoning
44
scienceest.
0
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 236 | 35.0 | AA |
| General Ranking | 272 | 39.0 | AA |
| Math Reasoning | 120 | 70.0 | AA |
| Science | 218 | 46.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
No hay datos de benchmarks disponibles
Índices de evaluación AA
Math Index69.7
Intelligence Index18.6
Coding Index16.0
Mmlu Pro0.8
Gpqa0.7
Aime 250.7
Livecodebench0.7
Ifbench0.3
Scicode0.3
Tau20.2
Lcr0.2
Terminalbench Hard0.1
Hle0.1
Puntuaciones por categoría LLM Stats
No hay datos de puntuación por categoría disponibles
Precios
Precio de entrada$1 / 1M tokens
Precio de salida$3 / 1M tokens
Precio mixto (3:1)$1.5 / 1M tokens
Velocidad
Tokens/seg39.1 tokens/s
Retraso del primer token0.76s
Tiempo hasta la respuesta51.97s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles
Fuentes externas
No hay enlaces externos disponibles