DeepSeek-Coder-V2
DeepSeekDeepSeek
Fecha de lanzamiento
2024-06-17
Parámetros
—
Longitud del contexto
1.0M
Modalidades
text
Radar de capacidades
5
general
70
coding
74
reasoning
77
scienceest.
60
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Ranking general | 517 | 7.0 | AA |
| Razonamiento matemático | 112 | 73.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Agents
GDPval-AA
1203.00 / 3000Aut.
BrowseComp
73.2%Aut.
MCP Atlas
69.0%Aut.
Terminal-Bench 2.0
56.9%Aut.
SWE-Bench Pro
52.6%Aut.
Toolathlon
47.8%Aut.
Biology
GPQA
88.1%Aut.
Code
LiveCodeBench
91.6%Aut.
SWE-Bench Verified
79.0%Aut.
SWE-bench Multilingual
73.3%Aut.
Factuality
SimpleQA
34.1%Aut.
Finance
MMLU-Pro
86.2%Aut.
General
CSimpleQA
78.9%Aut.
MRCR 1M
78.7%Aut.
CorpusQA 1M
60.5%Aut.
Math
CodeForces
1.00 / 3000Aut.
HMMT Feb 26
94.8%Aut.
IMO-AnswerBench
88.4%Aut.
MathArena Apex
85.7%Aut.
Humanity's Last Exam
45.1%Aut.
Índices de evaluación AA
Intelligence Index5.1
Math 5000.7
Puntuaciones por categoría LLM Stats
Legal100
Finance100
Agents100
General100
Reasoning68
Physics90
Healthcare90
Biology90
Chemistry90
Language80
Long Context80
Math80
Frontend Development80
Search70
Code70
Tool Calling60
Vision50
Factuality30
Precios
Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Precio de lectura caché$0.0028 / 1M tokens
Velocidad
Tokens/seg0.0
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s
Ranking de Precios por Proveedor
No hay datos de proveedores disponibles