DeepSeek Coder V2 Lite Instruct
DeepSeekDeepSeek
Fecha de lanzamiento
2024-06-17
Parámetros
—
Longitud del contexto
1.0M
Modalidades
text
Radar de capacidades
15
general
15
coding
32
reasoning
20
scienceest.
60
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Ranking de codificación | 390 | 17.0 | AA |
| Ranking general | 469 | 17.0 | AA |
| Ciencia | 445 | 19.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Agents
GDPval-AA
1332.00 / 3000Aut.
BrowseComp
83.4%Aut.
MCP Atlas
73.6%Aut.
Terminal-Bench 2.0
67.9%Aut.
SWE-Bench Pro
55.4%Aut.
Toolathlon
51.8%Aut.
FrontierSWE
29.0%Aut.
Biology
GPQA
90.1%Aut.
Code
LiveCodeBench
93.5%Aut.
SWE-Bench Verified
80.6%Aut.
SWE-bench Multilingual
76.2%Aut.
Factuality
SimpleQA
57.9%Aut.
Finance
MMLU-Pro
87.5%Aut.
General
CSimpleQA
84.4%Aut.
MRCR 1M
83.5%Aut.
LiveBench
73.6%Aut.
CorpusQA 1M
62.0%Aut.
Math
CodeForces
1.00 / 3000Aut.
HMMT Feb 26
95.2%Aut.
MathArena Apex
90.2%Aut.
IMO-AnswerBench
89.8%Aut.
Humanity's Last Exam
48.2%Aut.
Índices de evaluación AA
Intelligence Index3.1
Mmlu Pro0.4
Gpqa0.3
Livecodebench0.2
Scicode0.1
Hle0.1
Puntuaciones por categoría LLM Stats
Legal100
Finance100
Agents100
General100
Reasoning71
Language90
Physics90
Healthcare90
Biology90
Chemistry90
Long Context80
Math80
Search80
Frontend Development80
Code70
Factuality60
Tool Calling60
Vision50
Precios
Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Precio de lectura caché$0.00363 / 1M tokens
Velocidad
Tokens/seg0.0
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s
Ranking de Precios por Proveedor
No hay datos de proveedores disponibles