DeepSeek Coder V2 Lite Instruct
DeepSeekDeepSeek
Date de sortie
2024-06-17
Paramètres
—
Longueur du contexte
1.0M
Modalités
text
Radar de capacités
15
general
15
coding
32
reasoning
20
scienceest.
60
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement codage | 390 | 17.0 | AA |
| Classement général | 469 | 17.0 | AA |
| Science | 445 | 19.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
GDPval-AA
1332.00 / 3000Aut.
BrowseComp
83.4%Aut.
MCP Atlas
73.6%Aut.
Terminal-Bench 2.0
67.9%Aut.
SWE-Bench Pro
55.4%Aut.
Toolathlon
51.8%Aut.
FrontierSWE
29.0%Aut.
Biology
GPQA
90.1%Aut.
Code
LiveCodeBench
93.5%Aut.
SWE-Bench Verified
80.6%Aut.
SWE-bench Multilingual
76.2%Aut.
Factuality
SimpleQA
57.9%Aut.
Finance
MMLU-Pro
87.5%Aut.
General
CSimpleQA
84.4%Aut.
MRCR 1M
83.5%Aut.
LiveBench
73.6%Aut.
CorpusQA 1M
62.0%Aut.
Math
CodeForces
1.00 / 3000Aut.
HMMT Feb 26
95.2%Aut.
MathArena Apex
90.2%Aut.
IMO-AnswerBench
89.8%Aut.
Humanity's Last Exam
48.2%Aut.
Indices d'évaluation AA
Intelligence Index3.1
Mmlu Pro0.4
Gpqa0.3
Livecodebench0.2
Scicode0.1
Hle0.1
Scores par catégorie LLM Stats
Legal100
Finance100
Agents100
General100
Reasoning71
Language90
Physics90
Healthcare90
Biology90
Chemistry90
Long Context80
Math80
Search80
Frontend Development80
Code70
Factuality60
Tool Calling60
Vision50
Tarification
Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit
Prix de lecture cache$0.00363 / 1M tokens
Vitesse
Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s
Classement des Prix par Fournisseur
Aucune donnée de fournisseur disponible