DeepSeek-Coder-V2

DeepSeekDeepSeek

Fecha de lanzamiento

2024-06-17

Parámetros

—

Longitud del contexto

1.0M

Modalidades

text

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Ranking general	517	7.0	AA
Razonamiento matemático	112	73.0	AA

Puntuaciones de benchmarks (LLM Stats)

Agents

GDPval-AA

1203.00 / 3000Aut.

BrowseComp

73.2%Aut.

MCP Atlas

69.0%Aut.

Terminal-Bench 2.0

56.9%Aut.

SWE-Bench Pro

52.6%Aut.

Toolathlon

47.8%Aut.

Biology

GPQA

88.1%Aut.

Code

LiveCodeBench

91.6%Aut.

SWE-Bench Verified

79.0%Aut.

SWE-bench Multilingual

73.3%Aut.

Factuality

SimpleQA

34.1%Aut.

Finance

MMLU-Pro

86.2%Aut.

General

CSimpleQA

78.9%Aut.

MRCR 1M

78.7%Aut.

CorpusQA 1M

60.5%Aut.

Math

CodeForces

1.00 / 3000Aut.

HMMT Feb 26

94.8%Aut.

IMO-AnswerBench

88.4%Aut.

MathArena Apex

85.7%Aut.

Humanity's Last Exam

45.1%Aut.

Índices de evaluación AA

Intelligence Index

5.1

Math 500

0.7

Puntuaciones por categoría LLM Stats

Legal

100

Finance

100

Agents

100

General

100

Reasoning

Physics

Healthcare

Biology

Chemistry

Language

Long Context

Math

Frontend Development

Code

Tool Calling

Vision

Factuality

Precios

Precio de entradaGratis

Precio de salidaGratis

Precio mixto (3:1)Gratis

Precio de lectura caché$0.0028 / 1M tokens

Velocidad

Tokens/seg0.0

Retraso del primer token0.00s

Tiempo hasta la respuesta0.00s

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas

Artificial Analysis