DeepSeek R1 Distill Qwen 1.5B
DeepSeekDeepSeekOpen WeightMIT · Commercial OK
Descripción
DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.
Fecha de lanzamiento
2025-01-20
Parámetros
1.8B
Longitud del contexto
—
Modalidades
—
Radar de capacidades
14
general
7
coding
27
reasoning
7
scienceest.
0
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 460 | 4.0 | AA |
| General Ranking | 484 | 11.0 | AA |
| Math Reasoning | 269 | 30.0 | AA |
| Science | 482 | 5.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Biology
GPQA
33.8%Aut.
Code
LiveCodeBench
16.9%Aut.
Math
MATH-500
83.9%Aut.
AIME 2024
52.7%Aut.
Índices de evaluación AA
Math Index22.0
Intelligence Index9.1
Math 5000.7
Mmlu Pro0.3
Aime 250.2
Aime0.2
Ifbench0.1
Gpqa0.1
Livecodebench0.1
Scicode0.1
Hle0.0
Lcr0.0
Puntuaciones por categoría LLM Stats
Math70
Reasoning50
Biology30
Chemistry30
General30
Physics30
Code20
Precios
Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Velocidad
Tokens/seg0.0 tokens/s
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles