DeepSeek R1 Distill Qwen 7B
DeepSeekDeepSeekOpen WeightMIT · Commercial OK
Descripción
DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.
Fecha de lanzamiento
2025-01-20
Parámetros
7.6B
Longitud del contexto
—
Modalidades
—
Radar de capacidades
40
general
40
coding
90
reasoning
43
scienceest.
0
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
No hay datos de ranking disponibles
Puntuaciones de benchmarks (LLM Stats)
Biology
GPQA
49.1%Aut.
Code
LiveCodeBench
37.6%Aut.
Math
MATH-500
92.8%Aut.
AIME 2024
83.3%Aut.
Índices de evaluación AA
No hay datos de evaluación AA disponibles
Puntuaciones por categoría LLM Stats
Math90
Reasoning70
Biology50
Chemistry50
Physics50
Code40
General40
Precios
No hay datos de precios disponibles
Velocidad
No hay datos de velocidad disponibles
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles