DeepSeek R1 Distill Qwen 7B
DeepSeekDeepSeekOpen WeightMIT · Uso Comercial
Descripción
DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.
Fecha de lanzamiento
2025-01-20
Parámetros
7.6B
Longitud del contexto
—
Modalidades
—
Radar de capacidades
40
general
40
coding
90
reasoning
43
scienceest.
75
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
No hay datos de ranking disponibles
Puntuaciones de benchmarks (LLM Stats)
Biology
GPQA
49.1%Aut.
Code
LiveCodeBench
37.6%Aut.
Math
MATH-500
92.8%Aut.
AIME 2024
83.3%Aut.
Índices de evaluación AA
No hay datos de evaluación AA disponibles
Puntuaciones por categoría LLM Stats
Math90
Reasoning70
Physics50
Biology50
Chemistry50
General40
Code40
Precios
No hay datos de precios disponibles
Velocidad
No hay datos de velocidad disponibles
Ranking de Precios por Proveedor
Ranking de Precios por Proveedor
1 proveedores
ProveedorEntradaSalida
1Alibaba (China)
$0.072
$0.144
Comparar precios entre diferentes proveedores de API para este modelo.