DeepSeek R1 Distill Qwen 7B

DeepSeekDeepSeekOpen WeightMIT · Uso Comercial

Descripción

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Fecha de lanzamiento

2025-01-20

Parámetros

7.6B

Longitud del contexto

—

Modalidades

—

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

No hay datos de ranking disponibles

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA

49.1%Aut.

Code

LiveCodeBench

37.6%Aut.

Math

MATH-500

92.8%Aut.

AIME 2024

83.3%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Math

Reasoning

Physics

Biology

Chemistry

General

Code

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

1 proveedores

ProveedorEntradaSalida

1Alibaba (China)

$0.072

$0.144

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

LLM Stats Artificial Analysis