DeepSeek R1 Distill Qwen 32B

DeepSeekDeepSeekOpen WeightMIT · Uso Comercial

Descripción

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Fecha de lanzamiento

2025-01-20

Parámetros

32.8B

Longitud del contexto

—

Modalidades

text

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Ranking de codificación	361	21.0	AA
Ranking general	336	33.0	AA
Razonamiento matemático	113	72.0	AA
Ciencia	253	44.0	AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA

62.1%Aut.

Code

LiveCodeBench

57.2%Aut.

Math

MATH-500

94.3%Aut.

AIME 2024

83.3%Aut.

Índices de evaluación AA

Math Index

63.0

Intelligence Index

11.0

Math 500

0.9

Mmlu Pro

0.7

Aime

0.7

Aime 25

0.6

Gpqa

0.6

Scicode

0.4

Livecodebench

0.3

Ifbench

0.2

Lcr

0.1

Hle

0.1

Puntuaciones por categoría LLM Stats

Math

Reasoning

Physics

General

Biology

Chemistry

Code

Precios

Precio de entradaGratis

Precio de salidaGratis

Precio mixto (3:1)Gratis

Velocidad

Tokens/seg0.0

Retraso del primer token0.00s

Tiempo hasta la respuesta0.00s

Ranking de Precios por Proveedor

8 proveedores

Más barato: SiliconFlow (China)Más caro: NanoGPT

ProveedorEntradaSalida

1SiliconFlow (China)Más barato

$0.18

2SiliconFlow

$0.18

3Alibaba (China)

$0.287

$0.861

4Kilo Gateway

$0.29

5NovitaAI

$0.3

6Cloudflare Workers AI

$0.497

$4.881

7Cloudflare AI Gateway

$0.5

$4.88

8NanoGPT

$1.4

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

LLM Stats Artificial Analysis