DeepSeek R1 Distill Qwen 7B

DeepSeekDeepSeekOpen WeightMIT · Usage Commercial

Description

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Date de sortie

2025-01-20

Paramètres

7.6B

Longueur du contexte

—

Modalités

—

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Aucune donnée de classement disponible

Scores de benchmarks (LLM Stats)

Biology

GPQA

49.1%Aut.

Code

LiveCodeBench

37.6%Aut.

Math

MATH-500

92.8%Aut.

AIME 2024

83.3%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Math

Reasoning

Physics

Biology

Chemistry

General

Code

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

1 fournisseurs

FournisseurEntréeSortie

1Alibaba (China)

$0.072

$0.144

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

LLM Stats Artificial Analysis