DeepSeek V3 (Dec '24)

DeepSeekDeepSeekOpen WeightMIT + Model License (Commercial use allowed)

Description

A powerful Mixture-of-Experts (MoE) language model with 671B total parameters (37B activated per token). Features Multi-head Latent Attention (MLA), auxiliary-loss-free load balancing, and multi-token prediction training. Pre-trained on 14.8T tokens with strong performance in reasoning, math, and code tasks.

Date de sortie

2024-12-26

Paramètres

671.0B

Longueur du contexte

—

Modalités

text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	304	29.0	AA
Classement général	320	34.0	AA
Raisonnement mathématique	226	39.0	AA
Science	297	39.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

59.1%Aut.

Code

Aider-Polyglot Edit

79.7%Aut.

Aider-Polyglot

49.6%Aut.

SWE-Bench Verified

42.0%Aut.

LiveCodeBench

37.6%Aut.

Factuality

SimpleQA

24.9%Aut.

Finance

MMLU

88.5%Aut.

MMLU-Pro

75.9%Aut.

General

MMLU-Redux

89.1%Aut.

C-Eval

86.5%Aut.

IFEval

86.1%Aut.

CSimpleQA

64.8%Aut.

LongBench v2

48.7%Aut.

Language

CLUEWSC

90.9%Aut.

Math

DROP

91.6%Aut.

MATH-500

90.2%Aut.

CNMO 2024

43.2%Aut.

AIME 2024

39.2%Aut.

Reasoning

HumanEval-Mul

82.6%Aut.

FRAMES

73.3%Aut.

Indices d'évaluation AA

Math Index

26.0

Intelligence Index

10.4

Math 500

0.9

Mmlu Pro

0.8

Gpqa

0.6

Livecodebench

0.4

Scicode

0.4

Ifbench

0.3

Lcr

0.3

Aime 25

0.3

Aime

0.3

Tau2

0.2

Terminalbench Hard

0.1

Hle

0.0

Scores par catégorie LLM Stats

Instruction Following

Language

Legal

Finance

Healthcare

Math

Reasoning

Structured Output

General

Physics

Biology

Chemistry

Long Context

Code

Frontend Development

Factuality

Tarification

Prix d'entrée$0.4 / 1M tokens

Prix de sortie$0.89 / 1M tokens

Prix mixte (3:1)$0.523 / 1M tokens

Vitesse

Tokens/sec0.0

Délai du premier token0.00s

Temps de réponse0.00s

Classement des Prix par Fournisseur

17 fournisseurs

Moins cher: SiliconFlow (China)Plus cher: Together AI

FournisseurEntréeSortie

1SiliconFlow (China)Moins cher

$0.25

2SiliconFlow

$0.25

3Kilo Gateway

$0.27

4Vercel AI Gateway

$0.27

$1.12

5NanoGPT

$0.28

$0.42

6Chutes

$0.28

$0.42

7D.Run (China)

$0.28

$1.1

8Alibaba (China)

$0.287

$1.147

9DeepSeekPRINCIPAL

$0.4

$0.89

10NovitaAI

$0.4

$1.3

11Nebius Token Factory

$0.4

12Vultr

$0.55

$1.65

13Helicone

$0.56

$1.68

14Amazon Bedrock

$0.58

$1.68

15Vertex

$0.6

$1.7

16Synthetic

$1.25

17Together AI

$1.25

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

LLM Stats Artificial Analysis