Passer au contenu principal

Qwen2.5 Instruct 72B

AlibabaQwenOpen WeightQwen · Commercial OK

Description

Qwen2.5-72B-Instruct is an instruction-tuned 72 billion parameter language model, part of the Qwen2.5 series. It is designed to follow instructions, generate long texts (over 8K tokens), understand structured data (e.g., tables), and generate structured outputs, especially JSON. The model supports multilingual capabilities across over 29 languages.

Date de sortie
2024-09-19
Paramètres
72.7B
Longueur du contexte
33K
Modalités
text

Radar de capacités

31
general
19
coding
29
reasoning
32
scienceest.
0
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Code Ranking334
21.0
AA
General Ranking285
38.0
AA
Math Reasoning270
29.0
AA
Science332
33.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA49.0%Aut.

Code

HumanEval86.6%Aut.
LiveCodeBench55.5%Aut.

Communication

MT-Bench0.94 / 100Aut.

Creativity

AlignBench81.6%Aut.
Arena Hard81.2%Aut.

Finance

MMLU-Pro71.1%Aut.

General

MBPP0.88 / 100Aut.
MMLU-Redux86.8%Aut.
IFEval84.1%Aut.
MultiPL-E75.1%Aut.
LiveBench52.3%Aut.

Math

GSM8k95.8%Aut.
MATH83.1%Aut.

Indices d'évaluation AA

Intelligence Index
15.6
Math Index
14.0
Coding Index
11.9
Math 500
0.9
Mmlu Pro
0.7
Gpqa
0.5
Ifbench
0.4
Tau2
0.3
Livecodebench
0.3
Scicode
0.3
Lcr
0.2
Aime
0.2
Aime 25
0.1
Terminalbench Hard
0.0
Hle
0.0

Scores par catégorie LLM Stats

Communication
90
Creativity
90
Roleplay
90
Structured Output
80
Writing
80
Instruction Following
80
Language
80
Math
80
Reasoning
80
Code
70
Finance
70
General
70
Healthcare
70
Legal
70
Biology
50
Chemistry
50
Physics
50

Tarification

Prix d'entrée$0.36 / 1M tokens
Prix de sortie$0.4 / 1M tokens
Prix mixte (3:1)$0.37 / 1M tokens

Vitesse

Tokens/sec54.7 tokens/s
Délai du premier token1.08s
Temps de réponse1.08s

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes