Passer au contenu principal

Qwen2.5 7B Instruct

Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK

Description

Qwen2.5-7B-Instruct is an instruction-tuned 7B parameter language model that excels at following instructions, generating long texts (over 8K tokens), understanding structured data, and generating structured outputs like JSON. The model features enhanced capabilities in mathematics, coding, and multilingual support across 29+ languages including Chinese, English, French, Spanish, and more.

Date de sortie
2024-09-19
Paramètres
7.6B
Longueur du contexte
33K
Modalités
text

Radar de capacités

60
general
60
coding
70
reasoning
34
scienceest.
0
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Aucune donnée de classement disponible

Scores de benchmarks (LLM Stats)

Biology

GPQA36.4%Aut.

Code

HumanEval84.8%Aut.
LiveCodeBench28.7%Aut.

Communication

MT-Bench0.88 / 100Aut.

Creativity

AlignBench73.3%Aut.
Arena Hard52.0%Aut.

Finance

MMLU-Pro56.3%Aut.

General

MBPP0.79 / 100Aut.
MMLU-Redux75.4%Aut.
IFEval71.2%Aut.
MultiPL-E70.4%Aut.
LiveBench35.9%Aut.

Math

GSM8k91.6%Aut.
MATH75.5%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Communication
90
Roleplay
80
Structured Output
70
Creativity
70
Instruction Following
70
Language
70
Math
70
Writing
60
Code
60
Finance
60
General
60
Healthcare
60
Legal
60
Reasoning
60
Biology
40
Chemistry
40
Physics
40

Tarification

Prix d'entrée$0.04 / 1M tokens
Prix de sortie$0.1 / 1M tokens
Prix mixte (3:1)$0.055 / 1M tokens

Vitesse

Aucune donnée de vitesse disponible

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes