Qwen2.5 14B Instruct
Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK
Description
Qwen2.5-14B-Instruct is an instruction-tuned 14.7B parameter language model, part of the Qwen2.5 series. It features significant improvements in instruction following, long text generation (8K+ tokens), structured data understanding, and JSON output generation. The model supports a 128K token context length and multilingual capabilities across 29+ languages including Chinese, English, French, Spanish, and more.
Date de sortie
2024-09-19
Paramètres
14.7B
Longueur du contexte
—
Modalités
—
Radar de capacités
70
general
80
coding
70
reasoning
43
scienceest.
0
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Reasoning | 86 | 51.0 | LS |
Scores de benchmarks (LLM Stats)
Biology
GPQA
45.5%Aut.
Chemistry
MMLU-STEM
76.4%Aut.
Code
HumanEval
83.5%Aut.
Finance
MMLU
79.7%Aut.
MMLU-Pro
63.7%Aut.
TruthfulQA
58.4%Aut.
TheoremQA
43.0%Aut.
General
MBPP
0.82 / 100Aut.
MMLU-Redux
80.0%Aut.
MultiPL-E
72.8%Aut.
ARC-C
67.3%Aut.
MBPP+
63.2%Aut.
Language
BBH
78.2%Aut.
Math
GSM8k
94.8%Aut.
MATH
80.0%Aut.
Reasoning
HumanEval+
51.2%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Code80
General70
Healthcare70
Language70
Legal70
Math70
Reasoning70
Finance60
Biology50
Chemistry50
Physics40
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible