Qwen2.5 14B Instruct
Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK
Descripción
Qwen2.5-14B-Instruct is an instruction-tuned 14.7B parameter language model, part of the Qwen2.5 series. It features significant improvements in instruction following, long text generation (8K+ tokens), structured data understanding, and JSON output generation. The model supports a 128K token context length and multilingual capabilities across 29+ languages including Chinese, English, French, Spanish, and more.
Fecha de lanzamiento
2024-09-19
Parámetros
14.7B
Longitud del contexto
—
Modalidades
—
Radar de capacidades
70
general
80
coding
70
reasoning
43
scienceest.
0
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Reasoning | 86 | 51.0 | LS |
Puntuaciones de benchmarks (LLM Stats)
Biology
GPQA
45.5%Aut.
Chemistry
MMLU-STEM
76.4%Aut.
Code
HumanEval
83.5%Aut.
Finance
MMLU
79.7%Aut.
MMLU-Pro
63.7%Aut.
TruthfulQA
58.4%Aut.
TheoremQA
43.0%Aut.
General
MBPP
0.82 / 100Aut.
MMLU-Redux
80.0%Aut.
MultiPL-E
72.8%Aut.
ARC-C
67.3%Aut.
MBPP+
63.2%Aut.
Language
BBH
78.2%Aut.
Math
GSM8k
94.8%Aut.
MATH
80.0%Aut.
Reasoning
HumanEval+
51.2%Aut.
Índices de evaluación AA
No hay datos de evaluación AA disponibles
Puntuaciones por categoría LLM Stats
Code80
General70
Healthcare70
Language70
Legal70
Math70
Reasoning70
Finance60
Biology50
Chemistry50
Physics40
Precios
No hay datos de precios disponibles
Velocidad
No hay datos de velocidad disponibles
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles