Saltar al contenido principal

Qwen2.5 7B Instruct

Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK

Descripción

Qwen2.5-7B-Instruct is an instruction-tuned 7B parameter language model that excels at following instructions, generating long texts (over 8K tokens), understanding structured data, and generating structured outputs like JSON. The model features enhanced capabilities in mathematics, coding, and multilingual support across 29+ languages including Chinese, English, French, Spanish, and more.

Fecha de lanzamiento
2024-09-19
Parámetros
7.6B
Longitud del contexto
33K
Modalidades
text

Radar de capacidades

60
general
60
coding
70
reasoning
34
scienceest.
0
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

No hay datos de ranking disponibles

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA36.4%Aut.

Code

HumanEval84.8%Aut.
LiveCodeBench28.7%Aut.

Communication

MT-Bench0.88 / 100Aut.

Creativity

AlignBench73.3%Aut.
Arena Hard52.0%Aut.

Finance

MMLU-Pro56.3%Aut.

General

MBPP0.79 / 100Aut.
MMLU-Redux75.4%Aut.
IFEval71.2%Aut.
MultiPL-E70.4%Aut.
LiveBench35.9%Aut.

Math

GSM8k91.6%Aut.
MATH75.5%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Communication
90
Roleplay
80
Structured Output
70
Creativity
70
Instruction Following
70
Language
70
Math
70
Writing
60
Code
60
Finance
60
General
60
Healthcare
60
Legal
60
Reasoning
60
Biology
40
Chemistry
40
Physics
40

Precios

Precio de entrada$0.04 / 1M tokens
Precio de salida$0.1 / 1M tokens
Precio mixto (3:1)$0.055 / 1M tokens

Velocidad

No hay datos de velocidad disponibles

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas