Qwen2.5 14B Instruct
Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK
Описание
Qwen2.5-14B-Instruct is an instruction-tuned 14.7B parameter language model, part of the Qwen2.5 series. It features significant improvements in instruction following, long text generation (8K+ tokens), structured data understanding, and JSON output generation. The model supports a 128K token context length and multilingual capabilities across 29+ languages including Chinese, English, French, Spanish, and more.
Дата выхода
2024-09-19
Параметры
14.7B
Длина контекста
—
Модальности
—
Радар способностей
70
general
80
coding
70
reasoning
43
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Reasoning | 86 | 51.0 | LS |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
45.5%Сам.
Chemistry
MMLU-STEM
76.4%Сам.
Code
HumanEval
83.5%Сам.
Finance
MMLU
79.7%Сам.
MMLU-Pro
63.7%Сам.
TruthfulQA
58.4%Сам.
TheoremQA
43.0%Сам.
General
MBPP
0.82 / 100Сам.
MMLU-Redux
80.0%Сам.
MultiPL-E
72.8%Сам.
ARC-C
67.3%Сам.
MBPP+
63.2%Сам.
Language
BBH
78.2%Сам.
Math
GSM8k
94.8%Сам.
MATH
80.0%Сам.
Reasoning
HumanEval+
51.2%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Code80
General70
Healthcare70
Language70
Legal70
Math70
Reasoning70
Finance60
Biology50
Chemistry50
Physics40
Цены
Нет данных о ценах
Скорость
Нет данных о скорости
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров