Перейти к основному содержанию

Qwen2.5 14B Instruct

Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK

Описание

Qwen2.5-14B-Instruct is an instruction-tuned 14.7B parameter language model, part of the Qwen2.5 series. It features significant improvements in instruction following, long text generation (8K+ tokens), structured data understanding, and JSON output generation. The model supports a 128K token context length and multilingual capabilities across 29+ languages including Chinese, English, French, Spanish, and more.

Дата выхода
2024-09-19
Параметры
14.7B
Длина контекста
Модальности

Радар способностей

70
general
80
coding
70
reasoning
43
scienceоцен.
0
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Reasoning86
51.0
LS

Оценки бенчмарков (LLM Stats)

Biology

GPQA45.5%Сам.

Chemistry

MMLU-STEM76.4%Сам.

Code

HumanEval83.5%Сам.

Finance

MMLU79.7%Сам.
MMLU-Pro63.7%Сам.
TruthfulQA58.4%Сам.
TheoremQA43.0%Сам.

General

MBPP0.82 / 100Сам.
MMLU-Redux80.0%Сам.
MultiPL-E72.8%Сам.
ARC-C67.3%Сам.
MBPP+63.2%Сам.

Language

BBH78.2%Сам.

Math

GSM8k94.8%Сам.
MATH80.0%Сам.

Reasoning

HumanEval+51.2%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Code
80
General
70
Healthcare
70
Language
70
Legal
70
Math
70
Reasoning
70
Finance
60
Biology
50
Chemistry
50
Physics
40

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки