Qwen2 Instruct 72B
AlibabaQwenOpen Weighttongyi-qianwen
Описание
Qwen2-72B-Instruct is an instruction-tuned language model with 72 billion parameters, supporting a context length of up to 131,072 tokens. It's part of the new Qwen2 series, which has surpassed most open-source models and demonstrates competitiveness against proprietary models across various benchmarks.
Дата выхода
2024-06-07
Параметры
72.0B
Длина контекста
—
Модальности
—
Радар способностей
26
general
17
coding
36
reasoning
25
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 372 | 17.0 | AA |
| General Ranking | 364 | 31.0 | AA |
| Math Reasoning | 217 | 42.0 | AA |
| Reasoning | 14 | 88.0 | LS |
| Science | 387 | 26.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
42.4%Сам.
Code
HumanEval
86.0%Сам.
EvalPlus
0.79 / 100Сам.
Finance
MMLU
82.3%Сам.
MMLU-Pro
64.4%Сам.
TruthfulQA
54.8%Сам.
TheoremQA
44.4%Сам.
General
CMMLU
90.1%Сам.
C-Eval
83.8%Сам.
MBPP
0.80 / 100Сам.
MultiPL-E
69.2%Сам.
ARC-C
68.9%Сам.
Language
Winogrande
85.1%Сам.
BBH
82.4%Сам.
Math
GSM8k
91.1%Сам.
MATH
59.7%Сам.
Reasoning
HellaSwag
87.6%Сам.
Индексы оценки AA
Intelligence Index11.7
Math 5000.7
Mmlu Pro0.6
Gpqa0.4
Scicode0.2
Livecodebench0.2
Aime0.1
Hle0.0
Оценки категорий LLM Stats
Code80
Language80
General70
Healthcare70
Legal70
Math70
Reasoning70
Finance60
Biology40
Chemistry40
Physics40
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров