Qwen2 Instruct 72B
AlibabaQwenОткрытые весаtongyi-qianwen
Описание
Qwen2-72B-Instruct is an instruction-tuned language model with 72 billion parameters, supporting a context length of up to 131,072 tokens. It's part of the new Qwen2 series, which has surpassed most open-source models and demonstrates competitiveness against proprietary models across various benchmarks.
Дата выхода
2024-06-07
Параметры
72.0B
Длина контекста
—
Модальности
—
Радар способностей
23
general
17
coding
36
reasoning
25
scienceоцен.
30
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 392 | 17.0 | AA |
| Общий рейтинг | 395 | 28.0 | AA |
| Математическое мышление | 217 | 42.0 | AA |
| Рассуждения | 14 | 88.0 | LS |
| Наука | 410 | 25.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
42.4%Сам.
Code
HumanEval
86.0%Сам.
EvalPlus
0.79 / 100Сам.
Finance
MMLU
82.3%Сам.
MMLU-Pro
64.4%Сам.
TruthfulQA
54.8%Сам.
TheoremQA
44.4%Сам.
General
CMMLU
90.1%Сам.
C-Eval
83.8%Сам.
MBPP
0.80 / 100Сам.
MultiPL-E
69.2%Сам.
ARC-C
68.9%Сам.
Language
Winogrande
85.1%Сам.
BBH
82.4%Сам.
Math
GSM8k
91.1%Сам.
MATH
59.7%Сам.
Reasoning
HellaSwag
87.6%Сам.
Индексы оценки AA
Intelligence Index6.0
Math 5000.7
Mmlu Pro0.6
Gpqa0.4
Scicode0.2
Livecodebench0.2
Aime0.1
Hle0.0
Оценки категорий LLM Stats
Language80
Code80
Legal70
Math70
Reasoning70
General70
Healthcare70
Finance60
Physics40
Biology40
Chemistry40
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
1 провайдеров
ПровайдерВводВывод
1NanoGPT
$0.306
$0.306
Сравнение цен разных API-провайдеров для этой модели.