Перейти к основному содержанию

Qwen2 Instruct 72B

AlibabaQwenОткрытые весаtongyi-qianwen

Описание

Qwen2-72B-Instruct is an instruction-tuned language model with 72 billion parameters, supporting a context length of up to 131,072 tokens. It's part of the new Qwen2 series, which has surpassed most open-source models and demonstrates competitiveness against proprietary models across various benchmarks.

Дата выхода
2024-06-07
Параметры
72.0B
Длина контекста
Модальности

Радар способностей

23
general
17
coding
36
reasoning
25
scienceоцен.
30
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга392
17.0
AA
Общий рейтинг395
28.0
AA
Математическое мышление217
42.0
AA
Рассуждения14
88.0
LS
Наука410
25.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA42.4%Сам.

Code

HumanEval86.0%Сам.
EvalPlus0.79 / 100Сам.

Finance

MMLU82.3%Сам.
MMLU-Pro64.4%Сам.
TruthfulQA54.8%Сам.
TheoremQA44.4%Сам.

General

CMMLU90.1%Сам.
C-Eval83.8%Сам.
MBPP0.80 / 100Сам.
MultiPL-E69.2%Сам.
ARC-C68.9%Сам.

Language

Winogrande85.1%Сам.
BBH82.4%Сам.

Math

GSM8k91.1%Сам.
MATH59.7%Сам.

Reasoning

HellaSwag87.6%Сам.

Индексы оценки AA

Intelligence Index
6.0
Math 500
0.7
Mmlu Pro
0.6
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Aime
0.1
Hle
0.0

Оценки категорий LLM Stats

Language
80
Code
80
Legal
70
Math
70
Reasoning
70
General
70
Healthcare
70
Finance
60
Physics
40
Biology
40
Chemistry
40

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

1 провайдеров

ПровайдерВводВывод
1NanoGPT
$0.306
$0.306

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки