Qwen2 Instruct 72B

AlibabaQwenОткрытые весаtongyi-qianwen

Описание

Qwen2-72B-Instruct is an instruction-tuned language model with 72 billion parameters, supporting a context length of up to 131,072 tokens. It's part of the new Qwen2 series, which has surpassed most open-source models and demonstrates competitiveness against proprietary models across various benchmarks.

Дата выхода

2024-06-07

Параметры

72.0B

Длина контекста

—

Модальности

—

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	392	17.0	AA
Общий рейтинг	395	28.0	AA
Математическое мышление	217	42.0	AA
Рассуждения	14	88.0	LS
Наука	410	25.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

42.4%Сам.

Code

HumanEval

86.0%Сам.

EvalPlus

0.79 / 100Сам.

Finance

MMLU

82.3%Сам.

MMLU-Pro

64.4%Сам.

TruthfulQA

54.8%Сам.

TheoremQA

44.4%Сам.

General

CMMLU

90.1%Сам.

C-Eval

83.8%Сам.

MBPP

0.80 / 100Сам.

MultiPL-E

69.2%Сам.

ARC-C

68.9%Сам.

Language

Winogrande

85.1%Сам.

BBH

82.4%Сам.

Math

GSM8k

91.1%Сам.

MATH

59.7%Сам.

Reasoning

HellaSwag

87.6%Сам.

Индексы оценки AA

Intelligence Index

6.0

Math 500

0.7

Mmlu Pro

0.6

Gpqa

0.4

Scicode

0.2

Livecodebench

0.2

Aime

0.1

Hle

0.0

Оценки категорий LLM Stats

Language

Code

Legal

Math

Reasoning

General

Healthcare

Finance

Physics

Biology

Chemistry

Цены

Цена вводаБесплатно

Цена выводаБесплатно

Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0

Задержка первого токена0.00s

Время до первого ответа0.00s

Рейтинг цен провайдеров

1 провайдеров

ПровайдерВводВывод

1NanoGPT

$0.306

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis