Qwen2 Instruct 72B
AlibabaQwenオープンウエイトtongyi-qianwen
説明
Qwen2-72B-Instruct is an instruction-tuned language model with 72 billion parameters, supporting a context length of up to 131,072 tokens. It's part of the new Qwen2 series, which has surpassed most open-source models and demonstrates competitiveness against proprietary models across various benchmarks.
リリース日
2024-06-07
パラメータ
72.0B
コンテキスト長
—
モダリティ
—
能力レーダー
23
general
17
coding
36
reasoning
25
science推定
30
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 392 | 17.0 | AA |
| 総合ランキング | 395 | 28.0 | AA |
| 数学的推論 | 217 | 42.0 | AA |
| 推論 | 14 | 88.0 | LS |
| 科学 | 410 | 25.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
42.4%自己申告
Code
HumanEval
86.0%自己申告
EvalPlus
0.79 / 100自己申告
Finance
MMLU
82.3%自己申告
MMLU-Pro
64.4%自己申告
TruthfulQA
54.8%自己申告
TheoremQA
44.4%自己申告
General
CMMLU
90.1%自己申告
C-Eval
83.8%自己申告
MBPP
0.80 / 100自己申告
MultiPL-E
69.2%自己申告
ARC-C
68.9%自己申告
Language
Winogrande
85.1%自己申告
BBH
82.4%自己申告
Math
GSM8k
91.1%自己申告
MATH
59.7%自己申告
Reasoning
HellaSwag
87.6%自己申告
AA評価指数
Intelligence Index6.0
Math 5000.7
Mmlu Pro0.6
Gpqa0.4
Scicode0.2
Livecodebench0.2
Aime0.1
Hle0.0
LLM Statsカテゴリスコア
Language80
Code80
Legal70
Math70
Reasoning70
General70
Healthcare70
Finance60
Physics40
Biology40
Chemistry40
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s
プロバイダー価格ランキング
プロバイダー価格ランキング
1 プロバイダー
プロバイダー入力出力
1NanoGPT
$0.306
$0.306
このモデルの異なるAPIプロバイダー間の価格を比較。