Qwen2.5 Instruct 72B
AlibabaQwenOpen WeightQwen · Commercial OK
説明
Qwen2.5-72B-Instruct is an instruction-tuned 72 billion parameter language model, part of the Qwen2.5 series. It is designed to follow instructions, generate long texts (over 8K tokens), understand structured data (e.g., tables), and generate structured outputs, especially JSON. The model supports multilingual capabilities across over 29 languages.
リリース日
2024-09-19
パラメータ
72.7B
コンテキスト長
33K
モダリティ
text
能力レーダー
31
general
19
coding
29
reasoning
32
science推定
0
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 334 | 21.0 | AA |
| General Ranking | 285 | 38.0 | AA |
| Math Reasoning | 270 | 29.0 | AA |
| Science | 332 | 33.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
49.0%自己申告
Code
HumanEval
86.6%自己申告
LiveCodeBench
55.5%自己申告
Communication
MT-Bench
0.94 / 100自己申告
Creativity
AlignBench
81.6%自己申告
Arena Hard
81.2%自己申告
Finance
MMLU-Pro
71.1%自己申告
General
MBPP
0.88 / 100自己申告
MMLU-Redux
86.8%自己申告
IFEval
84.1%自己申告
MultiPL-E
75.1%自己申告
LiveBench
52.3%自己申告
Math
GSM8k
95.8%自己申告
MATH
83.1%自己申告
AA評価指数
Intelligence Index15.6
Math Index14.0
Coding Index11.9
Math 5000.9
Mmlu Pro0.7
Gpqa0.5
Ifbench0.4
Tau20.3
Livecodebench0.3
Scicode0.3
Lcr0.2
Aime0.2
Aime 250.1
Terminalbench Hard0.0
Hle0.0
LLM Statsカテゴリスコア
Communication90
Creativity90
Roleplay90
Structured Output80
Writing80
Instruction Following80
Language80
Math80
Reasoning80
Code70
Finance70
General70
Healthcare70
Legal70
Biology50
Chemistry50
Physics50
価格設定
入力価格$0.36 / 1M tokens
出力価格$0.4 / 1M tokens
混合価格(3:1)$0.37 / 1M tokens
速度
トークン/秒54.7 tokens/s
初トークン遅延1.08s
初回答遅延1.08s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません