Qwen2.5 14B Instruct
Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK
説明
Qwen2.5-14B-Instruct is an instruction-tuned 14.7B parameter language model, part of the Qwen2.5 series. It features significant improvements in instruction following, long text generation (8K+ tokens), structured data understanding, and JSON output generation. The model supports a 128K token context length and multilingual capabilities across 29+ languages including Chinese, English, French, Spanish, and more.
リリース日
2024-09-19
パラメータ
14.7B
コンテキスト長
—
モダリティ
—
能力レーダー
70
general
80
coding
70
reasoning
43
science推定
0
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Reasoning | 86 | 51.0 | LS |
ベンチマークスコア (LLM Stats)
Biology
GPQA
45.5%自己申告
Chemistry
MMLU-STEM
76.4%自己申告
Code
HumanEval
83.5%自己申告
Finance
MMLU
79.7%自己申告
MMLU-Pro
63.7%自己申告
TruthfulQA
58.4%自己申告
TheoremQA
43.0%自己申告
General
MBPP
0.82 / 100自己申告
MMLU-Redux
80.0%自己申告
MultiPL-E
72.8%自己申告
ARC-C
67.3%自己申告
MBPP+
63.2%自己申告
Language
BBH
78.2%自己申告
Math
GSM8k
94.8%自己申告
MATH
80.0%自己申告
Reasoning
HumanEval+
51.2%自己申告
AA評価指数
AA評価データがありません
LLM Statsカテゴリスコア
Code80
General70
Healthcare70
Language70
Legal70
Math70
Reasoning70
Finance60
Biology50
Chemistry50
Physics40
価格設定
価格データがありません
速度
速度データがありません
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません