Qwen2.5 Coder Instruct 7B
AlibabaQwenオープンウエイトApache 2.0 · 商用利用可
説明
Qwen2.5-Coder is a specialized coding model trained on 5.5 trillion tokens of code data, supporting 92 programming languages with a 128K context window. It excels in code generation, completion, and repair while maintaining strong performance in math and general tasks. The model demonstrates exceptional capabilities in multi-programming language tasks and code reasoning.
リリース日
2024-09-19
パラメータ
7.0B
コンテキスト長
131K
モダリティ
text
能力レーダー
17
general
13
coding
29
reasoning
21
science推定
24
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 420 | 14.0 | AA |
| 総合ランキング | 450 | 21.0 | AA |
| 数学的推論 | 250 | 35.0 | AA |
| 推論 | 62 | 63.0 | LS |
| 科学 | 443 | 20.0 | AA |
ベンチマークスコア (LLM Stats)
Code
HumanEval
88.4%自己申告
Aider
55.6%自己申告
LiveCodeBench
18.2%自己申告
Finance
MMLU-Base
68.0%自己申告
MMLU
67.6%自己申告
TruthfulQA
50.6%自己申告
MMLU-Pro
40.1%自己申告
TheoremQA
34.0%自己申告
General
MBPP
0.83 / 100自己申告
MMLU-Redux
66.6%自己申告
ARC-C
60.9%自己申告
BigCodeBench
41.0%自己申告
Language
Winogrande
72.9%自己申告
Math
GSM8k
83.9%自己申告
MATH
46.6%自己申告
STEM
34.0%自己申告
Reasoning
HellaSwag
76.8%自己申告
CRUXEval-Input-CoT
56.5%自己申告
CRUXEval-Output-CoT
56.0%自己申告
AA評価指数
Intelligence Index4.5
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.0
LLM Statsカテゴリスコア
Language60
Math60
Reasoning60
General60
Legal50
Finance50
Healthcare50
Code50
Physics30
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s
プロバイダー価格ランキング
プロバイダー価格ランキング
2 プロバイダー
最安: LLM Gateway最高: Alibaba (China)
プロバイダー入力出力
1LLM Gateway最安
$0.05
$0.05
2Alibaba (China)
$0.144
$0.287
このモデルの異なるAPIプロバイダー間の価格を比較。