Qwen2.5 Coder Instruct 7B
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
説明
Qwen2.5-Coder is a specialized coding model trained on 5.5 trillion tokens of code data, supporting 92 programming languages with a 128K context window. It excels in code generation, completion, and repair while maintaining strong performance in math and general tasks. The model demonstrates exceptional capabilities in multi-programming language tasks and code reasoning.
リリース日
2024-09-19
パラメータ
7.0B
コンテキスト長
33K
モダリティ
text
能力レーダー
20
general
13
coding
29
reasoning
21
science推定
0
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 399 | 14.0 | AA |
| General Ranking | 424 | 23.0 | AA |
| Math Reasoning | 250 | 35.0 | AA |
| Reasoning | 58 | 63.0 | LS |
| Science | 418 | 21.0 | AA |
ベンチマークスコア (LLM Stats)
Code
HumanEval
88.4%自己申告
Aider
55.6%自己申告
LiveCodeBench
18.2%自己申告
Finance
MMLU-Base
68.0%自己申告
MMLU
67.6%自己申告
TruthfulQA
50.6%自己申告
MMLU-Pro
40.1%自己申告
TheoremQA
34.0%自己申告
General
MBPP
0.83 / 100自己申告
MMLU-Redux
66.6%自己申告
ARC-C
60.9%自己申告
BigCodeBench
41.0%自己申告
Language
Winogrande
72.9%自己申告
Math
GSM8k
83.9%自己申告
MATH
46.6%自己申告
STEM
34.0%自己申告
Reasoning
HellaSwag
76.8%自己申告
CRUXEval-Input-CoT
56.5%自己申告
CRUXEval-Output-CoT
56.0%自己申告
AA評価指数
Intelligence Index10.0
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.0
LLM Statsカテゴリスコア
General60
Language60
Math60
Reasoning60
Code50
Finance50
Healthcare50
Legal50
Physics30
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません