メインコンテンツへスキップ

Qwen2.5 Coder Instruct 7B

AlibabaQwenOpen WeightApache 2.0 · Commercial OK

説明

Qwen2.5-Coder is a specialized coding model trained on 5.5 trillion tokens of code data, supporting 92 programming languages with a 128K context window. It excels in code generation, completion, and repair while maintaining strong performance in math and general tasks. The model demonstrates exceptional capabilities in multi-programming language tasks and code reasoning.

リリース日
2024-09-19
パラメータ
7.0B
コンテキスト長
33K
モダリティ
text

能力レーダー

20
general
13
coding
29
reasoning
21
science推定
0
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking399
14.0
AA
General Ranking424
23.0
AA
Math Reasoning250
35.0
AA
Reasoning58
63.0
LS
Science418
21.0
AA

ベンチマークスコア (LLM Stats)

Code

HumanEval88.4%自己申告
Aider55.6%自己申告
LiveCodeBench18.2%自己申告

Finance

MMLU-Base68.0%自己申告
MMLU67.6%自己申告
TruthfulQA50.6%自己申告
MMLU-Pro40.1%自己申告
TheoremQA34.0%自己申告

General

MBPP0.83 / 100自己申告
MMLU-Redux66.6%自己申告
ARC-C60.9%自己申告
BigCodeBench41.0%自己申告

Language

Winogrande72.9%自己申告

Math

GSM8k83.9%自己申告
MATH46.6%自己申告
STEM34.0%自己申告

Reasoning

HellaSwag76.8%自己申告
CRUXEval-Input-CoT56.5%自己申告
CRUXEval-Output-CoT56.0%自己申告

AA評価指数

Intelligence Index
10.0
Math 500
0.7
Mmlu Pro
0.5
Gpqa
0.3
Scicode
0.1
Livecodebench
0.1
Aime
0.1
Hle
0.0

LLM Statsカテゴリスコア

General
60
Language
60
Math
60
Reasoning
60
Code
50
Finance
50
Healthcare
50
Legal
50
Physics
30

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク