Qwen2.5 Coder Instruct 7B
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
설명
Qwen2.5-Coder is a specialized coding model trained on 5.5 trillion tokens of code data, supporting 92 programming languages with a 128K context window. It excels in code generation, completion, and repair while maintaining strong performance in math and general tasks. The model demonstrates exceptional capabilities in multi-programming language tasks and code reasoning.
출시일
2024-09-19
파라미터
7.0B
컨텍스트 길이
33K
모달리티
text
능력 레이더
20
general
13
coding
29
reasoning
21
science추정
0
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Code Ranking | 399 | 14.0 | AA |
| General Ranking | 424 | 23.0 | AA |
| Math Reasoning | 250 | 35.0 | AA |
| Reasoning | 58 | 63.0 | LS |
| Science | 418 | 21.0 | AA |
벤치마크 점수 (LLM Stats)
Code
HumanEval
88.4%자체 보고
Aider
55.6%자체 보고
LiveCodeBench
18.2%자체 보고
Finance
MMLU-Base
68.0%자체 보고
MMLU
67.6%자체 보고
TruthfulQA
50.6%자체 보고
MMLU-Pro
40.1%자체 보고
TheoremQA
34.0%자체 보고
General
MBPP
0.83 / 100자체 보고
MMLU-Redux
66.6%자체 보고
ARC-C
60.9%자체 보고
BigCodeBench
41.0%자체 보고
Language
Winogrande
72.9%자체 보고
Math
GSM8k
83.9%자체 보고
MATH
46.6%자체 보고
STEM
34.0%자체 보고
Reasoning
HellaSwag
76.8%자체 보고
CRUXEval-Input-CoT
56.5%자체 보고
CRUXEval-Output-CoT
56.0%자체 보고
AA 평가 지수
Intelligence Index10.0
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.0
LLM Stats 카테고리 점수
General60
Language60
Math60
Reasoning60
Code50
Finance50
Healthcare50
Legal50
Physics30
가격
입력 가격무료
출력 가격무료
혼합 가격 (3:1)무료
속도
토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다