Qwen2.5 Coder Instruct 7B
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
Описание
Qwen2.5-Coder is a specialized coding model trained on 5.5 trillion tokens of code data, supporting 92 programming languages with a 128K context window. It excels in code generation, completion, and repair while maintaining strong performance in math and general tasks. The model demonstrates exceptional capabilities in multi-programming language tasks and code reasoning.
Дата выхода
2024-09-19
Параметры
7.0B
Длина контекста
33K
Модальности
text
Радар способностей
20
general
13
coding
29
reasoning
21
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 399 | 14.0 | AA |
| General Ranking | 424 | 23.0 | AA |
| Math Reasoning | 250 | 35.0 | AA |
| Reasoning | 58 | 63.0 | LS |
| Science | 418 | 21.0 | AA |
Оценки бенчмарков (LLM Stats)
Code
HumanEval
88.4%Сам.
Aider
55.6%Сам.
LiveCodeBench
18.2%Сам.
Finance
MMLU-Base
68.0%Сам.
MMLU
67.6%Сам.
TruthfulQA
50.6%Сам.
MMLU-Pro
40.1%Сам.
TheoremQA
34.0%Сам.
General
MBPP
0.83 / 100Сам.
MMLU-Redux
66.6%Сам.
ARC-C
60.9%Сам.
BigCodeBench
41.0%Сам.
Language
Winogrande
72.9%Сам.
Math
GSM8k
83.9%Сам.
MATH
46.6%Сам.
STEM
34.0%Сам.
Reasoning
HellaSwag
76.8%Сам.
CRUXEval-Input-CoT
56.5%Сам.
CRUXEval-Output-CoT
56.0%Сам.
Индексы оценки AA
Intelligence Index10.0
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.0
Оценки категорий LLM Stats
General60
Language60
Math60
Reasoning60
Code50
Finance50
Healthcare50
Legal50
Physics30
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров