Qwen2.5 Coder Instruct 7B
AlibabaQwenОткрытые весаApache 2.0 · Коммерческое использование
Описание
Qwen2.5-Coder is a specialized coding model trained on 5.5 trillion tokens of code data, supporting 92 programming languages with a 128K context window. It excels in code generation, completion, and repair while maintaining strong performance in math and general tasks. The model demonstrates exceptional capabilities in multi-programming language tasks and code reasoning.
Дата выхода
2024-09-19
Параметры
7.0B
Длина контекста
131K
Модальности
text
Радар способностей
17
general
13
coding
29
reasoning
21
scienceоцен.
24
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 420 | 14.0 | AA |
| Общий рейтинг | 450 | 21.0 | AA |
| Математическое мышление | 250 | 35.0 | AA |
| Рассуждения | 62 | 63.0 | LS |
| Наука | 443 | 20.0 | AA |
Оценки бенчмарков (LLM Stats)
Code
HumanEval
88.4%Сам.
Aider
55.6%Сам.
LiveCodeBench
18.2%Сам.
Finance
MMLU-Base
68.0%Сам.
MMLU
67.6%Сам.
TruthfulQA
50.6%Сам.
MMLU-Pro
40.1%Сам.
TheoremQA
34.0%Сам.
General
MBPP
0.83 / 100Сам.
MMLU-Redux
66.6%Сам.
ARC-C
60.9%Сам.
BigCodeBench
41.0%Сам.
Language
Winogrande
72.9%Сам.
Math
GSM8k
83.9%Сам.
MATH
46.6%Сам.
STEM
34.0%Сам.
Reasoning
HellaSwag
76.8%Сам.
CRUXEval-Input-CoT
56.5%Сам.
CRUXEval-Output-CoT
56.0%Сам.
Индексы оценки AA
Intelligence Index4.5
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.0
Оценки категорий LLM Stats
Language60
Math60
Reasoning60
General60
Legal50
Finance50
Healthcare50
Code50
Physics30
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
2 провайдеров
Самый дешевый: LLM GatewayСамый дорогой: Alibaba (China)
ПровайдерВводВывод
1LLM GatewayСамый дешевый
$0.05
$0.05
2Alibaba (China)
$0.144
$0.287
Сравнение цен разных API-провайдеров для этой модели.