DeepSeek-V2.5 (Dec '24)
DeepSeekDeepSeekOpen Weightdeepseek
Описание
DeepSeek-V2.5 is an upgraded version that combines DeepSeek-V2-Chat and DeepSeek-Coder-V2-Instruct, integrating general and coding abilities. It better aligns with human preferences and has been optimized in various aspects, including writing and instruction following.
Дата выхода
2024-12-10
Параметры
236.0B
Длина контекста
164K
Модальности
text
Радар способностей
13
general
60
coding
76
reasoning
68
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| General Ranking | 471 | 14.0 | AA |
| Math Reasoning | 104 | 75.0 | AA |
| Reasoning | 49 | 69.0 | LS |
Оценки бенчмарков (LLM Stats)
Code
HumanEval
89.0%Сам.
Aider
72.2%Сам.
SWE-Bench Verified
16.8%Сам.
Communication
MT-Bench
0.90 / 100Сам.
Creativity
AlignBench
80.4%Сам.
Arena Hard
76.2%Сам.
AlpacaEval 2.0
50.5%Сам.
Finance
MMLU
80.4%Сам.
General
DS-FIM-Eval
78.3%Сам.
LiveCodeBench(01-09)
41.8%Сам.
Language
BBH
84.3%Сам.
Math
GSM8k
95.1%Сам.
MATH
74.7%Сам.
Reasoning
HumanEval-Mul
73.8%Сам.
DS-Arena-Code
63.1%Сам.
Индексы оценки AA
Intelligence Index12.5
Math 5000.8
Оценки категорий LLM Stats
Communication90
Roleplay90
Finance80
General80
Healthcare80
Language80
Legal80
Math80
Writing70
Creativity70
Reasoning70
Code60
Frontend Development20
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров