Перейти к основному содержанию

DeepSeek-V2.5 (Dec '24)

DeepSeekDeepSeekOpen Weightdeepseek

Описание

DeepSeek-V2.5 is an upgraded version that combines DeepSeek-V2-Chat and DeepSeek-Coder-V2-Instruct, integrating general and coding abilities. It better aligns with human preferences and has been optimized in various aspects, including writing and instruction following.

Дата выхода
2024-12-10
Параметры
236.0B
Длина контекста
164K
Модальности
text

Радар способностей

13
general
60
coding
76
reasoning
68
scienceоцен.
0
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
General Ranking471
14.0
AA
Math Reasoning104
75.0
AA
Reasoning49
69.0
LS

Оценки бенчмарков (LLM Stats)

Code

HumanEval89.0%Сам.
Aider72.2%Сам.
SWE-Bench Verified16.8%Сам.

Communication

MT-Bench0.90 / 100Сам.

Creativity

AlignBench80.4%Сам.
Arena Hard76.2%Сам.
AlpacaEval 2.050.5%Сам.

Finance

MMLU80.4%Сам.

General

DS-FIM-Eval78.3%Сам.
LiveCodeBench(01-09)41.8%Сам.

Language

BBH84.3%Сам.

Math

GSM8k95.1%Сам.
MATH74.7%Сам.

Reasoning

HumanEval-Mul73.8%Сам.
DS-Arena-Code63.1%Сам.

Индексы оценки AA

Intelligence Index
12.5
Math 500
0.8

Оценки категорий LLM Stats

Communication
90
Roleplay
90
Finance
80
General
80
Healthcare
80
Language
80
Legal
80
Math
80
Writing
70
Creativity
70
Reasoning
70
Code
60
Frontend Development
20

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки