メインコンテンツへスキップ

DeepSeek-V2.5 (Dec '24)

DeepSeekDeepSeekOpen Weightdeepseek

説明

DeepSeek-V2.5 is an upgraded version that combines DeepSeek-V2-Chat and DeepSeek-Coder-V2-Instruct, integrating general and coding abilities. It better aligns with human preferences and has been optimized in various aspects, including writing and instruction following.

リリース日
2024-12-10
パラメータ
236.0B
コンテキスト長
164K
モダリティ
text

能力レーダー

13
general
60
coding
76
reasoning
68
science推定
0
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
General Ranking471
14.0
AA
Math Reasoning104
75.0
AA
Reasoning49
69.0
LS

ベンチマークスコア (LLM Stats)

Code

HumanEval89.0%自己申告
Aider72.2%自己申告
SWE-Bench Verified16.8%自己申告

Communication

MT-Bench0.90 / 100自己申告

Creativity

AlignBench80.4%自己申告
Arena Hard76.2%自己申告
AlpacaEval 2.050.5%自己申告

Finance

MMLU80.4%自己申告

General

DS-FIM-Eval78.3%自己申告
LiveCodeBench(01-09)41.8%自己申告

Language

BBH84.3%自己申告

Math

GSM8k95.1%自己申告
MATH74.7%自己申告

Reasoning

HumanEval-Mul73.8%自己申告
DS-Arena-Code63.1%自己申告

AA評価指数

Intelligence Index
12.5
Math 500
0.8

LLM Statsカテゴリスコア

Communication
90
Roleplay
90
Finance
80
General
80
Healthcare
80
Language
80
Legal
80
Math
80
Writing
70
Creativity
70
Reasoning
70
Code
60
Frontend Development
20

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク