メインコンテンツへスキップ

DeepSeek-V2.5

DeepSeekDeepSeek

説明

DeepSeek-V2.5 is an upgraded version that combines DeepSeek-V2-Chat and DeepSeek-Coder-V2-Instruct, integrating general and coding abilities. It better aligns with human preferences and has been optimized in various aspects, including writing and instruction following.

リリース日
2024-09-06
パラメータ
コンテキスト長
モダリティ

能力レーダー

7
general
60
coding
80
reasoning
68
science推定
74
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
総合ランキング506
10.0
AA

ベンチマークスコア (LLM Stats)

Code

HumanEval89.0%自己申告
Aider72.2%自己申告
SWE-Bench Verified16.8%自己申告

Communication

MT-Bench0.90 / 100自己申告

Creativity

AlignBench80.4%自己申告
Arena Hard76.2%自己申告
AlpacaEval 2.050.5%自己申告

Finance

MMLU80.4%自己申告

General

DS-FIM-Eval78.3%自己申告
LiveCodeBench(01-09)41.8%自己申告

Language

BBH84.3%自己申告

Math

GSM8k95.1%自己申告
MATH74.7%自己申告

Reasoning

HumanEval-Mul73.8%自己申告
DS-Arena-Code63.1%自己申告

AA評価指数

Intelligence Index
6.6

LLM Statsカテゴリスコア

Roleplay
90
Communication
90
Language
80
Legal
80
Math
80
Finance
80
General
80
Healthcare
80
Reasoning
70
Creativity
70
Writing
70
Code
60
Frontend Development
20

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク