DeepSeek-V2.5 (Dec '24)
DeepSeekDeepSeekOpen Weightdeepseek
설명
DeepSeek-V2.5 is an upgraded version that combines DeepSeek-V2-Chat and DeepSeek-Coder-V2-Instruct, integrating general and coding abilities. It better aligns with human preferences and has been optimized in various aspects, including writing and instruction following.
출시일
2024-12-10
파라미터
236.0B
컨텍스트 길이
164K
모달리티
text
능력 레이더
13
general
60
coding
76
reasoning
68
science추정
0
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| General Ranking | 471 | 14.0 | AA |
| Math Reasoning | 104 | 75.0 | AA |
| Reasoning | 49 | 69.0 | LS |
벤치마크 점수 (LLM Stats)
Code
HumanEval
89.0%자체 보고
Aider
72.2%자체 보고
SWE-Bench Verified
16.8%자체 보고
Communication
MT-Bench
0.90 / 100자체 보고
Creativity
AlignBench
80.4%자체 보고
Arena Hard
76.2%자체 보고
AlpacaEval 2.0
50.5%자체 보고
Finance
MMLU
80.4%자체 보고
General
DS-FIM-Eval
78.3%자체 보고
LiveCodeBench(01-09)
41.8%자체 보고
Language
BBH
84.3%자체 보고
Math
GSM8k
95.1%자체 보고
MATH
74.7%자체 보고
Reasoning
HumanEval-Mul
73.8%자체 보고
DS-Arena-Code
63.1%자체 보고
AA 평가 지수
Intelligence Index12.5
Math 5000.8
LLM Stats 카테고리 점수
Communication90
Roleplay90
Finance80
General80
Healthcare80
Language80
Legal80
Math80
Writing70
Creativity70
Reasoning70
Code60
Frontend Development20
가격
입력 가격무료
출력 가격무료
혼합 가격 (3:1)무료
속도
토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다