DeepSeek LLM 67B Chat (V1)
DeepSeekDeepSeek
Дата выхода
2023-11-29
Параметры
—
Длина контекста
1.0M
Модальности
text
Радар способностей
3
general
70
coding
80
reasoning
77
scienceоцен.
60
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Общий рейтинг | 531 | 3.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
GDPval-AA
1332.00 / 3000Сам.
BrowseComp
83.4%Сам.
MCP Atlas
73.6%Сам.
Terminal-Bench 2.0
67.9%Сам.
SWE-Bench Pro
55.4%Сам.
Toolathlon
51.8%Сам.
FrontierSWE
29.0%Сам.
Biology
GPQA
90.1%Сам.
Code
LiveCodeBench
93.5%Сам.
SWE-Bench Verified
80.6%Сам.
SWE-bench Multilingual
76.2%Сам.
Factuality
SimpleQA
57.9%Сам.
Finance
MMLU-Pro
87.5%Сам.
General
CSimpleQA
84.4%Сам.
MRCR 1M
83.5%Сам.
LiveBench
73.6%Сам.
CorpusQA 1M
62.0%Сам.
Math
CodeForces
1.00 / 3000Сам.
HMMT Feb 26
95.2%Сам.
MathArena Apex
90.2%Сам.
IMO-AnswerBench
89.8%Сам.
Humanity's Last Exam
48.2%Сам.
Индексы оценки AA
Intelligence Index3.0
Оценки категорий LLM Stats
Legal100
Finance100
Agents100
General100
Reasoning71
Language90
Physics90
Healthcare90
Biology90
Chemistry90
Long Context80
Math80
Search80
Frontend Development80
Code70
Factuality60
Tool Calling60
Vision50
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Цена чтения кэша$0.00363 / 1M токенов
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Нет данных провайдеров