Перейти к основному содержанию

DeepSeek LLM 67B Chat (V1)

DeepSeekDeepSeek
Дата выхода
2023-11-29
Параметры
Длина контекста
1.0M
Модальности
text

Радар способностей

3
general
70
coding
80
reasoning
77
scienceоцен.
60
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Общий рейтинг531
3.0
AA

Оценки бенчмарков (LLM Stats)

Agents

GDPval-AA1332.00 / 3000Сам.
BrowseComp83.4%Сам.
MCP Atlas73.6%Сам.
Terminal-Bench 2.067.9%Сам.
SWE-Bench Pro55.4%Сам.
Toolathlon51.8%Сам.
FrontierSWE29.0%Сам.

Biology

GPQA90.1%Сам.

Code

LiveCodeBench93.5%Сам.
SWE-Bench Verified80.6%Сам.
SWE-bench Multilingual76.2%Сам.

Factuality

SimpleQA57.9%Сам.

Finance

MMLU-Pro87.5%Сам.

General

CSimpleQA84.4%Сам.
MRCR 1M83.5%Сам.
LiveBench73.6%Сам.
CorpusQA 1M62.0%Сам.

Math

CodeForces1.00 / 3000Сам.
HMMT Feb 2695.2%Сам.
MathArena Apex90.2%Сам.
IMO-AnswerBench89.8%Сам.
Humanity's Last Exam48.2%Сам.

Индексы оценки AA

Intelligence Index
3.0

Оценки категорий LLM Stats

Legal
100
Finance
100
Agents
100
General
100
Reasoning
71
Language
90
Physics
90
Healthcare
90
Biology
90
Chemistry
90
Long Context
80
Math
80
Search
80
Frontend Development
80
Code
70
Factuality
60
Tool Calling
60
Vision
50

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Цена чтения кэша$0.00363 / 1M токенов

Скорость

Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки