跳轉到主要內容

DeepSeek LLM 67B Chat (V1)

DeepSeekDeepSeek
發布日期
2023-11-29
參數規模
上下文長度
1.0M
支援模態
text

能力雷達圖

3
general
70
coding
80
reasoning
77
science估算
60
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
通用能力榜531
3.0
AA

基準測試分數 (LLM Stats)

Agents

GDPval-AA1332.00 / 3000自報
BrowseComp83.4%自報
MCP Atlas73.6%自報
Terminal-Bench 2.067.9%自報
SWE-Bench Pro55.4%自報
Toolathlon51.8%自報
FrontierSWE29.0%自報

Biology

GPQA90.1%自報

Code

LiveCodeBench93.5%自報
SWE-Bench Verified80.6%自報
SWE-bench Multilingual76.2%自報

Factuality

SimpleQA57.9%自報

Finance

MMLU-Pro87.5%自報

General

CSimpleQA84.4%自報
MRCR 1M83.5%自報
LiveBench73.6%自報
CorpusQA 1M62.0%自報

Math

CodeForces1.00 / 3000自報
HMMT Feb 2695.2%自報
MathArena Apex90.2%自報
IMO-AnswerBench89.8%自報
Humanity's Last Exam48.2%自報

AA 評測指數

Intelligence Index
3.0

LLM Stats 分類評分

Legal
100
Finance
100
Agents
100
General
100
Reasoning
71
Language
90
Physics
90
Healthcare
90
Biology
90
Chemistry
90
Long Context
80
Math
80
Search
80
Frontend Development
80
Code
70
Factuality
60
Tool Calling
60
Vision
50

定價

輸入價格免費
輸出價格免費
混合價格(3:1)免費
快取讀取價格$0.00363 / 1M tokens

速度

Tokens/秒0.0
首Token延遲0.00s
首回答延遲0.00s

供應商價格排行

暫無提供商資料

外部連結