メインコンテンツへスキップ

DeepSeek R1 0528 Qwen3 8B

DeepSeekDeepSeek
リリース日
2025-05-29
パラメータ
コンテキスト長
1.0M
モダリティ
text

能力レーダー

29
general
44
coding
68
reasoning
36
science推定
60
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力40
59.0
LS
コーディングランキング329
25.0
AA
総合ランキング412
25.0
AA
数学的推論117
71.0
AA
科学337
34.0
AA

ベンチマークスコア (LLM Stats)

Agents

GDPval-AA1332.00 / 3000自己申告
BrowseComp83.4%自己申告
MCP Atlas73.6%自己申告
Terminal-Bench 2.067.9%自己申告
SWE-Bench Pro55.4%自己申告
Toolathlon51.8%自己申告
FrontierSWE29.0%自己申告

Biology

GPQA90.1%自己申告

Code

LiveCodeBench93.5%自己申告
SWE-Bench Verified80.6%自己申告
SWE-bench Multilingual76.2%自己申告

Factuality

SimpleQA57.9%自己申告

Finance

MMLU-Pro87.5%自己申告

General

CSimpleQA84.4%自己申告
MRCR 1M83.5%自己申告
LiveBench73.6%自己申告
CorpusQA 1M62.0%自己申告

Math

CodeForces1.00 / 3000自己申告
HMMT Feb 2695.2%自己申告
MathArena Apex90.2%自己申告
IMO-AnswerBench89.8%自己申告
Humanity's Last Exam48.2%自己申告

AA評価指数

Math Index
63.7
Intelligence Index
10.4
Math 500
0.9
Mmlu Pro
0.7
Aime
0.7
Aime 25
0.6
Gpqa
0.6
Livecodebench
0.5
Scicode
0.2
Ifbench
0.2
Lcr
0.1
Hle
0.1
Terminalbench Hard
0.0
Tau2
0.0

LLM Statsカテゴリスコア

Legal
100
Finance
100
Agents
100
General
100
Reasoning
71
Language
90
Physics
90
Healthcare
90
Biology
90
Chemistry
90
Long Context
80
Math
80
Search
80
Frontend Development
80
Code
70
Factuality
60
Tool Calling
60
Vision
50

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料
キャッシュ読み取り価格$0.00363 / 1Mトークン

速度

トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s

プロバイダー価格ランキング

プロバイダー価格ランキング

15 プロバイダー

最安: NovitaAI最高: Azure
プロバイダー入力出力
1NovitaAI最安
$0.06
$0.09
2CrofAI
$0.35
$0.8
3DeepSeek
$0.435
$0.87
4Alibaba (China)
$0.435
$0.87
5Vivgrid
$0.435
$0.87
6LLM Gateway
$0.435
$0.87
7Auriko
$0.435
$0.87
8Cortecs
$1.553
$3.106
9Venice AI
$1.73
$3.796
10OpenCode Go
$1.74
$3.48
11OpenCode Zen
$1.74
$3.84
12FrogBot
$1.74
$3.48
13Wafer
$1.74
$3.48
14DigitalOcean
$1.74
$3.48
15Azure
$1.74
$3.48

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク