DeepSeek R1 0528 Qwen3 8B

DeepSeekDeepSeek

リリース日

2025-05-29

パラメータ

—

コンテキスト長

1.0M

モダリティ

text

能力レーダー

general

coding

reasoning

science推定

agents

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ベンチマークスコア (LLM Stats)

Agents

GDPval-AA

1332.00 / 3000自己申告

BrowseComp

83.4%自己申告

MCP Atlas

73.6%自己申告

Terminal-Bench 2.0

67.9%自己申告

SWE-Bench Pro

55.4%自己申告

Toolathlon

51.8%自己申告

FrontierSWE

29.0%自己申告

Biology

GPQA

90.1%自己申告

Code

LiveCodeBench

93.5%自己申告

SWE-Bench Verified

80.6%自己申告

SWE-bench Multilingual

76.2%自己申告

Factuality

SimpleQA

57.9%自己申告

Finance

MMLU-Pro

87.5%自己申告

General

CSimpleQA

84.4%自己申告

MRCR 1M

83.5%自己申告

LiveBench

73.6%自己申告

CorpusQA 1M

62.0%自己申告

Math

CodeForces

1.00 / 3000自己申告

HMMT Feb 26

95.2%自己申告

MathArena Apex

90.2%自己申告

IMO-AnswerBench

89.8%自己申告

Humanity's Last Exam

48.2%自己申告

AA評価指数

Math Index

63.7

Intelligence Index

10.4

Math 500

0.9

Mmlu Pro

0.7

Aime

0.7

Aime 25

0.6

Gpqa

0.6

Livecodebench

0.5

Scicode

0.2

Ifbench

0.2

Lcr

0.1

Hle

0.1

Terminalbench Hard

0.0

Tau2

0.0

LLM Statsカテゴリスコア

Legal

100

Finance

100

Agents

100

General

100

Reasoning

Language

Physics

Healthcare

Biology

Chemistry

Long Context

Math

Frontend Development

Code

Factuality

Tool Calling

Vision

価格設定

入力価格無料

出力価格無料

混合価格（3:1）無料

キャッシュ読み取り価格$0.00363 / 1Mトークン

速度

トークン/秒0.0

初トークン遅延0.00s

初回答遅延0.00s

プロバイダー価格ランキング

15 プロバイダー

最安: NovitaAI最高: Azure

プロバイダー入力出力

1NovitaAI最安

$0.06

$0.09

2CrofAI

$0.35

$0.8

3DeepSeek

$0.435

$0.87

4Alibaba (China)

$0.435

$0.87

5Vivgrid

$0.435

$0.87

6LLM Gateway

$0.435

$0.87

7Auriko

$0.435

$0.87

8Cortecs

$1.553

$3.106

9Venice AI

$1.73

$3.796

10OpenCode Go

$1.74

$3.48

11OpenCode Zen

$1.74

$3.84

12FrogBot

$1.74

$3.48

13Wafer

$1.74

$3.48

14DigitalOcean

$1.74

$3.48

15Azure

$1.74

$3.48

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク

Artificial Analysis

ドメイン	#順位	スコア	ソース
エージェント能力	40	59.0	LS
コーディングランキング	329	25.0	AA
総合ランキング	412	25.0	AA
数学的推論	117	71.0	AA
科学	337	34.0	AA