Claude 4 Sonnet (Non-reasoning)

AnthropicClaude

リリース日

2025-05-22

パラメータ

—

コンテキスト長

1.0M

モダリティ

image, pdf, text

能力レーダー

general

coding

reasoning

science推定

agents

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ベンチマークスコア (LLM Stats)

Agents

Vending-Bench 2

801759.0%自己申告

GDPval-AA

1606.00 / 3000自己申告

DeepSearchQA

91.3%自己申告

BrowseComp

84.0%自己申告

CyberGym

73.8%自己申告

OSWorld

72.7%自己申告

Terminal-Bench 2.0

65.4%自己申告

MCP Atlas

62.7%自己申告

Finance Agent

60.7%自己申告

FrontierSWE

56.0%自己申告

OpenRCA

34.9%自己申告

Legal Agent Benchmark

4.2%自己申告

Biology

GPQA

91.3%自己申告

Code

SWE-Bench Verified

80.8%自己申告

SWE-bench Multilingual

77.8%自己申告

Communication

Tau2 Telecom

99.3%自己申告

Tau2 Retail

91.9%自己申告

General

MMMLU

91.1%自己申告

MMMU-Pro

77.3%自己申告

LiveBench

76.3%自己申告

MRCR v2 (8-needle)

76.0%自己申告

Healthcare

FigQA

78.3%自己申告

Long Context

Graphwalks parents >128k

95.4%自己申告

Graphwalks BFS >128k

61.5%自己申告

Math

AIME 2025

99.8%自己申告

Humanity's Last Exam

53.1%自己申告

Multimodal

CharXiv-R

77.4%自己申告

Reasoning

ARC-AGI v2

68.8%自己申告

AA評価指数

Math Index

38.0

Intelligence Index

25.5

Math 500

0.9

Mmlu Pro

0.8

Gpqa

0.7

Tau2

0.5

Ifbench

0.5

Livecodebench

0.4

Lcr

0.4

Aime

0.4

Aime 25

0.4

Scicode

0.4

Terminalbench Hard

0.3

Hle

0.0

LLM Statsカテゴリスコア

Agents

100

Finance

100

Legal

100

Reasoning

100

General

100

Communication

100

Language

Physics

Biology

Chemistry

Long Context

Math

Multimodal

Safety

Spatial Reasoning

Frontend Development

Healthcare

Tool Calling

Code

Vision

価格設定

入力価格$3 / 1Mトークン

出力価格$15 / 1Mトークン

混合価格（3:1）$6 / 1Mトークン

キャッシュ読み取り価格$0.5 / 1Mトークン

キャッシュ書き込み価格$6.25 / 1Mトークン

速度

トークン/秒0.0

初トークン遅延0.00s

初回答遅延0.00s

プロバイダー価格ランキング

2 プロバイダー

最安: Anthropic最高: SAP AI Core

プロバイダー入力出力

1Anthropicプライマリ

$15

2SAP AI Core

$15

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク

Artificial Analysis

ドメイン	#順位	スコア	ソース
コーディングランキング	187	50.0	AA
総合ランキング	161	55.0	AA
数学的推論	182	50.0	AA
科学	244	45.0	AA