Перейти к основному содержанию

Claude 4.5 Sonnet (Reasoning)

AnthropicClaude
Дата выхода
2025-09-29
Параметры
Длина контекста
1.0M
Модальности
image, pdf, text

Радар способностей

48
general
65
coding
87
reasoning
57
scienceоцен.
80
agents
80
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга61
74.0
AA
Общий рейтинг72
71.0
AA
Математическое мышление47
89.0
AA
Наука83
64.0
AA

Оценки бенчмарков (LLM Stats)

Agents

Vending-Bench 2801759.0%Сам.
GDPval-AA1606.00 / 3000Сам.
DeepSearchQA91.3%Сам.
BrowseComp84.0%Сам.
CyberGym73.8%Сам.
OSWorld72.7%Сам.
Terminal-Bench 2.065.4%Сам.
MCP Atlas62.7%Сам.
Finance Agent60.7%Сам.
FrontierSWE56.0%Сам.
OpenRCA34.9%Сам.
Legal Agent Benchmark4.2%Сам.

Biology

GPQA91.3%Сам.

Code

SWE-Bench Verified80.8%Сам.
SWE-bench Multilingual77.8%Сам.

Communication

Tau2 Telecom99.3%Сам.
Tau2 Retail91.9%Сам.

General

MMMLU91.1%Сам.
MMMU-Pro77.3%Сам.
LiveBench76.3%Сам.
MRCR v2 (8-needle)76.0%Сам.

Healthcare

FigQA78.3%Сам.

Long Context

Graphwalks parents >128k95.4%Сам.
Graphwalks BFS >128k61.5%Сам.

Math

AIME 202599.8%Сам.
Humanity's Last Exam53.1%Сам.

Multimodal

CharXiv-R77.4%Сам.

Reasoning

ARC-AGI v268.8%Сам.

Индексы оценки AA

Math Index
88.0
Intelligence Index
34.7
Aime 25
0.9
Mmlu Pro
0.9
Gpqa
0.8
Tau2
0.8
Livecodebench
0.7
Lcr
0.7
Ifbench
0.6
Scicode
0.4
Terminalbench Hard
0.4
Hle
0.2

Оценки категорий LLM Stats

Agents
100
Finance
100
Legal
100
Reasoning
100
General
100
Communication
100
Language
90
Physics
90
Search
90
Biology
90
Chemistry
90
Long Context
80
Math
80
Multimodal
80
Safety
80
Spatial Reasoning
80
Frontend Development
80
Healthcare
80
Tool Calling
80
Code
70
Vision
70

Цены

Цена ввода$3 / 1M токенов
Цена вывода$15 / 1M токенов
Смешанная цена (3:1)$6 / 1M токенов
Цена чтения кэша$0.5 / 1M токенов
Цена записи кэша$6.25 / 1M токенов

Скорость

Токенов/сек57.2
Задержка первого токена7.33s
Время до первого ответа7.33s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

3 провайдеров

Самый дешевый: AnthropicСамый дорогой: Cortecs
ПровайдерВводВывод
1AnthropicОсновной
$3
$15
2Helicone
$3
$15
3Cortecs
$3.259
$16.296

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки