Перейти к основному содержанию

Claude 4.5 Haiku (Reasoning)

AnthropicClaude
Дата выхода
2025-10-15
Параметры
Длина контекста
1.0M
Модальности
image, pdf, text

Радар способностей

41
general
50
coding
81
reasoning
47
scienceоцен.
80
agents
80
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга112
63.0
AA
Общий рейтинг130
59.0
AA
Математическое мышление64
85.0
AA
Наука162
52.0
AA

Оценки бенчмарков (LLM Stats)

Agents

Vending-Bench 2801759.0%Сам.
GDPval-AA1606.00 / 3000Сам.
DeepSearchQA91.3%Сам.
BrowseComp84.0%Сам.
CyberGym73.8%Сам.
OSWorld72.7%Сам.
Terminal-Bench 2.065.4%Сам.
MCP Atlas62.7%Сам.
Finance Agent60.7%Сам.
FrontierSWE56.0%Сам.
OpenRCA34.9%Сам.
Legal Agent Benchmark4.2%Сам.

Biology

GPQA91.3%Сам.

Code

SWE-Bench Verified80.8%Сам.
SWE-bench Multilingual77.8%Сам.

Communication

Tau2 Telecom99.3%Сам.
Tau2 Retail91.9%Сам.

General

MMMLU91.1%Сам.
MMMU-Pro77.3%Сам.
LiveBench76.3%Сам.
MRCR v2 (8-needle)76.0%Сам.

Healthcare

FigQA78.3%Сам.

Long Context

Graphwalks parents >128k95.4%Сам.
Graphwalks BFS >128k61.5%Сам.

Math

AIME 202599.8%Сам.
Humanity's Last Exam53.1%Сам.

Multimodal

CharXiv-R77.4%Сам.

Reasoning

ARC-AGI v268.8%Сам.

Индексы оценки AA

Math Index
83.7
Coding Index
43.9
Intelligence Index
29.6
Aime 25
0.8
Mmlu Pro
0.8
Lcr
0.7
Gpqa
0.7
Livecodebench
0.6
Tau2
0.5
Ifbench
0.5
Terminalbench V2 1
0.4
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.1
Tau Banking
0.1

Оценки категорий LLM Stats

Agents
100
Finance
100
Legal
100
Reasoning
100
General
100
Communication
100
Language
90
Physics
90
Search
90
Biology
90
Chemistry
90
Long Context
80
Math
80
Multimodal
80
Safety
80
Spatial Reasoning
80
Frontend Development
80
Healthcare
80
Tool Calling
80
Code
70
Vision
70

Цены

Цена ввода$1 / 1M токенов
Цена вывода$5 / 1M токенов
Смешанная цена (3:1)$2 / 1M токенов
Цена чтения кэша$0.5 / 1M токенов
Цена записи кэша$6.25 / 1M токенов

Скорость

Токенов/сек174.6
Задержка первого токена12.91s
Время до первого ответа12.91s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

1 провайдеров

ПровайдерВводВывод
1AnthropicОсновной
$1
$5

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки