Перейти к основному содержанию

Claude 3.7 Sonnet (Reasoning)

AnthropicClaude

Описание

The most intelligent Claude model and the first hybrid reasoning model on the market. Claude 3.7 Sonnet can produce near-instant responses or extended, step-by-step thinking that is made visible to the user. Shows particularly strong improvements in coding and front-end web development.

Дата выхода
2025-02-24
Параметры
Длина контекста
200K
Модальности
image, pdf, text

Радар способностей

42
general
41
coding
62
reasoning
51
scienceоцен.
70
agents
80
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Оценки бенчмарков (LLM Stats)

Agents

Terminal-Bench35.2%Сам.

Biology

GPQA84.8%Сам.

Code

SWE-Bench Verified70.3%Сам.

Communication

TAU-bench Retail81.2%Сам.
TAU-bench Airline58.4%Сам.

General

IFEval93.2%Сам.
MMMLU86.1%Сам.
MMMU75.0%Сам.

Math

MATH-50096.2%Сам.
AIME 202480.0%Сам.
AIME 202554.8%Сам.

Индексы оценки AA

Math Index
56.3
Coding Index
36.4
Intelligence Index
27.1
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.8
Lcr
0.6
Aime 25
0.6
Tau2
0.5
Aime
0.5
Ifbench
0.5
Livecodebench
0.5
Scicode
0.4
Terminalbench Hard
0.2
Hle
0.1

Оценки категорий LLM Stats

Instruction Following
90
Language
90
Structured Output
90
Math
80
Multimodal
80
Physics
80
General
80
Healthcare
80
Biology
80
Chemistry
80
Vision
80
Reasoning
70
Frontend Development
70
Communication
70
Tool Calling
70
Code
50
Agents
40

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Цена чтения кэша$0.3 / 1M токенов
Цена записи кэша$3.75 / 1M токенов

Скорость

Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

3 провайдеров

Самый дешевый: AbacusСамый дорогой: Anthropic
ПровайдерВводВывод
1AbacusСамый дешевый
$3
$15
2LLM Gateway
$3
$15
3Anthropic
$3
$15

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки