Claude Instant
AnthropicClaude
Дата выхода
2023-03-14
Параметры
—
Длина контекста
1.0M
Модальности
image, pdf, text
Радар способностей
15
general
9
coding
15
reasoning
24
scienceоцен.
80
agents
80
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 445 | 10.0 | AA |
| Общий рейтинг | 478 | 16.0 | AA |
| Математическое мышление | 337 | 11.0 | AA |
| Наука | 457 | 17.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
Vending-Bench 2
801759.0%Сам.
GDPval-AA
1606.00 / 3000Сам.
DeepSearchQA
91.3%Сам.
BrowseComp
84.0%Сам.
CyberGym
73.8%Сам.
OSWorld
72.7%Сам.
Terminal-Bench 2.0
65.4%Сам.
MCP Atlas
62.7%Сам.
Finance Agent
60.7%Сам.
FrontierSWE
56.0%Сам.
OpenRCA
34.9%Сам.
Legal Agent Benchmark
4.2%Сам.
Biology
GPQA
91.3%Сам.
Code
SWE-Bench Verified
80.8%Сам.
SWE-bench Multilingual
77.8%Сам.
Communication
Tau2 Telecom
99.3%Сам.
Tau2 Retail
91.9%Сам.
General
MMMLU
91.1%Сам.
MMMU-Pro
77.3%Сам.
LiveBench
76.3%Сам.
MRCR v2 (8-needle)
76.0%Сам.
Healthcare
FigQA
78.3%Сам.
Long Context
Graphwalks parents >128k
95.4%Сам.
Graphwalks BFS >128k
61.5%Сам.
Math
AIME 2025
99.8%Сам.
Humanity's Last Exam
53.1%Сам.
Multimodal
CharXiv-R
77.4%Сам.
Reasoning
ARC-AGI v2
68.8%Сам.
Индексы оценки AA
Coding Index7.8
Intelligence Index2.1
Mmlu Pro0.4
Gpqa0.3
Math 5000.3
Livecodebench0.1
Hle0.0
Aime0.0
Оценки категорий LLM Stats
Agents100
Finance100
Legal100
Reasoning100
General100
Communication100
Language90
Physics90
Search90
Biology90
Chemistry90
Long Context80
Math80
Multimodal80
Safety80
Spatial Reasoning80
Frontend Development80
Healthcare80
Tool Calling80
Code70
Vision70
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Цена чтения кэша$0.5 / 1M токенов
Цена записи кэша$6.25 / 1M токенов
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Нет данных провайдеров