Claude Instant

AnthropicClaude

Дата выхода

2023-03-14

Параметры

—

Длина контекста

1.0M

Модальности

image, pdf, text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	445	10.0	AA
Общий рейтинг	478	16.0	AA
Математическое мышление	337	11.0	AA
Наука	457	17.0	AA

Оценки бенчмарков (LLM Stats)

Agents

Vending-Bench 2

801759.0%Сам.

GDPval-AA

1606.00 / 3000Сам.

DeepSearchQA

91.3%Сам.

BrowseComp

84.0%Сам.

CyberGym

73.8%Сам.

OSWorld

72.7%Сам.

Terminal-Bench 2.0

65.4%Сам.

MCP Atlas

62.7%Сам.

Finance Agent

60.7%Сам.

FrontierSWE

56.0%Сам.

OpenRCA

34.9%Сам.

Legal Agent Benchmark

4.2%Сам.

Biology

GPQA

91.3%Сам.

Code

SWE-Bench Verified

80.8%Сам.

SWE-bench Multilingual

77.8%Сам.

Communication

Tau2 Telecom

99.3%Сам.

Tau2 Retail

91.9%Сам.

General

MMMLU

91.1%Сам.

MMMU-Pro

77.3%Сам.

LiveBench

76.3%Сам.

MRCR v2 (8-needle)

76.0%Сам.

Healthcare

FigQA

78.3%Сам.

Long Context

Graphwalks parents >128k

95.4%Сам.

Graphwalks BFS >128k

61.5%Сам.

Math

AIME 2025

99.8%Сам.

Humanity's Last Exam

53.1%Сам.

Multimodal

CharXiv-R

77.4%Сам.

Reasoning

ARC-AGI v2

68.8%Сам.

Индексы оценки AA

Coding Index

7.8

Intelligence Index

2.1

Mmlu Pro

0.4

Gpqa

0.3

Math 500

0.3

Livecodebench

0.1

Hle

0.0

Aime

0.0

Оценки категорий LLM Stats

Agents

100

Finance

100

Legal

100

Reasoning

100

General

100

Communication

100

Language

Physics

Biology

Chemistry

Long Context

Math

Multimodal

Safety

Spatial Reasoning

Frontend Development

Healthcare

Tool Calling

Code

Vision

Цены

Цена вводаБесплатно

Цена выводаБесплатно

Смешанная цена (3:1)Бесплатно

Цена чтения кэша$0.5 / 1M токенов

Цена записи кэша$6.25 / 1M токенов

Скорость

Токенов/сек0.0

Задержка первого токена0.00s

Время до первого ответа0.00s

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки

Artificial Analysis