Claude 3 Opus
AnthropicClaudeProprietary
Описание
Claude 3 Opus is Anthropic's most intelligent model, with best-in-market performance on highly complex tasks. It can navigate open-ended prompts and sight-unseen scenarios with remarkable fluency and human-like understanding, showing the outer limits of what's possible with generative AI.
Дата выхода
2024-03-04
Параметры
—
Длина контекста
—
Модальности
image, text
Радар способностей
31
general
23
coding
31
reasoning
31
scienceоцен.
0
agents
80
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 252 | 32.0 | AA |
| General Ranking | 260 | 41.0 | AA |
| Math Reasoning | 254 | 33.0 | AA |
| Reasoning | 2 | 95.0 | LS |
| Science | 358 | 30.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
50.4%Сам.
Code
HumanEval
84.9%Сам.
Finance
MMLU
86.8%Сам.
MMLU-Pro
68.5%Сам.
General
ARC-C
96.4%Сам.
Language
BIG-Bench Hard
86.8%Сам.
Math
GSM8k
95.0%Сам.
MGSM
90.7%Сам.
DROP
83.1%Сам.
MATH
60.1%Сам.
Reasoning
HellaSwag
95.4%Сам.
Индексы оценки AA
Coding Index19.5
Intelligence Index18.0
Mmlu Pro0.7
Math 5000.6
Gpqa0.5
Livecodebench0.3
Scicode0.2
Aime0.0
Hle0.0
Оценки категорий LLM Stats
Code80
Finance80
General80
Healthcare80
Language80
Legal80
Math80
Reasoning80
Biology50
Chemistry50
Physics50
Цены
Цена ввода$18.75 / 1M tokens
Цена вывода$75 / 1M tokens
Смешанная цена (3:1)$32.813 / 1M tokens
Скорость
Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров