Перейти к основному содержанию

Claude 3.5 Sonnet

AnthropicClaudeProprietary

Описание

Claude 3.5 Sonnet is a powerful AI model with industry-leading software engineering skills. It excels in coding, planning, and problem-solving, with significant improvements in agentic coding and tool use tasks. The model includes computer use capabilities in public beta, allowing it to interact with computer interfaces like a human user.

Дата выхода
2024-10-22
Параметры
Длина контекста
Модальности
image, text

Радар способностей

80
general
70
coding
90
reasoning
60
scienceоцен.
60
agents
100
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Agents & Tools99
18.0
LS
Multimodal Ranking1
94.0
LS

Оценки бенчмарков (LLM Stats)

Agents

OSWorld Extended22.0%Сам.
OSWorld Screenshot-only14.9%Сам.

Biology

GPQA67.2%Сам.

Code

HumanEval93.7%Сам.
SWE-Bench Verified49.0%Сам.

Communication

TAU-bench Retail69.2%Сам.
TAU-bench Airline46.0%Сам.

Finance

MMLU90.4%Сам.
MMLU-Pro77.6%Сам.

General

MMMU68.3%Сам.

Image To Text

DocVQA95.2%Сам.

Language

BIG-Bench Hard93.1%Сам.

Math

GSM8k96.4%Сам.
MGSM91.6%Сам.
DROP87.1%Сам.
MATH78.3%Сам.
MathVista67.7%Сам.

Multimodal

AI2D94.7%Сам.
ChartQA90.8%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Image To Text
100
Language
90
Math
90
Vision
80
Finance
80
General
80
Healthcare
80
Legal
80
Multimodal
80
Reasoning
80
Biology
70
Chemistry
70
Code
70
Physics
70
Tool Calling
60
Communication
60
Frontend Development
50

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки