Перейти к основному содержанию

Nova 2 Omni

AmazonAmazonProprietary

Описание

Amazon Nova 2 Omni is Amazon's first unified multimodal reasoning model that processes text, documents, images, video, and audio inputs and generates both text and images from a single model, eliminating multi-model coordination complexity. It delivers strong multimodal perception, core reasoning, agentic tool use, and high-quality image generation and editing, with configurable extended thinking. It supports a 1M token context window, 200+ languages for text, and 10 languages for speech input.

Дата выхода
2025-12-02
Параметры
Длина контекста
Модальности

Радар способностей

70
general
0
coding
90
reasoning
68
scienceоцен.
70
agents
80
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Агентные возможности52
58.0
LS
Мультимодальный рейтинг58
73.0
LS

Оценки бенчмарков (LLM Stats)

Agents

BFCL-V458.3%Сам.

Audio

MMAU75.3%Сам.
MAVERIX66.6%Сам.
CoVoST240.7%Сам.

Communication

Tau2 Telecom80.0%Сам.
Tau2 Retail78.3%Сам.
Multi-Challenge75.5%Сам.
Tau2 Airline68.8%Сам.

Document Understanding

RealKIE-FCC59.8%Сам.

Finance

MMLU-Pro80.7%Сам.

General

IFBench68.7%Сам.
MMMU-Pro61.4%Сам.

Grounding

RefCOCOg86.3%Сам.
ScreenSpot85.4%Сам.

Image To Text

OCRBench_V258.2%Сам.

Math

AIME 202592.1%Сам.

Multimodal

Video-MME77.9%Сам.
QVHighlights76.7%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Spatial Reasoning
90
Grounding
90
Math
90
Video
80
Finance
80
Healthcare
80
Legal
80
Reasoning
80
Communication
80
Tool Calling
70
Vision
70
General
70
Instruction Following
70
Multimodal
70
Document Understanding
60
Image To Text
60
Language
60
Agents
60
Speech To Text
40
Audio
40

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки