Nova 2 Omni
AmazonAmazonProprietary
Описание
Amazon Nova 2 Omni is Amazon's first unified multimodal reasoning model that processes text, documents, images, video, and audio inputs and generates both text and images from a single model, eliminating multi-model coordination complexity. It delivers strong multimodal perception, core reasoning, agentic tool use, and high-quality image generation and editing, with configurable extended thinking. It supports a 1M token context window, 200+ languages for text, and 10 languages for speech input.
Дата выхода
2025-12-02
Параметры
—
Длина контекста
—
Модальности
—
Радар способностей
70
general
0
coding
90
reasoning
68
scienceоцен.
70
agents
80
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Агентные возможности | 52 | 58.0 | LS |
| Мультимодальный рейтинг | 58 | 73.0 | LS |
Оценки бенчмарков (LLM Stats)
Agents
BFCL-V4
58.3%Сам.
Audio
MMAU
75.3%Сам.
MAVERIX
66.6%Сам.
CoVoST2
40.7%Сам.
Communication
Tau2 Telecom
80.0%Сам.
Tau2 Retail
78.3%Сам.
Multi-Challenge
75.5%Сам.
Tau2 Airline
68.8%Сам.
Document Understanding
RealKIE-FCC
59.8%Сам.
Finance
MMLU-Pro
80.7%Сам.
General
IFBench
68.7%Сам.
MMMU-Pro
61.4%Сам.
Grounding
RefCOCOg
86.3%Сам.
ScreenSpot
85.4%Сам.
Image To Text
OCRBench_V2
58.2%Сам.
Math
AIME 2025
92.1%Сам.
Multimodal
Video-MME
77.9%Сам.
QVHighlights
76.7%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Spatial Reasoning90
Grounding90
Math90
Video80
Finance80
Healthcare80
Legal80
Reasoning80
Communication80
Tool Calling70
Vision70
General70
Instruction Following70
Multimodal70
Document Understanding60
Image To Text60
Language60
Agents60
Speech To Text40
Audio40
Цены
Нет данных о ценах
Скорость
Нет данных о скорости
Рейтинг цен провайдеров
Нет данных провайдеров