メインコンテンツへスキップ

Nova 2 Omni

AmazonAmazonProprietary

説明

Amazon Nova 2 Omni is Amazon's first unified multimodal reasoning model that processes text, documents, images, video, and audio inputs and generates both text and images from a single model, eliminating multi-model coordination complexity. It delivers strong multimodal perception, core reasoning, agentic tool use, and high-quality image generation and editing, with configurable extended thinking. It supports a 1M token context window, 200+ languages for text, and 10 languages for speech input.

リリース日
2025-12-02
パラメータ
コンテキスト長
モダリティ

能力レーダー

70
general
0
coding
90
reasoning
68
science推定
70
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力52
58.0
LS
マルチモーダルランキング58
73.0
LS

ベンチマークスコア (LLM Stats)

Agents

BFCL-V458.3%自己申告

Audio

MMAU75.3%自己申告
MAVERIX66.6%自己申告
CoVoST240.7%自己申告

Communication

Tau2 Telecom80.0%自己申告
Tau2 Retail78.3%自己申告
Multi-Challenge75.5%自己申告
Tau2 Airline68.8%自己申告

Document Understanding

RealKIE-FCC59.8%自己申告

Finance

MMLU-Pro80.7%自己申告

General

IFBench68.7%自己申告
MMMU-Pro61.4%自己申告

Grounding

RefCOCOg86.3%自己申告
ScreenSpot85.4%自己申告

Image To Text

OCRBench_V258.2%自己申告

Math

AIME 202592.1%自己申告

Multimodal

Video-MME77.9%自己申告
QVHighlights76.7%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Spatial Reasoning
90
Grounding
90
Math
90
Video
80
Finance
80
Healthcare
80
Legal
80
Reasoning
80
Communication
80
Tool Calling
70
Vision
70
General
70
Instruction Following
70
Multimodal
70
Document Understanding
60
Image To Text
60
Language
60
Agents
60
Speech To Text
40
Audio
40

価格設定

価格データがありません

速度

速度データがありません

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク