メインコンテンツへスキップ

Nova Lite

AmazonAmazonProprietary

説明

A low-cost multimodal model that is lightning fast for processing images, video, documents, and text.

リリース日
2024-12-03
パラメータ
コンテキスト長
モダリティ
image, text

能力レーダー

25
general
10
coding
22
reasoning
25
science推定
70
agents
90
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools39
61.0
LS
Code Ranking411
12.0
AA
General Ranking381
28.0
AA
Math Reasoning299
22.0
AA
Multimodal Ranking17
86.0
LS
Science396
24.0
AA

ベンチマークスコア (LLM Stats)

Agents

MM-Mind2Web60.7%自己申告

Biology

GPQA42.0%自己申告

Code

HumanEval85.4%自己申告

Economics

FinQA73.6%自己申告
CRAG43.8%自己申告

Finance

MMLU80.5%自己申告

Frontend Development

VisualWebBench77.7%自己申告

General

ARC-C92.4%自己申告
IFEval89.7%自己申告
BFCL66.6%自己申告
MMMU56.2%自己申告

Grounding

GroundUI-1K80.2%自己申告

Image To Text

DocVQA92.4%自己申告
TextVQA80.2%自己申告

Language

Translation Set1→en COMET2288.8%自己申告
Translation en→Set1 COMET2288.8%自己申告
BBH82.4%自己申告
VATEX77.8%自己申告
Translation Set1→en spBleu43.1%自己申告
Translation en→Set1 spBleu41.5%自己申告
SQuALITY19.2%自己申告

Long Context

EgoSchema71.4%自己申告
LVBench40.4%自己申告

Math

GSM8k94.5%自己申告
DROP80.2%自己申告
MATH73.3%自己申告

Multimodal

ChartQA86.8%自己申告

AA評価指数

Intelligence Index
12.7
Math Index
7.0
Coding Index
5.1
Math 500
0.8
Mmlu Pro
0.6
Gpqa
0.4
Ifbench
0.3
Lcr
0.2
Tau2
0.2
Livecodebench
0.2
Scicode
0.1
Aime
0.1
Aime 25
0.1
Hle
0.0
Terminalbench Hard
0.0

LLM Statsカテゴリスコア

Structured Output
90
Code
90
Image To Text
90
Instruction Following
90
Legal
80
Math
80
Tool Calling
70
Vision
70
Finance
70
General
70
Healthcare
70
Multimodal
70
Reasoning
70
Agents
60
Economics
60
Frontend Development
60
Language
60
Biology
40
Chemistry
40
Long Context
40
Physics
40
Search
40
Summarization
20

価格設定

入力価格$0.06 / 1M tokens
出力価格$0.24 / 1M tokens
混合価格(3:1)$0.105 / 1M tokens

速度

トークン/秒186.0 tokens/s
初トークン遅延0.66s
初回答遅延0.66s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク