Перейти к основному содержанию

Nova Lite

AmazonAmazonProprietary

Описание

A low-cost multimodal model that is lightning fast for processing images, video, documents, and text.

Дата выхода
2024-12-03
Параметры
Длина контекста
Модальности
image, text

Радар способностей

25
general
10
coding
22
reasoning
25
scienceоцен.
70
agents
90
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Agents & Tools39
61.0
LS
Code Ranking411
12.0
AA
General Ranking381
28.0
AA
Math Reasoning299
22.0
AA
Multimodal Ranking17
86.0
LS
Science396
24.0
AA

Оценки бенчмарков (LLM Stats)

Agents

MM-Mind2Web60.7%Сам.

Biology

GPQA42.0%Сам.

Code

HumanEval85.4%Сам.

Economics

FinQA73.6%Сам.
CRAG43.8%Сам.

Finance

MMLU80.5%Сам.

Frontend Development

VisualWebBench77.7%Сам.

General

ARC-C92.4%Сам.
IFEval89.7%Сам.
BFCL66.6%Сам.
MMMU56.2%Сам.

Grounding

GroundUI-1K80.2%Сам.

Image To Text

DocVQA92.4%Сам.
TextVQA80.2%Сам.

Language

Translation Set1→en COMET2288.8%Сам.
Translation en→Set1 COMET2288.8%Сам.
BBH82.4%Сам.
VATEX77.8%Сам.
Translation Set1→en spBleu43.1%Сам.
Translation en→Set1 spBleu41.5%Сам.
SQuALITY19.2%Сам.

Long Context

EgoSchema71.4%Сам.
LVBench40.4%Сам.

Math

GSM8k94.5%Сам.
DROP80.2%Сам.
MATH73.3%Сам.

Multimodal

ChartQA86.8%Сам.

Индексы оценки AA

Intelligence Index
12.7
Math Index
7.0
Coding Index
5.1
Math 500
0.8
Mmlu Pro
0.6
Gpqa
0.4
Ifbench
0.3
Lcr
0.2
Tau2
0.2
Livecodebench
0.2
Scicode
0.1
Aime
0.1
Aime 25
0.1
Hle
0.0
Terminalbench Hard
0.0

Оценки категорий LLM Stats

Structured Output
90
Code
90
Image To Text
90
Instruction Following
90
Legal
80
Math
80
Tool Calling
70
Vision
70
Finance
70
General
70
Healthcare
70
Multimodal
70
Reasoning
70
Agents
60
Economics
60
Frontend Development
60
Language
60
Biology
40
Chemistry
40
Long Context
40
Physics
40
Search
40
Summarization
20

Цены

Цена ввода$0.06 / 1M tokens
Цена вывода$0.24 / 1M tokens
Смешанная цена (3:1)$0.105 / 1M tokens

Скорость

Токенов/сек186.0 tokens/s
Задержка первого токена0.66s
Время до первого ответа0.66s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки