Gemini 1.5 Pro (Sep '24)
GoogleGeminiProprietary
Описание
Gemini 1.5 Pro is a mid-size multimodal model optimized for a wide range of reasoning tasks. It can process large amounts of data at once, including 2 hours of video, 19 hours of audio, codebases with 60,000 lines of code, or 2,000 pages of text.
Дата выхода
2024-09-24
Параметры
—
Длина контекста
1.0M
Модальности
audio, file, image, text, video
Радар способностей
32
general
27
coding
50
reasoning
38
scienceоцен.
0
agents
80
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 222 | 38.0 | AA |
| General Ranking | 258 | 41.0 | AA |
| Math Reasoning | 162 | 56.0 | AA |
| Multimodal Ranking | 32 | 79.0 | LS |
| Reasoning | 4 | 93.0 | LS |
| Science | 283 | 39.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
59.1%Сам.
Code
HumanEval
84.1%Сам.
Finance
MMLU
85.9%Сам.
MMLU-Pro
75.8%Сам.
General
Natural2Code
85.4%Сам.
MRCR
82.6%Сам.
MMMU
65.9%Сам.
Vibe-Eval
53.9%Сам.
Healthcare
WMT23
75.1%Сам.
Language
BIG-Bench Hard
89.2%Сам.
FLEURS
0.07 / 100Сам.
Math
GSM8k
90.8%Сам.
MGSM
87.5%Сам.
MATH
86.5%Сам.
DROP
74.9%Сам.
MathVista
68.1%Сам.
FunctionalMATH
64.6%Сам.
PhysicsFinals
63.9%Сам.
HiddenMath
52.0%Сам.
AMC_2022_23
46.4%Сам.
Multimodal
Video-MME
78.6%Сам.
Reasoning
HellaSwag
93.3%Сам.
Safety
XSTest
98.8%Сам.
Индексы оценки AA
Coding Index23.6
Intelligence Index16.0
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Livecodebench0.3
Scicode0.3
Aime0.2
Hle0.0
Оценки категорий LLM Stats
Safety100
Code80
Finance80
Healthcare80
Legal80
Long Context80
Math80
Reasoning80
Vision70
General70
Language70
Multimodal70
Biology60
Chemistry60
Physics60
Speech To Text10
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров