Gemini 1.5 Pro (Sep '24)

GoogleGeminiProprietary

Описание

Gemini 1.5 Pro is a mid-size multimodal model optimized for a wide range of reasoning tasks. It can process large amounts of data at once, including 2 hours of video, 19 hours of audio, codebases with 60,000 lines of code, or 2,000 pages of text.

Дата выхода

2024-09-24

Параметры

—

Длина контекста

—

Модальности

image, text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	283	31.0	AA
Общий рейтинг	291	37.0	AA
Математическое мышление	162	56.0	AA
Наука	306	38.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

59.1%Сам.

Code

HumanEval

84.1%Сам.

Finance

MMLU

85.9%Сам.

MMLU-Pro

75.8%Сам.

General

Natural2Code

85.4%Сам.

MRCR

82.6%Сам.

MMMU

65.9%Сам.

Vibe-Eval

53.9%Сам.

Healthcare

WMT23

75.1%Сам.

Language

FLEURS

93.3%Сам.

BIG-Bench Hard

89.2%Сам.

Math

GSM8k

90.8%Сам.

MGSM

87.5%Сам.

MATH

86.5%Сам.

DROP

74.9%Сам.

MathVista

68.1%Сам.

FunctionalMATH

64.6%Сам.

PhysicsFinals

63.9%Сам.

HiddenMath

52.0%Сам.

AMC_2022_23

46.4%Сам.

Multimodal

Video-MME

78.6%Сам.

Reasoning

HellaSwag

93.3%Сам.

Safety

XSTest

98.8%Сам.

Индексы оценки AA

Coding Index

23.6

Intelligence Index

10.0

Math 500

0.9

Mmlu Pro

0.8

Gpqa

0.6

Livecodebench

0.3

Scicode

0.3

Aime

0.2

Hle

0.0

Оценки категорий LLM Stats

Safety

100

Speech To Text

Language

Legal

Long Context

Math

Reasoning

Finance

Healthcare

Code

Multimodal

General

Vision

Physics

Biology

Chemistry

Цены

Цена вводаБесплатно

Цена выводаБесплатно

Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0

Задержка первого токена0.00s

Время до первого ответа0.00s

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки

LLM Stats Artificial Analysis