Gemini 2.0 Pro Experimental (Feb '25)

GoogleGemini

Дата выхода

2025-02-05

Параметры

—

Длина контекста

1.0M

Модальности

audio, image, pdf, text, video

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	264	35.0	AA
Общий рейтинг	252	42.0	AA
Математическое мышление	138	65.0	AA
Наука	267	42.0	AA

Оценки бенчмарков (LLM Stats)

Agents

Vending-Bench 2

363500.0%Сам.

t2-bench

90.2%Сам.

MCP Atlas

57.4%Сам.

Toolathlon

49.4%Сам.

Terminal-Bench 2.0

47.6%Сам.

Finance Agent v2

42.5%Сам.

Legal Agent Benchmark

0.0%Сам.

Biology

GPQA

90.4%Сам.

Code

LiveCodeBench Pro

2316.00 / 3000Сам.

SWE-Bench Verified

78.0%Сам.

Factuality

SimpleQA

68.7%Сам.

FACTS Grounding

61.9%Сам.

General

Global PIQA

92.8%Сам.

MMMLU

91.8%Сам.

MMMU-Pro

81.2%Сам.

LiveBench

72.4%Сам.

MRCR v2 (8-needle)

22.1%Сам.

Grounding

ScreenSpot Pro

69.1%Сам.

Healthcare

VideoMMMU

86.9%Сам.

Math

AIME 2025

99.7%Сам.

Humanity's Last Exam

43.5%Сам.

Multimodal

CharXiv-R

80.3%Сам.

OmniDocBench 1.5

12.1%Сам.

Reasoning

ARC-AGI v2

33.6%Сам.

Индексы оценки AA

Coding Index

25.5

Intelligence Index

11.8

Math 500

0.9

Mmlu Pro

0.8

Gpqa

0.6

Aime

0.4

Livecodebench

0.3

Scicode

0.3

Hle

0.1

Оценки категорий LLM Stats

Code

100

Agents

100

General

100

Reasoning

100

Language

Physics

Biology

Chemistry

Math

Frontend Development

Multimodal

Factuality

Grounding

Tool Calling

Vision

Spatial Reasoning

Healthcare

Finance

Long Context

Structured Output

Legal

Цены

Цена вводаБесплатно

Цена выводаБесплатно

Смешанная цена (3:1)Бесплатно

Цена чтения кэша$0.05 / 1M токенов

Скорость

Токенов/сек0.0

Задержка первого токена0.00s

Время до первого ответа0.00s

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки

Artificial Analysis