Перейти к основному содержанию

Gemini 2.5 Flash Preview (Non-reasoning)

GoogleGemini

Описание

A thinking model designed for a balance between price and performance. It builds upon Gemini 2.0 Flash with upgraded reasoning, hybrid thinking control, multimodal capabilities (text, image, video, audio input), and a 1M token input context window.

Дата выхода
2025-04-17
Параметры
Длина контекста
1.0M
Модальности
audio, image, pdf, text, video

Радар способностей

31
general
37
coding
61
reasoning
36
scienceоцен.
54
agents
80
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга225
44.0
AA
Общий рейтинг256
41.0
AA
Математическое мышление126
69.0
AA
Наука324
35.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA82.8%Сам.

Code

Aider-Polyglot61.9%Сам.
SWE-Bench Verified60.4%Сам.
Aider-Polyglot Edit56.7%Сам.

Factuality

FACTS Grounding85.3%Сам.
SimpleQA26.9%Сам.

General

Global-MMLU-Lite88.4%Сам.
MMMU79.7%Сам.
Vibe-Eval65.4%Сам.
LiveCodeBench v563.9%Сам.
MRCR32.0%Сам.

Math

AIME 202488.0%Сам.
AIME 202572.0%Сам.
Humanity's Last Exam11.0%Сам.

Индексы оценки AA

Intelligence Index
11.7
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.6
Aime
0.4
Livecodebench
0.4
Scicode
0.2
Hle
0.1

Оценки категорий LLM Stats

Language
90
Grounding
90
Physics
80
Healthcare
80
Biology
80
Chemistry
80
Multimodal
70
Math
60
Reasoning
60
Factuality
60
Frontend Development
60
General
60
Code
60
Vision
50
Long Context
20

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Цена чтения кэша$0.03 / 1M токенов

Скорость

Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки