Gemini 2.5 Flash Preview (Reasoning)
GoogleGeminiProprietary
설명
A thinking model designed for a balance between price and performance. It builds upon Gemini 2.0 Flash with upgraded reasoning, hybrid thinking control, multimodal capabilities (text, image, video, audio input), and a 1M token input context window.
출시일
2025-04-17
파라미터
—
컨텍스트 길이
1.0M
모달리티
audio, file, image, text, video
능력 레이더
39
general
47
coding
86
reasoning
46
science추정
0
agents
80
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Code Ranking | 124 | 55.0 | AA |
| General Ranking | 178 | 53.0 | AA |
| Math Reasoning | 24 | 94.0 | AA |
| Science | 163 | 52.0 | AA |
벤치마크 점수 (LLM Stats)
Biology
GPQA
82.8%자체 보고
Code
Aider-Polyglot
61.9%자체 보고
SWE-Bench Verified
60.4%자체 보고
Aider-Polyglot Edit
56.7%자체 보고
Factuality
FACTS Grounding
85.3%자체 보고
SimpleQA
26.9%자체 보고
General
Global-MMLU-Lite
88.4%자체 보고
MMMU
79.7%자체 보고
Vibe-Eval
65.4%자체 보고
LiveCodeBench v5
63.9%자체 보고
MRCR
32.0%자체 보고
Math
AIME 2024
88.0%자체 보고
AIME 2025
72.0%자체 보고
Humanity's Last Exam
11.0%자체 보고
AA 평가 지수
Intelligence Index24.3
Math 5001.0
Aime0.8
Mmlu Pro0.8
Gpqa0.7
Livecodebench0.5
Scicode0.4
Hle0.1
LLM Stats 카테고리 점수
Grounding90
Language90
Biology80
Chemistry80
Healthcare80
Physics80
Multimodal70
Code60
Factuality60
Frontend Development60
General60
Math60
Reasoning60
Vision50
Long Context20
가격
입력 가격무료
출력 가격무료
혼합 가격 (3:1)무료
속도
토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s
사용 가능한 프로바이더
(LS 내부 단위)| 프로바이더 | 입력 가격 | 출력 가격 |
|---|---|---|
| 300K | 2.5M |