메인 콘텐츠로 건너뛰기

Gemini 1.0 Ultra

GoogleGemini
출시일
2023-12-06
파라미터
컨텍스트 길이
1.0M
모달리티
audio, image, pdf, text, video

능력 레이더

5
general
18
coding
80
reasoning
77
science추정
60
agents
80
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
코딩 랭킹347
22.0
AA
종합 랭킹522
6.0
AA

벤치마크 점수 (LLM Stats)

Agents

Vending-Bench 2363500.0%자체 보고
t2-bench90.2%자체 보고
MCP Atlas57.4%자체 보고
Toolathlon49.4%자체 보고
Terminal-Bench 2.047.6%자체 보고
Finance Agent v242.5%자체 보고
Legal Agent Benchmark0.0%자체 보고

Biology

GPQA90.4%자체 보고

Code

LiveCodeBench Pro2316.00 / 3000자체 보고
SWE-Bench Verified78.0%자체 보고

Factuality

SimpleQA68.7%자체 보고
FACTS Grounding61.9%자체 보고

General

Global PIQA92.8%자체 보고
MMMLU91.8%자체 보고
MMMU-Pro81.2%자체 보고
LiveBench72.4%자체 보고
MRCR v2 (8-needle)22.1%자체 보고

Grounding

ScreenSpot Pro69.1%자체 보고

Healthcare

VideoMMMU86.9%자체 보고

Math

AIME 202599.7%자체 보고
Humanity's Last Exam43.5%자체 보고

Multimodal

CharXiv-R80.3%자체 보고
OmniDocBench 1.512.1%자체 보고

Reasoning

ARC-AGI v233.6%자체 보고

AA 평가 지수

Coding Index
17.6
Intelligence Index
4.6

LLM Stats 카테고리 점수

Code
100
Agents
100
General
100
Reasoning
100
Language
90
Physics
90
Biology
90
Chemistry
90
Math
80
Frontend Development
80
Multimodal
70
Factuality
70
Grounding
70
Tool Calling
60
Vision
60
Spatial Reasoning
50
Healthcare
50
Finance
40
Long Context
20
Structured Output
10
Legal
0

가격

입력 가격무료
출력 가격무료
혼합 가격 (3:1)무료
캐시 읽기 가격$0.05 / 1M 토큰

속도

토큰/초0.0
첫 토큰 지연0.00s
첫 응답 지연0.00s

공급자 가격 순위

프로바이더 데이터가 없습니다

외부 링크