跳转到主要内容

Gemini 1.0 Ultra

GoogleGemini

发布日期

2023-12-06

参数规模

—

上下文长度

1.0M

支持模态

audio, image, pdf, text, video

能力雷达图

5

general

18

coding

80

reasoning

77

science估算

60

agents

80

multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域	#排名	分数	来源
代码能力榜	347	22.0	AA
通用能力榜	522	6.0	AA

基准测试分数 (LLM Stats)

Agents

Vending-Bench 2

363500.0%自报

t2-bench

90.2%自报

MCP Atlas

57.4%自报

Toolathlon

49.4%自报

Terminal-Bench 2.0

47.6%自报

Finance Agent v2

42.5%自报

Legal Agent Benchmark

0.0%自报

Biology

GPQA

90.4%自报

Code

LiveCodeBench Pro

2316.00 / 3000自报

SWE-Bench Verified

78.0%自报

Factuality

SimpleQA

68.7%自报

FACTS Grounding

61.9%自报

General

Global PIQA

92.8%自报

MMMLU

91.8%自报

MMMU-Pro

81.2%自报

LiveBench

72.4%自报

MRCR v2 (8-needle)

22.1%自报

Grounding

ScreenSpot Pro

69.1%自报

Healthcare

VideoMMMU

86.9%自报

Math

AIME 2025

99.7%自报

Humanity's Last Exam

43.5%自报

Multimodal

CharXiv-R

80.3%自报

OmniDocBench 1.5

12.1%自报

Reasoning

ARC-AGI v2

33.6%自报

AA 评测指数

Coding Index

17.6

Intelligence Index

4.6

LLM Stats 分类评分

Code

100

Agents

100

General

100

Reasoning

100

Language

90

Physics

90

Biology

90

Chemistry

90

Math

80

Frontend Development

80

Multimodal

70

Factuality

70

Grounding

70

Tool Calling

60

Vision

60

Spatial Reasoning

50

Healthcare

50

Finance

40

Long Context

20

Structured Output

10

Legal

0

定价

输入价格免费

输出价格免费

混合价格(3:1)免费

缓存读取价格$0.05 / 1M tokens

速度

Tokens/秒0.0

首Token延迟0.00s

首回答延迟0.00s

供应商价格排行

暂无提供商数据

外部链接

Artificial Analysis