跳转到主要内容

Gemma 3 4B Instruct

GoogleGemmaOpen WeightGemma · Commercial OK

描述

Gemma 3 4B is a 4-billion-parameter vision-language model from Google, handling text and image input and generating text output. It features a 128K context window, multilingual support, and open weights. Suitable for question answering, summarization, reasoning, and image understanding tasks.

发布日期
2025-03-12
参数规模
4.0B
上下文长度
131K
支持模态
image, text

能力雷达图

17
general
6
coding
22
reasoning
17
science估算
0
agents
70
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜448
6.0
AA
通用能力榜467
15.0
AA
数学推理291
24.0
AA
多模态榜67
65.0
LS
推理能力96
36.0
LS
科学能力451
15.0
AA

基准测试分数 (LLM Stats)

Biology

GPQA30.8%自报

Code

HumanEval71.3%自报
LiveCodeBench12.6%自报

Factuality

FACTS Grounding70.1%自报
SimpleQA4.0%自报

Finance

MMLU-Pro43.6%自报

General

IFEval90.2%自报
Natural2Code70.3%自报
MBPP0.63 / 100自报
Global-MMLU-Lite54.5%自报
MMMU (val)48.8%自报
BIG-Bench Extra Hard11.0%自报

Image To Text

DocVQA75.8%自报
VQAv2 (val)62.4%自报
TextVQA57.8%自报

Language

BIG-Bench Hard72.2%自报
WMT24++46.8%自报
ECLeKTic4.6%自报

Math

GSM8k89.2%自报
MATH75.6%自报
MathVista-Mini50.0%自报
HiddenMath43.0%自报

Multimodal

AI2D74.8%自报
ChartQA68.8%自报
InfoVQA50.0%自报

Reasoning

Bird-SQL (dev)36.3%自报

AA 评测指数

Math Index
12.7
Intelligence Index
6.3
Coding Index
2.9
Math 500
0.8
Mmlu Pro
0.4
Gpqa
0.3
Ifbench
0.3
Aime 25
0.1
Livecodebench
0.1
Scicode
0.1
Aime
0.1
Lcr
0.1
Hle
0.1
Tau2
0.1
Terminalbench Hard
0.0

LLM Stats 分类评分

Structured Output
90
Instruction Following
90
Grounding
70
Image To Text
70
Vision
60
Math
60
Multimodal
60
Healthcare
50
Reasoning
50
Code
40
Factuality
40
Finance
40
General
40
Language
40
Legal
40
Biology
30
Chemistry
30
Physics
30

定价

输入价格$0.04 / 1M tokens
输出价格$0.08 / 1M tokens
混合价格(3:1)$0.05 / 1M tokens

速度

Tokens/秒30.0 tokens/s
首Token延迟1.19s
首回答延迟1.19s

可用提供商

(LS 内部计价单位)

暂无提供商数据

外部链接