跳轉到主要內容

Gemma 3 4B Instruct

GoogleGemmaOpen WeightGemma · Commercial OK

描述

Gemma 3 4B is a 4-billion-parameter vision-language model from Google, handling text and image input and generating text output. It features a 128K context window, multilingual support, and open weights. Suitable for question answering, summarization, reasoning, and image understanding tasks.

發布日期
2025-03-12
參數規模
4.0B
上下文長度
131K
支援模態
image, text

能力雷達圖

17
general
6
coding
22
reasoning
17
science估算
0
agents
70
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
代码能力榜448
6.0
AA
通用能力榜467
15.0
AA
数学推理291
24.0
AA
多模态榜67
65.0
LS
推理能力96
36.0
LS
科学能力451
15.0
AA

基準測試分數 (LLM Stats)

Biology

GPQA30.8%自報

Code

HumanEval71.3%自報
LiveCodeBench12.6%自報

Factuality

FACTS Grounding70.1%自報
SimpleQA4.0%自報

Finance

MMLU-Pro43.6%自報

General

IFEval90.2%自報
Natural2Code70.3%自報
MBPP0.63 / 100自報
Global-MMLU-Lite54.5%自報
MMMU (val)48.8%自報
BIG-Bench Extra Hard11.0%自報

Image To Text

DocVQA75.8%自報
VQAv2 (val)62.4%自報
TextVQA57.8%自報

Language

BIG-Bench Hard72.2%自報
WMT24++46.8%自報
ECLeKTic4.6%自報

Math

GSM8k89.2%自報
MATH75.6%自報
MathVista-Mini50.0%自報
HiddenMath43.0%自報

Multimodal

AI2D74.8%自報
ChartQA68.8%自報
InfoVQA50.0%自報

Reasoning

Bird-SQL (dev)36.3%自報

AA 評測指數

Math Index
12.7
Intelligence Index
6.3
Coding Index
2.9
Math 500
0.8
Mmlu Pro
0.4
Gpqa
0.3
Ifbench
0.3
Aime 25
0.1
Livecodebench
0.1
Scicode
0.1
Aime
0.1
Lcr
0.1
Hle
0.1
Tau2
0.1
Terminalbench Hard
0.0

LLM Stats 分類評分

Structured Output
90
Instruction Following
90
Grounding
70
Image To Text
70
Vision
60
Math
60
Multimodal
60
Healthcare
50
Reasoning
50
Code
40
Factuality
40
Finance
40
General
40
Language
40
Legal
40
Biology
30
Chemistry
30
Physics
30

定價

輸入價格$0.04 / 1M tokens
輸出價格$0.08 / 1M tokens
混合價格(3:1)$0.05 / 1M tokens

速度

Tokens/秒30.0 tokens/s
首Token延遲1.19s
首回答延遲1.19s

可用提供商

(LS 內部計價單位)

暫無提供商資料

外部連結