メインコンテンツへスキップ

gpt-oss-20B (high)

OpenAIOpen WeightApache 2.0 · Commercial OK

説明

The gpt-oss-20b model (technically 20.9B parameters) achieves near-parity with OpenAI o4-mini on core reasoning benchmarks, while running efficiently on a single 80 GB GPU. The gpt-oss-20b model delivers similar results to OpenAI o3‑mini on common benchmarks and can run on edge devices with just 16 GB of memory, making it ideal for on-device use cases, local inference, or rapid iteration without costly infrastructure. Both models also perform strongly on tool use, few-shot function calling, CoT reasoning (as seen in results on the Tau-Bench agentic evaluation suite) and HealthBench (even outperforming proprietary models like OpenAI o1 and GPT‑4o). Note: While referred to as '20b' for simplicity, it technically has 20.9B parameters.

リリース日
2025-08-05
パラメータ
20.9B
コンテキスト長
131K
モダリティ
text

能力レーダー

37
general
41
coding
86
reasoning
45
science推定
50
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking196
41.0
AA
General Ranking147
58.0
AA
Math Reasoning39
90.0
AA
Science183
49.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA71.5%自己申告

Communication

TAU-bench Retail54.8%自己申告

Finance

MMLU85.3%自己申告

Healthcare

HealthBench42.5%自己申告
HealthBench Hard10.8%自己申告

Math

CodeForces0.74 / 3000自己申告
Humanity's Last Exam10.9%自己申告

AA評価指数

Math Index
89.3
Intelligence Index
24.5
Coding Index
18.5
Aime 25
0.9
Livecodebench
0.8
Mmlu Pro
0.7
Gpqa
0.7
Ifbench
0.7
Tau2
0.6
Scicode
0.3
Lcr
0.3
Terminalbench Hard
0.1
Hle
0.1

LLM Statsカテゴリスコア

Finance
90
Language
90
Legal
90
General
80
Biology
70
Chemistry
70
Physics
70
Math
60
Reasoning
60
Tool Calling
50
Communication
50
Healthcare
50
Vision
10

価格設定

入力価格$0.05 / 1M tokens
出力価格$0.2 / 1M tokens
混合価格(3:1)$0.088 / 1M tokens

速度

トークン/秒282.4 tokens/s
初トークン遅延0.36s
初回答遅延7.44s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
OpenAI100K500K
Fireworks100K500K
Groq100K500K

外部リンク