Перейти к основному содержанию

gpt-oss-20B (high)

OpenAIОткрытые весаApache 2.0 · Коммерческое использование

Описание

The gpt-oss-20b model (technically 20.9B parameters) achieves near-parity with OpenAI o4-mini on core reasoning benchmarks, while running efficiently on a single 80 GB GPU. The gpt-oss-20b model delivers similar results to OpenAI o3‑mini on common benchmarks and can run on edge devices with just 16 GB of memory, making it ideal for on-device use cases, local inference, or rapid iteration without costly infrastructure. Both models also perform strongly on tool use, few-shot function calling, CoT reasoning (as seen in results on the Tau-Bench agentic evaluation suite) and HealthBench (even outperforming proprietary models like OpenAI o1 and GPT‑4o). Note: While referred to as '20b' for simplicity, it technically has 20.9B parameters.

Дата выхода
2025-08-05
Параметры
20.9B
Длина контекста
131K
Модальности
text

Радар способностей

32
general
42
coding
86
reasoning
45
scienceоцен.
50
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга248
39.0
AA
Общий рейтинг171
53.0
AA
Математическое мышление39
90.0
AA
Наука201
48.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA71.5%Сам.

Communication

TAU-bench Retail54.8%Сам.

Finance

MMLU85.3%Сам.

Healthcare

HealthBench42.5%Сам.
HealthBench Hard10.8%Сам.

Math

CodeForces0.74 / 3000Сам.
Humanity's Last Exam10.9%Сам.

Индексы оценки AA

Math Index
89.3
Coding Index
20.7
Intelligence Index
14.9
Aime 25
0.9
Livecodebench
0.8
Mmlu Pro
0.7
Gpqa
0.7
Ifbench
0.7
Tau2
0.6
Scicode
0.3
Lcr
0.3
Terminalbench V2 1
0.1
Terminalbench Hard
0.1
Hle
0.1
Tau Banking
0.1

Оценки категорий LLM Stats

Language
90
Legal
90
Finance
90
General
80
Physics
70
Biology
70
Chemistry
70
Math
60
Reasoning
60
Healthcare
50
Communication
50
Tool Calling
50
Vision
10

Цены

Цена ввода$0.05 / 1M токенов
Цена вывода$0.2 / 1M токенов
Смешанная цена (3:1)$0.088 / 1M токенов

Скорость

Токенов/сек232.9
Задержка первого токена0.67s
Время до первого ответа9.25s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

16 провайдеров

Самый дешевый: LLM GatewayСамый дорогой: Regolo AI
ПровайдерВводВывод
1LLM GatewayСамый дешевый
$0.04
$0.15
2Clarifai
$0.045
$0.18
3Helicone
$0.05
$0.2
4OpenAIОсновной
$0.05
$0.2
5DigitalOcean
$0.05
$0.45
6OVHcloud AI Endpoints
$0.05
$0.18
7Databricks
$0.05
$0.2
8Neon
$0.05
$0.2
9Fireworks AI
$0.07
$0.3
10Amazon Bedrock
$0.07
$0.3
11FrogBot
$0.07
$0.2
12Vertex
$0.07
$0.25
13NanoGPT
$0.2
$0.8
14Cloudflare AI Gateway
$0.2
$0.3
15Cloudflare Workers AI
$0.2
$0.3
16Regolo AI
$0.4
$1.8

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки