메인 콘텐츠로 건너뛰기

GPT-5.2 (Non-reasoning)

OpenAIGPT

설명

GPT‑5.2 introduces substantial gains in professional knowledge work, outperforming experts on GDPval with 70.9% wins or ties, and setting new highs in coding (SWE‑Bench Pro 55.6%), science (GPQA Diamond ~92–93%), math (AIME 2025: 100%), long‑context accuracy up to 256k tokens, and reliable tool‑calling (Tau2 Telecom 98.7%). It rolls out as Instant, Thinking, and Pro—faster, more structured, and less error‑prone—priced at $1.75/1M input and $14/1M output tokens, with Pro variants supporting xhigh reasoning for top‑quality, end‑to‑end execution.

출시일
2025-12-11
파라미터
컨텍스트 길이
400K
모달리티
image, text

능력 레이더

40
general
61
coding
54
reasoning
48
science추정
70
agents
85
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
코딩 랭킹138
58.0
AA
종합 랭킹169
54.0
AA
수학 추론175
52.0
AA
과학179
51.0
AA

벤치마크 점수 (LLM Stats)

Agents

BrowseComp65.8%자체 보고
MCP Atlas60.6%자체 보고
Toolathlon46.3%자체 보고

Biology

GPQA92.4%자체 보고

Code

SWE-Bench Verified80.0%자체 보고
SWE-Lancer (IC-Diamond subset)74.6%자체 보고

Communication

Tau2 Telecom98.7%자체 보고
Tau2 Retail82.0%자체 보고

General

MMMLU89.6%자체 보고
MMMU-Pro79.5%자체 보고
LiveBench74.8%자체 보고

Grounding

ScreenSpot Pro86.3%자체 보고

Healthcare

VideoMMMU85.9%자체 보고

Math

AIME 2025100.0%자체 보고
HMMT 202599.4%자체 보고
FrontierMath40.3%자체 보고
Humanity's Last Exam34.5%자체 보고

Multimodal

CharXiv-R82.1%자체 보고

Reasoning

Graphwalks BFS <128k94.0%자체 보고
BrowseComp Long Context 128k92.0%자체 보고
BrowseComp Long Context 256k89.8%자체 보고
Graphwalks parents <128k89.0%자체 보고
ARC-AGI86.2%자체 보고
ARC-AGI v252.9%자체 보고

AA 평가 지수

Math Index
51.0
Intelligence Index
26.0
Mmlu Pro
0.8
Gpqa
0.7
Livecodebench
0.7
Aime 25
0.5
Ifbench
0.5
Tau2
0.5
Scicode
0.4
Lcr
0.4
Terminalbench Hard
0.3
Tau Banking
0.1
Hle
0.1

LLM Stats 카테고리 점수

Language
90
Physics
90
Grounding
90
Healthcare
90
Biology
90
Chemistry
90
Communication
90
Multimodal
80
Reasoning
80
Search
80
Spatial Reasoning
80
Frontend Development
80
General
80
Math
70
Code
70
Tool Calling
70
Vision
70
Agents
60

가격

입력 가격$1.75 / 1M 토큰
출력 가격$14 / 1M 토큰
혼합 가격 (3:1)$4.813 / 1M 토큰
캐시 읽기 가격$0.175 / 1M 토큰

속도

토큰/초85.5
첫 토큰 지연0.67s
첫 응답 지연0.67s

공급자 가격 순위

공급자 가격 순위

1개 공급자

공급자입력출력
1OpenAI주요
$1.75
$14

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크