메인 콘텐츠로 건너뛰기

GPT-4.1 mini

OpenAIGPTProprietary

설명

GPT-4.1 mini provides a balance between intelligence, speed, and cost. It's a significant leap in small model performance, even beating GPT-4o in many benchmarks while reducing latency and cost.

출시일
2025-04-14
파라미터
컨텍스트 길이
1.0M
모달리티
file, image, text

능력 레이더

37
general
31
coding
54
reasoning
45
science추정
50
agents
85
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Code Ranking229
37.0
AA
General Ranking207
49.0
AA
Math Reasoning161
56.0
AA
Multimodal Ranking49
75.0
LS
Reasoning61
62.0
LS
Science196
48.0
AA

벤치마크 점수 (LLM Stats)

Biology

GPQA65.0%자체 보고

Code

Aider-Polyglot34.7%자체 보고
Aider-Polyglot Edit31.6%자체 보고
SWE-Bench Verified23.6%자체 보고

Communication

Multi-IF67.0%자체 보고
TAU-bench Retail55.8%자체 보고
TAU-bench Airline36.0%자체 보고
Multi-Challenge35.8%자체 보고

Finance

MMLU87.5%자체 보고

General

IFEval84.1%자체 보고
MMMLU78.5%자체 보고
MMMU72.7%자체 보고
Internal API instruction following (hard)45.1%자체 보고

Language

COLLIE54.6%자체 보고

Long Context

ComplexFuncBench49.3%자체 보고
OpenAI-MRCR: 2 needle 128k47.2%자체 보고
OpenAI-MRCR: 2 needle 1M33.3%자체 보고
Graphwalks BFS >128k15.0%자체 보고
Graphwalks parents >128k11.0%자체 보고

Math

MathVista73.1%자체 보고
AIME 202449.6%자체 보고
AIME 202540.2%자체 보고
HMMT 202535.0%자체 보고
Humanity's Last Exam3.7%자체 보고

Multimodal

CharXiv-D88.4%자체 보고
CharXiv-R56.8%자체 보고

Reasoning

Graphwalks BFS <128k61.7%자체 보고
Graphwalks parents <128k60.5%자체 보고

AA 평가 지수

Math Index
46.3
Intelligence Index
22.9
Coding Index
18.5
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.7
Tau2
0.5
Livecodebench
0.5
Aime 25
0.5
Aime
0.4
Lcr
0.4
Scicode
0.4
Ifbench
0.4
Terminalbench Hard
0.1
Hle
0.0

LLM Stats 카테고리 점수

Finance
90
Legal
90
Healthcare
80
Instruction Following
80
Structured Output
70
Biology
70
Chemistry
70
Language
70
Multimodal
70
Physics
70
Vision
60
General
60
Tool Calling
50
Writing
50
Communication
50
Math
50
Reasoning
50
Spatial Reasoning
40
Code
30
Long Context
30
Frontend Development
20

가격

입력 가격$0.4 / 1M tokens
출력 가격$1.6 / 1M tokens
혼합 가격 (3:1)$0.7 / 1M tokens

속도

토큰/초78.8 tokens/s
첫 토큰 지연0.52s
첫 응답 지연0.52s

사용 가능한 프로바이더

(LS 내부 단위)
프로바이더입력 가격출력 가격
OpenAI400K1.6M

외부 링크