跳轉到主要內容

GPT-4.1 mini

OpenAIGPTProprietary

描述

GPT-4.1 mini provides a balance between intelligence, speed, and cost. It's a significant leap in small model performance, even beating GPT-4o in many benchmarks while reducing latency and cost.

發布日期
2025-04-14
參數規模
上下文長度
1.0M
支援模態
image, pdf, text

能力雷達圖

33
general
47
coding
54
reasoning
45
science估算
50
agents
85
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
程式碼能力榜244
40.0
AA
通用能力榜222
46.0
AA
數學推理160
56.0
AA
多模態榜54
75.0
LS
推理能力65
62.0
LS
科學能力215
47.0
AA

基準測試分數 (LLM Stats)

Biology

GPQA65.0%自報

Code

Aider-Polyglot34.7%自報
Aider-Polyglot Edit31.6%自報
SWE-Bench Verified23.6%自報

Communication

Multi-IF67.0%自報
TAU-bench Retail55.8%自報
TAU-bench Airline36.0%自報
Multi-Challenge35.8%自報

Finance

MMLU87.5%自報

General

IFEval84.1%自報
MMMLU78.5%自報
MMMU72.7%自報
Internal API instruction following (hard)45.1%自報

Language

COLLIE54.6%自報

Long Context

ComplexFuncBench49.3%自報
OpenAI-MRCR: 2 needle 128k47.2%自報
OpenAI-MRCR: 2 needle 1M33.3%自報
Graphwalks BFS >128k15.0%自報
Graphwalks parents >128k11.0%自報

Math

MathVista73.1%自報
AIME 202449.6%自報
AIME 202540.2%自報
HMMT 202535.0%自報
Humanity's Last Exam3.7%自報

Multimodal

CharXiv-D88.4%自報
CharXiv-R56.8%自報

Reasoning

Graphwalks BFS <128k61.7%自報
Graphwalks parents <128k60.5%自報

AA 評測指數

Math Index
46.3
Intelligence Index
16.3
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.7
Tau2
0.5
Livecodebench
0.5
Aime 25
0.5
Aime
0.4
Lcr
0.4
Scicode
0.4
Ifbench
0.4
Terminalbench Hard
0.1
Hle
0.0

LLM Stats 分類評分

Legal
90
Finance
90
Instruction Following
80
Healthcare
80
Language
70
Multimodal
70
Physics
70
Structured Output
70
Biology
70
Chemistry
70
General
60
Vision
60
Math
50
Reasoning
50
Communication
50
Tool Calling
50
Writing
50
Spatial Reasoning
40
Long Context
30
Code
30
Frontend Development
20

定價

輸入價格$0.4 / 1M tokens
輸出價格$1.6 / 1M tokens
混合價格(3:1)$0.7 / 1M tokens
快取讀取價格$0.1 / 1M tokens

速度

Tokens/秒98.8
首Token延遲0.52s
首回答延遲0.52s

供應商價格排行

供應商價格排行

17 個供應商

最便宜: OpenAI最貴: Merge Gateway
供應商輸入輸出
1OpenAI最便宜
$0
$0
2Poe
$0.36
$1.4
3Helicone
$0.4
$1.6
4302.AI
$0.4
$1.6
5NanoGPT
$0.4
$1.6
6Abacus
$0.4
$1.6
7OpenRouter
$0.4
$1.6
8Kilo Gateway
$0.4
$1.6
9SAP AI Core
$0.4
$1.6
10Azure Cognitive Services
$0.4
$1.6
11Requesty
$0.4
$1.6
12Vercel AI Gateway
$0.4
$1.6
13LLM Gateway
$0.4
$1.6
14Azure
$0.4
$1.6
15NEAR AI Cloud
$0.4
$1.6
16OrcaRouter
$0.4
$1.6
17Merge Gateway
$0.4
$1.6

比較該模型在不同 API 供應商之間的定價。

外部連結