Saltar al contenido principal

o1

OpenAIOpenAI o-seriesProprietary

Descripción

A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.

Fecha de lanzamiento
2024-12-05
Parámetros
Longitud del contexto
200K
Modalidades
image, pdf, text

Radar de capacidades

39
general
49
coding
80
reasoning
48
scienceest.
60
agents
70
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación151
55.0
AA
Ranking general105
63.0
AA
Razonamiento matemático55
87.0
AA
Ciencia195
49.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA78.0%Aut.
GPQA Biology69.2%Aut.

Chemistry

GPQA Chemistry64.7%Aut.

Code

HumanEval88.1%Aut.
SWE-Bench Verified41.0%Aut.

Communication

TAU-bench Retail70.8%Aut.
TAU-bench Airline50.0%Aut.

Factuality

SimpleQA47.0%Aut.

Finance

MMLU91.8%Aut.

General

MMMLU87.7%Aut.
MMMU77.6%Aut.
LiveBench67.0%Aut.

Math

GSM8k97.1%Aut.
MATH96.4%Aut.
MGSM89.3%Aut.
AIME 202474.3%Aut.
MathVista71.8%Aut.
FrontierMath5.5%Aut.

Physics

GPQA Physics92.8%Aut.

Índices de evaluación AA

Coding Index
39.7
Intelligence Index
23.4
Math 500
1.0
Mmlu Pro
0.8
Gpqa
0.7
Aime
0.7
Ifbench
0.7
Livecodebench
0.7
Tau2
0.6
Lcr
0.6
Scicode
0.4
Terminalbench Hard
0.1
Hle
0.1

Puntuaciones por categoría LLM Stats

Language
90
Legal
90
Finance
90
Math
80
Physics
80
Healthcare
80
Biology
80
Chemistry
80
Multimodal
70
Reasoning
70
General
70
Vision
70
Code
60
Communication
60
Tool Calling
60
Factuality
50
Frontend Development
40

Precios

Precio de entrada$15 / 1M tokens
Precio de salida$60 / 1M tokens
Precio mixto (3:1)$26.25 / 1M tokens
Precio de lectura caché$7.5 / 1M tokens

Velocidad

Tokens/seg147.9
Retraso del primer token13.04s
Tiempo hasta la respuesta13.04s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

13 proveedores

Más barato: PoeMás caro: Merge Gateway
ProveedorEntradaSalida
1PoeMás barato
$14
$54
2NanoGPT
$14.994
$59.993
3OpenAIPRINCIPAL
$15
$60
4OpenRouter
$15
$60
5Kilo Gateway
$15
$60
6Cloudflare AI Gateway
$15
$60
7Helicone
$15
$60
8Azure Cognitive Services
$15
$60
9DigitalOcean
$15
$60
10Vercel AI Gateway
$15
$60
11LLM Gateway
$15
$60
12Azure
$15
$60
13Merge Gateway
$15
$60

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas