o1-preview

OpenAIOpenAI o-seriesProprietary

Description

A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.

Date de sortie

2024-09-12

Paramètres

—

Longueur du contexte

200K

Modalités

image, pdf, text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	222	44.0	AA
Classement général	400	27.0	AA
Raisonnement mathématique	27	93.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

73.3%Aut.

Code

SWE-Bench Verified

41.3%Aut.

Factuality

SimpleQA

42.4%Aut.

Finance

MMLU

90.8%Aut.

General

LiveBench

52.3%Aut.

Math

MGSM

90.8%Aut.

MATH

85.5%Aut.

AIME 2024

42.0%Aut.

Indices d'évaluation AA

Coding Index

34.0

Intelligence Index

17.0

Math 500

0.9

Scores par catégorie LLM Stats

Language

Legal

Finance

Healthcare

Math

Physics

Biology

Chemistry

Reasoning

General

Factuality

Frontend Development

Code

Tarification

Prix d'entrée$16.5 / 1M tokens

Prix de sortie$66 / 1M tokens

Prix mixte (3:1)$28.875 / 1M tokens

Prix de lecture cache$7.5 / 1M tokens

Vitesse

Tokens/sec0.0

Délai du premier token0.00s

Temps de réponse0.00s

Classement des Prix par Fournisseur

2 fournisseurs

Moins cher: NanoGPTPlus cher: OpenAI

FournisseurEntréeSortie

1NanoGPTMoins cher

$14.994

$59.993

2OpenAIPRINCIPAL

$16.5

$66

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

LLM Stats Artificial Analysis