메인 콘텐츠로 건너뛰기

o1

OpenAIOpenAI o-seriesProprietary

설명

A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.

출시일
2024-12-05
파라미터
컨텍스트 길이
200K
모달리티
file, image, text

능력 레이더

43
general
39
coding
80
reasoning
48
science추정
60
agents
70
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Code Ranking157
49.0
AA
General Ranking104
66.0
AA
Math Reasoning55
87.0
AA
Science169
51.0
AA

벤치마크 점수 (LLM Stats)

Biology

GPQA78.0%자체 보고
GPQA Biology69.2%자체 보고

Chemistry

GPQA Chemistry64.7%자체 보고

Code

HumanEval88.1%자체 보고
SWE-Bench Verified41.0%자체 보고

Communication

TAU-bench Retail70.8%자체 보고
TAU-bench Airline50.0%자체 보고

Factuality

SimpleQA47.0%자체 보고

Finance

MMLU91.8%자체 보고

General

MMMLU87.7%자체 보고
MMMU77.6%자체 보고
LiveBench67.0%자체 보고

Math

GSM8k97.1%자체 보고
MATH96.4%자체 보고
MGSM89.3%자체 보고
AIME 202474.3%자체 보고
MathVista71.8%자체 보고
FrontierMath5.5%자체 보고

Physics

GPQA Physics92.8%자체 보고

AA 평가 지수

Intelligence Index
30.8
Coding Index
20.5
Math 500
1.0
Mmlu Pro
0.8
Gpqa
0.7
Aime
0.7
Ifbench
0.7
Livecodebench
0.7
Tau2
0.6
Lcr
0.6
Scicode
0.4
Terminalbench Hard
0.1
Hle
0.1

LLM Stats 카테고리 점수

Finance
90
Language
90
Legal
90
Biology
80
Chemistry
80
Healthcare
80
Math
80
Physics
80
Vision
70
General
70
Multimodal
70
Reasoning
70
Tool Calling
60
Code
60
Communication
60
Factuality
50
Frontend Development
40

가격

입력 가격$15 / 1M tokens
출력 가격$60 / 1M tokens
혼합 가격 (3:1)$26.25 / 1M tokens

속도

토큰/초111.0 tokens/s
첫 토큰 지연22.15s
첫 응답 지연22.15s

사용 가능한 프로바이더

(LS 내부 단위)

프로바이더 데이터가 없습니다

외부 링크