o1-preview
OpenAIOpenAI o-seriesProprietary
설명
A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.
출시일
2024-09-12
파라미터
—
컨텍스트 길이
200K
모달리티
file, image, text
능력 레이더
24
general
34
coding
92
reasoning
60
science추정
0
agents
80
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Code Ranking | 109 | 58.0 | AA |
| General Ranking | 325 | 34.0 | AA |
| Math Reasoning | 27 | 93.0 | AA |
벤치마크 점수 (LLM Stats)
Biology
GPQA
73.3%자체 보고
Code
SWE-Bench Verified
41.3%자체 보고
Factuality
SimpleQA
42.4%자체 보고
Finance
MMLU
90.8%자체 보고
General
LiveBench
52.3%자체 보고
Math
MGSM
90.8%자체 보고
MATH
85.5%자체 보고
AIME 2024
42.0%자체 보고
AA 평가 지수
Coding Index34.0
Intelligence Index23.7
Math 5000.9
LLM Stats 카테고리 점수
Finance90
Healthcare90
Language90
Legal90
Biology70
Chemistry70
Math70
Physics70
General60
Reasoning60
Code40
Factuality40
Frontend Development40
가격
입력 가격$16.5 / 1M tokens
출력 가격$66 / 1M tokens
혼합 가격 (3:1)$28.875 / 1M tokens
속도
토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다