메인 콘텐츠로 건너뛰기

Claude Mythos Preview

AnthropicClaudeProprietary

설명

Claude Mythos Preview is an unreleased general-purpose frontier model from Anthropic, a new tier above Opus (internal codename 'Capybara'). It identified thousands of zero-day vulnerabilities across every major operating system and web browser as part of Project Glasswing, a cross-industry cybersecurity initiative with 12 partners including AWS, Apple, Microsoft, and Google. State-of-the-art on SWE-bench Verified (93.9%), GPQA Diamond (94.6%), USAMO (97.6%), Terminal-Bench 2.0 (82.0%), CyberGym (83.1%), and Cybench (100% pass@1, saturated). Represents a 4.3x increase over the previous trendline for model performance. Deployed under ASL-3 Standard. Best-aligned Claude model to date per Anthropic's risk report, with the first-ever 24-hour internal alignment review before deployment. Not planned for general availability. Pricing for participants: $25/$125 per million tokens (input/output). 244-page system card.

출시일
파라미터
컨텍스트 길이
모달리티
image, text

능력 레이더

90
general
80
coding
80
reasoning
77
science추정
80
agents
90
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Agents & Tools3
79.0
LS
Multimodal Ranking3
93.0
LS

벤치마크 점수 (LLM Stats)

Agents

CyBench100.0%자체 보고
BrowseComp86.9%자체 보고
CyberGym83.1%자체 보고
Terminal-Bench 2.082.0%자체 보고
OSWorld-Verified79.6%자체 보고
SWE-Bench Pro77.8%자체 보고
SWE-Bench Multimodal59.0%자체 보고

Biology

GPQA94.6%자체 보고

Code

SWE-Bench Verified93.9%자체 보고
SWE-bench Multilingual87.3%자체 보고

General

MMMLU92.7%자체 보고

Healthcare

FigQA89.0%자체 보고

Long Context

Graphwalks BFS >128k80.0%자체 보고

Math

USAMO2597.6%자체 보고
Humanity's Last Exam64.7%자체 보고

Multimodal

CharXiv-R93.2%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Biology
90
Chemistry
90
Frontend Development
90
General
90
Healthcare
90
Language
90
Multimodal
90
Physics
90
Reasoning
90
Safety
90
Search
90
Spatial Reasoning
80
Tool Calling
80
Vision
80
Agents
80
Code
80
Long Context
80
Math
80

가격

가격 데이터가 없습니다

속도

속도 데이터가 없습니다

사용 가능한 프로바이더

(LS 내부 단위)

프로바이더 데이터가 없습니다

외부 링크