メインコンテンツへスキップ

Claude Mythos Preview

AnthropicClaudeProprietary

説明

Claude Mythos Preview is an unreleased general-purpose frontier model from Anthropic, a new tier above Opus (internal codename 'Capybara'). It identified thousands of zero-day vulnerabilities across every major operating system and web browser as part of Project Glasswing, a cross-industry cybersecurity initiative with 12 partners including AWS, Apple, Microsoft, and Google. State-of-the-art on SWE-bench Verified (93.9%), GPQA Diamond (94.6%), USAMO (97.6%), Terminal-Bench 2.0 (82.0%), CyberGym (83.1%), and Cybench (100% pass@1, saturated). Represents a 4.3x increase over the previous trendline for model performance. Deployed under ASL-3 Standard. Best-aligned Claude model to date per Anthropic's risk report, with the first-ever 24-hour internal alignment review before deployment. Not planned for general availability. Pricing for participants: $25/$125 per million tokens (input/output). 244-page system card.

リリース日
パラメータ
コンテキスト長
モダリティ
image, text

能力レーダー

90
general
80
coding
80
reasoning
77
science推定
80
agents
90
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools3
79.0
LS
Multimodal Ranking3
93.0
LS

ベンチマークスコア (LLM Stats)

Agents

CyBench100.0%自己申告
BrowseComp86.9%自己申告
CyberGym83.1%自己申告
Terminal-Bench 2.082.0%自己申告
OSWorld-Verified79.6%自己申告
SWE-Bench Pro77.8%自己申告
SWE-Bench Multimodal59.0%自己申告

Biology

GPQA94.6%自己申告

Code

SWE-Bench Verified93.9%自己申告
SWE-bench Multilingual87.3%自己申告

General

MMMLU92.7%自己申告

Healthcare

FigQA89.0%自己申告

Long Context

Graphwalks BFS >128k80.0%自己申告

Math

USAMO2597.6%自己申告
Humanity's Last Exam64.7%自己申告

Multimodal

CharXiv-R93.2%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Biology
90
Chemistry
90
Frontend Development
90
General
90
Healthcare
90
Language
90
Multimodal
90
Physics
90
Reasoning
90
Safety
90
Search
90
Spatial Reasoning
80
Tool Calling
80
Vision
80
Agents
80
Code
80
Long Context
80
Math
80

価格設定

価格データがありません

速度

速度データがありません

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク