Claude Sonnet 4.6 (Non-reasoning, High Effort)
AnthropicClaudeProprietary
설명
Claude Sonnet 4.6 is a full upgrade of the model's skills across coding, computer use, long-context reasoning, agent planning, knowledge work, and design. Users preferred Sonnet 4.6 over Sonnet 4.5 approximately 70% of the time. First Sonnet-class model with 1M token context window (beta) and context compaction. Major improvement in computer use skills compared to prior Sonnet models. Default model on Free and Pro plans. Pricing: $3/$15 per million tokens (input/output).
출시일
2026-02-17
파라미터
—
컨텍스트 길이
1.0M
모달리티
audio, image, text, video
능력 레이더
38
general
46
coding
80
reasoning
55
science추정
80
agents
80
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 31 | 63.0 | LS |
| Code Ranking | 30 | 78.0 | AA |
| General Ranking | 98 | 66.0 | AA |
| Reasoning | 64 | 58.0 | LS |
| Science | 81 | 64.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
GDPval-AA
1633.00 / 3000자체 보고
BrowseComp
74.7%자체 보고
OSWorld
72.5%자체 보고
Finance Agent
63.3%자체 보고
MCP Atlas
61.3%자체 보고
Terminal-Bench 2.0
59.1%자체 보고
Biology
GPQA
89.9%자체 보고
Code
SWE-Bench Verified
79.6%자체 보고
Communication
Tau2 Telecom
97.9%자체 보고
Tau2 Retail
91.7%자체 보고
General
MMMLU
89.3%자체 보고
MMMU-Pro
75.6%자체 보고
Math
Humanity's Last Exam
49.0%자체 보고
Reasoning
ARC-AGI v2
58.3%자체 보고
AA 평가 지수
Coding Index46.4
Intelligence Index44.4
Gpqa0.8
Tau20.8
Lcr0.6
Scicode0.5
Terminalbench Hard0.5
Ifbench0.4
Hle0.1
LLM Stats 카테고리 점수
Legal100
Finance100
General100
Agents100
Reasoning100
Biology90
Chemistry90
Communication90
Language90
Physics90
Tool Calling80
Frontend Development80
Code70
Math70
Multimodal70
Search70
Spatial Reasoning60
Vision60
Long Context50
Healthcare20
가격
입력 가격$3.75 / 1M tokens
출력 가격$15 / 1M tokens
혼합 가격 (3:1)$6.563 / 1M tokens
속도
토큰/초55.5 tokens/s
첫 토큰 지연1.07s
첫 응답 지연1.07s
사용 가능한 프로바이더
(LS 내부 단위)| 프로바이더 | 입력 가격 | 출력 가격 |
|---|---|---|
| Anthropic | 3.0M | 15.0M |