GLM-4.6 (Reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
설명
GLM-4.6 is the latest version of Z.ai's flagship model, bringing significant improvements over GLM-4.5. Key features include: 200K token context window (expanded from 128K), superior coding performance with better real-world application in Claude Code/Cline/Roo Code/Kilo Code, advanced reasoning with tool use during inference, stronger agent capabilities, and refined writing aligned with human preferences. GLM-4.6 achieves competitive performance with DeepSeek-V3.2-Exp and Claude Sonnet 4, reaching near parity with Claude Sonnet 4 (48.6% win rate) on CC-Bench real-world coding tasks.
출시일
2025-09-30
파라미터
357.0B
컨텍스트 길이
205K
모달리티
image, text, video
능력 레이더
45
general
44
coding
85
reasoning
51
science추정
40
agents
20
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 84 | 43.0 | LS |
| Code Ranking | 111 | 58.0 | AA |
| General Ranking | 135 | 61.0 | AA |
| Math Reasoning | 54 | 87.0 | AA |
| Science | 122 | 58.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
BrowseComp
45.1%자체 보고
Terminal-Bench
40.5%자체 보고
Biology
GPQA
81.0%자체 보고
Code
SWE-Bench Verified
68.0%자체 보고
General
LiveCodeBench v6
82.8%자체 보고
Math
AIME 2025
93.9%자체 보고
Humanity's Last Exam
17.2%자체 보고
AA 평가 지수
Math Index86.0
Intelligence Index32.5
Coding Index29.5
Aime 250.9
Mmlu Pro0.8
Gpqa0.8
Tau20.7
Livecodebench0.7
Lcr0.5
Ifbench0.4
Scicode0.4
Terminalbench Hard0.3
Hle0.1
LLM Stats 카테고리 점수
Biology80
Chemistry80
General80
Physics80
Frontend Development70
Math60
Reasoning60
Code50
Search50
Agents40
Vision20
가격
입력 가격$0.55 / 1M tokens
출력 가격$2.2 / 1M tokens
혼합 가격 (3:1)$0.963 / 1M tokens
속도
토큰/초37.2 tokens/s
첫 토큰 지연0.82s
첫 응답 지연54.62s
사용 가능한 프로바이더
(LS 내부 단위)| 프로바이더 | 입력 가격 | 출력 가격 |
|---|---|---|
| Fireworks | 550K | 2.2M |
| DeepInfra | 600K | 2.0M |