GLM-4.7 (Reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
설명
GLM 4.7 is a coding‑centric model that thinks before acting, preserves its reasoning across turns, and lets you control thinking per request for speed or accuracy. It upgrades agentic workflows with stronger multi‑step tool use, better terminal and multilingual coding, and a noticeable jump in UI output quality for modern, clean webpages and slides. You can use it in popular coding agents, call it via the Z.ai API, and even run it locally with public weights on HuggingFace and ModelScope using vLLM or SGLang.
출시일
2025-12-22
파라미터
358.0B
컨텍스트 길이
203K
모달리티
text
능력 레이더
53
general
56
coding
93
reasoning
59
science추정
60
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 59 | 55.0 | LS |
| Code Ranking | 57 | 71.0 | AA |
| General Ranking | 39 | 81.0 | AA |
| Math Reasoning | 13 | 96.0 | AA |
| Reasoning | 55 | 67.0 | LS |
| Science | 44 | 74.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
Tau-bench
87.4%자체 보고
BrowseComp
52.0%자체 보고
Terminal-Bench 2.0
41.0%자체 보고
Terminal-Bench
33.3%자체 보고
Biology
GPQA
85.7%자체 보고
Code
SWE-Bench Verified
73.8%자체 보고
SWE-bench Multilingual
66.7%자체 보고
Finance
MMLU-Pro
84.3%자체 보고
General
LiveCodeBench v6
84.9%자체 보고
Math
AIME 2025
95.7%자체 보고
IMO-AnswerBench
82.0%자체 보고
Humanity's Last Exam
42.8%자체 보고
Reasoning
BrowseComp-zh
66.6%자체 보고
AA 평가 지수
Math Index95.0
Intelligence Index42.1
Coding Index36.3
Tau21.0
Aime 250.9
Livecodebench0.9
Gpqa0.9
Mmlu Pro0.9
Ifbench0.7
Lcr0.6
Scicode0.5
Terminalbench Hard0.3
Hle0.3
LLM Stats 카테고리 점수
Biology90
Chemistry90
General90
Physics90
Finance80
Healthcare80
Language80
Legal80
Math80
Frontend Development70
Reasoning70
Tool Calling60
Search60
Agents50
Code50
Vision40
가격
입력 가격$0.6 / 1M tokens
출력 가격$2.2 / 1M tokens
혼합 가격 (3:1)$1 / 1M tokens
속도
토큰/초91.5 tokens/s
첫 토큰 지연0.90s
첫 응답 지연22.74s
사용 가능한 프로바이더
(LS 내부 단위)| 프로바이더 | 입력 가격 | 출력 가격 |
|---|---|---|
| Novita | 600K | 2.2M |
| Fireworks | 600K | 2.2M |