Qwen3.5 122B A10B (Non-reasoning)
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
설명
Qwen3.5-122B-A10B is a multimodal Mixture-of-Experts model with 122 billion total parameters and 10 billion activated parameters. It combines strong reasoning, coding, long-context, and visual understanding performance with production-friendly efficiency and a native 262K context window.
출시일
2026-02-24
파라미터
122.0B
컨텍스트 길이
262K
모달리티
image, text, video
능력 레이더
31
general
32
coding
83
reasoning
53
science추정
60
agents
80
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 45 | 58.0 | LS |
| Code Ranking | 116 | 57.0 | AA |
| General Ranking | 121 | 63.0 | AA |
| Multimodal Ranking | 61 | 70.0 | LS |
| Reasoning | 53 | 68.0 | LS |
| Science | 108 | 59.0 | AA |
벤치마크 점수 (LLM Stats)
3d
SUNRGBD
0.36 / 100자체 보고
Hypersim
0.13 / 100자체 보고
Agents
t2-bench
79.5%자체 보고
BFCL-V4
72.2%자체 보고
AndroidWorld_SR
66.4%자체 보고
BrowseComp
63.8%자체 보고
FullStackBench en
62.6%자체 보고
WideSearch
60.5%자체 보고
FullStackBench zh
58.7%자체 보고
OSWorld-Verified
58.0%자체 보고
TIR-Bench
53.2%자체 보고
Terminal-Bench 2.0
49.4%자체 보고
VITA-Bench
33.6%자체 보고
DeepPlanning
24.1%자체 보고
Biology
GPQA
86.6%자체 보고
Chemistry
SuperGPQA
67.1%자체 보고
Code
SWE-Bench Verified
72.0%자체 보고
Communication
Multi-Challenge
61.5%자체 보고
Embodied
EmbSpatialBench
0.84 / 100자체 보고
Finance
MMLU-Pro
86.7%자체 보고
MMLU-ProX
82.2%자체 보고
General
MMLU-Redux
94.0%자체 보고
IFEval
93.4%자체 보고
C-Eval
91.9%자체 보고
Global PIQA
88.4%자체 보고
MAXIFE
87.9%자체 보고
MMMLU
86.7%자체 보고
MMMU
83.9%자체 보고
MMStar
82.9%자체 보고
Include
82.8%자체 보고
LiveCodeBench v6
78.9%자체 보고
MMMU-Pro
76.9%자체 보고
IFBench
76.1%자체 보고
SimpleVQA
0.62 / 100자체 보고
LongBench v2
60.2%자체 보고
NOVA-63
58.6%자체 보고
Grounding
RefCOCO-avg
0.91 / 100자체 보고
ScreenSpot Pro
70.4%자체 보고
RefSpatialBench
0.69 / 100자체 보고
Healthcare
VideoMMMU
82.0%자체 보고
SlakeVQA
81.6%자체 보고
MedXpertQA
67.3%자체 보고
PMC-VQA
63.3%자체 보고
Image To Text
OCRBench
92.1%자체 보고
Language
LingoQA
80.8%자체 보고
WMT24++
78.3%자체 보고
Long Context
MLVU
87.3%자체 보고
LVBench
74.4%자체 보고
AA-LCR
66.9%자체 보고
MMLongBench-Doc
0.59 / 100자체 보고
Math
HMMT 2025
91.4%자체 보고
HMMT25
90.3%자체 보고
MathVista-Mini
87.4%자체 보고
MathVision
86.2%자체 보고
DynaMath
85.9%자체 보고
CodeForces
0.85 / 3000자체 보고
PolyMATH
68.9%자체 보고
Humanity's Last Exam
47.5%자체 보고
Multimodal
VLMsAreBlind
96.7%자체 보고
AI2D
93.3%자체 보고
V*
93.2%자체 보고
MMBench-V1.1
92.8%자체 보고
OmniDocBench 1.5
89.8%자체 보고
VideoMME w sub.
87.3%자체 보고
VideoMME w/o sub.
83.9%자체 보고
CC-OCR
81.8%자체 보고
CharXiv-R
77.2%자체 보고
MVBench
76.6%자체 보고
MMVU
74.7%자체 보고
BabyVision
40.2%자체 보고
ZEROBench-Sub
0.36 / 100자체 보고
Nuscene
15.4%자체 보고
ZEROBench
0.09 / 100자체 보고
Reasoning
CountBench
0.97 / 100자체 보고
BrowseComp-zh
69.9%자체 보고
Hallusion Bench
67.6%자체 보고
ERQA
62.0%자체 보고
Seal-0
44.1%자체 보고
OJBench
39.5%자체 보고
Spatial Reasoning
RealWorldQA
85.1%자체 보고
Vision
ODinW
44.5%자체 보고
AA 평가 지수
Intelligence Index35.9
Coding Index31.6
Tau20.8
Gpqa0.8
Lcr0.6
Ifbench0.5
Scicode0.4
Terminalbench Hard0.3
Hle0.1
LLM Stats 카테고리 점수
Biology90
Structured Output80
Text-to-image80
Video80
Chemistry80
Embodied80
Finance80
General80
Grounding80
Healthcare80
Image To Text80
Instruction Following80
Language80
Legal80
Math80
Physics80
Spatial Reasoning70
Vision70
Economics70
Frontend Development70
Long Context70
Multimodal70
Reasoning70
Tool Calling60
Agents60
Code60
Communication60
Search60
Spatial20
3d20
가격
입력 가격$0.4 / 1M tokens
출력 가격$3.2 / 1M tokens
혼합 가격 (3:1)$1.1 / 1M tokens
속도
토큰/초146.3 tokens/s
첫 토큰 지연1.23s
첫 응답 지연1.23s
사용 가능한 프로바이더
(LS 내부 단위)| 프로바이더 | 입력 가격 | 출력 가격 |
|---|---|---|
| Novita | 400K | 3.2M |