메인 콘텐츠로 건너뛰기

Qwen3.5 35B A3B (Reasoning)

AlibabaQwen

출시일

2026-02-24

파라미터

—

컨텍스트 길이

262K

모달리티

audio, image, text, video

능력 레이더

27

general

38

coding

85

reasoning

55

science추정

60

agents

80

multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인	#순위	점수	소스
코딩 랭킹	117	63.0	AA
종합 랭킹	89	68.0	AA
과학	93	63.0	AA

벤치마크 점수 (LLM Stats)

3d

SUNRGBD

0.33 / 100자체 보고

Hypersim

0.13 / 100자체 보고

Agents

t2-bench

81.2%자체 보고

AndroidWorld_SR

71.1%자체 보고

BFCL-V4

67.3%자체 보고

BrowseComp

61.0%자체 보고

FullStackBench en

58.1%자체 보고

WideSearch

57.1%자체 보고

TIR-Bench

55.5%자체 보고

FullStackBench zh

55.0%자체 보고

OSWorld-Verified

54.5%자체 보고

Terminal-Bench 2.0

40.5%자체 보고

VITA-Bench

31.9%자체 보고

DeepPlanning

22.8%자체 보고

Biology

GPQA

84.2%자체 보고

Chemistry

SuperGPQA

63.4%자체 보고

Code

SWE-Bench Verified

69.2%자체 보고

Communication

Multi-Challenge

60.0%자체 보고

Embodied

EmbSpatialBench

0.83 / 100자체 보고

Finance

MMLU-Pro

85.3%자체 보고

MMLU-ProX

81.0%자체 보고

General

MMLU-Redux

93.3%자체 보고

IFEval

91.9%자체 보고

C-Eval

90.2%자체 보고

MAXIFE

86.6%자체 보고

Global PIQA

86.6%자체 보고

MMMLU

85.2%자체 보고

MMStar

81.9%자체 보고

MMMU

81.4%자체 보고

Include

79.7%자체 보고

MMMU-Pro

75.1%자체 보고

LiveCodeBench v6

74.6%자체 보고

IFBench

70.2%자체 보고

LongBench v2

59.0%자체 보고

SimpleVQA

0.58 / 100자체 보고

NOVA-63

57.1%자체 보고

Grounding

RefCOCO-avg

0.89 / 100자체 보고

ScreenSpot Pro

68.6%자체 보고

RefSpatialBench

0.64 / 100자체 보고

Healthcare

VideoMMMU

80.4%자체 보고

SlakeVQA

78.7%자체 보고

PMC-VQA

62.0%자체 보고

MedXpertQA

61.4%자체 보고

Image To Text

OCRBench

91.0%자체 보고

Language

LingoQA

79.2%자체 보고

WMT24++

76.3%자체 보고

Long Context

MLVU

85.6%자체 보고

LVBench

71.4%자체 보고

MMLongBench-Doc

0.59 / 100자체 보고

AA-LCR

58.5%자체 보고

Math

HMMT25

89.2%자체 보고

HMMT 2025

89.0%자체 보고

MathVista-Mini

86.2%자체 보고

DynaMath

85.0%자체 보고

MathVision

83.9%자체 보고

CodeForces

0.82 / 3000자체 보고

PolyMATH

64.4%자체 보고

Humanity's Last Exam

47.4%자체 보고

Multimodal

VLMsAreBlind

97.0%자체 보고

V*

92.7%자체 보고

AI2D

92.6%자체 보고

MMBench-V1.1

91.5%자체 보고

OmniDocBench 1.5

89.3%자체 보고

VideoMME w sub.

86.6%자체 보고

VideoMME w/o sub.

82.5%자체 보고

CC-OCR

80.7%자체 보고

CharXiv-R

77.5%자체 보고

MVBench

74.8%자체 보고

MMVU

72.3%자체 보고

BabyVision

38.4%자체 보고

ZEROBench-Sub

0.34 / 100자체 보고

Nuscene

14.6%자체 보고

ZEROBench

0.08 / 100자체 보고

Reasoning

CountBench

0.98 / 100자체 보고

BrowseComp-zh

69.5%자체 보고

Hallusion Bench

67.9%자체 보고

ERQA

64.8%자체 보고

Seal-0

41.4%자체 보고

OJBench

36.0%자체 보고

Spatial Reasoning

RealWorldQA

84.1%자체 보고

Vision

ODinW

42.6%자체 보고

AA 평가 지수

Intelligence Index

29.3

Tau2

0.9

Gpqa

0.8

Ifbench

0.7

Lcr

0.6

Scicode

0.4

Terminalbench Hard

0.3

Hle

0.2

LLM Stats 카테고리 점수

Image To Text

80

Instruction Following

80

Language

80

Legal

80

Math

80

Physics

80

Structured Output

80

Embodied

80

Finance

80

General

80

Biology

80

Text-to-image

80

Video

80

Long Context

70

Multimodal

70

Reasoning

70

Spatial Reasoning

70

Frontend Development

70

Grounding

70

Healthcare

70

Chemistry

70

Vision

70

Search

60

Code

60

Communication

60

Economics

60

Tool Calling

60

Agents

50

3d

20

Spatial

10

가격

입력 가격$0.25 / 1M 토큰

출력 가격$2 / 1M 토큰

혼합 가격 (3:1)$0.688 / 1M 토큰

속도

토큰/초168.2

첫 토큰 지연1.29s

첫 응답 지연13.19s

공급자 가격 순위

공급자 가격 순위

1개 공급자

공급자입력출력

1Alibaba주요

$0.25

$2

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크

Artificial Analysis