Qwen3 4B (Non-reasoning)

AlibabaQwen

रिलीज़ तिथि

2025-04-28

पैरामीटर

—

संदर्भ लंबाई

262K

मोडैलिटीज़

audio, image, text, video

क्षमता रडार

general

coding

reasoning

scienceअनुमानित

agents

multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन	#रैंक	स्कोर	स्रोत
कोडिंग रैंकिंग	332	25.0	AA
सामान्य रैंकिंग	396	28.0	AA
गणितीय तर्क	174	53.0	AA
विज्ञान	428	23.0	AA

बेंचमार्क स्कोर (LLM Stats)

3d

SUNRGBD

0.33 / 100स्वयं

Hypersim

0.13 / 100स्वयं

Agents

t2-bench

81.2%स्वयं

AndroidWorld_SR

71.1%स्वयं

BFCL-V4

67.3%स्वयं

BrowseComp

61.0%स्वयं

FullStackBench en

58.1%स्वयं

WideSearch

57.1%स्वयं

TIR-Bench

55.5%स्वयं

FullStackBench zh

55.0%स्वयं

OSWorld-Verified

54.5%स्वयं

Terminal-Bench 2.0

40.5%स्वयं

VITA-Bench

31.9%स्वयं

DeepPlanning

22.8%स्वयं

Biology

GPQA

84.2%स्वयं

Chemistry

SuperGPQA

63.4%स्वयं

Code

SWE-Bench Verified

69.2%स्वयं

Communication

Multi-Challenge

60.0%स्वयं

Embodied

EmbSpatialBench

0.83 / 100स्वयं

Finance

MMLU-Pro

85.3%स्वयं

MMLU-ProX

81.0%स्वयं

General

MMLU-Redux

93.3%स्वयं

IFEval

91.9%स्वयं

C-Eval

90.2%स्वयं

MAXIFE

86.6%स्वयं

Global PIQA

86.6%स्वयं

MMMLU

85.2%स्वयं

MMStar

81.9%स्वयं

MMMU

81.4%स्वयं

Include

79.7%स्वयं

MMMU-Pro

75.1%स्वयं

LiveCodeBench v6

74.6%स्वयं

IFBench

70.2%स्वयं

LongBench v2

59.0%स्वयं

SimpleVQA

0.58 / 100स्वयं

NOVA-63

57.1%स्वयं

Grounding

RefCOCO-avg

0.89 / 100स्वयं

ScreenSpot Pro

68.6%स्वयं

RefSpatialBench

0.64 / 100स्वयं

Healthcare

VideoMMMU

80.4%स्वयं

SlakeVQA

78.7%स्वयं

PMC-VQA

62.0%स्वयं

MedXpertQA

61.4%स्वयं

Image To Text

OCRBench

91.0%स्वयं

Language

LingoQA

79.2%स्वयं

WMT24++

76.3%स्वयं

Long Context

MLVU

85.6%स्वयं

LVBench

71.4%स्वयं

MMLongBench-Doc

0.59 / 100स्वयं

AA-LCR

58.5%स्वयं

Math

HMMT25

89.2%स्वयं

HMMT 2025

89.0%स्वयं

MathVista-Mini

86.2%स्वयं

DynaMath

85.0%स्वयं

MathVision

83.9%स्वयं

CodeForces

0.82 / 3000स्वयं

PolyMATH

64.4%स्वयं

Humanity's Last Exam

47.4%स्वयं

Multimodal

VLMsAreBlind

97.0%स्वयं

92.7%स्वयं

AI2D

92.6%स्वयं

MMBench-V1.1

91.5%स्वयं

OmniDocBench 1.5

89.3%स्वयं

VideoMME w sub.

86.6%स्वयं

VideoMME w/o sub.

82.5%स्वयं

CC-OCR

80.7%स्वयं

CharXiv-R

77.5%स्वयं

MVBench

74.8%स्वयं

MMVU

72.3%स्वयं

BabyVision

38.4%स्वयं

ZEROBench-Sub

0.34 / 100स्वयं

Nuscene

14.6%स्वयं

ZEROBench

0.08 / 100स्वयं

Reasoning

CountBench

0.98 / 100स्वयं

BrowseComp-zh

69.5%स्वयं

Hallusion Bench

67.9%स्वयं

ERQA

64.8%स्वयं

Seal-0

41.4%स्वयं

OJBench

36.0%स्वयं

Spatial Reasoning

RealWorldQA

84.1%स्वयं

Vision

ODinW

42.6%स्वयं

AA मूल्यांकन सूचकांक

Intelligence Index

6.8

Math 500

0.8

Mmlu Pro

0.6

Gpqa

0.4

Livecodebench

0.2

Aime

0.2

Scicode

0.2

Hle

0.0

LLM Stats श्रेणी स्कोर

Image To Text

Instruction Following

Language

Legal

Math

Physics

Structured Output

Embodied

Finance

General

Biology

Text-to-image

Video

Long Context

Multimodal

Reasoning

Spatial Reasoning

Frontend Development

Grounding

Healthcare

Chemistry

Vision

Code

Communication

Economics

Tool Calling

Agents

Spatial

मूल्य निर्धारण

इनपुट मूल्य$0.11 / 1M टोकन

आउटपुट मूल्य$0.42 / 1M टोकन

मिश्रित मूल्य (3:1)$0.188 / 1M टोकन

गति

टोकन/सेकंड0.0

पहले टोकन में देरी0.00s

पहले उत्तर में देरी0.00s

प्रदाता मूल्य रैंकिंग

1 प्रदाता

प्रदाताइनपुटआउटपुट

1Alibabaप्राथमिक

$0.11

$0.42

इस मॉडल के लिए विभिन्न API प्रदाताओं के मूल्य निर्धारण की तुलना करें।

बाहरी लिंक

Artificial Analysis