QwQ 32B
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
Description
A model focused on advancing AI reasoning capabilities, particularly excelling in mathematics and programming. Features deep introspection and self-questioning abilities while having some limitations in language mixing and recursive/endless reasoning patterns.
Date de sortie
2025-03-05
Paramètres
32.5B
Longueur du contexte
—
Modalités
—
Radar de capacités
35
general
57
coding
54
reasoning
41
scienceest.
70
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Code Ranking | 147 | 51.0 | AA |
| General Ranking | 236 | 44.0 | AA |
| Math Reasoning | 171 | 53.0 | AA |
| Science | 233 | 45.0 | AA |
Scores de benchmarks (LLM Stats)
Biology
GPQA
65.2%Aut.
Code
LiveCodeBench
63.4%Aut.
General
IFEval
83.9%Aut.
LiveBench
73.1%Aut.
BFCL
66.4%Aut.
Math
MATH-500
90.6%Aut.
AIME 2024
79.5%Aut.
Indices d'évaluation AA
Math Index29.0
Intelligence Index19.7
Math 5001.0
Aime0.8
Mmlu Pro0.8
Livecodebench0.6
Gpqa0.6
Ifbench0.4
Scicode0.4
Aime 250.3
Lcr0.3
Hle0.1
Scores par catégorie LLM Stats
Structured Output80
Instruction Following80
Math80
Tool Calling70
Biology70
Chemistry70
General70
Physics70
Reasoning70
Code60
Tarification
Prix d'entrée$0.66 / 1M tokens
Prix de sortie$1 / 1M tokens
Prix mixte (3:1)$0.745 / 1M tokens
Vitesse
Tokens/sec31.7 tokens/s
Délai du premier token0.40s
Temps de réponse79.07s
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible