QvQ-72B-Preview
Alibaba Cloud / Qwen TeamOpen WeightQwen · Usage Commercial
Description
An experimental research model focusing on advanced visual reasoning and step-by-step cognitive capabilities. Achieves strong performance on multi-modal science and mathematics tasks, though exhibits some limitations such as potential language mixing and recursive reasoning loops.
Date de sortie
2024-12-25
Paramètres
73.4B
Longueur du contexte
—
Modalités
—
Radar de capacités
70
general
0
coding
50
reasoning
60
scienceest.
35
agents
60
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
Aucune donnée de classement disponible
Scores de benchmarks (LLM Stats)
General
MMMU
70.3%Aut.
Math
MathVista
71.4%Aut.
MathVision
35.9%Aut.
OlympiadBench
20.4%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Reasoning70
General70
Healthcare70
Multimodal60
Vision60
Math50
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Classement des Prix par Fournisseur
Aucune donnée de fournisseur disponible