QvQ-72B-Preview
Alibaba Cloud / Qwen TeamOpen WeightQwen · Commercial OK
Description
An experimental research model focusing on advanced visual reasoning and step-by-step cognitive capabilities. Achieves strong performance on multi-modal science and mathematics tasks, though exhibits some limitations such as potential language mixing and recursive reasoning loops.
Date de sortie
2024-12-25
Paramètres
73.4B
Longueur du contexte
—
Modalités
—
Radar de capacités
70
general
0
coding
50
reasoning
60
scienceest.
0
agents
60
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
Aucune donnée de classement disponible
Scores de benchmarks (LLM Stats)
General
MMMU
70.3%Aut.
Math
MathVista
71.4%Aut.
MathVision
35.9%Aut.
OlympiadBench
20.4%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
General70
Healthcare70
Reasoning70
Vision60
Multimodal60
Math50
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible