Passer au contenu principal

QvQ-72B-Preview

Alibaba Cloud / Qwen TeamOpen WeightQwen · Commercial OK

Description

An experimental research model focusing on advanced visual reasoning and step-by-step cognitive capabilities. Achieves strong performance on multi-modal science and mathematics tasks, though exhibits some limitations such as potential language mixing and recursive reasoning loops.

Date de sortie
2024-12-25
Paramètres
73.4B
Longueur du contexte
Modalités

Radar de capacités

70
general
0
coding
50
reasoning
60
scienceest.
0
agents
60
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Aucune donnée de classement disponible

Scores de benchmarks (LLM Stats)

General

MMMU70.3%Aut.

Math

MathVista71.4%Aut.
MathVision35.9%Aut.
OlympiadBench20.4%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

General
70
Healthcare
70
Reasoning
70
Vision
60
Multimodal
60
Math
50

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes