QvQ-72B-Preview

Alibaba Cloud / Qwen TeamOpen WeightQwen · Usage Commercial

Description

An experimental research model focusing on advanced visual reasoning and step-by-step cognitive capabilities. Achieves strong performance on multi-modal science and mathematics tasks, though exhibits some limitations such as potential language mixing and recursive reasoning loops.

Date de sortie

2024-12-25

Paramètres

73.4B

Longueur du contexte

—

Modalités

—

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Aucune donnée de classement disponible

Scores de benchmarks (LLM Stats)

General

MMMU

70.3%Aut.

Math

MathVista

71.4%Aut.

MathVision

35.9%Aut.

OlympiadBench

20.4%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Reasoning

General

Healthcare

Multimodal

Vision

Math

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes

LLM Stats Artificial Analysis