Saltar al contenido principal

QvQ-72B-Preview

Alibaba Cloud / Qwen TeamOpen WeightQwen · Commercial OK

Descripción

An experimental research model focusing on advanced visual reasoning and step-by-step cognitive capabilities. Achieves strong performance on multi-modal science and mathematics tasks, though exhibits some limitations such as potential language mixing and recursive reasoning loops.

Fecha de lanzamiento
2024-12-25
Parámetros
73.4B
Longitud del contexto
Modalidades

Radar de capacidades

70
general
0
coding
50
reasoning
60
scienceest.
0
agents
60
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

No hay datos de ranking disponibles

Puntuaciones de benchmarks (LLM Stats)

General

MMMU70.3%Aut.

Math

MathVista71.4%Aut.
MathVision35.9%Aut.
OlympiadBench20.4%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

General
70
Healthcare
70
Reasoning
70
Vision
60
Multimodal
60
Math
50

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas