QvQ-72B-Preview

Alibaba Cloud / Qwen TeamOpen WeightQwen · Uso Comercial

Descripción

An experimental research model focusing on advanced visual reasoning and step-by-step cognitive capabilities. Achieves strong performance on multi-modal science and mathematics tasks, though exhibits some limitations such as potential language mixing and recursive reasoning loops.

Fecha de lanzamiento

2024-12-25

Parámetros

73.4B

Longitud del contexto

—

Modalidades

—

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

No hay datos de ranking disponibles

Puntuaciones de benchmarks (LLM Stats)

General

MMMU

70.3%Aut.

Math

MathVista

71.4%Aut.

MathVision

35.9%Aut.

OlympiadBench

20.4%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Reasoning

General

Healthcare

Multimodal

Vision

Math

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas

LLM Stats Artificial Analysis