QvQ-72B-Preview
Alibaba Cloud / Qwen TeamOpen WeightQwen · Commercial OK
描述
An experimental research model focusing on advanced visual reasoning and step-by-step cognitive capabilities. Achieves strong performance on multi-modal science and mathematics tasks, though exhibits some limitations such as potential language mixing and recursive reasoning loops.
發布日期
2024-12-25
參數規模
73.4B
上下文長度
—
支援模態
—
能力雷達圖
70
general
0
coding
50
reasoning
60
science估算
0
agents
60
multimodal
Science 在缺少專門科學評測時使用推理能力代理估算。
排行榜排名
暫無排名資料
基準測試分數 (LLM Stats)
General
MMMU
70.3%自報
Math
MathVista
71.4%自報
MathVision
35.9%自報
OlympiadBench
20.4%自報
AA 評測指數
暫無 AA 評測資料
LLM Stats 分類評分
General70
Healthcare70
Reasoning70
Vision60
Multimodal60
Math50
定價
暫無定價資料
速度
暫無速度資料
可用提供商
(LS 內部計價單位)暫無提供商資料