メインコンテンツへスキップ

Qwen3.7-Plus

Alibaba Cloud / Qwen TeamQwenProprietary

説明

Qwen3.7-Plus is Alibaba Cloud Qwen Team's multimodal agent model that unifies vision and language into a single agent foundation. Built on the Qwen3.7 text backbone, it operates as a multimodal interactive hybrid agent—perceiving real-world scenes, reading screens and operating GUIs, writing code from visual references, navigating mobile apps end-to-end, and answering search-augmented visual questions—while blending GUI and CLI interactions within a single agent loop. It is a versatile coding agent and productivity assistant with full-modality input, generalizing across scaffolds such as Claude Code, OpenClaw, and Qwen Code. Features a 1 million token context window, up to 65,536 output tokens, always-on thinking, and a preserve_thinking mode for agentic tasks. Available via Alibaba Cloud Model Studio (DashScope).

リリース日
2026-05-31
パラメータ
コンテキスト長
1.0M
モダリティ
image, text, video

能力レーダー

53
general
70
coding
70
reasoning
60
science推定
70
agents
90
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力41
59.0
LS
マルチモーダルランキング49
75.0
LS
推論70
58.0
LS

ベンチマークスコア (LLM Stats)

Agents

GDPval-AA946.00 / 3000自己申告
SpreadSheetBench-v186.3%自己申告
AndroidWorld81.0%自己申告
OSWorld-Verified73.3%自己申告
MCP Atlas73.2%自己申告
BFCL-V472.9%自己申告
Terminal-Bench 2.070.3%自己申告
CoWorkBench65.1%自己申告
Claw-Eval62.7%自己申告
DeepPlanning62.3%自己申告
QwenWorldBench62.1%自己申告
QwenClawBench61.8%自己申告
MCP-Mark58.7%自己申告
SWE-Bench Pro57.6%自己申告
ClawEval-MM55.7%自己申告
SkillsBench54.9%自己申告
VITA-Bench45.6%自己申告
MMSearch-Plus41.4%自己申告
NL2Repo41.1%自己申告
Finance Agent v238.2%自己申告

Biology

GPQA90.3%自己申告
SciCode51.3%自己申告

Chemistry

SuperGPQA71.4%自己申告

Code

SWE-Bench Verified77.7%自己申告
SWE-bench Multilingual75.8%自己申告

Finance

MMLU-Pro88.5%自己申告
MMLU-ProX85.4%自己申告

General

IFEval94.6%自己申告
MMLU-Redux94.5%自己申告
MRCR v291.7%自己申告
Global PIQA90.3%自己申告
LiveCodeBench v689.6%自己申告
MMMLU89.0%自己申告
MAXIFE88.8%自己申告
Include83.0%自己申告
SimpleVQA0.82 / 100自己申告
IFBench79.1%自己申告
MMMU-Pro79.0%自己申告
NOVA-6358.8%自己申告

Grounding

ScreenSpot Pro79.0%自己申告

Healthcare

VideoMMMU85.4%自己申告

Image To Text

OCRBench_V267.1%自己申告

Knowledge

MedXpertQA-MM71.0%自己申告
BC-VL51.1%自己申告
MMBC46.3%自己申告

Language

WMT24++84.6%自己申告
LingoQA83.4%自己申告

Long Context

MLVU87.4%自己申告
LVBench76.2%自己申告

Math

HMMT Feb 2692.9%自己申告
MathVision90.3%自己申告
IMO-AnswerBench86.0%自己申告
PolyMATH84.0%自己申告
Humanity's Last Exam34.7%自己申告
CritPT6.0%自己申告

Multimodal

OmniDocBench 1.591.4%自己申告
Video-MME88.0%自己申告
CharXiv-R85.9%自己申告
HiPhO84.1%自己申告
TVBench78.2%自己申告
VLADBench77.2%自己申告
SURDS77.2%自己申告
CountQA77.0%自己申告
BabyVision70.4%自己申告
WorldVQA61.1%自己申告
VisFactor42.8%自己申告

Reasoning

ERQA69.8%自己申告
Apex22.7%自己申告

Spatial Reasoning

RealWorldQA86.9%自己申告

Vision

ODinW51.1%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Legal
100
Finance
100
Agents
64
General
53
Reasoning
30
Structured Output
90
Instruction Following
90
Language
90
Long Context
90
Productivity
90
Video
90
Spatial Reasoning
80
Multimodal
80
Physics
80
Frontend Development
80
Grounding
80
Healthcare
80
Vision
80
Image To Text
70
Math
70
Biology
70
Chemistry
70
Code
70
Economics
70
Tool Calling
70
Coding
50

価格設定

入力価格$0.5 / 1Mトークン
出力価格$3 / 1Mトークン
混合価格(3:1)$1.125 / 1Mトークン
キャッシュ読み取り価格$0.05 / 1Mトークン
キャッシュ書き込み価格$0.625 / 1Mトークン

速度

速度データがありません

プロバイダー価格ランキング

プロバイダー価格ランキング

6 プロバイダー

最安: NanoGPT最高: Alibaba (China)
プロバイダー入力出力
1NanoGPT最安
$0.4
$1.6
2OpenCode Go
$0.4
$1.6
3LLM Gateway
$0.4
$1.6
4Alibaba Cloud / Qwen Teamプライマリ
$0.5
$3
5Alibaba
$0.5
$3
6Alibaba (China)
$0.5
$3

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク