Qwen2.5 Max

AlibabaQwen

リリース日

2025-01-28

パラメータ

—

コンテキスト長

262K

モダリティ

audio, image, text, video

能力レーダー

general

coding

reasoning

science推定

agents

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ベンチマークスコア (LLM Stats)

3d

SUNRGBD

0.36 / 100自己申告

Hypersim

0.13 / 100自己申告

Agents

GDPval-AA

985.00 / 3000自己申告

t2-bench

79.5%自己申告

BFCL-V4

72.2%自己申告

AndroidWorld_SR

66.4%自己申告

BrowseComp

63.8%自己申告

FullStackBench en

62.6%自己申告

WideSearch

60.5%自己申告

FullStackBench zh

58.7%自己申告

OSWorld-Verified

58.0%自己申告

TIR-Bench

53.2%自己申告

Terminal-Bench 2.0

49.4%自己申告

VITA-Bench

33.6%自己申告

DeepPlanning

24.1%自己申告

Biology

GPQA

86.6%自己申告

Chemistry

SuperGPQA

67.1%自己申告

Code

SWE-Bench Verified

72.0%自己申告

Communication

Multi-Challenge

61.5%自己申告

Embodied

EmbSpatialBench

0.84 / 100自己申告

Finance

MMLU-Pro

86.7%自己申告

MMLU-ProX

82.2%自己申告

General

MMLU-Redux

94.0%自己申告

IFEval

93.4%自己申告

C-Eval

91.9%自己申告

Global PIQA

88.4%自己申告

MAXIFE

87.9%自己申告

MMMLU

86.7%自己申告

MMMU

83.9%自己申告

MMStar

82.9%自己申告

Include

82.8%自己申告

LiveCodeBench v6

78.9%自己申告

MMMU-Pro

76.9%自己申告

IFBench

76.1%自己申告

SimpleVQA

0.62 / 100自己申告

LongBench v2

60.2%自己申告

NOVA-63

58.6%自己申告

Grounding

RefCOCO-avg

0.91 / 100自己申告

ScreenSpot Pro

70.4%自己申告

RefSpatialBench

0.69 / 100自己申告

Healthcare

VideoMMMU

82.0%自己申告

SlakeVQA

81.6%自己申告

MedXpertQA

67.3%自己申告

PMC-VQA

63.3%自己申告

Image To Text

OCRBench

92.1%自己申告

Language

LingoQA

80.8%自己申告

WMT24++

78.3%自己申告

Long Context

MLVU

87.3%自己申告

LVBench

74.4%自己申告

AA-LCR

66.9%自己申告

MMLongBench-Doc

0.59 / 100自己申告

Math

HMMT 2025

91.4%自己申告

HMMT25

90.3%自己申告

MathVista-Mini

87.4%自己申告

MathVision

86.2%自己申告

DynaMath

85.9%自己申告

CodeForces

0.85 / 3000自己申告

PolyMATH

68.9%自己申告

Humanity's Last Exam

47.5%自己申告

Multimodal

VLMsAreBlind

96.7%自己申告

AI2D

93.3%自己申告

93.2%自己申告

MMBench-V1.1

92.8%自己申告

OmniDocBench 1.5

89.8%自己申告

VideoMME w sub.

87.3%自己申告

VideoMME w/o sub.

83.9%自己申告

CC-OCR

81.8%自己申告

CharXiv-R

77.2%自己申告

MVBench

76.6%自己申告

MMVU

74.7%自己申告

BabyVision

40.2%自己申告

ZEROBench-Sub

0.36 / 100自己申告

Nuscene

15.4%自己申告

ZEROBench

0.09 / 100自己申告

Reasoning

CountBench

0.97 / 100自己申告

BrowseComp-zh

69.9%自己申告

Hallusion Bench

67.6%自己申告

ERQA

62.0%自己申告

Seal-0

44.1%自己申告

OJBench

39.5%自己申告

Spatial Reasoning

RealWorldQA

85.1%自己申告

Vision

ODinW

44.5%自己申告

AA評価指数

Intelligence Index

10.2

Math 500

0.8

Mmlu Pro

0.8

Gpqa

0.6

Livecodebench

0.4

Scicode

0.3

Aime

0.2

Hle

0.0

LLM Statsカテゴリスコア

Legal

100

Finance

100

Agents

General

Reasoning

Biology

Image To Text

Instruction Following

Language

Math

Physics

Structured Output

Embodied

Grounding

Healthcare

Chemistry

Text-to-image

Video

Long Context

Multimodal

Spatial Reasoning

Frontend Development

Economics

Vision

Code

Communication

Tool Calling

Spatial

価格設定

入力価格$1.6 / 1Mトークン

出力価格$6.4 / 1Mトークン

混合価格（3:1）$2.8 / 1Mトークン

速度

トークン/秒0.0

初トークン遅延0.00s

初回答遅延0.00s

プロバイダー価格ランキング

8 プロバイダー

最安: Helicone最高: Alibaba

プロバイダー入力出力

1Helicone最安

$0.03

$0.09

2Inference

$0.2

3NanoGPT

$0.493

4Alibaba (China)

$0.574

$1.721

5OpenRouter

$0.65

$3.25

6Kilo Gateway

$0.65

$3.25

7ZenMux

8Alibaba

$1.2

$4.8

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク

Artificial Analysis

ドメイン	#順位	スコア	ソース
コーディングランキング	250	39.0	AA
総合ランキング	275	39.0	AA
数学的推論	166	54.0	AA
科学	289	40.0	AA