メインコンテンツへスキップ

Seed 2.1 Pro

ByteDanceProprietary

説明

ByteDance's flagship next-generation agent model built for real-world productivity. A deep-thinking model with strong demand understanding, long-horizon planning, and continuous self-repair, it delivers reliable end-to-end results across complex coding, long-chain agents, and multi-step engineering workflows. Seed 2.1 Pro also advances knowledge, reasoning, and multimodal understanding, with SOTA results across several video understanding benchmarks. Served via Volcano Engine as Doubao-Seed-2.1-pro.

リリース日
2026-06-24
パラメータ
コンテキスト長
モダリティ

能力レーダー

80
general
60
coding
70
reasoning
51
science推定
70
agents
70
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力38
60.0
LS
マルチモーダルランキング70
70.0
LS
推論79
56.0
LS

ベンチマークスコア (LLM Stats)

3d

BLINK81.4%自己申告

Agents

GDPval87.9%自己申告
BrowseComp86.2%自己申告
MCP Atlas83.8%自己申告
OSWorld78.8%自己申告
Web Bench78.4%自己申告
MobileWorld73.1%自己申告
OfficeQA Pro72.2%自己申告
Terminal-Bench 2.171.0%自己申告
CyberGym70.2%自己申告
OneMillion Bench68.8%自己申告
Agent Startup Bench68.8%自己申告
SeedClawBench66.6%自己申告
Trae Error Fix63.3%自己申告
Trae Code Gen62.4%自己申告
WildClawBench61.7%自己申告
xDailyBench61.0%自己申告
Finance Agent v1.160.7%自己申告
SWE-Bench Pro57.5%自己申告
Repo Env55.0%自己申告
PresentBench54.6%自己申告
Workspace Bench53.0%自己申告
Doubao Multi-Turn Bench52.5%自己申告
ClawEval-MM51.0%自己申告
Toolathlon50.6%自己申告
Program Bench50.3%自己申告
NL2Repo47.0%自己申告
CreativeWork42.5%自己申告
Agents' Last Exam41.4%自己申告
SWE-Atlas35.2%自己申告
APEX-Agents33.8%自己申告
DeepSWE32.7%自己申告
GameWorld31.2%自己申告
PostTrainBench16.5%自己申告

Biology

SciCode59.8%自己申告

Chemistry

SuperGPQA70.8%自己申告
SuperChem59.8%自己申告

Code

Artifacts Bench51.0%自己申告
FrontierCS46.3%自己申告

Coding

AetherCode65.8%自己申告
Image2FloorPlan48.0%自己申告

Embodied

EmbSpatialBench0.83 / 100自己申告

General

MMMU-Pro82.7%自己申告
SimpleVQA0.74 / 100自己申告
MSQA50.2%自己申告
KINA48.3%自己申告

Image To Text

OCRBench_V263.2%自己申告

Knowledge

VideoSimpleQA76.4%自己申告
WorldBench67.6%自己申告

Long Context

DUDE82.8%自己申告
LongVideoBench80.6%自己申告
MMLongBench-128K78.3%自己申告
LVBench78.0%自己申告

Math

MathVision94.5%自己申告
MathVista90.7%自己申告
MathVerse89.7%自己申告
Beyond AIME87.0%自己申告
EMMA79.3%自己申告
FrontierScience Olympiad75.0%自己申告
DynaMath73.1%自己申告
IMO 20250.65 / 42自己申告
Humanity's Last Exam55.7%自己申告
IMOProof-Adv54.3%自己申告
MathArena Apex31.3%自己申告
LiveMathematicianBench20.9%自己申告
HorizonMath2.0%自己申告

Multimodal

CharXiv-D95.5%自己申告
Video-MME89.2%自己申告
CharXiv-R86.4%自己申告
VLMsAreBiased83.6%自己申告
OVOBench80.7%自己申告
TVBench80.5%自己申告
TOMATO79.5%自己申告
LiveSports-3K76.8%自己申告
MotionBench74.9%自己申告
BabyVision73.7%自己申告
TreeBench71.1%自己申告
ChartQAPro70.9%自己申告
Minerva70.7%自己申告
OVBench70.0%自己申告
VideoHolmes68.2%自己申告
CrossVid65.0%自己申告
ContPhy63.6%自己申告
MeasureBench62.9%自己申告
ZEROBench0.56 / 100自己申告
VisuLogic0.54 / 100自己申告
WorldVQA53.0%自己申告
VisFactor51.4%自己申告
MMSIBench35.9%自己申告

Physics

IPhO 202579.3%自己申告

Reasoning

ERQA72.0%自己申告
ArcAGI262.5%自己申告
FrontierScience Research28.3%自己申告

Spatial Reasoning

RealWorldQA86.7%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Structured Output
100
Search
90
Legal
80
Long Context
80
Spatial Reasoning
80
Embodied
80
Finance
80
General
80
3d
80
Image To Text
70
Math
70
Multimodal
70
Physics
70
Reasoning
70
Safety
70
Healthcare
70
Chemistry
70
Economics
70
Tool Calling
70
Video
70
Vision
70
Agents
60
Biology
60
Code
60
Frontend Development
50
Coding
50
Science
30
Systems
20

価格設定

価格データがありません

速度

速度データがありません

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク