메인 콘텐츠로 건너뛰기

Seed 2.1 Pro

ByteDanceProprietary

설명

ByteDance's flagship next-generation agent model built for real-world productivity. A deep-thinking model with strong demand understanding, long-horizon planning, and continuous self-repair, it delivers reliable end-to-end results across complex coding, long-chain agents, and multi-step engineering workflows. Seed 2.1 Pro also advances knowledge, reasoning, and multimodal understanding, with SOTA results across several video understanding benchmarks. Served via Volcano Engine as Doubao-Seed-2.1-pro.

출시일
2026-06-24
파라미터
컨텍스트 길이
모달리티

능력 레이더

80
general
60
coding
70
reasoning
51
science추정
70
agents
70
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
에이전트형 역량38
60.0
LS
멀티모달 랭킹70
70.0
LS
추론79
56.0
LS

벤치마크 점수 (LLM Stats)

3d

BLINK81.4%자체 보고

Agents

GDPval87.9%자체 보고
BrowseComp86.2%자체 보고
MCP Atlas83.8%자체 보고
OSWorld78.8%자체 보고
Web Bench78.4%자체 보고
MobileWorld73.1%자체 보고
OfficeQA Pro72.2%자체 보고
Terminal-Bench 2.171.0%자체 보고
CyberGym70.2%자체 보고
OneMillion Bench68.8%자체 보고
Agent Startup Bench68.8%자체 보고
SeedClawBench66.6%자체 보고
Trae Error Fix63.3%자체 보고
Trae Code Gen62.4%자체 보고
WildClawBench61.7%자체 보고
xDailyBench61.0%자체 보고
Finance Agent v1.160.7%자체 보고
SWE-Bench Pro57.5%자체 보고
Repo Env55.0%자체 보고
PresentBench54.6%자체 보고
Workspace Bench53.0%자체 보고
Doubao Multi-Turn Bench52.5%자체 보고
ClawEval-MM51.0%자체 보고
Toolathlon50.6%자체 보고
Program Bench50.3%자체 보고
NL2Repo47.0%자체 보고
CreativeWork42.5%자체 보고
Agents' Last Exam41.4%자체 보고
SWE-Atlas35.2%자체 보고
APEX-Agents33.8%자체 보고
DeepSWE32.7%자체 보고
GameWorld31.2%자체 보고
PostTrainBench16.5%자체 보고

Biology

SciCode59.8%자체 보고

Chemistry

SuperGPQA70.8%자체 보고
SuperChem59.8%자체 보고

Code

Artifacts Bench51.0%자체 보고
FrontierCS46.3%자체 보고

Coding

AetherCode65.8%자체 보고
Image2FloorPlan48.0%자체 보고

Embodied

EmbSpatialBench0.83 / 100자체 보고

General

MMMU-Pro82.7%자체 보고
SimpleVQA0.74 / 100자체 보고
MSQA50.2%자체 보고
KINA48.3%자체 보고

Image To Text

OCRBench_V263.2%자체 보고

Knowledge

VideoSimpleQA76.4%자체 보고
WorldBench67.6%자체 보고

Long Context

DUDE82.8%자체 보고
LongVideoBench80.6%자체 보고
MMLongBench-128K78.3%자체 보고
LVBench78.0%자체 보고

Math

MathVision94.5%자체 보고
MathVista90.7%자체 보고
MathVerse89.7%자체 보고
Beyond AIME87.0%자체 보고
EMMA79.3%자체 보고
FrontierScience Olympiad75.0%자체 보고
DynaMath73.1%자체 보고
IMO 20250.65 / 42자체 보고
Humanity's Last Exam55.7%자체 보고
IMOProof-Adv54.3%자체 보고
MathArena Apex31.3%자체 보고
LiveMathematicianBench20.9%자체 보고
HorizonMath2.0%자체 보고

Multimodal

CharXiv-D95.5%자체 보고
Video-MME89.2%자체 보고
CharXiv-R86.4%자체 보고
VLMsAreBiased83.6%자체 보고
OVOBench80.7%자체 보고
TVBench80.5%자체 보고
TOMATO79.5%자체 보고
LiveSports-3K76.8%자체 보고
MotionBench74.9%자체 보고
BabyVision73.7%자체 보고
TreeBench71.1%자체 보고
ChartQAPro70.9%자체 보고
Minerva70.7%자체 보고
OVBench70.0%자체 보고
VideoHolmes68.2%자체 보고
CrossVid65.0%자체 보고
ContPhy63.6%자체 보고
MeasureBench62.9%자체 보고
ZEROBench0.56 / 100자체 보고
VisuLogic0.54 / 100자체 보고
WorldVQA53.0%자체 보고
VisFactor51.4%자체 보고
MMSIBench35.9%자체 보고

Physics

IPhO 202579.3%자체 보고

Reasoning

ERQA72.0%자체 보고
ArcAGI262.5%자체 보고
FrontierScience Research28.3%자체 보고

Spatial Reasoning

RealWorldQA86.7%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Structured Output
100
Search
90
Legal
80
Long Context
80
Spatial Reasoning
80
Embodied
80
Finance
80
General
80
3d
80
Image To Text
70
Math
70
Multimodal
70
Physics
70
Reasoning
70
Safety
70
Healthcare
70
Chemistry
70
Economics
70
Tool Calling
70
Video
70
Vision
70
Agents
60
Biology
60
Code
60
Frontend Development
50
Coding
50
Science
30
Systems
20

가격

가격 데이터가 없습니다

속도

속도 데이터가 없습니다

공급자 가격 순위

프로바이더 데이터가 없습니다

외부 링크