Step3 VL 10B
StepFun오픈 웨이트Apache 2.0 · 상업적 사용 가능
설명
STEP3-VL-10B is a lightweight open-source foundation model designed to redefine the trade-off between compact efficiency and frontier-level multimodal intelligence. Built on a unified, fully unfrozen pre-training strategy on 1.2T multimodal tokens integrating a language-aligned Perception Encoder with a Qwen3-8B decoder. Features Parallel Coordinated Reasoning (PaCoRe) to scale test-time compute for complex perceptual reasoning.
출시일
2026-01-20
파라미터
10.0B
컨텍스트 길이
—
모달리티
—
능력 레이더
10
general
31
coding
69
reasoning
44
science추정
58
agents
85
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
벤치마크 점수 (LLM Stats)
Communication
Multi-Challenge
62.6%자체 보고
General
MMMU
78.1%자체 보고
Math
AIME 2025
87.7%자체 보고
MathVista
84.0%자체 보고
MathVision
70.8%자체 보고
Multimodal
MMBench
91.8%자체 보고
AA 평가 지수
Intelligence Index9.5
Gpqa0.7
Ifbench0.5
Scicode0.3
Tau20.2
Hle0.1
Terminalbench Hard0.1
Lcr0.0
LLM Stats 카테고리 점수
Math80
Multimodal80
Reasoning80
General80
Healthcare80
Vision80
Communication60
가격
입력 가격무료
출력 가격무료
혼합 가격 (3:1)무료
속도
토큰/초0.0
첫 토큰 지연0.00s
첫 응답 지연0.00s
공급자 가격 순위
프로바이더 데이터가 없습니다