メインコンテンツへスキップ

Step3 VL 10B

StepFunオープンウエイトApache 2.0 · 商用利用可

説明

STEP3-VL-10B is a lightweight open-source foundation model designed to redefine the trade-off between compact efficiency and frontier-level multimodal intelligence. Built on a unified, fully unfrozen pre-training strategy on 1.2T multimodal tokens integrating a language-aligned Perception Encoder with a Qwen3-8B decoder. Features Parallel Coordinated Reasoning (PaCoRe) to scale test-time compute for complex perceptual reasoning.

リリース日
2026-01-20
パラメータ
10.0B
コンテキスト長
モダリティ

能力レーダー

10
general
31
coding
69
reasoning
44
science推定
58
agents
85
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
コーディングランキング479
4.0
AA
総合ランキング418
24.0
AA
マルチモーダルランキング7
92.0
LS
科学221
46.0
AA

ベンチマークスコア (LLM Stats)

Communication

Multi-Challenge62.6%自己申告

General

MMMU78.1%自己申告

Math

AIME 202587.7%自己申告
MathVista84.0%自己申告
MathVision70.8%自己申告

Multimodal

MMBench91.8%自己申告

AA評価指数

Intelligence Index
9.5
Gpqa
0.7
Ifbench
0.5
Scicode
0.3
Tau2
0.2
Hle
0.1
Terminalbench Hard
0.1
Lcr
0.0

LLM Statsカテゴリスコア

Math
80
Multimodal
80
Reasoning
80
General
80
Healthcare
80
Vision
80
Communication
60

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク