メインコンテンツへスキップ

Step3 VL 10B

StepFunOpen WeightApache 2.0 · Commercial OK

説明

STEP3-VL-10B is a lightweight open-source foundation model designed to redefine the trade-off between compact efficiency and frontier-level multimodal intelligence. Built on a unified, fully unfrozen pre-training strategy on 1.2T multimodal tokens integrating a language-aligned Perception Encoder with a Qwen3-8B decoder. Features Parallel Coordinated Reasoning (PaCoRe) to scale test-time compute for complex perceptual reasoning.

リリース日
2026-01-20
パラメータ
10.0B
コンテキスト長
モダリティ

能力レーダー

14
general
17
coding
69
reasoning
44
science推定
0
agents
85
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking393
14.0
AA
General Ranking386
27.0
AA
Multimodal Ranking7
92.0
LS
Science192
48.0
AA

ベンチマークスコア (LLM Stats)

Communication

Multi-Challenge62.6%自己申告

General

MMMU78.1%自己申告

Math

AIME 202587.7%自己申告
MathVista84.0%自己申告
MathVision70.8%自己申告

Multimodal

MMBench91.8%自己申告

AA評価指数

Intelligence Index
15.4
Coding Index
13.9
Gpqa
0.7
Ifbench
0.5
Scicode
0.3
Tau2
0.2
Hle
0.1
Terminalbench Hard
0.1
Lcr
0.0

LLM Statsカテゴリスコア

Vision
80
General
80
Healthcare
80
Math
80
Multimodal
80
Reasoning
80
Communication
60

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク