Passer au contenu principal

Step3 VL 10B

StepFunOpen WeightApache 2.0 · Usage Commercial

Description

STEP3-VL-10B is a lightweight open-source foundation model designed to redefine the trade-off between compact efficiency and frontier-level multimodal intelligence. Built on a unified, fully unfrozen pre-training strategy on 1.2T multimodal tokens integrating a language-aligned Perception Encoder with a Qwen3-8B decoder. Features Parallel Coordinated Reasoning (PaCoRe) to scale test-time compute for complex perceptual reasoning.

Date de sortie
2026-01-20
Paramètres
10.0B
Longueur du contexte
Modalités

Radar de capacités

10
general
31
coding
69
reasoning
44
scienceest.
58
agents
85
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage479
4.0
AA
Classement général418
24.0
AA
Classement multimodal7
92.0
LS
Science221
46.0
AA

Scores de benchmarks (LLM Stats)

Communication

Multi-Challenge62.6%Aut.

General

MMMU78.1%Aut.

Math

AIME 202587.7%Aut.
MathVista84.0%Aut.
MathVision70.8%Aut.

Multimodal

MMBench91.8%Aut.

Indices d'évaluation AA

Intelligence Index
9.5
Gpqa
0.7
Ifbench
0.5
Scicode
0.3
Tau2
0.2
Hle
0.1
Terminalbench Hard
0.1
Lcr
0.0

Scores par catégorie LLM Stats

Math
80
Multimodal
80
Reasoning
80
General
80
Healthcare
80
Vision
80
Communication
60

Tarification

Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes