Step3 VL 10B
StepFunOpen WeightApache 2.0 · Usage Commercial
Description
STEP3-VL-10B is a lightweight open-source foundation model designed to redefine the trade-off between compact efficiency and frontier-level multimodal intelligence. Built on a unified, fully unfrozen pre-training strategy on 1.2T multimodal tokens integrating a language-aligned Perception Encoder with a Qwen3-8B decoder. Features Parallel Coordinated Reasoning (PaCoRe) to scale test-time compute for complex perceptual reasoning.
Date de sortie
2026-01-20
Paramètres
10.0B
Longueur du contexte
—
Modalités
—
Radar de capacités
10
general
31
coding
69
reasoning
44
scienceest.
58
agents
85
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement codage | 479 | 4.0 | AA |
| Classement général | 418 | 24.0 | AA |
| Classement multimodal | 7 | 92.0 | LS |
| Science | 221 | 46.0 | AA |
Scores de benchmarks (LLM Stats)
Communication
Multi-Challenge
62.6%Aut.
General
MMMU
78.1%Aut.
Math
AIME 2025
87.7%Aut.
MathVista
84.0%Aut.
MathVision
70.8%Aut.
Multimodal
MMBench
91.8%Aut.
Indices d'évaluation AA
Intelligence Index9.5
Gpqa0.7
Ifbench0.5
Scicode0.3
Tau20.2
Hle0.1
Terminalbench Hard0.1
Lcr0.0
Scores par catégorie LLM Stats
Math80
Multimodal80
Reasoning80
General80
Healthcare80
Vision80
Communication60
Tarification
Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit
Vitesse
Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s
Classement des Prix par Fournisseur
Aucune donnée de fournisseur disponible