Step3 VL 10B
StepFunOpen WeightApache 2.0 · Commercial OK
Descripción
STEP3-VL-10B is a lightweight open-source foundation model designed to redefine the trade-off between compact efficiency and frontier-level multimodal intelligence. Built on a unified, fully unfrozen pre-training strategy on 1.2T multimodal tokens integrating a language-aligned Perception Encoder with a Qwen3-8B decoder. Features Parallel Coordinated Reasoning (PaCoRe) to scale test-time compute for complex perceptual reasoning.
Fecha de lanzamiento
2026-01-20
Parámetros
10.0B
Longitud del contexto
—
Modalidades
—
Radar de capacidades
14
general
17
coding
69
reasoning
44
scienceest.
0
agents
85
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 393 | 14.0 | AA |
| General Ranking | 386 | 27.0 | AA |
| Multimodal Ranking | 7 | 92.0 | LS |
| Science | 192 | 48.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Communication
Multi-Challenge
62.6%Aut.
General
MMMU
78.1%Aut.
Math
AIME 2025
87.7%Aut.
MathVista
84.0%Aut.
MathVision
70.8%Aut.
Multimodal
MMBench
91.8%Aut.
Índices de evaluación AA
Intelligence Index15.4
Coding Index13.9
Gpqa0.7
Ifbench0.5
Scicode0.3
Tau20.2
Hle0.1
Terminalbench Hard0.1
Lcr0.0
Puntuaciones por categoría LLM Stats
Vision80
General80
Healthcare80
Math80
Multimodal80
Reasoning80
Communication60
Precios
Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Velocidad
Tokens/seg0.0 tokens/s
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles