Step3 VL 10B
StepFunОткрытые весаApache 2.0 · Коммерческое использование
Описание
STEP3-VL-10B is a lightweight open-source foundation model designed to redefine the trade-off between compact efficiency and frontier-level multimodal intelligence. Built on a unified, fully unfrozen pre-training strategy on 1.2T multimodal tokens integrating a language-aligned Perception Encoder with a Qwen3-8B decoder. Features Parallel Coordinated Reasoning (PaCoRe) to scale test-time compute for complex perceptual reasoning.
Дата выхода
2026-01-20
Параметры
10.0B
Длина контекста
—
Модальности
—
Радар способностей
10
general
31
coding
69
reasoning
44
scienceоцен.
58
agents
85
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 479 | 4.0 | AA |
| Общий рейтинг | 418 | 24.0 | AA |
| Мультимодальный рейтинг | 7 | 92.0 | LS |
| Наука | 221 | 46.0 | AA |
Оценки бенчмарков (LLM Stats)
Communication
Multi-Challenge
62.6%Сам.
General
MMMU
78.1%Сам.
Math
AIME 2025
87.7%Сам.
MathVista
84.0%Сам.
MathVision
70.8%Сам.
Multimodal
MMBench
91.8%Сам.
Индексы оценки AA
Intelligence Index9.5
Gpqa0.7
Ifbench0.5
Scicode0.3
Tau20.2
Hle0.1
Terminalbench Hard0.1
Lcr0.0
Оценки категорий LLM Stats
Math80
Multimodal80
Reasoning80
General80
Healthcare80
Vision80
Communication60
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Нет данных провайдеров