Muse Spark
MetaProprietary
Description
Muse Spark is the first model in the Muse family developed by Meta Superintelligence Labs. It is a natively multimodal reasoning model with support for tool-use, visual chain of thought, and multi-agent orchestration. It features a Contemplating mode that orchestrates multiple agents reasoning in parallel. It demonstrates competitive performance in multimodal perception, reasoning, health, and agentic tasks, with Contemplating mode achieving 58% on Humanity's Last Exam and 38% on FrontierScience Research.
Date de sortie
2026-04-08
Paramètres
—
Longueur du contexte
—
Modalités
—
Radar de capacités
42
general
58
coding
88
reasoning
66
scienceest.
80
agents
70
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Capacité agentique | 67 | 54.0 | LS |
| Classement codage | 33 | 79.0 | AA |
| Classement général | 19 | 81.0 | AA |
| Classement multimodal | 77 | 60.0 | LS |
| Raisonnement | 92 | 50.0 | LS |
| Science | 15 | 84.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
GDPval-AA
1164.00 / 3000Aut.
DeepSearchQA
74.8%Aut.
Terminal-Bench 2.0
59.0%Aut.
SWE-Bench Pro
52.4%Aut.
Biology
GPQA
89.5%Aut.
Code
LiveCodeBench Pro
0.80 / 3000Aut.
SWE-Bench Verified
77.4%Aut.
Communication
Tau2 Telecom
91.5%Aut.
General
MMMU-Pro
80.4%Aut.
SimpleVQA
0.71 / 100Aut.
Grounding
ScreenSpot Pro
84.1%Aut.
Healthcare
MedXpertQA
78.4%Aut.
HealthBench Hard
42.8%Aut.
Math
Humanity's Last Exam
58.4%Aut.
Multimodal
CharXiv-R
86.4%Aut.
ZEROBench
0.33 / 100Aut.
Physics
IPhO 2025
82.6%Aut.
Reasoning
ERQA
64.7%Aut.
ARC-AGI v2
42.5%Aut.
FrontierScience Research
38.3%Aut.
Indices d'évaluation AA
Coding Index58.6
Intelligence Index43.1
Tau20.9
Gpqa0.9
Ifbench0.8
Lcr0.7
Terminalbench V2 10.6
Scicode0.5
Terminalbench Hard0.5
Hle0.4
Tau Banking0.2
Scores par catégorie LLM Stats
Legal100
Finance100
Agents100
General100
Reasoning78
Physics90
Biology90
Chemistry90
Communication90
Frontend Development80
Grounding80
Tool Calling80
Image To Text70
Multimodal70
Search70
Code70
Vision70
Math60
Spatial Reasoning60
Healthcare60
Tarification
Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit
Vitesse
Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s
Classement des Prix par Fournisseur
Aucune donnée de fournisseur disponible