Muse Spark
MetaProprietary
説明
Muse Spark is the first model in the Muse family developed by Meta Superintelligence Labs. It is a natively multimodal reasoning model with support for tool-use, visual chain of thought, and multi-agent orchestration. It features a Contemplating mode that orchestrates multiple agents reasoning in parallel. It demonstrates competitive performance in multimodal perception, reasoning, health, and agentic tasks, with Contemplating mode achieving 58% on Humanity's Last Exam and 38% on FrontierScience Research.
リリース日
2026-04-08
パラメータ
—
コンテキスト長
—
モダリティ
—
能力レーダー
49
general
48
coding
88
reasoning
66
science推定
80
agents
70
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 48 | 57.0 | LS |
| Code Ranking | 18 | 82.0 | AA |
| General Ranking | 14 | 88.0 | AA |
| Multimodal Ranking | 68 | 60.0 | LS |
| Reasoning | 87 | 50.0 | LS |
| Science | 9 | 90.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
GDPval-AA
1444.00 / 3000自己申告
DeepSearchQA
74.8%自己申告
Terminal-Bench 2.0
59.0%自己申告
SWE-Bench Pro
52.4%自己申告
Biology
GPQA
89.5%自己申告
Code
LiveCodeBench Pro
0.80 / 3000自己申告
SWE-Bench Verified
77.4%自己申告
Communication
Tau2 Telecom
91.5%自己申告
General
MMMU-Pro
80.4%自己申告
SimpleVQA
0.71 / 100自己申告
Grounding
ScreenSpot Pro
84.1%自己申告
Healthcare
MedXpertQA
78.4%自己申告
HealthBench Hard
42.8%自己申告
Math
Humanity's Last Exam
58.4%自己申告
Multimodal
CharXiv-R
86.4%自己申告
ZEROBench
0.33 / 100自己申告
Physics
IPhO 2025
82.6%自己申告
Reasoning
ERQA
64.7%自己申告
ARC-AGI v2
42.5%自己申告
FrontierScience Research
38.3%自己申告
AA評価指数
Intelligence Index52.1
Coding Index47.5
Tau20.9
Gpqa0.9
Ifbench0.8
Lcr0.7
Scicode0.5
Terminalbench Hard0.5
Hle0.4
LLM Statsカテゴリスコア
Finance100
Legal100
Agents100
General100
Reasoning97
Biology90
Chemistry90
Communication90
Physics90
Tool Calling80
Frontend Development80
Grounding80
Vision70
Code70
Image To Text70
Multimodal70
Search70
Spatial Reasoning60
Healthcare60
Math60
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません