メインコンテンツへスキップ

Muse Spark

MetaProprietary

説明

Muse Spark is the first model in the Muse family developed by Meta Superintelligence Labs. It is a natively multimodal reasoning model with support for tool-use, visual chain of thought, and multi-agent orchestration. It features a Contemplating mode that orchestrates multiple agents reasoning in parallel. It demonstrates competitive performance in multimodal perception, reasoning, health, and agentic tasks, with Contemplating mode achieving 58% on Humanity's Last Exam and 38% on FrontierScience Research.

リリース日
2026-04-08
パラメータ
コンテキスト長
モダリティ

能力レーダー

49
general
48
coding
88
reasoning
66
science推定
80
agents
70
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools48
57.0
LS
Code Ranking18
82.0
AA
General Ranking14
88.0
AA
Multimodal Ranking68
60.0
LS
Reasoning87
50.0
LS
Science9
90.0
AA

ベンチマークスコア (LLM Stats)

Agents

GDPval-AA1444.00 / 3000自己申告
DeepSearchQA74.8%自己申告
Terminal-Bench 2.059.0%自己申告
SWE-Bench Pro52.4%自己申告

Biology

GPQA89.5%自己申告

Code

LiveCodeBench Pro0.80 / 3000自己申告
SWE-Bench Verified77.4%自己申告

Communication

Tau2 Telecom91.5%自己申告

General

MMMU-Pro80.4%自己申告
SimpleVQA0.71 / 100自己申告

Grounding

ScreenSpot Pro84.1%自己申告

Healthcare

MedXpertQA78.4%自己申告
HealthBench Hard42.8%自己申告

Math

Humanity's Last Exam58.4%自己申告

Multimodal

CharXiv-R86.4%自己申告
ZEROBench0.33 / 100自己申告

Physics

IPhO 202582.6%自己申告

Reasoning

ERQA64.7%自己申告
ARC-AGI v242.5%自己申告
FrontierScience Research38.3%自己申告

AA評価指数

Intelligence Index
52.1
Coding Index
47.5
Tau2
0.9
Gpqa
0.9
Ifbench
0.8
Lcr
0.7
Scicode
0.5
Terminalbench Hard
0.5
Hle
0.4

LLM Statsカテゴリスコア

Finance
100
Legal
100
Agents
100
General
100
Reasoning
97
Biology
90
Chemistry
90
Communication
90
Physics
90
Tool Calling
80
Frontend Development
80
Grounding
80
Vision
70
Code
70
Image To Text
70
Multimodal
70
Search
70
Spatial Reasoning
60
Healthcare
60
Math
60

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク