Muse Spark
MetaProprietary
설명
Muse Spark is the first model in the Muse family developed by Meta Superintelligence Labs. It is a natively multimodal reasoning model with support for tool-use, visual chain of thought, and multi-agent orchestration. It features a Contemplating mode that orchestrates multiple agents reasoning in parallel. It demonstrates competitive performance in multimodal perception, reasoning, health, and agentic tasks, with Contemplating mode achieving 58% on Humanity's Last Exam and 38% on FrontierScience Research.
출시일
2026-04-08
파라미터
—
컨텍스트 길이
—
모달리티
—
능력 레이더
49
general
48
coding
88
reasoning
66
science추정
80
agents
70
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 48 | 57.0 | LS |
| Code Ranking | 18 | 82.0 | AA |
| General Ranking | 14 | 88.0 | AA |
| Multimodal Ranking | 68 | 60.0 | LS |
| Reasoning | 87 | 50.0 | LS |
| Science | 9 | 90.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
GDPval-AA
1444.00 / 3000자체 보고
DeepSearchQA
74.8%자체 보고
Terminal-Bench 2.0
59.0%자체 보고
SWE-Bench Pro
52.4%자체 보고
Biology
GPQA
89.5%자체 보고
Code
LiveCodeBench Pro
0.80 / 3000자체 보고
SWE-Bench Verified
77.4%자체 보고
Communication
Tau2 Telecom
91.5%자체 보고
General
MMMU-Pro
80.4%자체 보고
SimpleVQA
0.71 / 100자체 보고
Grounding
ScreenSpot Pro
84.1%자체 보고
Healthcare
MedXpertQA
78.4%자체 보고
HealthBench Hard
42.8%자체 보고
Math
Humanity's Last Exam
58.4%자체 보고
Multimodal
CharXiv-R
86.4%자체 보고
ZEROBench
0.33 / 100자체 보고
Physics
IPhO 2025
82.6%자체 보고
Reasoning
ERQA
64.7%자체 보고
ARC-AGI v2
42.5%자체 보고
FrontierScience Research
38.3%자체 보고
AA 평가 지수
Intelligence Index52.1
Coding Index47.5
Tau20.9
Gpqa0.9
Ifbench0.8
Lcr0.7
Scicode0.5
Terminalbench Hard0.5
Hle0.4
LLM Stats 카테고리 점수
Finance100
Legal100
Agents100
General100
Reasoning97
Biology90
Chemistry90
Communication90
Physics90
Tool Calling80
Frontend Development80
Grounding80
Vision70
Code70
Image To Text70
Multimodal70
Search70
Spatial Reasoning60
Healthcare60
Math60
가격
입력 가격무료
출력 가격무료
혼합 가격 (3:1)무료
속도
토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다