메인 콘텐츠로 건너뛰기

MiMo-V2-Omni

XiaomiProprietary

설명

MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.

출시일
2026-03-19
파라미터
컨텍스트 길이
262K
모달리티
audio, image, text, video

능력 레이더

38
general
36
coding
83
reasoning
54
science추정
100
agents
85
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Agents & Tools61
54.0
LS
Code Ranking75
66.0
AA
General Ranking74
73.0
AA
Science82
64.0
AA

벤치마크 점수 (LLM Stats)

Agents

GDPval-AA1410.00 / 3000자체 보고
PinchBench81.2%자체 보고
Claw-Eval54.8%자체 보고
MM-BrowserComp52.0%자체 보고
OmniGAIA49.8%자체 보고

Code

SWE-Bench Verified74.8%자체 보고

AA 평가 지수

Intelligence Index
43.4
Coding Index
35.5
Tau2
0.9
Gpqa
0.8
Lcr
0.7
Ifbench
0.5
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2

LLM Stats 카테고리 점수

Finance
100
General
100
Legal
100
Reasoning
100
Agents
100
Code
70
Coding
70
Frontend Development
70

가격

입력 가격무료
출력 가격무료
혼합 가격 (3:1)무료

속도

토큰/초120.9 tokens/s
첫 토큰 지연1.35s
첫 응답 지연17.89s

사용 가능한 프로바이더

(LS 내부 단위)
프로바이더입력 가격출력 가격
Xiaomi400K2.0M

외부 링크