메인 콘텐츠로 건너뛰기

MiMo-V2-Omni-0327

Xiaomi

설명

MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.

출시일
2026-03-27
파라미터
컨텍스트 길이
262K
모달리티
audio, image, pdf, text, video

능력 레이더

33
general
40
coding
86
reasoning
56
science추정
100
agents
85
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
코딩 랭킹79
71.0
AA
종합 랭킹66
72.0
AA
과학78
64.0
AA

벤치마크 점수 (LLM Stats)

Agents

GDPval-AA1410.00 / 3000자체 보고
PinchBench81.2%자체 보고
Claw-Eval54.8%자체 보고
MM-BrowserComp52.0%자체 보고
OmniGAIA49.8%자체 보고

Code

SWE-Bench Verified74.8%자체 보고

AA 평가 지수

Intelligence Index
36.4
Tau2
0.9
Gpqa
0.9
Ifbench
0.7
Lcr
0.6
Scicode
0.4
Terminalbench Hard
0.4
Hle
0.2

LLM Stats 카테고리 점수

Legal
100
Finance
100
General
100
Reasoning
100
Agents
100
Frontend Development
70
Code
70
Coding
70

가격

입력 가격$0.4 / 1M 토큰
출력 가격$2 / 1M 토큰
혼합 가격 (3:1)$0.8 / 1M 토큰
캐시 읽기 가격$0.08 / 1M 토큰

속도

토큰/초81.7
첫 토큰 지연1.80s
첫 응답 지연26.29s

공급자 가격 순위

공급자 가격 순위

1개 공급자

공급자입력출력
1Xiaomi주요
$0.4
$2

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크