MiMo-V2-Omni-0327
Xiaomi
설명
MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.
출시일
2026-03-27
파라미터
—
컨텍스트 길이
262K
모달리티
audio, image, pdf, text, video
능력 레이더
33
general
40
coding
86
reasoning
56
science추정
100
agents
85
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
벤치마크 점수 (LLM Stats)
Agents
GDPval-AA
1410.00 / 3000자체 보고
PinchBench
81.2%자체 보고
Claw-Eval
54.8%자체 보고
MM-BrowserComp
52.0%자체 보고
OmniGAIA
49.8%자체 보고
Code
SWE-Bench Verified
74.8%자체 보고
AA 평가 지수
Intelligence Index36.4
Tau20.9
Gpqa0.9
Ifbench0.7
Lcr0.6
Scicode0.4
Terminalbench Hard0.4
Hle0.2
LLM Stats 카테고리 점수
Legal100
Finance100
General100
Reasoning100
Agents100
Frontend Development70
Code70
Coding70
가격
입력 가격$0.4 / 1M 토큰
출력 가격$2 / 1M 토큰
혼합 가격 (3:1)$0.8 / 1M 토큰
캐시 읽기 가격$0.08 / 1M 토큰
속도
토큰/초81.7
첫 토큰 지연1.80s
첫 응답 지연26.29s
공급자 가격 순위
공급자 가격 순위
1개 공급자
공급자입력출력
1Xiaomi주요
$0.4
$2
이 모델의 다양한 API 공급자 간 가격 비교.