MiMo-V2.5-TTS
Xiaomi
설명
MiMo-V2.5 is Xiaomi's native omnimodal sparse Mixture-of-Experts model with 310B total parameters, 15B activated parameters, and a 1M-token context window. Built on the MiMo-V2-Flash backbone, it adds dedicated vision and audio encoders for text, image, video, and audio understanding, and is post-trained with SFT, agentic reinforcement learning, and Multi-Teacher On-Policy Distillation for multimodal perception, long-context reasoning, and agentic workflows.
출시일
2026-04-22
파라미터
—
컨텍스트 길이
1.0M
모달리티
audio, image, text, video
능력 레이더
80
general
60
coding
70
reasoning
60
science추정
70
agents
88
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| 오디오 | 35 | 65.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
MiMo Coding Bench
71.8%자체 보고
Terminal-Bench 2.0
65.8%자체 보고
Claw-Eval
63.2%자체 보고
SWE-Bench Pro
56.1%자체 보고
Finance Agent v2
36.7%자체 보고
ResearchClawBench
16.9%자체 보고
Document Understanding
OmniDocBench
87.2%자체 보고
General
MMMU-Pro
77.9%자체 보고
Long Context
GraphWalks
87.0%자체 보고
Multimodal
HR-Bench (4k)
88.5%자체 보고
Video-MME
87.7%자체 보고
DailyOmni
83.5%자체 보고
CharXiv-R
81.0%자체 보고
VideoHolmes
64.0%자체 보고
AA 평가 지수
AA 평가 데이터가 없습니다
LLM Stats 카테고리 점수
Long Context90
Multimodal80
General80
Vision80
Reasoning70
Tool Calling70
Agents60
Code60
Coding60
Finance40
가격
입력 가격$0.4 / 1M 토큰
출력 가격$2 / 1M 토큰
혼합 가격 (3:1)$0.8 / 1M 토큰
캐시 읽기 가격$0.08 / 1M 토큰
속도
속도 데이터가 없습니다
공급자 가격 순위
공급자 가격 순위
1개 공급자
공급자입력출력
1Xiaomi주요
$0.4
$2
이 모델의 다양한 API 공급자 간 가격 비교.