MiMo-V2-Flash (Reasoning)

Xiaomi

설명

MiMo-V2-Flash is a powerful, efficient, and ultra-fast foundation language model that excels in reasoning, coding, and agentic scenarios. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, featuring a hybrid attention architecture with sliding-window and full attention (5:1 ratio, 128-token window). Delivers 150 tokens/sec inference with 256k context window.

출시일

2025-12-16

파라미터

—

컨텍스트 길이

262K

모달리티

text

능력 레이더

general

coding

reasoning

science추정

agents

multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인	#순위	점수	소스
에이전트형 역량	76	53.0	LS
코딩 랭킹	63	74.0	AA
종합 랭킹	63	73.0	AA
수학 추론	9	97.0	AA
과학	86	64.0	AA

벤치마크 점수 (LLM Stats)

Agents

Tau-bench

80.3%자체 보고

BrowseComp

58.3%자체 보고

Terminal-Bench 2.0

38.5%자체 보고

Terminal-Bench

30.5%자체 보고

Biology

GPQA

83.7%자체 보고

Code

SWE-Bench Verified

73.4%자체 보고

SWE-bench Multilingual

71.7%자체 보고

Creativity

Arena-Hard v2

86.2%자체 보고

Finance

MMLU-Pro

84.9%자체 보고

General

LiveCodeBench v6

80.6%자체 보고

LongBench v2

60.6%자체 보고

MRCR

45.7%자체 보고

Math

AIME 2025

94.1%자체 보고

HMMT 2025

84.4%자체 보고

Humanity's Last Exam

22.1%자체 보고

AA 평가 지수

Math Index

96.3

Intelligence Index

31.2

Aime 25

1.0

Tau2

1.0

Livecodebench

0.9

Gpqa

0.8

Mmlu Pro

0.8

Ifbench

0.6

Lcr

0.6

Scicode

0.4

Terminalbench Hard

0.3

Hle

0.2

LLM Stats 카테고리 점수

Creativity

Writing

Language

Legal

Physics

Finance

Healthcare

Biology

Chemistry

Math

Reasoning

Frontend Development

General

Structured Output

Tool Calling

Long Context

Agents

Code

Vision

가격

입력 가격$0.1 / 1M 토큰

출력 가격$0.3 / 1M 토큰

혼합 가격 (3:1)$0.15 / 1M 토큰

캐시 읽기 가격$0.01 / 1M 토큰

속도

토큰/초75.2

첫 토큰 지연2.23s

첫 응답 지연28.81s

공급자 가격 순위

4개 공급자

최저가: Xiaomi최고가: NanoGPT

공급자입력출력

1Xiaomi주요

$0.1

$0.3

2Qiniu

$0.1

$0.3

3LLM Gateway

$0.1

$0.3

4NanoGPT

$0.102

$0.306

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크

Artificial Analysis