Kimi K2.5 (Non-reasoning)
KimiKimiOpen WeightMIT · Commercial OK
説明
Kimi K2.5 is Moonshot AI's flagship agentic model and a new SOTA open model. It unifies vision and text, thinking and non-thinking modes, and single-agent and multi-agent execution into one model. Built with Full-Parameter RL tuning, it achieves state-of-the-art performance across agents, coding, image, and video benchmarks.
リリース日
2026-01-27
パラメータ
1.0T
コンテキスト長
262K
モダリティ
image, text, video
能力レーダー
32
general
28
coding
79
reasoning
52
science推定
50
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 34 | 62.0 | LS |
| Code Ranking | 154 | 49.0 | AA |
| General Ranking | 131 | 61.0 | AA |
| Multimodal Ranking | 58 | 71.0 | LS |
| Reasoning | 67 | 57.0 | LS |
| Science | 117 | 58.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
WideSearch
79.0%自己申告
DeepSearchQA
77.1%自己申告
BrowseComp
74.9%自己申告
PaperBench
63.5%自己申告
Terminal-Bench 2.0
50.8%自己申告
SWE-Bench Pro
50.7%自己申告
CyberGym
41.3%自己申告
Biology
GPQA
87.6%自己申告
SciCode
48.7%自己申告
Code
SWE-Bench Verified
76.8%自己申告
SWE-bench Multilingual
73.0%自己申告
OJBench (C++)
57.4%自己申告
Economics
FinSearchComp T2&T3
67.8%自己申告
Finance
MMLU-Pro
87.1%自己申告
General
LiveCodeBench v6
85.0%自己申告
MMMU-Pro
78.5%自己申告
SimpleVQA
0.71 / 100自己申告
LongBench v2
61.0%自己申告
Healthcare
VideoMMMU
86.6%自己申告
Image To Text
OCRBench
92.3%自己申告
Long Context
LongVideoBench
79.8%自己申告
LVBench
75.9%自己申告
AA-LCR
70.0%自己申告
Math
AIME 2025
96.1%自己申告
HMMT 2025
95.4%自己申告
MathVista-Mini
90.1%自己申告
MathVision
84.2%自己申告
IMO-AnswerBench
81.8%自己申告
Humanity's Last Exam
50.2%自己申告
Multimodal
InfoVQAtest
92.6%自己申告
OmniDocBench 1.5
88.8%自己申告
Video-MME
87.4%自己申告
MMVU
80.4%自己申告
CharXiv-R
77.5%自己申告
MotionBench
70.4%自己申告
WorldVQA
46.3%自己申告
ZEROBench
0.11 / 100自己申告
Reasoning
Seal-0
57.4%自己申告
AA評価指数
Intelligence Index37.3
Coding Index25.8
Tau20.8
Gpqa0.8
Lcr0.6
Ifbench0.4
Scicode0.4
Terminalbench Hard0.2
Hle0.1
LLM Statsカテゴリスコア
Finance90
Language90
Legal90
Video80
Vision80
Frontend Development80
Image To Text80
Long Context80
Math80
Multimodal80
Structured Output70
Biology70
Chemistry70
General70
Healthcare70
Physics70
Reasoning70
Search70
Agents60
Code60
Tool Calling50
Safety40
価格設定
入力価格$0.6 / 1M tokens
出力価格$3 / 1M tokens
混合価格(3:1)$1.2 / 1M tokens
速度
トークン/秒45.6 tokens/s
初トークン遅延1.22s
初回答遅延1.22s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Moonshot AI | 600K | 3.0M |
| Fireworks | 600K | 3.0M |