Kimi K2.5 (Non-reasoning)
KimiKimiОткрытые весаMIT · Коммерческое использование
Описание
Kimi K2.5 is Moonshot AI's flagship agentic model and a new SOTA open model. It unifies vision and text, thinking and non-thinking modes, and single-agent and multi-agent execution into one model. Built with Full-Parameter RL tuning, it achieves state-of-the-art performance across agents, coding, image, and video benchmarks.
Дата выхода
2026-01-27
Параметры
1.0T
Длина контекста
262K
Модальности
image, text, video
Радар способностей
26
general
40
coding
79
reasoning
52
scienceоцен.
50
agents
80
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Агентные возможности | 42 | 59.0 | LS |
| Рейтинг кодинга | 168 | 54.0 | AA |
| Общий рейтинг | 157 | 56.0 | AA |
| Мультимодальный рейтинг | 66 | 71.0 | LS |
| Рассуждения | 72 | 57.0 | LS |
| Наука | 139 | 56.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
WideSearch
79.0%Сам.
DeepSearchQA
77.1%Сам.
BrowseComp
74.9%Сам.
PaperBench
63.5%Сам.
Terminal-Bench 2.0
50.8%Сам.
SWE-Bench Pro
50.7%Сам.
CyberGym
41.3%Сам.
FrontierSWE
26.0%Сам.
Biology
GPQA
87.6%Сам.
SciCode
48.7%Сам.
Code
SWE-Bench Verified
76.8%Сам.
SWE-bench Multilingual
73.0%Сам.
OJBench (C++)
57.4%Сам.
Economics
FinSearchComp T2&T3
67.8%Сам.
Finance
MMLU-Pro
87.1%Сам.
General
LiveCodeBench v6
85.0%Сам.
MMMU-Pro
78.5%Сам.
SimpleVQA
0.71 / 100Сам.
LiveBench
69.1%Сам.
LongBench v2
61.0%Сам.
Healthcare
VideoMMMU
86.6%Сам.
Image To Text
OCRBench
92.3%Сам.
Long Context
LongVideoBench
79.8%Сам.
LVBench
75.9%Сам.
AA-LCR
70.0%Сам.
Math
AIME 2025
96.1%Сам.
HMMT 2025
95.4%Сам.
MathVista-Mini
90.1%Сам.
MathVision
84.2%Сам.
IMO-AnswerBench
81.8%Сам.
Humanity's Last Exam
50.2%Сам.
Multimodal
InfoVQAtest
92.6%Сам.
OmniDocBench 1.5
88.8%Сам.
Video-MME
87.4%Сам.
MMVU
80.4%Сам.
CharXiv-R
77.5%Сам.
MotionBench
70.4%Сам.
WorldVQA
46.3%Сам.
ZEROBench
0.11 / 100Сам.
Reasoning
Seal-0
57.4%Сам.
Индексы оценки AA
Intelligence Index29.4
Tau20.8
Gpqa0.8
Lcr0.6
Ifbench0.4
Scicode0.4
Terminalbench Hard0.2
Hle0.1
Оценки категорий LLM Stats
Language90
Legal90
Finance90
Image To Text80
Long Context80
Math80
Multimodal80
Frontend Development80
Video80
Vision80
Physics70
Reasoning70
Search70
Structured Output70
General70
Healthcare70
Biology70
Chemistry70
Agents60
Code50
Tool Calling50
Safety40
Цены
Цена ввода$0.6 / 1M токенов
Цена вывода$3 / 1M токенов
Смешанная цена (3:1)$1.2 / 1M токенов
Цена чтения кэша$0.1 / 1M токенов
Скорость
Токенов/сек37.8
Задержка первого токена1.25s
Время до первого ответа1.25s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
17 провайдеров
Самый дешевый: NanoGPTСамый дорогой: Moonshot AI
ПровайдерВводВывод
1NanoGPTСамый дешевый
$0.3
$1.9
2CrofAI
$0.35
$1.7
3DigitalOcean
$0.5
$2.7
4Auriko
$0.5
$2.8
5Cortecs
$0.55
$2.76
6Alibaba (China)
$0.574
$2.411
7KimiОсновной
$0.6
$3
8Abacus
$0.6
$3
9OpenCode Go
$0.6
$3
10OpenCode Zen
$0.6
$3
11FrogBot
$0.6
$3
12AIHubMix
$0.6
$3
13Moonshot AI (China)
$0.6
$3
14Azure Cognitive Services
$0.6
$3
15LLM Gateway
$0.6
$3
16Azure
$0.6
$3
17Moonshot AI
$0.6
$3
Сравнение цен разных API-провайдеров для этой модели.