Kimi K2.5 (Non-reasoning)

KimiKimiОткрытые весаMIT · Коммерческое использование

Описание

Kimi K2.5 is Moonshot AI's flagship agentic model and a new SOTA open model. It unifies vision and text, thinking and non-thinking modes, and single-agent and multi-agent execution into one model. Built with Full-Parameter RL tuning, it achieves state-of-the-art performance across agents, coding, image, and video benchmarks.

Дата выхода

2026-01-27

Параметры

1.0T

Длина контекста

262K

Модальности

image, text, video

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Агентные возможности	42	59.0	LS
Рейтинг кодинга	168	54.0	AA
Общий рейтинг	157	56.0	AA
Мультимодальный рейтинг	66	71.0	LS
Рассуждения	72	57.0	LS
Наука	139	56.0	AA

Оценки бенчмарков (LLM Stats)

Agents

WideSearch

79.0%Сам.

DeepSearchQA

77.1%Сам.

BrowseComp

74.9%Сам.

PaperBench

63.5%Сам.

Terminal-Bench 2.0

50.8%Сам.

SWE-Bench Pro

50.7%Сам.

CyberGym

41.3%Сам.

FrontierSWE

26.0%Сам.

Biology

GPQA

87.6%Сам.

SciCode

48.7%Сам.

Code

SWE-Bench Verified

76.8%Сам.

SWE-bench Multilingual

73.0%Сам.

OJBench (C++)

57.4%Сам.

Economics

FinSearchComp T2&T3

67.8%Сам.

Finance

MMLU-Pro

87.1%Сам.

General

LiveCodeBench v6

85.0%Сам.

MMMU-Pro

78.5%Сам.

SimpleVQA

0.71 / 100Сам.

LiveBench

69.1%Сам.

LongBench v2

61.0%Сам.

Healthcare

VideoMMMU

86.6%Сам.

Image To Text

OCRBench

92.3%Сам.

Long Context

LongVideoBench

79.8%Сам.

LVBench

75.9%Сам.

AA-LCR

70.0%Сам.

Math

AIME 2025

96.1%Сам.

HMMT 2025

95.4%Сам.

MathVista-Mini

90.1%Сам.

MathVision

84.2%Сам.

IMO-AnswerBench

81.8%Сам.

Humanity's Last Exam

50.2%Сам.

Multimodal

InfoVQAtest

92.6%Сам.

OmniDocBench 1.5

88.8%Сам.

Video-MME

87.4%Сам.

MMVU

80.4%Сам.

CharXiv-R

77.5%Сам.

MotionBench

70.4%Сам.

WorldVQA

46.3%Сам.

ZEROBench

0.11 / 100Сам.

Reasoning

Seal-0

57.4%Сам.

Индексы оценки AA

Intelligence Index

29.4

Tau2

0.8

Gpqa

0.8

Lcr

0.6

Ifbench

0.4

Scicode

0.4

Terminalbench Hard

0.2

Hle

0.1

Оценки категорий LLM Stats

Language

Legal

Finance

Image To Text

Long Context

Math

Multimodal

Frontend Development

Video

Vision

Physics

Reasoning

Structured Output

General

Healthcare

Biology

Chemistry

Agents

Code

Tool Calling

Safety

Цены

Цена ввода$0.6 / 1M токенов

Цена вывода$3 / 1M токенов

Смешанная цена (3:1)$1.2 / 1M токенов

Цена чтения кэша$0.1 / 1M токенов

Скорость

Токенов/сек37.8

Задержка первого токена1.25s

Время до первого ответа1.25s

Рейтинг цен провайдеров

17 провайдеров

Самый дешевый: NanoGPTСамый дорогой: Moonshot AI

ПровайдерВводВывод

1NanoGPTСамый дешевый

$0.3

$1.9

2CrofAI

$0.35

$1.7

3DigitalOcean

$0.5

$2.7

4Auriko

$0.5

$2.8

5Cortecs

$0.55

$2.76

6Alibaba (China)

$0.574

$2.411

7KimiОсновной

$0.6

8Abacus

$0.6

9OpenCode Go

$0.6

10OpenCode Zen

$0.6

11FrogBot

$0.6

12AIHubMix

$0.6

13Moonshot AI (China)

$0.6

14Azure Cognitive Services

$0.6

15LLM Gateway

$0.6

16Azure

$0.6

17Moonshot AI

$0.6

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis