Kimi K2.5 (Non-reasoning)

KimiKimiオープンウエイトMIT · 商用利用可

説明

Kimi K2.5 is Moonshot AI's flagship agentic model and a new SOTA open model. It unifies vision and text, thinking and non-thinking modes, and single-agent and multi-agent execution into one model. Built with Full-Parameter RL tuning, it achieves state-of-the-art performance across agents, coding, image, and video benchmarks.

リリース日

2026-01-27

パラメータ

1.0T

コンテキスト長

262K

モダリティ

image, text, video

能力レーダー

general

coding

reasoning

science推定

agents

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ベンチマークスコア (LLM Stats)

Agents

WideSearch

79.0%自己申告

DeepSearchQA

77.1%自己申告

BrowseComp

74.9%自己申告

PaperBench

63.5%自己申告

Terminal-Bench 2.0

50.8%自己申告

SWE-Bench Pro

50.7%自己申告

CyberGym

41.3%自己申告

FrontierSWE

26.0%自己申告

Biology

GPQA

87.6%自己申告

SciCode

48.7%自己申告

Code

SWE-Bench Verified

76.8%自己申告

SWE-bench Multilingual

73.0%自己申告

OJBench (C++)

57.4%自己申告

Economics

FinSearchComp T2&T3

67.8%自己申告

Finance

MMLU-Pro

87.1%自己申告

General

LiveCodeBench v6

85.0%自己申告

MMMU-Pro

78.5%自己申告

SimpleVQA

0.71 / 100自己申告

LiveBench

69.1%自己申告

LongBench v2

61.0%自己申告

Healthcare

VideoMMMU

86.6%自己申告

Image To Text

OCRBench

92.3%自己申告

Long Context

LongVideoBench

79.8%自己申告

LVBench

75.9%自己申告

AA-LCR

70.0%自己申告

Math

AIME 2025

96.1%自己申告

HMMT 2025

95.4%自己申告

MathVista-Mini

90.1%自己申告

MathVision

84.2%自己申告

IMO-AnswerBench

81.8%自己申告

Humanity's Last Exam

50.2%自己申告

Multimodal

InfoVQAtest

92.6%自己申告

OmniDocBench 1.5

88.8%自己申告

Video-MME

87.4%自己申告

MMVU

80.4%自己申告

CharXiv-R

77.5%自己申告

MotionBench

70.4%自己申告

WorldVQA

46.3%自己申告

ZEROBench

0.11 / 100自己申告

Reasoning

Seal-0

57.4%自己申告

AA評価指数

Intelligence Index

29.4

Tau2

0.8

Gpqa

0.8

Lcr

0.6

Ifbench

0.4

Scicode

0.4

Terminalbench Hard

0.2

Hle

0.1

LLM Statsカテゴリスコア

Language

Legal

Finance

Math

Multimodal

Image To Text

Long Context

Frontend Development

Video

Vision

Physics

Reasoning

Structured Output

General

Healthcare

Biology

Chemistry

Agents

Code

Tool Calling

Safety

価格設定

入力価格$0.6 / 1Mトークン

出力価格$3 / 1Mトークン

混合価格（3:1）$1.2 / 1Mトークン

キャッシュ読み取り価格$0.1 / 1Mトークン

速度

トークン/秒42.2

初トークン遅延1.21s

初回答遅延1.21s

プロバイダー価格ランキング

17 プロバイダー

最安: NanoGPT最高: Moonshot AI

プロバイダー入力出力

1NanoGPT最安

$0.3

$1.9

2CrofAI

$0.35

$1.7

3DigitalOcean

$0.5

$2.7

4Auriko

$0.5

$2.8

5Cortecs

$0.55

$2.76

6Alibaba (China)

$0.574

$2.411

7Kimiプライマリ

$0.6

8Abacus

$0.6

9OpenCode Go

$0.6

10OpenCode Zen

$0.6

11FrogBot

$0.6

12AIHubMix

$0.6

13Moonshot AI (China)

$0.6

14Azure Cognitive Services

$0.6

15LLM Gateway

$0.6

16Azure

$0.6

17Moonshot AI

$0.6

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク

LLM Stats Artificial Analysis

ドメイン	#順位	スコア	ソース
エージェント能力	42	59.0	LS
コーディングランキング	168	54.0	AA
総合ランキング	157	56.0	AA
マルチモーダルランキング	66	71.0	LS
推論	72	57.0	LS
科学	139	56.0	AA