跳轉到主要內容

Kimi Linear 48B A3B Instruct

KimiKimi

發布日期

2025-10-30

參數規模

—

上下文長度

262K

支援模態

image, text, video

能力雷達圖

23

general

34

coding

37

reasoning

26

science估算

50

agents

80

multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域	#排名	分數	來源
程式碼能力榜	285	31.0	AA
通用能力榜	432	22.0	AA
數學推理	235	37.0	AA
科學能力	412	24.0	AA

基準測試分數 (LLM Stats)

Agents

WideSearch

79.0%自報

DeepSearchQA

77.1%自報

BrowseComp

74.9%自報

PaperBench

63.5%自報

Terminal-Bench 2.0

50.8%自報

SWE-Bench Pro

50.7%自報

CyberGym

41.3%自報

FrontierSWE

26.0%自報

Biology

GPQA

87.6%自報

SciCode

48.7%自報

Code

SWE-Bench Verified

76.8%自報

SWE-bench Multilingual

73.0%自報

OJBench (C++)

57.4%自報

Economics

FinSearchComp T2&T3

67.8%自報

Finance

MMLU-Pro

87.1%自報

General

LiveCodeBench v6

85.0%自報

MMMU-Pro

78.5%自報

SimpleVQA

0.71 / 100自報

LiveBench

69.1%自報

LongBench v2

61.0%自報

Healthcare

VideoMMMU

86.6%自報

Image To Text

OCRBench

92.3%自報

Long Context

LongVideoBench

79.8%自報

LVBench

75.9%自報

AA-LCR

70.0%自報

Math

AIME 2025

96.1%自報

HMMT 2025

95.4%自報

MathVista-Mini

90.1%自報

MathVision

84.2%自報

IMO-AnswerBench

81.8%自報

Humanity's Last Exam

50.2%自報

Multimodal

InfoVQAtest

92.6%自報

OmniDocBench 1.5

88.8%自報

Video-MME

87.4%自報

MMVU

80.4%自報

CharXiv-R

77.5%自報

MotionBench

70.4%自報

WorldVQA

46.3%自報

ZEROBench

0.11 / 100自報

Reasoning

Seal-0

57.4%自報

AA 評測指數

Math Index

36.3

Intelligence Index

8.5

Mmlu Pro

0.6

Gpqa

0.4

Livecodebench

0.4

Aime 25

0.4

Ifbench

0.3

Lcr

0.3

Scicode

0.2

Terminalbench Hard

0.1

Hle

0.0

Tau2

0.0

LLM Stats 分類評分

Language

90

Legal

90

Finance

90

Image To Text

80

Long Context

80

Math

80

Multimodal

80

Frontend Development

80

Video

80

Vision

80

Physics

70

Reasoning

70

Search

70

Structured Output

70

General

70

Healthcare

70

Biology

70

Chemistry

70

Agents

60

Code

50

Tool Calling

50

Safety

40

定價

輸入價格免費

輸出價格免費

混合價格(3:1)免費

快取讀取價格$0.1 / 1M tokens

速度

Tokens/秒0.0

首Token延遲0.00s

首回答延遲0.00s

供應商價格排行

暫無提供商資料

外部連結

Artificial Analysis