跳转到主要内容

Mercury 2

InceptionProprietary

描述

Mercury 2 is the fastest reasoning LLM, built on diffusion-based language model (dLLM) architecture. Instead of generating text token-by-token, it refines multiple text blocks simultaneously, achieving over 1,000 tokens per second on Nvidia Blackwell GPUs — 5x faster than leading speed-optimized LLMs. Supports tool usage and JSON output with 128K context window.

发布日期
2026-02-20
参数规模
上下文长度
128K
支持模态
text

能力雷达图

23
general
39
coding
77
reasoning
51
science估算
50
agents
0
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜220
45.0
AA
通用能力榜132
59.0
AA
科学能力124
57.0
AA

基准测试分数 (LLM Stats)

Biology

GPQA74.0%自报
SciCode38.0%自报

Code

LiveCodeBench67.0%自报

Communication

Tau2 Airline53.0%自报

General

IFBench71.0%自报

Math

AIME 202591.1%自报

AA 评测指数

Intelligence Index
25.3
Gpqa
0.8
Tau2
0.7
Ifbench
0.7
Scicode
0.4
Lcr
0.4
Terminalbench Hard
0.3
Hle
0.2

LLM Stats 分类评分

Instruction Following
70
General
70
Math
60
Physics
60
Reasoning
60
Biology
60
Chemistry
60
Code
50
Communication
50
Tool Calling
50

定价

输入价格$0.25 / 1M tokens
输出价格$0.75 / 1M tokens
混合价格(3:1)$0.375 / 1M tokens
缓存读取价格$0.025 / 1M tokens

速度

Tokens/秒1239.8
首Token延迟3.43s
首回答延迟3.43s

供应商价格排行

供应商价格排行

6 个供应商

最便宜: Inception最贵: Venice AI
供应商输入输出
1Inception最便宜
$0
$0
2NanoGPT
$0.25
$0.75
3OpenRouter
$0.25
$0.75
4Kilo Gateway
$0.25
$0.75
5Vercel AI Gateway
$0.25
$0.75
6Venice AI
$0.3125
$0.9375

比较该模型在不同 API 供应商之间的定价。

外部链接