Saltar al contenido principal

Mercury 2

InceptionProprietary

Descripción

Mercury 2 is the fastest reasoning LLM, built on diffusion-based language model (dLLM) architecture. Instead of generating text token-by-token, it refines multiple text blocks simultaneously, achieving over 1,000 tokens per second on Nvidia Blackwell GPUs — 5x faster than leading speed-optimized LLMs. Supports tool usage and JSON output with 128K context window.

Fecha de lanzamiento
2026-02-20
Parámetros
Longitud del contexto
128K
Modalidades
text

Radar de capacidades

23
general
39
coding
77
reasoning
51
scienceest.
50
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación220
45.0
AA
Ranking general132
59.0
AA
Ciencia124
57.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA74.0%Aut.
SciCode38.0%Aut.

Code

LiveCodeBench67.0%Aut.

Communication

Tau2 Airline53.0%Aut.

General

IFBench71.0%Aut.

Math

AIME 202591.1%Aut.

Índices de evaluación AA

Intelligence Index
25.3
Gpqa
0.8
Tau2
0.7
Ifbench
0.7
Scicode
0.4
Lcr
0.4
Terminalbench Hard
0.3
Hle
0.2

Puntuaciones por categoría LLM Stats

Instruction Following
70
General
70
Math
60
Physics
60
Reasoning
60
Biology
60
Chemistry
60
Code
50
Communication
50
Tool Calling
50

Precios

Precio de entrada$0.25 / 1M tokens
Precio de salida$0.75 / 1M tokens
Precio mixto (3:1)$0.375 / 1M tokens
Precio de lectura caché$0.025 / 1M tokens

Velocidad

Tokens/seg1239.8
Retraso del primer token3.43s
Tiempo hasta la respuesta3.43s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

6 proveedores

Más barato: InceptionMás caro: Venice AI
ProveedorEntradaSalida
1InceptionMás barato
$0
$0
2NanoGPT
$0.25
$0.75
3OpenRouter
$0.25
$0.75
4Kilo Gateway
$0.25
$0.75
5Vercel AI Gateway
$0.25
$0.75
6Venice AI
$0.3125
$0.9375

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas