Passer au contenu principal

Mercury 2

InceptionProprietary

Description

Mercury 2 is the fastest reasoning LLM, built on diffusion-based language model (dLLM) architecture. Instead of generating text token-by-token, it refines multiple text blocks simultaneously, achieving over 1,000 tokens per second on Nvidia Blackwell GPUs — 5x faster than leading speed-optimized LLMs. Supports tool usage and JSON output with 128K context window.

Date de sortie
2026-02-20
Paramètres
Longueur du contexte
128K
Modalités
text

Radar de capacités

23
general
39
coding
77
reasoning
51
scienceest.
50
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage220
45.0
AA
Classement général132
59.0
AA
Science124
57.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA74.0%Aut.
SciCode38.0%Aut.

Code

LiveCodeBench67.0%Aut.

Communication

Tau2 Airline53.0%Aut.

General

IFBench71.0%Aut.

Math

AIME 202591.1%Aut.

Indices d'évaluation AA

Intelligence Index
25.3
Gpqa
0.8
Tau2
0.7
Ifbench
0.7
Scicode
0.4
Lcr
0.4
Terminalbench Hard
0.3
Hle
0.2

Scores par catégorie LLM Stats

Instruction Following
70
General
70
Math
60
Physics
60
Reasoning
60
Biology
60
Chemistry
60
Code
50
Communication
50
Tool Calling
50

Tarification

Prix d'entrée$0.25 / 1M tokens
Prix de sortie$0.75 / 1M tokens
Prix mixte (3:1)$0.375 / 1M tokens
Prix de lecture cache$0.025 / 1M tokens

Vitesse

Tokens/sec1107.5
Délai du premier token3.28s
Temps de réponse3.28s

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

6 fournisseurs

Moins cher: InceptionPlus cher: Venice AI
FournisseurEntréeSortie
1InceptionMoins cher
$0
$0
2NanoGPT
$0.25
$0.75
3OpenRouter
$0.25
$0.75
4Kilo Gateway
$0.25
$0.75
5Vercel AI Gateway
$0.25
$0.75
6Venice AI
$0.3125
$0.9375

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes