Mercury 2
InceptionProprietary
Описание
Mercury 2 is the fastest reasoning LLM, built on diffusion-based language model (dLLM) architecture. Instead of generating text token-by-token, it refines multiple text blocks simultaneously, achieving over 1,000 tokens per second on Nvidia Blackwell GPUs — 5x faster than leading speed-optimized LLMs. Supports tool usage and JSON output with 128K context window.
Дата выхода
2026-02-20
Параметры
—
Длина контекста
128K
Модальности
text
Радар способностей
29
general
32
coding
77
reasoning
51
scienceоцен.
50
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 155 | 49.0 | AA |
| General Ranking | 115 | 64.0 | AA |
| Science | 106 | 60.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
74.0%Сам.
SciCode
38.0%Сам.
Code
LiveCodeBench
67.0%Сам.
Communication
Tau2 Airline
53.0%Сам.
General
IFBench
71.0%Сам.
Math
AIME 2025
91.1%Сам.
Индексы оценки AA
Intelligence Index32.8
Coding Index30.6
Gpqa0.8
Tau20.7
Ifbench0.7
Scicode0.4
Lcr0.4
Terminalbench Hard0.3
Hle0.2
Оценки категорий LLM Stats
General70
Instruction Following70
Biology60
Chemistry60
Math60
Physics60
Reasoning60
Tool Calling50
Code50
Communication50
Цены
Цена ввода$0.25 / 1M tokens
Цена вывода$0.75 / 1M tokens
Смешанная цена (3:1)$0.375 / 1M tokens
Скорость
Токенов/сек881.5 tokens/s
Задержка первого токена3.71s
Время до первого ответа3.71s
Доступные провайдеры
(Внутренние единицы LS)| Провайдер | Цена ввода | Цена вывода |
|---|---|---|
| Inception | 250K | 750K |