Mercury 2

InceptionProprietary

Описание

Mercury 2 is the fastest reasoning LLM, built on diffusion-based language model (dLLM) architecture. Instead of generating text token-by-token, it refines multiple text blocks simultaneously, achieving over 1,000 tokens per second on Nvidia Blackwell GPUs — 5x faster than leading speed-optimized LLMs. Supports tool usage and JSON output with 128K context window.

Дата выхода

2026-02-20

Параметры

—

Длина контекста

128K

Модальности

text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	220	45.0	AA
Общий рейтинг	132	59.0	AA
Наука	124	57.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

74.0%Сам.

SciCode

38.0%Сам.

Code

LiveCodeBench

67.0%Сам.

Communication

Tau2 Airline

53.0%Сам.

General

IFBench

71.0%Сам.

Math

AIME 2025

91.1%Сам.

Индексы оценки AA

Intelligence Index

25.3

Gpqa

0.8

Tau2

0.7

Ifbench

0.7

Scicode

0.4

Lcr

0.4

Terminalbench Hard

0.3

Hle

0.2

Оценки категорий LLM Stats

Instruction Following

General

Math

Physics

Reasoning

Biology

Chemistry

Code

Communication

Tool Calling

Цены

Цена ввода$0.25 / 1M токенов

Цена вывода$0.75 / 1M токенов

Смешанная цена (3:1)$0.375 / 1M токенов

Цена чтения кэша$0.025 / 1M токенов

Скорость

Токенов/сек1239.8

Задержка первого токена3.43s

Время до первого ответа3.43s

Рейтинг цен провайдеров

6 провайдеров

Самый дешевый: InceptionСамый дорогой: Venice AI

ПровайдерВводВывод

1InceptionСамый дешевый

2NanoGPT

$0.25

$0.75

3OpenRouter

$0.25

$0.75

4Kilo Gateway

$0.25

$0.75

5Vercel AI Gateway

$0.25

$0.75

6Venice AI

$0.3125

$0.9375

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis