Polza.AI
Polza.ai Logo

Начните пользоваться прямо сейчас

Единый API для 400+ моделей ИИ. Создавайте тексты, код, изображения, аудио и видео в одном интерфейсе.

TelegramXInstagramYouTubeVK
© 2025 Polza Ai • Все права защищены
К списку моделей
Inception: Mercury 2

Inception: Mercury 2

ID: inception/mercury-2

Попробовать

23,35 ₽

Запрос/ 1М

70,06 ₽

Ответ / 1М

Изображение вход /1М

Изображение выход /1М

128K

Контекст

50K

Макс. ответ

Описание

Технический обзор диффузионной языковой модели Mercury 2

1. Введение и общее описание

Mercury 2 — это революционная языковая модель от компании Inception Labs, представляющая собой первую в индустрии диффузионную LLM (dLLM), оптимизированную для задач высокоскоростного рассуждения. В отличие от традиционных моделей, использующих авторегрессионный подход, Mercury 2 применяет методы диффузии для параллельной генерации токенов.

  • Разработчик: Inception Labs.
  • Тип модели: Диффузионная языковая модель (dLLM).
  • Назначение: Обеспечение сверхнизкой задержки в интерактивных ИИ-системах, агентских циклах и сложных производственных процессах.
  • Контекстное окно: 128 000 токенов.
  • Целевая аудитория: Разработчики корпоративного ПО, специалисты по системной архитектуре ИИ, создатели голосовых интерфейсов и инструментов для real-time кодинга.

2. Технические характеристики

Mercury 2 радикально меняет правила игры в аппаратной эффективности ИИ-систем.

  • Архитектура: Трансформерная архитектура с внедренным механизмом диффузионного итеративного уточнения (denoising). В отличие от авторегрессии, где каждый токен зависит от предыдущего, модель генерирует черновой вариант ответа целиком и итеративно его правит.
  • Контекстное окно: 128 000 токенов, что позволяет обрабатывать объемные технические документы, кодовые базы и длинные диалоги.
  • Требования к развертыванию: Модель оптимизирована для запуска на графических процессорах NVIDIA (в частности, архитектура Blackwell демонстрирует лучшие показатели производительности — до 1009 токенов в секунду).
  • Поддерживаемые форматы: Текст, исходный код, структурированные данные (JSON, выровненный по схеме).
  • Языковая поддержка: Мультиязычная модель с упором на синтаксическую корректность в программировании и логическую связность.

3. Показатели производительности (бенчмарки)

Mercury 2 демонстрирует уникальный баланс между скоростью и точностью рассуждений, достигая >1000 токенов в секунду, что примерно в 10 раз быстрее традиционных фронтирных моделей.

БенчмаркПоказатель (прибл.)Комментарий
AIME 202591.1Высокая точность в тестах на математическое рассуждение.
Качество рассуждения85-95% vs FrontierКонкурентоспособна с моделями уровня GPT-5.2 Mini и Claude 4.5 Haiku.

Модель показывает выдающиеся результаты в задачах, где важна скорость и логическая последовательность (логический анализ, обработка структурированных данных), при этом сохраняя качество, достаточное для задач средней и высокой сложности.

4. Ключевые возможности

  1. Параллельная генерация токенов: Основная инновация, устраняющая «бутылочное горлышко» авторегрессии.
  2. Итеративное уточнение (Error Correction): Способность исправлять ошибки в процессе генерации, что повышает предсказуемость вывода.
  3. Настраиваемые уровни рассуждения: Пользователь может задавать глубину итераций (denoising steps) в зависимости от задачи.
  4. Схема-ориентированный JSON: Высокая надежность при работе с API и парсинге данных.
  5. Нативная поддержка инструментов: Эффективное взаимодействие с внешними функциями (Tool Use).

Сценарий (кодинг): Разработчик использует Mercury 2 в IDE для автодополнения кода в реальном времени. В момент написания функции модель «предсказывает» не только следующий символ, но и структуру всей функции целиком, мгновенно исправляя синтаксические неточности, что исключает задержку перед глазами пользователя.

5. Оптимальные случаи использования

Mercury 2 идеально подходит для систем, где каждая миллисекунда задержки снижает эффективность:

  • Реальные голосовые интерфейсы: Мгновенный ответ без долгих пауз.
  • Агентские циклы (Agent Loops): Где цепочка вызовов инструментов требует высокой скорости.
  • Real-time RAG: Быстрый поиск и синтез ответов из баз данных.
  • Автоматизация программирования: Генерация кода в реальном времени.

Таблица выбора:

Идеально дляНе рекомендуется для
Сверхбыстрых агентских системДлинного литературного творчества
Обработки JSONСложного поэтического стиля
Голосовых помощниковЗадач, требующих глубины «Chain of Thought» уровня моделей-гигантов

6. Ограничения

Несмотря на инновационную архитектуру, Mercury 2 имеет ряд ограничений:

  • Специфика диффузии: В очень творческих, абстрактных задачах модель может уступать авторегрессионным гигантам в богатстве языка.
  • Сложность промптинга: Из-за итеративного механизма требования к промптам могут отличаться от привычных (потребуется калибровка глубины рассуждения для достижения максимального качества).
  • Галлюцинации: Как и любая LLM, модель подвержена вероятностным ошибкам, особенно при работе с фактами за пределами обучающей выборки.

Mercury 2 знаменует собой переход к эпохе параллельных вычислений в ИИ, делая взаимодействие с нейросетями почти мгновенным и открывая двери для новых типов интерактивных приложений.

Провайдеры для Inception: Mercury 2

Inception

Статус

23,354 ₽Запрос/ 1М
70,061 ₽Ответ / 1М
Изображение вход /1М
Изображение выход /1М
128KКонтекст
50KМакс. ответ

Статус работы провайдера

Нет данных 29 мар., 16:50 – 17:00

Дополнительные цены

2,335 ₽Кэш чтение /1М

Политика в отношении данных

Prompt Training:-
Prompt Logging:-
Moderation:Not moderated

Поддерживаемые параметры

reasoninginclude_reasoningmax_tokensstoptemperaturetoolstool_choiceresponse_formatstructured_outputs

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

import OpenAI from 'openai';

const openai = new OpenAI({
  baseURL: 'https://polza.ai/api/v1',
  apiKey: '<POLZA_AI_API_KEY>'
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'inception/mercury-2',
    messages: [{
      role: 'user',
      content: 'Что думаешь об этой жизни?',
    }],
  });
  console.log(completion.choices[0].message);
}

main();
SelectВыбор за вами
Polza.AI Logo

Polza.AI — лучший выбор

для

Воспользуйтесь сервисом прямо сейчас. А если остались вопросы - запишитесь на демо

Inception: Mercury 2 — цены, контекст, API | Polza AI