POST Media
Универсальный API генерации медиа (изображения, видео, аудио)
Documentation Index
Fetch the complete documentation index at: https://polza.ai/docs/llms.txt
Use this file to discover all available pages before exploring further.
О Media API
Универсальный эндпоинт для генерации медиа контента. Поддерживает различные модели и провайдеров через единый интерфейс.Общие параметры
| Параметр | Тип | Обязательный | Описание |
|---|---|---|---|
model | string | Да | ID модели для генерации |
input | object | Да | Параметры генерации (зависят от модели) |
async | boolean | Нет | Принудительный асинхронный режим |
user | string | Нет | Идентификатор конечного пользователя |
provider | object | Нет | Конфигурация роутинга по провайдерам |
Передача файлов (URL и base64)
Для моделей, поддерживающих image-to-image или video-to-video, медиа файлы передаются в массивеimages или videos. Каждый элемент — объект с полями:
| Поле | Тип | Описание |
|---|---|---|
type | "url" | "base64" | Формат данных |
data | string | URL файла или base64-строка (с data URI или без) |
Пример с base64
data:image/png;base64,...), так и без — просто строка base64.
Если провайдер не поддерживает base64 напрямую, файл автоматически загружается в хранилище и передаётся как URL.Типы контента
- Изображения (Nano Banana, Seedream, GPT Image и др.)
- Видео (Veo, Wan, Kling, Seedance, Sora и др.)
- Аудио — синтез речи (TTS) и распознавание речи (STT)
Хранение результатов
При генерации медиа контента Polza.ai автоматически:- Скачивает результат у AI провайдера на собственное хранилище
- Хранит файлы 7 дней для повторного доступа
- Раздаёт через CDN для быстрого доступа внутри России
PERMANENT.Руководства по моделям
Подробные примеры, параметры и особенности каждой модели — в руководствах:Видео
Изображения
Аудио
Ответ
Возвращает объект Media Status со статусомpending:
Авторизации
API ключ передаётся в заголовке: Authorization: Bearer <POLZA_AI_API_KEY>
Тело
ID модели для генерации
"seedream-3"
Входные параметры генерации
- Изображение
- Видео
- Аудио (TTS)
- Музыка
Настройки роутинга провайдеров
Асинхронный режим генерации. При true возвращается taskId для опроса статуса
false
Уникальный идентификатор конечного пользователя для отслеживания и предотвращения злоупотреблений
"user-123"
Ответ
Уникальный идентификатор генерации
"gen_581761234567890123"
Тип объекта
"media.generation"
Статус генерации
pending, processing, completed, failed, cancelled "pending"
Временная метка создания (Unix timestamp)
1703001234
ID модели, которая генерирует контент
"google/gemini-2.5-flash-image"
Временная метка завершения (Unix timestamp)
1703001244
Данные сгенерированного контента
Информация об использовании ресурсов
Информация об ошибке (если failed)
Текстовый ответ модели (если вернула текст вместо/вместе с изображением)
"Банан и яблоко — это фрукты."
Краткое резюме рассуждений модели
"Preparing image generation prompt with camera settings..."
Предупреждения (неподдерживаемые параметры и т.д.)
[
"Параметр isEnhance не поддерживается OpenRouter и будет проигнорирован"
]