Перейти к основному содержанию
Gemini Omni Video — мультимодальная модель генерации видео от Google DeepMind. Поддерживает text-to-video, image-to-video (анимация изображения) и video-to-video (редактирование существующего ролика), разрешения 720p / 1080p / 4K, длительность 4 / 6 / 8 / 10 сек.
Полная документация API: Генерация медиа

Обзор

ХарактеристикаЗначение
ID моделиgemini-omni-video
promptТекстовое описание желаемого видео
aspect_ratio16:9, 9:16
resolution720p, 1080p, 4k
duration4, 6, 8, 10 (секунды)
imagesМассив референсных изображений (image-to-video)
videosМассив исходных видео (video-to-video)
asynctrue (асинхронная генерация)

Режимы работы

Только текстовый промпт — модель генерирует ролик с нуля.
{
  "model": "gemini-omni-video",
  "input": {
    "prompt": "человек скачет на лошади по степи",
    "aspect_ratio": "16:9",
    "resolution": "1080p",
    "duration": "6"
  },
  "async": true
}

Параметры

ПараметрТипОбязательныйОписание
modelstringДаgemini-omni-video
promptstringДаТекстовое описание желаемого видео
aspect_ratiostringНет16:9, 9:16
resolutionstringНет720p, 1080p, 4k
durationstringНет4, 6, 8, 10 (секунды)
imagesarrayНетРеференсные изображения для image-to-video: [{ "type": "url", "data": "..." }]
videosarrayНетИсходные видео для video-to-video: [{ "type": "url", "data": "..." }]
asyncboolНетЗапустить генерацию асинхронно. По умолчанию true
Параметр async: true — обязателен для всех запросов: генерация видео возвращает id сразу, а готовый ролик приходит позже.

Пример запроса (cURL)

curl -X POST "https://polza.ai/api/v1/media" \
  -H "Authorization: Bearer <POLZA_AI_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-omni-video",
    "input": {
      "prompt": "человек скачет на лошади по степи",
      "aspect_ratio": "16:9",
      "resolution": "1080p",
      "duration": "6"
    },
    "async": true
  }'

Асинхронная генерация

Генерация видео — асинхронный процесс. После отправки запроса вы получите id, который нужно использовать для проверки статуса:
1

Отправка запроса

POST на /api/v1/media возвращает id генерации
2

Проверка статуса

GET на /api/v1/media/{id} возвращает текущий статус
3

Получение результата

Когда статус completed, в ответе будет URL готового видео

Советы и лучшие практики

В промпте явно указывайте, что должно двигаться: «камера приближается», «объект вращается», «человек бежит». Без этого модель может выдать статичную сцену.
Большие значения duration (8–10 сек) и 4k заметно увеличивают время и стоимость генерации. Для тестов используйте 720p + duration: 4.
images[] и videos[] принимают публичные URL в формате { "type": "url", "data": "https://..." }. Для приватных файлов сначала загрузите их через /v1/storage/upload (см. Хранилище файлов).
Если нужно не генерировать с нуля, а подправить существующий ролик (добавить эффект, изменить темп, сменить стиль) — используйте режим video-to-video через videos[].

Следующие шаги

Статус генерации

Проверка статуса генерации медиа

Хранилище файлов

Загрузка изображений и видео