Перейти к основному содержанию
POST
/
v2
/
images
/
generations
Создать генерацию изображения (OpenAI-совместимый API)
curl --request POST \
  --url https://polza.ai/api/v2/images/generations \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "dall-e-3",
  "prompt": "A white siamese cat sitting on a windowsill",
  "n": 1,
  "size": "auto",
  "quality": "auto",
  "response_format": "url",
  "style": "vivid",
  "user": "user-123"
}
'
{
  "created": 1589478378,
  "data": [
    {
      "url": "https://oaidalleapiprodscus.blob.core.windows.net/...",
      "b64_json": "iVBORw0KGgoAAAANSUhEUgAAAAUA...",
      "revised_prompt": "A fluffy white siamese cat with blue eyes sitting peacefully on a wooden windowsill..."
    }
  ],
  "usage": {
    "input_units": 1,
    "output_units": 1,
    "duration_seconds": 5,
    "input_tokens": 10,
    "output_tokens": 0,
    "total_tokens": 10,
    "cost_rub": 1.5,
    "cost": 1.5
  }
}
OpenAI-совместимый эндпоинт для генерации изображений. Поддерживает формат запросов GPT image models, DALL-E 3, DALL-E 2.
Этот эндпоинт совместим с OpenAI SDK и подходит для быстрой миграции существующего кода. Если вы разрабатываете новый софт — рекомендуем использовать Media API, который предоставляет единый интерфейс для всех медиа-операций.
Этот эндпоинт доступен по пути /v2/images/generations. При использовании OpenAI SDK с base_url="https://polza.ai/api/v1" запросы автоматически направляются на правильный путь.

Параметры

Обязательные

ПараметрТипОписание
modelstringМодель для генерации (например, gpt-image-1, dall-e-3)
promptstringТекстовое описание изображения

Опциональные

ПараметрТипПо умолчаниюОписание
ninteger (1-10)1Количество изображений
sizestringautoРазмер изображения
qualitystringautoКачество генерации
response_formatstringurlФормат ответа: url, b64_json
stylestringvividСтиль: vivid, natural (только DALL-E 3)
userstringИдентификатор конечного пользователя

size

Размер генерируемого изображения:
ЗначениеОписание
autoПровайдер сам определит размер (по умолчанию)
256x256Маленький квадрат
512x512Средний квадрат
1024x1024Большой квадрат
1536x1024Горизонтальный
1024x1536Вертикальный
1792x1024Широкий горизонтальный
1024x1792Высокий вертикальный

quality

Качество генерации:
ЗначениеОписание
autoАвтоматический выбор (по умолчанию)
lowНизкое качество (быстрее)
mediumСреднее качество
highВысокое качество
standardСтандартное (для DALL-E)
hdHD качество (для DALL-E 3)

Примеры

curl -X POST "https://polza.ai/api/v2/images/generations" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-1",
    "prompt": "Космический пейзаж с планетами",
    "size": "1024x1024",
    "quality": "high"
  }'

Поведение при таймауте

Генерация выполняется синхронно с таймаутом 120 секунд.

Успешная генерация (до 120 сек)

Возвращается объект с результатом:
{
  "created": 1706123456,
  "data": [
    {
      "url": "https://cdn.polza.ai/...",
      "revised_prompt": "Улучшенный промпт..."
    }
  ],
  "usage": {
    "input_tokens": 10,
    "output_tokens": 0,
    "total_tokens": 10,
    "cost_rub": 2.50,
    "cost": 2.50
  }
}

Таймаут (более 120 сек)

Если генерация не успевает завершиться за 120 секунд, запрос автоматически переходит в асинхронный режим:
{
  "id": "gen_abc123...",
  "status": "pending",
  "model": "dall-e-3",
  "created": 1706123456
}
Используйте GET /v1/media/{id} для проверки статуса. Рекомендуется polling с интервалом 3-5 секунд.

Статусы генерации

СтатусОписание
pendingВ очереди
processingГенерация выполняется
completedГотово
failedОшибка

Тело

application/json
model
string
обязательно

ID модели для генерации изображений

Пример:

"dall-e-3"

prompt
string
обязательно

Текстовое описание изображения для генерации (до 32000 символов для GPT image models, 4000 для dall-e-3)

Пример:

"A white siamese cat sitting on a windowsill"

n
number
по умолчанию:1

Количество генерируемых изображений (1-10, для dall-e-3 только 1)

Требуемый диапазон: 1 <= x <= 10
Пример:

1

size
enum<string>
по умолчанию:auto

Размер генерируемого изображения. auto для GPT image models

Доступные опции:
auto,
256x256,
512x512,
1024x1024,
1536x1024,
1024x1536,
1792x1024,
1024x1792
Пример:

"auto"

quality
enum<string>
по умолчанию:auto

Качество изображения. auto/high/medium/low для GPT image models, hd/standard для DALL-E

Доступные опции:
auto,
low,
medium,
high,
standard,
hd
Пример:

"auto"

response_format
enum<string>
по умолчанию:url

Формат ответа - URL или base64-encoded JSON

Доступные опции:
url,
b64_json
Пример:

"url"

style
enum<string>
по умолчанию:vivid

Стиль изображения (только для dall-e-3)

Доступные опции:
vivid,
natural
Пример:

"vivid"

user
string

Уникальный идентификатор конечного пользователя для отслеживания и предотвращения злоупотреблений

Пример:

"user-123"

Ответ

Успешная генерация изображения. При таймауте (>120 сек) возвращается ImagePendingResponsePresenter с taskId для проверки статуса через GET /v2/media/{id}

created
number
обязательно

Unix timestamp времени создания

Пример:

1589478378

data
object[]
обязательно

Массив сгенерированных изображений

usage
object

Информация об использовании ресурсов