Перейти к основному содержанию
Быстрая модель синтеза речи (text-to-speech) от ElevenLabs. Текст до 5000 символов, выбор голоса, скорость 0.7–1.2, опциональные временные метки и контекст (previous_text, next_text).
Полная документация API: Генерация медиа

Обзор

ХарактеристикаЗначение
ID моделиelevenlabs/text-to-speech-turbo-2-5
Max prompt5 000 символов
voiceRachel, Aria, Roger, Sarah и др. (по умолчанию Rachel)
speed0.7–1.2, по умолчанию 1
stability, similarity_boost, style0–1
timestampstrue / false
language_coderu, en, de, fr, es и др. (ISO 639-1)

Параметры

ПараметрОбязательныйОписание
modelДаelevenlabs/text-to-speech-turbo-2-5
promptДаТекст для синтеза речи, до 5000 символов
voiceНетГолос. По умолчанию Rachel
speedНет0.7–1.2. По умолчанию 1
stabilityНетСтабильность голоса 0–1
similarity_boostНетУсиление схожести 0–1
styleНетЭкспрессия стиля 0–1
timestampsНетtrue/false — возвращать временные метки слов
previous_textНетПредшествующий текст для контекста, до 5000 символов
next_textНетПоследующий текст для контекста, до 5000 символов
language_codeНетКод языка ISO 639-1

Пример запроса (cURL)

curl -X POST "https://polza.ai/api/v1/media" \
  -H "Authorization: Bearer <POLZA_AI_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "elevenlabs/text-to-speech-turbo-2-5",
    "input": {
      "prompt": "Текст для синтеза речи",
      "voice": "Rachel",
      "speed": 1,
      "stability": 0.5,
      "similarity_boost": 0.75,
      "style": 0,
      "timestamps": "false",
      "language_code": "ru"
    },
    "async": true
  }'