Перейти к основному содержанию
Многоязычная модель синтеза речи (text-to-speech) от ElevenLabs. Текст до 5000 символов, те же голоса и параметры, что и у Turbo, с поддержкой множества языков.
Полная документация API: Генерация медиа

Обзор

ХарактеристикаЗначение
ID моделиelevenlabs/text-to-speech-multilingual-v2
Max prompt5 000 символов
voiceRachel, Aria, Roger, Sarah и др. (по умолчанию Rachel)
speed0.7–1.2, по умолчанию 1
stability, similarity_boost, style0–1
timestampstrue / false
language_coderu, en, de, fr, es, it, pt, pl, uk и др. (ISO 639-1)

Параметры

ПараметрОбязательныйОписание
modelДаelevenlabs/text-to-speech-multilingual-v2
promptДаТекст для синтеза речи, до 5000 символов
voiceНетГолос. По умолчанию Rachel
speedНет0.7–1.2. По умолчанию 1
stabilityНетСтабильность голоса 0–1
similarity_boostНетУсиление схожести 0–1
styleНетЭкспрессия стиля 0–1
timestampsНетtrue/false — временные метки слов
previous_textНетПредшествующий текст, до 5000 символов
next_textНетПоследующий текст, до 5000 символов
language_codeНетКод языка ISO 639-1

Пример запроса (cURL)

curl -X POST "https://polza.ai/api/v1/media" \
  -H "Authorization: Bearer <POLZA_AI_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "elevenlabs/text-to-speech-multilingual-v2",
    "input": {
      "prompt": "Текст для синтеза речи",
      "voice": "Rachel",
      "speed": 1,
      "stability": 0.5,
      "similarity_boost": 0.75,
      "style": 0,
      "timestamps": "false",
      "language_code": "ru"
    },
    "async": true
  }'