Перейти к основному содержанию
Usage Accounting — встроенная функция для отслеживания использования токенов и стоимости AI-запросов с возвратом информации в ответе.

Как работает

  • Автоматический подсчет токенов и расходов
  • Детальная аналитика по типам (prompt, completion, reasoning, cached)
  • Готовая стоимость в рублях, уже списанная
  • Информация включается в стандартный ответ API без задержек

Структура ответа

Каждый ответ API содержит объект usage:
{
  "usage": {
    "prompt_tokens": 150,
    "completion_tokens": 250,
    "total_tokens": 400,
    "cost_rub": 15.75,
    "cost": 15.75,
    "prompt_tokens_details": {
      "cached_tokens": 100,
      "audio_tokens": 10,
      "video_tokens": 5
    },
    "completion_tokens_details": {
      "reasoning_tokens": 50,
      "audio_tokens": 10,
      "image_tokens": 5
    }
  }
}

Поля usage

ПолеОписание
prompt_tokensВходящие токены
completion_tokensВыходящие токены
total_tokensСумма всех токенов
cost_rubСтоимость в рублях
costСтоимость в рублях (алиас cost_rub)

Детализация входных токенов (prompt_tokens_details)

ПолеОписание
cached_tokensТокены из кеша (~90% дешевле)
audio_tokensТокены аудио во входных данных
video_tokensТокены видео во входных данных

Детализация выходных токенов (completion_tokens_details)

ПолеОписание
reasoning_tokensТокены рассуждений (для o1, R1 и др.)
audio_tokensТокены аудио в ответе
image_tokensТокены изображений в ответе

Типы токенов и стоимость

ТипОписаниеСтоимость
PromptВходящие сообщения, контекстБазовая цена
CompletionГенерируемый текст2-4x выше prompt
ReasoningВнутренние рассуждения моделей~4x выше обычных
CachedИз кеша провайдера~90% дешевле

Streaming режим

В потоковом режиме информация о usage приходит в последнем SSE-сообщении перед [DONE]:
data: {"choices":[{"delta":{"content":"..."}}]}
data: {"choices":[{"delta":{"content":"..."}}]}
data: {"choices":[],"usage":{"prompt_tokens":100,"completion_tokens":200,"cost_rub":5.50,"cost":5.50}}
data: [DONE]

Оптимизация расходов

Используйте кеширование

Для повторяющихся промптов экономия до 90%

Выбирайте модель

Подбирайте модель под сложность задачи

Ограничивайте max_tokens

Устанавливайте разумные лимиты

Мониторьте reasoning

Reasoning токены дороже, но эффективнее

Проверка баланса

Для отслеживания общего баланса используйте API баланса:
curl -H "Authorization: Bearer <API_KEY>" \
  https://polza.ai/api/v1/balance
Ответ:
{
  "amount": "1250.50"
}