Перейти к основному содержанию
Reasoning Tokens, также известные как thinking tokens или токены рассуждений, предоставляют прозрачный взгляд на процесс рассуждения модели искусственного интеллекта.

Как это работает

1

Внутренний процесс

Модель проходит внутренний процесс размышления над задачей
2

Сохранение рассуждений

Промежуточные мысли сохраняются как токены рассуждений
3

Формирование ответа

На основе рассуждений создаётся финальный ответ
4

Возврат результата

Возвращаются и рассуждения, и итоговый результат

Ключевые преимущества

Прозрачность

Видимость процесса принятия решений моделью

Улучшенное качество

Лучшее решение сложных задач

Отладка

Понимание источников ошибок

Обучение

Изучение подходов к решению проблем
Reasoning tokens учитываются как output tokens для биллинга и увеличивают стоимость, но значительно повышают качество ответов.

Поддерживаемые модели

Модельenabledexcludeeffortmax_tokenssummary
T-Pro 2.0+----
OpenAI o-series++++*+
Anthropic Claude+++++
DeepSeek R1++++*-
Grok+++--
Gemini Thinking+++*++

Параметры управления

effort

Управляет интенсивностью рассуждений:
  • none — рассуждения отключены
  • minimal — минимальные рассуждения
  • low — сниженные рассуждения
  • medium — сбалансированный режим (по умолчанию)
  • high — детальные рассуждения
  • xhigh — максимально детальные рассуждения

max_tokens

Ограничивает количество токенов рассуждений.

exclude

Если true, рассуждения не включаются в ответ (но всё равно учитываются в биллинге).

summary

Управляет уровнем детализации резюме рассуждений:
  • auto — автоматический выбор (по умолчанию)
  • concise — краткое резюме
  • detailed — подробное резюме

enabled

Явное включение/выключение рассуждений (true / false). По умолчанию определяется из effort или max_tokens.

Когда использовать

Рекомендуется

  • Математические задачи
  • Программирование
  • Анализ данных
  • Планирование
  • Логические головоломки
  • Объяснение сложных концепций

Не рекомендуется

  • Простые фактические вопросы
  • Генерация контента
  • Перевод текстов
  • Простые диалоги
  • Когда скорость критична

Пример использования

{
  "model": "openai/o4-mini",
  "messages": [
    {
      "role": "user",
      "content": "Реши уравнение: 2x + 5 = 13"
    }
  ],
  "reasoning": {
    "effort": "high",
    "max_tokens": 1000,
    "summary": "auto"
  }
}

Ответ с рассуждениями

{
  "choices": [
    {
      "message": {
        "content": "x = 4",
        "reasoning": "Чтобы решить уравнение 2x + 5 = 13:\n1. Вычтем 5 из обеих сторон: 2x = 8\n2. Разделим обе стороны на 2: x = 4\n3. Проверка: 2(4) + 5 = 8 + 5 = 13 ✓"
      }
    }
  ],
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 25,
    "completion_tokens_details": {
      "reasoning_tokens": 89
    }
  }
}