Всем привет! Сегодня я хочу поделиться своим проектом, который вырос из простой идеи «сделать удобно» в полноценного мультимодального Telegram-бота — бота с несколькими личностями, интеграцией с iCloud и собственной системой внутреннего биллинга и многим другим. А бэкендом для всей этой магии выступает единый API от Polza.ai.
Проблема: зоопарк подписок и вкладок
Я думаю, многим это знакомо: для текстов и кода ты используешь одну нейросеть (к примеру Gemini через VPN), для картинок — покупаешь отдельную подписку, а для транскрибации голосовых ищешь третьего бота или идёшь в Google Translate и «надиктовываешь» запрос туда. В какой-то момент мне надоело прыгать между вкладками и окнами — мне хотелось иметь «единый пульт управления» прямо в Telegram.
Требования были простыми:
- Доступ к топовым LLM (Gemini, GPT) и генераторам изображений (GPT, Nano Banana Pro, Grok) в одном месте
- Оплата по принципу pay-as-you-go (платишь только за то, что потратил)
- Стабильный API
Выбор пал на Polza.ai. Спойлер: платформа не просто закрыла все потребности, но и подкинула пару забавных фич, о которых расскажу ниже.
Архитектура: один бот — пять личностей
Вместо того чтобы делать типичного чат-бота «вопрос-ответ», я написал на Python (с библиотекой telebot) систему с разными «личностями», каждая из которых решает свою задачу через API Polza, меняя системные промпты.
📅 Астра (Тайм-менеджмент)
Личный ассистент-хранитель расписания. Работает на базе Gemini 2.5 Flash. Я записываю ей голосовое в Telegram: «Напомни завтра в 15:00 сходить в зал». Бот переводит голос в текст (спасибо интеграции с Whisper 1), Gemini вытаскивает даты, упаковывает их в строгий JSON, и мой Python-скрипт через протокол CalDAV отправляет .ics-файл прямо в Apple Calendar. В моём календаре на телефоне появляется запись со временем и напоминанием — а редактировать расписание можно также через голосовые или текстовые запросы.
💼 Бальзак (Финансовый агрегатор)
Минималистичный фин-учёт. Вместо сложных таблиц я просто отправляю боту скрин своих расходов или доходов из заметок/сообщений. Gemini использует image_url, читает картинку, конвертирует строчки в JSON-массив и складывает в локальную SQLite базу.
💎 БогдановAI и Nano Banana (Арт-дирекция)
Здесь начинается генерация. Gemini выступает в роли «промпт-инженера», собирая сложнейшие структуры для генерации (камера, свет, ISO, фокус). Затем готовый промпт летит в модель Nano Banana 2 или Grok Image.


Технические челленджи и их решения
1. Укрощение JSON и борьба с «ленью» нейросетей
Был момент, когда при подсчёте частичного погашения долгов Gemini ленилась считать математику и выдавала в JSON текстовый плейсхолдер:
{"amount": "<ОСТАТОК_ДОЛГА>"}
Естественно, база данных от такого «мува ИИ» ломалась. Пришлось прописывать жёсткие системные промпты (капсом запрещать слова в поле amount) и делать на стороне Python принудительную конвертацию через float(), защищая код от сбоев.
2. Внедрение собственного микро-биллинга
Так как Polza.ai списывает деньги за токены, мне было важно понимать, сколько тратят мои тестеры, не заходя каждый раз в дашборд Polza.ai. Мы с ИИ-коллегой написали систему внутреннего биллинга прямо в боте.
Проанализировав историю запросов в дашборде PolzaAI, вывели средние значения:
| Действие | Стоимость |
|---|---|
| Генерация картинки (Nano Banana 2) | 4.80 ₽ |
| Анализ фото (Vision) | 0.30 ₽ |
| Обычный текстовый запрос / voice | 0.05 ₽ |
Эти тарифы зашиты в код: при каждом вызове API бот фоном плюсует копейки к beta_stats.json. В админ-панели есть кнопка «💰 Биллинг», которая выдаёт красивый отчёт по расходам до сотых долей рубля. Точность совпадения с реальным балансом — ~99%.



«Баг», который оказался фичей
Один из самых забавных моментов случился при тестировании модели Grok Image: обычно при генерации API отдаёт массив из 2 ссылок на картинки. Но однажды сервер на стороне xAI/Polza расщедрился и сгенерировал в одном ответе сразу 6 ссылок!
Мой код не крашнулся, динамически подстроился, скачал все 6 исходников и выдал их в чат. Самое приятное: в истории биллинга Polza.ai за этот запрос списали стандартные 2.50 ₽. Получить в 3 раза больше контента по цене одного запроса — это не баг, это фича!


Итоги
Polza.ai оказалась отличным и надёжным бэкендом для разработки. Благодаря единому ключу авторизации и доступу к совершенно разным архитектурам (от Whisper до Gemini 2.5 Flash и других), удалось собрать сложную систему, которая экономит как часы рутины, так и кучу разных ИИ-подписок каждый день.
Если вы задумывались о том, чтобы перенести свои проекты на единый API — смело могу порекомендовать Polza.ai API. Мне её более чем хватает!
