К списку моделей

Провайдер хранит данные в РФ
Qwen: Qwen3.6 35B A3B
ID: qwen/qwen3.6-35b-a3b
256 ₽
Запрос / 1М
64 ₽
Ответ / 1М
—
Изображение вход / 1М
—
Изображение выход / 1М
262K
Контекст
—
Макс. ответ
Провайдеры для Qwen: Qwen3.6 35B A3B
yandex
Статус
256 ₽Запрос / 1М
64 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
—Макс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.
WandB
Статус
23,008 ₽Запрос / 1М
115,04 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
23,008 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
reasoningВключает режим размышлений (chain-of-thought), где модель показывает ход рассуждений.include_reasoningВключает вывод рассуждений модели в ответ.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.repetition_penaltyfrequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.stopСписок строк, при встрече которых модель прекращает генерацию.seedФиксирует генерацию для воспроизводимых результатов.response_formatЗадаёт формат ответа: текст или структурированный JSON.structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.
DekaLLM
Статус
13,713 ₽Запрос / 1М
92,032 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
—Макс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
reasoningВключает режим размышлений (chain-of-thought), где модель показывает ход рассуждений.include_reasoningВключает вывод рассуждений модели в ответ.frequency_penaltyСнижает вероятность повторения уже использованных токенов.logit_biasmax_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.presence_penaltyПоощряет модель использовать новые темы в ответе.seedФиксирует генерацию для воспроизводимых результатов.stopСписок строк, при встрече которых модель прекращает генерацию.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.logprobsВозвращает логарифмические вероятности выбранных токенов.top_logprobs
Io Net
Статус
15,645 ₽Запрос / 1М
110,438 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
reasoningВключает режим размышлений (chain-of-thought), где модель показывает ход рассуждений.include_reasoningВключает вывод рассуждений модели в ответ.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.seedФиксирует генерацию для воспроизводимых результатов.response_formatЗадаёт формат ответа: текст или структурированный JSON.
AkashML
Статус
15,645 ₽Запрос / 1М
110,438 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
reasoningВключает режим размышлений (chain-of-thought), где модель показывает ход рассуждений.include_reasoningВключает вывод рассуждений модели в ответ.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.repetition_penaltyseedФиксирует генерацию для воспроизводимых результатов.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.response_formatЗадаёт формат ответа: текст или структурированный JSON.structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
AtlasCloud
Статус
14,836 ₽Запрос / 1М
88,834 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
66KМакс. ответ
Дополнительные цены
14,836 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
reasoningВключает режим размышлений (chain-of-thought), где модель показывает ход рассуждений.include_reasoningВключает вывод рассуждений модели в ответ.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.min_pfrequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.repetition_penaltyseedФиксирует генерацию для воспроизводимых результатов.logit_biasresponse_formatЗадаёт формат ответа: текст или структурированный JSON.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
Parasail
Статус
13,805 ₽Запрос / 1М
92,032 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
4,602 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
reasoningВключает режим размышлений (chain-of-thought), где модель показывает ход рассуждений.include_reasoningВключает вывод рассуждений модели в ответ.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.repetition_penaltyseedФиксирует генерацию для воспроизводимых результатов.stopСписок строк, при встрече которых модель прекращает генерацию.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.logit_biasstructured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.response_formatЗадаёт формат ответа: текст или структурированный JSON.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
SiliconFlow
Статус
18,406 ₽Запрос / 1М
147,251 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
reasoningВключает режим размышлений (chain-of-thought), где модель показывает ход рассуждений.include_reasoningВключает вывод рассуждений модели в ответ.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.frequency_penaltyСнижает вероятность повторения уже использованных токенов.repetition_penaltypresence_penaltyПоощряет модель использовать новые темы в ответе.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.response_formatЗадаёт формат ответа: текст или структурированный JSON.
Ambient
Статус
13,805 ₽Запрос / 1М
92,032 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
4,602 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
reasoningВключает режим размышлений (chain-of-thought), где модель показывает ход рассуждений.include_reasoningВключает вывод рассуждений модели в ответ.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.frequency_penaltyСнижает вероятность повторения уже использованных токенов.logit_biasmin_ppresence_penaltyПоощряет модель использовать новые темы в ответе.repetition_penaltyseedФиксирует генерацию для воспроизводимых результатов.stopСписок строк, при встрече которых модель прекращает генерацию.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.response_formatЗадаёт формат ответа: текст или структурированный JSON.structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.logprobsВозвращает логарифмические вероятности выбранных токенов.top_logprobs
API и примеры кода
Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный
в личном кабинете.
