К списку моделей
MoonshotAI: Kimi K2 0905
ID: moonshotai/kimi-k2-0905
59,81 ₽
Запрос / 1М
249,22 ₽
Ответ / 1М
—
Изображение вход / 1М
—
Изображение выход / 1М
262K
Контекст
8K
Макс. ответ
Провайдеры для MoonshotAI: Kimi K2 0905
AtlasCloud
Статус
59,812 ₽Запрос / 1М
249,216 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
8KМакс. ответ
Дополнительные цены
59,812 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.min_pfrequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.repetition_penaltystopСписок строк, при встрече которых модель прекращает генерацию.seedФиксирует генерацию для воспроизводимых результатов.logit_biasresponse_formatЗадаёт формат ответа: текст или структурированный JSON.structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
BaseTen
Статус
59,812 ₽Запрос / 1М
249,216 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
164KМакс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.response_formatЗадаёт формат ответа: текст или структурированный JSON.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.stopСписок строк, при встрече которых модель прекращает генерацию.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
Chutes
Статус
38,878 ₽Запрос / 1М
189,404 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
19,439 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
response_formatЗадаёт формат ответа: текст или структурированный JSON.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.seedФиксирует генерацию для воспроизводимых результатов.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.repetition_penaltystructured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
DeepInfra
Статус
39,875 ₽Запрос / 1М
199,373 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
131KКонтекст
—Макс. ответ
Дополнительные цены
14,953 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.repetition_penaltytop_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.seedФиксирует генерацию для воспроизводимых результатов.min_presponse_formatЗадаёт формат ответа: текст или структурированный JSON.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
Fireworks
Статус
59,812 ₽Запрос / 1М
249,216 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
—Макс. ответ
Дополнительные цены
29,906 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.repetition_penaltylogit_biaslogprobsВозвращает логарифмические вероятности выбранных токенов.top_logprobsresponse_formatЗадаёт формат ответа: текст или структурированный JSON.structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
Groq
Статус
99,686 ₽Запрос / 1М
299,059 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
16KМакс. ответ
Дополнительные цены
49,843 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
response_formatЗадаёт формат ответа: текст или структурированный JSON.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.seedФиксирует генерацию для воспроизводимых результатов.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.
Moonshot AI
Статус
114,639 ₽Запрос / 1М
797,491 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
—Макс. ответ
Дополнительные цены
14,953 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.response_formatЗадаёт формат ответа: текст или структурированный JSON.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
Novita
Статус
59,812 ₽Запрос / 1М
249,216 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
response_formatЗадаёт формат ответа: текст или структурированный JSON.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.seedФиксирует генерацию для воспроизводимых результатов.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.repetition_penaltytoolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.
Parasail
Статус
58,815 ₽Запрос / 1М
298,062 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.response_formatЗадаёт формат ответа: текст или структурированный JSON.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.repetition_penaltyseedФиксирует генерацию для воспроизводимых результатов.stopСписок строк, при встрече которых модель прекращает генерацию.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.logit_biastoolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
SiliconFlow
Статус
39,875 ₽Запрос / 1М
199,373 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
262KМакс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.response_formatЗадаёт формат ответа: текст или структурированный JSON.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.frequency_penaltyСнижает вероятность повторения уже использованных токенов.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.
Together
Статус
99,686 ₽Запрос / 1М
299,059 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
262KКонтекст
—Макс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.response_formatЗадаёт формат ответа: текст или структурированный JSON.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.repetition_penaltylogit_biasmin_ptoolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
Nebius
Статус
49,843 ₽Запрос / 1М
239,247 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
131KКонтекст
—Макс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.repetition_penaltytoolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
DeepInfra
Статус
54,828 ₽Запрос / 1М
219,31 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
131KКонтекст
—Макс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.repetition_penaltytop_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.seedФиксирует генерацию для воспроизводимых результатов.min_presponse_formatЗадаёт формат ответа: текст или структурированный JSON.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
Novita
Статус
56,821 ₽Запрос / 1М
229,279 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
131KКонтекст
33KМакс. ответ
Дополнительные цены
—
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.seedФиксирует генерацию для воспроизводимых результатов.top_kОграничивает выбор токенов фиксированным количеством наиболее вероятных вариантов.repetition_penaltytoolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
Moonshot AI
Статус
59,812 ₽Запрос / 1М
249,216 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
131KКонтекст
—Макс. ответ
Дополнительные цены
14,953 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
structured_outputsГарантирует, что ответ модели соответствует заданной JSON-схеме.response_formatЗадаёт формат ответа: текст или структурированный JSON.max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.stopСписок строк, при встрече которых модель прекращает генерацию.frequency_penaltyСнижает вероятность повторения уже использованных токенов.presence_penaltyПоощряет модель использовать новые темы в ответе.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.logprobsВозвращает логарифмические вероятности выбранных токенов.top_logprobs
AtlasCloud
Статус
69,78 ₽Запрос / 1М
249,216 ₽Ответ / 1М
—Изображение вход / 1М
—Изображение выход / 1М
131KКонтекст
66KМакс. ответ
Дополнительные цены
69,78 ₽Кэш чтение / 1М
Политика в отношении данных
Prompt Training:-
Prompt Logging:-
Moderation:Not moderated
Поддерживаемые параметры
max_tokensЭто устанавливает верхний предел для количества токенов, которые модель может генерировать в ответ. Больше этого предела выдаваться не будет. Максимальное значение - это длина контекста за вычетом длины запроса.temperatureУправляет случайностью ответа. Низкие значения (0.0–0.3) делают ответ более детерминированным, высокие (0.7–1.0) — более креативным.top_pNucleus sampling — ограничивает выбор токенов по совокупной вероятности. Значение 0.9 означает, что модель рассматривает только токены, составляющие 90% вероятности.toolsПозволяет модели вызывать внешние функции (function calling) для получения данных или выполнения действий.tool_choiceУправляет тем, должна ли модель вызывать инструмент, и если да — какой именно.
API и примеры кода
Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный
в личном кабинете.
