Polza.AI
Polza.ai Logo

Начните пользоваться прямо сейчас

Единый API для 400+ моделей ИИ. Создавайте тексты, код, изображения, аудио и видео в одном интерфейсе.

TelegramXInstagramYouTubeVK
© 2025 Polza Ai • Все права защищены
К списку моделей
Qwen: Qwen3.5-122B-A10B

Qwen: Qwen3.5-122B-A10B

ID: qwen/qwen3.5-122b-a10b

Попробовать

24,29 ₽

Запрос/ 1М

194,3 ₽

Ответ / 1М

Изображение вход /1М

Изображение выход /1М

262K

Контекст

66K

Макс. ответ

Описание

Технический обзор нейросетевой модели Qwen3.5-122B-A10B

1. Введение и общее описание

Qwen3.5-122B-A10B — это передовая мультимодальная модель с открытыми весами, разработанная компанией Alibaba Cloud. Она представляет собой мощное решение в рамках серии Qwen 3.5, занимая позицию «золотой середины» между компактными моделями и флагманскими системами сверхбольшого масштаба.

Модель спроектирована как универсальный инструмент для решения комплексных задач, объединяющий глубокое понимание текста, программирование и сложные визуальные рассуждения. Благодаря архитектуре Sparse Mixture-of-Experts (MoE), модель сочетает высокую точность с эффективностью вывода. Контекстное окно объемом 262 144 токена (с возможностью расширения до 1 млн токенов через YaRN) делает её подходящей для анализа массивных документов и длинных сессий кода. Она ориентирована на профессиональных разработчиков, исследовательские группы и предприятия, которым требуется высокая производительность при управляемых требованиях к вычислительным ресурсам.

2. Технические характеристики

  • Архитектура: Гибридная система, сочетающая Gated DeltaNet и Sparse Mixture-of-Experts. Модель использует продвинутый механизм маршрутизации экспертов (8 активных из 256 + 1 общий).
  • Количество параметров: 122 миллиарда общих параметров, из которых 10 миллиардов параметров активируются при обработке каждого токена.
  • Контекстное окно: 262 144 нативных токена, расширяемость до ~1 000 000.
  • Максимальный выход: 65 536 токенов.
  • Мультимодальность: Поддержка текста, изображений и видео.
  • Языковая поддержка: 201 язык и диалект, включая глубокую интеграцию региональных лингвистических особенностей.
  • Особенности слоев: 48 слоев с размерностью скрытого состояния (hidden dimension) 3072.
  • Лицензирование: Apache 2.0.

3. Показатели производительности (бенчмарки)

Модель Qwen3.5-122B-A10B демонстрирует показатели, которые вплотную приближают её к закрытым флагманским решениям.

БенчмаркРезультат
MMLU-Pro86.7
GPQA Diamond86.6
MMMU (Vision)83.9
SWE-bench Verified72.0
LiveCodeBench v678.9
  • Комментарий: Показатель GPQA Diamond (86.6) является выдающимся для модели данного класса, опережая многие существующие рыночные решения. Высокие баллы в SWE-bench и LiveCodeBench подтверждают, что модель способна решать реальные инженерные задачи, а не только академические тесты.

4. Ключевые возможности

  1. Продвинутое программирование: Высокая способность к дебаггингу и написанию чистого кода.
    • Пример промпта: "Проанализируй данный репозиторий (предоставлен как контекст) и предложи рефакторинг для оптимизации O(n^2) операции в модуле обработки данных, используя многопоточность."
  2. Мультимодальное мышление: Способность «видеть» и анализировать графики, схемы и видеопотоки.
  3. Длинный контекст: Удержание фокуса на специфических деталях внутри документов объемом в сотни страниц.
  4. Агентные навыки: Эффективная работа с внешними инструментами через вызов функций (Function Calling).
    • Пример промпта: "Используй инструменты поиска и анализа баз данных, чтобы составить отчет о продажах за Q3, сравнив их с прогнозами, представленными в PDF-файле."
  5. Логическое рассуждение (Reasoning): Способность к дедукции в сложных научных и математических дисциплинах.

5. Оптимальные случаи использования

  • Анализ больших данных: Обработка юридических архивов или технической документации.
  • AI-разработка: Роль «умного» помощника в IDE (Copilot-style сценарии).
  • Vision-аналитика: Автоматизация извлечения данных из таблиц, чертежей и OCR-задач.
  • RAG-системы: Работа в качестве мощного движка извлечения смыслов для баз знаний.

Кому подходит: Организациям с собственными инфраструктурными мощностями (H100/A100 кластеры), разработчикам сложных агентных систем. Кому не стоит использовать: Проектам, требующим мгновенного ответа на слабых домашних GPU (модель требует значительного объема VRAM из-за размера весов) или задачам, где критично низкое энергопотребление и отсутствие задержек (latency).

6. Ограничения

  • Ресурсная емкость: Несмотря на MoE-архитектуру, полноценный инференс 122B модели требует многокарточных конфигураций или серьезного квантования, что может снизить точность.
  • Галлюцинации: Как и любая LLM, модель склонна к уверенным, но фактическим неверным ответам при нехватке контекста.
  • Сложность настройки: Для достижения максимальной эффективности агентных задач требуется тщательный системный промптинг и настройка параметров генерации (temperature, top_p).
  • Цензура и этика: Модель прошла этапы обучения для соблюдения этических норм безопасности, что может иногда приводить к чрезмерно осторожным отказам в ответе на острые темы.

Провайдеры для Qwen: Qwen3.5-122B-A10B

Alibaba

Статус

24,288 ₽Запрос/ 1М
194,302 ₽Ответ / 1М
Изображение вход /1М
Изображение выход /1М
262KКонтекст
66KМакс. ответ

Статус работы провайдера

Нет данных 29 мар., 16:50 – 17:00

Дополнительные цены

Политика в отношении данных

Prompt Training:-
Prompt Logging:-
Moderation:Not moderated

Поддерживаемые параметры

reasoninginclude_reasoningmax_tokenstemperaturetop_pseedpresence_penaltyresponse_formattoolstool_choicestructured_outputslogprobstop_logprobs

Novita

Статус

37,366 ₽Запрос/ 1М
298,926 ₽Ответ / 1М
Изображение вход /1М
Изображение выход /1М
262KКонтекст
66KМакс. ответ

Статус работы провайдера

Нет данных 29 мар., 16:50 – 17:00

Дополнительные цены

Политика в отношении данных

Prompt Training:-
Prompt Logging:-
Moderation:Not moderated

Поддерживаемые параметры

reasoninginclude_reasoningmax_tokenstemperaturetop_pstopfrequency_penaltypresence_penaltyseedtop_krepetition_penaltytoolstool_choiceresponse_format

AtlasCloud

Статус

28,024 ₽Запрос/ 1М
224,195 ₽Ответ / 1М
Изображение вход /1М
Изображение выход /1М
262KКонтекст
66KМакс. ответ

Статус работы провайдера

Нет данных 29 мар., 16:50 – 17:00

Дополнительные цены

28,024 ₽Кэш чтение /1М

Политика в отношении данных

Prompt Training:-
Prompt Logging:-
Moderation:Not moderated

Поддерживаемые параметры

reasoninginclude_reasoningmax_tokenstemperaturetop_ptop_kmin_pfrequency_penaltypresence_penaltyrepetition_penaltyseedlogit_biasresponse_formatstructured_outputstoolstool_choice

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

import OpenAI from 'openai';

const openai = new OpenAI({
  baseURL: 'https://polza.ai/api/v1',
  apiKey: '<POLZA_AI_API_KEY>'
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'qwen/qwen3.5-122b-a10b',
    messages: [{
      role: 'user',
      content: 'Что думаешь об этой жизни?',
    }],
  });
  console.log(completion.choices[0].message);
}

main();
SelectВыбор за вами
Polza.AI Logo

Polza.AI — лучший выбор

для

Воспользуйтесь сервисом прямо сейчас. А если остались вопросы - запишитесь на демо

Qwen: Qwen3.5-122B-A10B — цены, контекст, API | Polza AI