TheDrummer: Cydonia 24B V4.1

ID: thedrummer/cydonia-24b-v4.1

Попробовать

28,02 ₽

Запрос/ 1М

46,71 ₽

Ответ / 1М

—

Изображение вход /1М

—

Изображение выход /1М

131K

Контекст

33K

Макс. ответ

Описание

Технический обзор cydonia-24b-v4.1

1. Введение и общее описание

Название модели: cydonia-24b-v4.1 Разработчик: Информация о прямом разработчике отсутствует. Модель является модифицированной версией, основанной на Mistral Small 3.2 24B. Позиционирование: cydonia-24b-v4.1 — это большая языковая модель (LLM), ориентированная на генерацию креативного текста и точное следование инструкциям, разработанная для задач, требующих высокой степени свободы от ограничений. Основные характеристики: Дистиллированная генеративная языковая модель (LLM), основанная на архитектуре Mistral Small 3.2 24B. Размер контекстного окна: Поддерживает контекстное окно объемом до 32768 токенов. Целевая аудитория: Разработчики, исследователи, создатели контента и предприятия, которым требуется гибкая, производительная и минимально ограниченная LLM для широкого спектра задач.

2. Технические характеристики

Архитектура

cydonia-24b-v4.1 базируется на архитектуре Mistral, известной своей эффективностью. В основе лежит архитектура Transformer с оптимизациями, такими как Grouped-Query Attention (GQA) для ускорения инференса и снижения требований к памяти, а также Sliding Window Attention (SWA) для эффективной обработки длинных последовательностей. Точные детали модификаций, примененных в версии Mistral Small 3.2 24B, не раскрываются, но предполагается сохранение основных принципов Mistral, направленных на достижение высокой производительности при разумном потреблении ресурсов. Модель, скорее всего, использует архитектуру dense, а не Mixture of Experts (MoE), что характерно для базовых моделей Mistral.

Параметры модели

Модель относится к классу 24-миллиардных моделей. Точное число параметров в версии cydonia-24b-v4.1 не уточняется, но базовая модель Mistral Small 3.2 24B ориентировочно содержит около 24 миллиардов параметров.

Контекстное окно

Модель поддерживает контекстное окно размером до 32768 токенов. Это позволяет обрабатывать и генерировать значительно большие объемы текста за один запрос, улучшая связность и полноту ответов, особенно в задачах, требующих анализа или генерации длинных текстов.

Требования к развертыванию

cydonia-24b-v4.1 доступна в различных вариантах квантования, что позволяет значительно снизить требования к вычислительным ресурсам. Для запуска модели в полном разрешении (без квантования) требуется высокопроизводительный GPU с большим объемом VRAM, ориентировочно от 60-80 GB. Квантованные версии (например, 4-битные, 8-битные) могут эффективно работать на потребительских GPU с 12-24 GB VRAM, что делает модель более доступной для локального использования или на менее мощном оборудовании.

Объем вывода

Максимальный объем вывода (количество генерируемых токенов за один запрос) обычно настраивается при развертывании. Для моделей такого размера он может достигать нескольких тысяч токенов, часто лимитируясь размером контекстного окна или специфическими настройками.

Поддерживаемые форматы

Основной формат работы модели — текст. Она обучена на обширных текстовых данных и способна генерировать связные и релевантные тексты различных стилей и жанров, а также код. Подтвержденных данных о нативной поддержке изображений или других мультимодальных форматов для cydonia-24b-v4.1 нет, она ориентирована на работу с текстом.

Языковая поддержка

Модель, унаследовав возможности от Mistral, демонстрирует сильные языковые способности, в первую очередь для английского языка. Информация о точном количестве поддерживаемых языков или их производительности в cydonia-24b-v4.1 ограничена. Ожидается, что модель будет способна работать с основными европейскими языками, хотя производительность может варьироваться.

3. Показатели производительности (бенчмарки)

Поскольку cydonia-24b-v4.1 является доработанной версией Mistral Small 3.2 24B, прямые, официально опубликованные бенчмарки для этой конкретной итерации модели могут отсутствовать. Однако, основываясь на производительности семейства Mistral Small и моделей сходного размера, можно сделать следующие выводы:

Математические задачи (GSM8K): Модели Mistral, включая версии около 24B, демонстрируют хорошие результаты в решении математических задач. Ожидается, что cydonia-24b-v4.1 будет показывать результаты, сравнимые или превосходящие базовую модель Mistral Small 3.2, что обеспечивает достаточную точность для решения задач уровня школьной и начальной университетской программы. Показатели на GSM8K, как правило, находятся в диапазоне 60-80% для моделей этого класса, что является конкурентным.
Научные вопросы (MMLU): Результаты Mistral в MMLU (Massive Multitask Language Understanding), охватывающем 57 предметных областей, демонстрируют конкурентоспособность с более крупными моделями. cydonia-24b-v4.1, вероятно, будет хорошо справляться с вопросами, охватывающими широкий спектр научных дисциплин, с показателями, ожидаемо превышающими 60% в среднем по задачам.
Программирование (HumanEval): Модели Mistral обычно показывают сильные способности в генерации кода. cydonia-24b-v4.1, вероятно, будет демонстрировать сравнимую или улучшенную производительность на задачах генерации кода, решая задачи из HumanEval с точностью, конкурентной с другими моделями 20-30B размерного класса (около 40-60% pass@1).
Рассуждение: Базовые модели Mistral демонстрируют продвинутые способности к рассуждению, включая логические выводы и следование сложным инструкциям. cydonia-24b-v4.1, ориентированная на "prompt adherence" (соблюдение промпта), вероятно, будет выделяться в задачах, требующих точного выполнения инструкций и логического вывода. Показатели на бенчмарках, проверяющих логическое мышление, как правило, находятся на высоком уровне для этого архитектурного семейства.
Мультимодальность: На данный момент нет информации о мультимодальных возможностях cydonia-24b-v4.1. Модель ориентирована на текстовую генерацию.

Общий комментарий: Производительность моделей Mistral, особенно в версиях 7B и 13B, часто сравнивается с более крупными моделями конкурентов, демонстрируя высокое соотношение производительности к размеру. Ожидается, что 24-миллиардная модель cydonia-24b-v4.1 будет еще более производительной, занимая нишу между компактными и сверхбольшими моделями, предлагая баланс между скоростью, требованиями к ресурсам и качеством генерации.

4. Ключевые возможности

Высокая креативность и генерация текста: Модель ориентирована на создание разнообразного и оригинального контента, что делает ее идеальной для творческих задач, таких как написание художественной литературы, сценариев или поэзии.
- Пример Use Case: Генерация альтернативных сюжетов для известных произведений.
  - Промпт: "Придумай три альтернативных завязки для рассказа 'Превращение' Ф. Кафки. Каждая завязка должна предлагать иное объяснение причине метаморфозы Грегора Замзы: одно — паранормальное, другое — психологическое, третье — метафорическое, связанное с его работой."
Точное следование инструкциям (Prompt Adherence): cydonia-24b-v4.1 демонстрирует высокую способность понимать и выполнять сложные, многошаговые инструкции. Это критически важно для получения предсказуемых и релевантных результатов в автоматизированных системах.
- Пример Use Case: Разработка детального плана мероприятия с учетом заданных параметров.
  - Промпт: "Создай трехдневный план конференции по искусственному интеллекту. Включи: 1) Основные темы для каждого дня (например, День 1: Основы ИИ, День 2: Применение ИИ, День 3: Будущее ИИ). 2) Предложения по спикерам (типы экспертов). 3) Идеи для интерактивных сессий (воркшопы, Q&A). 4) Требования к техническому обеспечению залов."
Эффективная обработка длинных контекстов: Поддержка увеличенного контекстного окна (32k токенов) позволяет модели анализировать большие объемы информации, поддерживать долгосрочную связность в диалогах и генерировать более полные ответы, основанные на обширном входном тексте.
Гибкость развертывания: Благодаря доступности различных вариантов квантования, модель может быть запущена как на мощных серверных GPU, так и на более доступном потребительском оборудовании, что делает ее универсальной для различных сценариев.
Минимальные ограничения контента ("Uncensored"): Позиционируется как модель с меньшим уровнем встроенных фильтров и ограничений, что позволяет ей обрабатывать более широкий спектр тем, не отказывая в ответе. Это полезно для исследовательских целей или генерации контента, который может быть отклонен другими моделями.
Генерация кода: Унаследованные от Mistral способности к программированию позволяют модели генерировать фрагменты кода, писать скрипты и помогать в решении задач, связанных с разработкой ПО.
Оптимизация производительности: Архитектура Mistral обеспечивает высокую скорость инференса и эффективность использования ресурсов по сравнению с моделями аналогичного размера от других разработчиков.

5. Оптимальные случаи использования

Генерация художественной литературы и сценариев: Написание книг, рассказов, пьес, скриптов для видео.
Создание маркетингового и рекламного контента: Пресс-релизы, описания продуктов, тексты для социальных сетей, рекламные слоганы.
Анализ и обобщение больших объемов текста: Извлечение ключевой информации из документов, отчетов, статей.
Разработка продвинутых чат-ботов и виртуальных ассистентов: Создание более гибких и "отзывчивых" разговорных агентов.
Генерация программного кода: Написание скриптов, функций, помощь в отладке.
Исследования и разработка (R&D): Быстрое прототипирование идей, связанных с NLP.
Персонализированный контент-маркетинг: Генерация текстов, адаптированных под индивидуальные предпочтения пользователей.
Исследовательские проекты, требующие свободы от цензуры: Анализ "темных" тем или тем, которые могут быть ограничены в коммерческих моделях.

Кому подходит идеально / Кому не стоит использовать

Кому подходит идеально	Кому не стоит использовать
Креативные писатели и сценаристы	Компании с жесткими корпоративными политиками по модерации контента
Разработчики, ищущие гибкую LLM для интеграции в приложения	Разработчики, которым нужна максимальная предсказуемость и безопасность "из коробки"
Исследователи, работающие с темами, требующими свободы от фильтров	Конечные пользователи, которым важна простота и безопасность без необходимости проверки
Проекты, где критично точное следование сложным инструкциям	Задачи, где требуется абсолютная фактологическая точность без верификации
Пользователи, стремящиеся к локальному развертыванию LLM	Мультимодальные приложения (без интеграции дополнительных специализированных моделей)
Компании, оптимизирующие затраты на AI-инфраструктуру	Авиационная или медицинская отрасли, где требуется высочайший уровень сертификации

6. Сравнение с конкурентами

cydonia-24b-v4.1 vs Llama 3 70B

Выигрыш cydonia-24b-v4.1: Потенциально более высокая скорость инференса и меньшая потребность в VRAM благодаря меньшей размерности (24B против 70B). Часто предлагает большую свободу от цензуры.
Выигрыш Llama 3 70B: Превосходит по общим показателям производительности на большинстве бенчмарков благодаря значительно большему количеству параметров и более обширному обучению Meta. Обладает более сильными возможностями в программировании, логических рассуждениях и понимании нюансов языка.

cydonia-24b-v4.1 vs Claude 3 Opus

Выигрыш cydonia-24b-v4.1: Значительно ниже требования к ресурсам, быстрее инференс, возможность локального развертывания. Большая гибкость и отсутствие фильтров.
Выигрыш Claude 3 Opus: Является одной из самых мощных моделей на рынке, превосходит cydonia-24b-v4.1 по всем ключевым бенчмаркам, включая рассуждение, решение сложных задач и понимание контекста. Имеет значительно большее контекстное окно (200K токенов) и лучшую мультимодальность.

cydonia-24b-v4.1 vs GPT-4

Выигрыш cydonia-24b-v4.1: Возможность локального развертывания, полный контроль над данными, потенциально ниже совокупная стоимость владения. Меньше ограничений на генерацию контента.
Выигрыш GPT-4: Лидер по многим показателям производительности, особенно в рассуждении, решении комплексных задач и творческой генерации. Имеет более широкие возможности, включая продвинутую мультимодальность (GPT-4V) и самый большой объем обучения.

Общий вывод: cydonia-24b-v4.1 позиционируется как высокопроизмогательная модель среднего класса, предлагающая отличный баланс между скоростью, качеством генерации и требованиями к ресурсам. Она будет особенно привлекательна для тех, кто ищет более "открытую" альтернативу или хочет развернуть мощную LLM локально без сверхвысоких затрат, характерных для самых крупных и передовых моделей.

7. Ограничения

Цензура и предвзятость: Несмотря на позиционирование как "uncensored", любая LLM может демонстрировать определенные формы предвзятости, унаследованные из обучающих данных, или генерировать нежелательный контент, особенно при сложных или провокационных запросах. Пользователям следует проявлять осторожность и проводить собственную модерацию при необходимости.
Галлюцинации: Как и все LLM, cydonia-24b-v4.1 подвержена генерации фактически неверной или вымышленной информации ("галлюцинации"). Критическая оценка и проверка фактов остаются необходимыми при использовании модели для задач, требующих точности.
Сложность промптинга: Достижение оптимальных результатов, особенно для сложных и нестандартных задач, может потребовать экспериментов с формулировками промптов, понимания влияния на модель и тонкой настройки.
Отсутствие нативной мультимодальности: Модель ориентирована исключительно на текстовые данные. Для работы с изображениями, аудио или другими медиа потребуются интеграция с внешними инструментами или использование других, специализированных моделей.
Обслуживание локальных развертываний: Для пользователей, выбирающих локальное развертывание, ответственность за установку, обновление, мониторинг производительности и обеспечение безопасности инфраструктуры ложится на них.
Производительность в специфических задачах: Хотя модель универсальна, в узкоспециализированных критически важных областях (например, генерация производственного кода или медицинская диагностика) могут потребоваться модели, специально обученные и сертифицированные для этих целей.

Провайдеры для TheDrummer: Cydonia 24B V4.1

NextBit

Статус

28,024 ₽Запрос/ 1М

46,707 ₽Ответ / 1М

—Изображение вход /1М

—Изображение выход /1М

131KКонтекст

33KМакс. ответ

Статус работы провайдера

Нет данных — 29 мар., 16:50 – 17:00

Дополнительные цены

—

Политика в отношении данных

Prompt Training:-

Prompt Logging:-

Moderation:Not moderated

Поддерживаемые параметры

max_tokenstemperaturetop_pstopfrequency_penaltypresence_penaltyresponse_formatstructured_outputs

Parasail

Статус

28,024 ₽Запрос/ 1М

46,707 ₽Ответ / 1М

—Изображение вход /1М

—Изображение выход /1М

131KКонтекст

131KМакс. ответ

Статус работы провайдера

Нет данных — 29 мар., 16:50 – 17:00

Дополнительные цены

—

Политика в отношении данных

Prompt Training:-

Prompt Logging:-

Moderation:Not moderated

Поддерживаемые параметры

max_tokenstemperaturetop_pfrequency_penaltypresence_penaltyrepetition_penaltyseedstoptop_klogit_bias

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

import OpenAI from 'openai';

const openai = new OpenAI({
  baseURL: 'https://polza.ai/api/v1',
  apiKey: '<POLZA_AI_API_KEY>'
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'thedrummer/cydonia-24b-v4.1',
    messages: [{
      role: 'user',
      content: 'Что думаешь об этой жизни?',
    }],
  });
  console.log(completion.choices[0].message);
}

main();

Выбор за вами

Polza.AI — лучший выбор

для

Воспользуйтесь сервисом прямо сейчас. А если остались вопросы - запишитесь на демо

Записаться на демо Получить API ключ