GigaChat
GigaChat — нейросетевая модель от Сбера, которая появилась в мае 2023 года.
Название её, видимо, отсылка к мему Гигачад.
Подробности[править]
О создании модели GigaChat стало известно в конце апреля 2023 года, запущена она была в мае. Отличительной особенностью является использование моделью русского языка, что является далеко не первым примером подобной сети (тот же Сбер уже публиковал в открытом доступе русские варианты нейросетей для генерации картинок, текстов). В этой модели используется 18 миллиардов параметров (для сравнения, в модели Яндекса — 100 миллиардов).
Основывается на языковых моделях ruGPT-3.5 и FRED-T5.
Указывается, что нейросеть предпочитает творческие ответы и может допускать фактические неточности, и следует рассматривать генерируемый текст как творчество. Видимо, таким образом обеспечивается защита от возможных претензий.
Во время тестирования отмечается, что на вопросы, например «сколько лет Илону Маску» или «что такое Скайрим», нейросеть дает выглядщие правдоподобными, но на самом деле некорректные ответы, подобное происходит и в ответ на простой вопрос вроде «какой сегодня день». Указывалось, что основной конкурент проекта — ChatGPT, отвечает на подобные вопросы корректно.
Есть и генерация изображений с использованием Kandinsky, впрочем как указывается в официальном мануале, эта сеть не очень хорошо понимает русский язык, поэтому требуется перечислять особенности картинки как список параметров, а не задавать запрос на естественном языке.
В мае стала работать в режиме закрытой беты, регистрация производится через подписку на телеграм-канал.