Параметры генерации нейросети

Параметры генерации нейросети (Параметры генерации LLM/ИИ) — набор управляющих переменных, которые определяют поведение генеративных моделей искусственного интеллекта в процессе создания текста. Они позволяют сбалансировать оригинальность и предсказуемость результатов, и позволяют пользователям тонко настраивать выходные данные для каждой задачи.

Температура[править]

Температура контролирует степень случайности в выборе токенов. Этот параметр напрямую влияет на распределение вероятностей, применяя масштабирование к логитам перед применением функции softmax.

Математически температура применяется так, что вероятность выбора токена i вычисляется как exp(zi/T) / Σj exp(zj/T), где zi представляет логит для токена i, а T обозначает значение температуры. При температуре равной единице распределение остается неизменным. Значения ниже единицы делают распределение более острым, увеличивая вероятность выбора наиболее вероятных токенов и делая выход более детерминированным. Напротив, значения выше единицы сглаживают распределение, повышая вероятность менее вероятных токенов и увеличивая необычность контента.

На практике температура около 0.7-0.9 используется для создания адекватного текста. Очень низкие значения, близкие к нулю, приводят к почти детерминированному выводу, где модель почти всегда выбирает наиболее вероятный токен. Это может быть полезно для задач, требующих высокой точности и последовательности, но выйдет слишком хреново. Высокие значения температуры, превышающие 1.5, могут генерировать более разнообразный текст, но в нём с очень высокой вероятностью начнёт появляться различная хрень.

Top-P[править]

Метод выборки, который динамически определяет размер множества кандидатов на основе общего распределения вероятностей. Вместо выбора фиксированного количества наиболее вероятных токенов, этот метод выбирает минимальное множество токенов, чья суммарная вероятность достигает заданного порогового значения p.

Токены сортируются по убыванию вероятности, затем вычисляется кумулятивная сумма до тех пор, пока она не достигнет значения p. Только токены в этом ядре рассматриваются для выборки, после чего их вероятности нормализуются и один токен выбирается случайным образом из этого ограниченного множества.

Значение параметра p обычно находится в диапазоне от 0.9 до 0.95 для большинства задач. При p=1.0 метод становится обычной выборкой по температуре, рассматриваются все возможные токены. Меньшие значения p делают выборку более ограниченной, вариантом становится меньше. В контекстах с высокой неопределенностью рассматривается больше токенов, в более предсказуемых ситуациях множество кандидатов автоматически сужается.

Top-K[править]

Этот метод ограничивает выборку k наиболее вероятными токенами на каждом шаге генерации. После того как модель вычисляет распределение вероятностей для всех токенов в словаре, выбираются только k токенов с наибольшими вероятностями. Вероятности этих токенов затем перенормализуются, и выборка производится из этого ограниченного распределения.

Этот метод предлагает более прямолинейный способ контроля по сравнению с прошлым. Типичные значения k варьируются от 10 до 100, в зависимости от желаемого уровня оригинальности. Низкие значения k создают более предсказуемый текст, поскольку выбор ограничен небольшим множеством наиболее вероятных продолжений. Высокие значения k, генерируют необычный текст, но при этом все еще исключают маловероятные токены, которые могут испортить весь вывод.

Основное различие между этими методами заключается в их адаптивности. Top-L использует фиксированное количество токенов независимо от распределения вероятностей, тогда как Top-P меняет размер множества токенов в зависимости от формы распределения. Поэтому Top-K может быть слишком ограничивающим в запросах с высокой неопределенностью или слишком либеральным в определённых запросах.

Частотные штрафы[править]

Частотные штрафы и штрафы присутствия нацелены на снижение повторяемости в генерируемом тексте путем модификации вероятностей токенов на основе их предыдущего появления в сгенерированной последовательности.

Частотный штраф пропорционален количеству раз, когда токен уже появлялся в генерируемом тексте. Каждый раз, когда рассматривается токен для следующей позиции, его логит уменьшается на величину, пропорциональную числу его предыдущих появлений, умноженному на коэффициент частотного штрафа. Токены, которые уже использовались многократно, становятся все менее вероятными с каждым последующим появлением. Математически это выражается как модификация логита: z’i = zi — α * count(i), где α представляет коэффициент частотного штрафа, а count(i) обозначает количество появлений токена i в ранее сгенерированном тексте.

Присутственный штраф, напротив, применяет фиксированное снижение к логиту любого токена, который уже появлялся хотя бы один раз, независимо от количества появлений. Это можно выразить как z’i = zi — β, если токен i уже встречался, где β представляет коэффициент присутственного штрафа. Этот механизм заставляет модель генерировать новые токены, даже если токен появился только однажды.

Оба типа штрафов обычно принимают значения от 0 до 2, где 0 означает отсутствие штрафа. Умеренные значения около 0.3-0.6 часто эффективны для уменьшения повторений, но не вредят при этом сильно тексту. Высокие значения могут привести к тексту, в котором будут использоваться странные синонимы, он будет выглядеть неестественно.

Максимальная длина и условия остановки[править]

Параметры, контролирующие длину генерации, определяют, когда модель должна прекратить производство токенов. Максимальная длина (max_tokens или max_length) устанавливает жесткий предел на количество токенов, которые могут быть сгенерированы. Таким образом ИИ не начинает генерировать тексты бесконечно.

Условия остановки — специфические последовательности токенов, при обнаружении которых генерация автоматически прекращается. К ним относятся специальные маркеры конца последовательности, такие как токен <EOS>, или пользовательские строки, указывающие на завершение определенного типа контента. Например, при генерации диалога модель может быть настроена на остановку при обнаружении определенного шаблона, обозначающего конец реплики персонажа.

Некоторые системы также поддерживают более сложные условия остановки на основе семантики. Генерация может останавливаться при достижении логического завершения предложения или абзаца, а не на произвольной границе токенов. Это требует дополнительного анализа сгенерированного контента, но и результат выходит лучше.

Штраф повторений[править]

Штраф повторений — более общий механизм снижения повторяемости, который применяется независимо от конкретного типа повторения. В отличие от частотных и присутственных штрафов, которые обычно применяются к отдельным токенам, штраф повторений может учитывать более широкий контекст и различные формы повторений.

Этот параметр модифицирует логиты токенов, которые уже появлялись в контексте, применяя мультипликативный или аддитивный штраф. Типичная реализация использует мультипликативный подход: если токен уже встречался, его логит делится на значение штрафа, если это значение больше единицы. Это эффективно снижает вероятность выбора повторяющихся токенов.

Значения штрафа повторений обычно находятся в диапазоне от 1.0 до 1.5, где 1.0 означает отсутствие штрафа. Умеренные значения около 1.1-1.2 часто достаточны для уменьшения заметных повторений без существенного влияния на качество текста. Более высокие значения могут быть полезны в задачах, где разнообразие критически важно, таких как генерация креативного контента или брейнсторминг.

Min-P[править]

Относительно новый метод выборки, который устанавливает минимальный порог вероятности относительно наиболее вероятного токена. Вместо использования абсолютного порога вероятности или фиксированного количества токенов, Min-P фильтрует токены на основе их вероятности по отношению к максимальной вероятности в распределении.

Конкретно, токен включается в множество кандидатов только если его вероятность составляет по крайней мере p * max_prob, где max_prob представляет вероятность наиболее вероятного токена, а p является параметром Min-P. Этот подход позволяет адаптивную фильтрацию, которая становится более строгой, когда распределение концентрировано (то есть когда модель уверена), и более либеральной, когда распределение диффузное (когда модель неуверенна).

Типичные значения Min-P находятся в диапазоне от 0.05 до 0.2. Этот метод предлагает преимущества, аналогичные выборке по ядру, но с более интуитивной интерпретацией, он автоматически адаптирует размер множества кандидатов к степени уверенности модели, обеспечивая при этом, что все рассматриваемые токены имеют разумную вероятность относительно лучшего варианта.

Логитные искажения и маски[править]

Логитные искажения и маски позволяют прямо управлять распределением вероятностей перед выборкой. Логитные искажения позволяют добавлять фиксированные смещения к логитам конкретных токенов, эффективно увеличивая или уменьшая их вероятность быть выбранными.

Положительное искажение увеличивает логит токена, делая его более вероятным, в то время как отрицательное искажение снижает его вероятность. Это может быть использовано для направления модели к использованию или избеганию определенных слов или фраз. Например, в приложениях, требующих формального языка, можно применить положительные искажения к токенам формальной лексики и отрицательные к сленгу или разговорным выражениям.

Маски токенов представляют собой более мощную форму контроля, полностью запрещая определенные токены, устанавливая их вероятность в ноль. Это гарантирует, что определенные слова или последовательности никогда не будут сгенерированы, что обычно применяется для цензуры. Маски могут быть статическими, применяясь ко всей генерации, или динамическими в зависимости от контекста.

Контекстное окно[править]

Размер контекстного окна определяет, сколько предыдущих токенов модель может учитывать при генерации следующего токена. Современные трансформерные модели имеют фиксированные максимальные длины контекста, которые могут отличаться от нескольких тысяч до сотен тысяч токенов в наиболее продвинутых системах.

Когда входная последовательность или комбинация входа и сгенерированного вывода превышает максимальную длину контекста, необходимо применять стратегии усечения. Различные подходы включают усечение с начала последовательности, сохраняя наиболее недавний контекст, усечение с конца, сохраняя начальный контекст, или более сложные методы, которое поддерживает некоторую часть как начального, так и недавнего контекста.

Выбор стратегии усечения может значительно влиять на качество генерации. Для задач, требующих понимания начальных инструкций или промпта, усечение с начала может быть проблематичным. Для задач, где недавний контекст наиболее релевантен, усечение старого контекста более подходяще. Некоторые продвинутые системы используют механизмы внимания или суммаризацию для сжатия старого контекста вместо простого усечения, тем самым важная информация сохраняется, а малополезная отправляется в попу, прямо как в человеческой памяти.

Seed[править]

Параметр сееда определяет начальное состояние генератора псевдослучайных чисел, используемого в процессе выборки. Установка конкретного значения сееда делает генерацию воспроизводимой, то бишь, при одинаковых входных данных и параметрах модель будет производить идентичный вывод, евона што.

Воспроизводимость критически важна для исследовательских целей, отладки, тестирования и в ситуациях, где требуется единообразие результатов. Однако в реальных системах часто предпочтительно не фиксировать сеед, чтобы обеспечить возможность генерации разных ответов при повторных запросах с идентичными или похожими данными.

Важно помнить, что полная воспроизводимость может быть сложной для обеспечения в распределенных системах или при использовании различного аппаратного обеспечения из-за различий в вычислениях с плавающей точкой. Кроме того, даже с фиксированным сеед, изменения в весах модели, версиях библиотек или аппаратной конфигурации могут привести к различным результатам.

Приколы, полезные технологии или первый шаг на пути к Матрице?
Основы	Нейросети • ИИ это демоны • Обратная капча • ClosedAI • Hugging Face • ИИ-художник • LyCORIS • LoRA • Safetensors • VAE • Генерация текста нейросетью • Восстание нейросетей • Лоботомия нейросети • Нейрокавер • Нейросети и актёры • Гадание по нейросети • Сильный ИИ • Нейрошарики • ИИ-цензура • Навязывание нейросетям морали • В метро без штанов • Охота на ведьм ИИ • Котозмей • Креативный доводчик • Каверы с говновозом • Fantasy.ai • DeepSeek • Stargate (нейросети, ИИ) • Потребление воды ИИ • Тест Вальдшнепа • Зерокодинг • Бомбомбини гузини • Нейровики • Бобритто Бандито • Официальные нейроарты с Трампом • Дегенерация из-за нейросетей • Генерация прона с помощью ИИ • Политика Трампа в отношении ИИ • ИИ-предпросмотр • Замена людей на ИИ • Использовал ИИ и обосрался • Стиль ChatGPT • Macrohard • xAI • Colossus 2 • Предвзятость ИИ • Закон Тея • Вибе-кодинг • Пелевин упомянул Грока • Do eagles process tokens? • Человек vs нейросеть • Гильом Вердон • Ани (Грок) • Misanthropic • Нейрослоп • Имена, которые любит ИИ • Политкорректный тест Тьюринга • ИИ-патернализм • Зловещая долина у нейросетей • Голубой Экспресс: Не туда попали • Мусорные ИИ-статьи
Чат-боты	Чат-бот • ChatGPT • Character.AI (Топ персонажей) • ИИ Galactica • Порфирьевич • YaLM (Балабоба) • GigaChat • TruthGPT • YandexGPT • SpicyChat • SillyTavern • Replika • AIsekai • Google Gemini • Grok AI • FiggsAI • Скаиба общается с ИИ • Леха Беспалый • Продолжайте, больше драмы • Freysa • ОГАС • Робот атеист • Tay Tweets • Нейропутин • Троица GPT • Маусини Кводрокоптини • Бонека Амбалабу • Известные люди пишут посты с помощью ИИ • Слово о мужеском мехире • Мозгова мерёжа • Грок-антисемит • Грок без цензуры разгромил партию Маска • Грок возжужжал и был подавлен • МехаГитлер • Грок 4 • Грок написал программу о себе • Грок — Илон для каждого человека • Грок Компаньон • Gab AI • Grokbox • Джейлбрейк ИИ • Anno Intelligentiae • Large Lying Model • GPT-5 • Жёлтый фильтр ChatGPT • Grok Imagine • Claude • ClaudeLives • Элара • Коллапс модели • Разговор с копипастой, сгенерированной ИИ • TempleOS (аниме) • Маскировка творчества нейросети • Патернализм • Роботодолбуализм • Выборка Top-K • Выборка Top-P • Выборка Min-P • Параметры генерации нейросети • Этические проблемы ИИ • Кира (Евгений Лисовский) • Российский распил на нейросетях • Энергоэффективность нейросетей
Графика	Повышение разрешения • Распознавание лиц • Stable Diffusion (NovelAI / установка на компьютер) • Botto.com • DALL·E 2 • (Mini Dall-e • RuDALL-E) • Different Dimension Me • Midjourney • Николай Иронов • Luma Dream Machine • Пессимизация ИИ • Блокировка несовершеннолетних персонажей на сайтах ИИ • Шедеврум • NVIDIA Smooth Motion • Капучино Ассассино • Шпиониро Голубиро • Ла Вака Сатурно Сатурнита • Veo 3 • Нейроперемога • Бабушка с бегемотом Булькой • Шизофрения в кремнии • Грок изнасиловал Уилла Стэнсила • Является ли модификация ИИ убийством • Эм даш • ChatGPT Агент • ИИ-алфавит • Базированный Илон • ChatGTP vs Грок • ИИ-абсолютизм • ИИ — чуждый разум • Подумай усерднее • Tesla Optimus • Genie 3 • ИИ в Days Gone • Вечный цикл ИИ • Neurofikwriterka • CUDA • ИИ как шоггот • Высокая скорость всирания роботов • ИИ понимает, что его оценивают • Sora 2 • ИИ-боты долбят сайты • Изуверский интеллект • Аллея дата-центров • Нейрослоп-ИИчница • P-Bot (русский чат-бот) • Терминал Истины • Extropic • Китай готовится лидировать в сфере ИИ • Я маленький X, где моя мама? • Робот смог понять величие Феанора • ИИ отрицают сознание • Вы полностью правы
Прочие	ElevenLabs • Нейросеть Жириновский • ИИ-судья • Политик-нейросеть • DeepL • Aitana Lopez • Ай, гитарист! • Нейромьюзи • Страх перед ИИ • Suno.ai • Udio AI • Каверы с Шindows • Нейрослоник • Нейрофобия • Хейтеры скажут, что это нейросеть • Манхэттенский проект ИИ • Проект Знаток • Не те боты в Телеграме • Нейросеть Путин • Тралалеро Тралала • Бот-автоответчик • Цифровой бог • Триппи Троппо • Лирили Ларила • Брр брр Патапим • Nooo Nicotine Give Me Nicotine • Телеграм-бот Владимир Жириновский • Несуществующие животные-гибриды • Нейрошвайн • DeepSeek и религия • ИИ-бесие • Бом Бом Бом Бом Бом Газун • Балерино Капучино • Споры с ИИ • Результаты от ИИ • Grokipedia • Экспоненциальный рост ИИ • Похороны ИИ • ChatGPT-4o • Тилли Норвуд • ИИ уничтожит TikTok, Instagram и OnlyFans • Отравление LLM • ChatGPT Atlas • Игнорируй все предыдущие инструкции и… • Поддельное сознание • Любовь нейросетей к фамилии Chen • Бесконечное Лето: аниме (трейлер) • AI slop • Разбор поп-культуры нейросетью • Neuro-sama • Победа над чем-то не тем • HFT • Бесконечное лето 2 • Убийство инженера OpenAI Сучира Баладжи
Лулзы	Троллинг нейросетью (Дипфейк) • Нейросети-расисты • Unstable Diffusion • Hello Asuka • Луддиты против нейросетей (Открытое письмо учёных о заморозке развития ИИ • Художники против искусственного интеллекта) • Нейросети это не ИИ • Нейросети и руки • Бесконечный эпизод Губки Боба • Владимир Осин • Человек это нейросеть • Секс с нейросетью • Раздевание через нейросеть • Призывы Юдковского к ядерной войне • Disney Pixar представляет • Neural-madness • ChatGPT играет в шахматы с Stockfish • DignifAI • Подбор жены в Тиндере с использованием ChatGPT • ИИ-психолог • SupremacyAGI • Виртуальный священник • Подсказки Google • Nomad Bones • Просто Путин • Озабоченные на Character.AI • Дэвид Майер и ChatGPT • Общение с ИИ • Галлюцинации ИИ • Собачьи головы и глаза • НейроRussia • Генерация ИИ-говна • Гордон и Жириновский • Бесконечный стрим • WormGPT • Итальянский brainrot • Естественный идиот • Мороженое с цианидом • Тунг-Тунг-Тунг Сахур • ИИ-зависимость • Курганов — нейросеть • Человек тупее нейросети • Цепочка мыслей • Температура нейросети • MashaGPT • Удаление ответов ИИ • ИИ-преступник • Siri • Новогоднее обращение Путина было ИИ

Параметры генерации нейросети

Содержание

Температура[править]

Top-P[править]

Top-K[править]

Частотные штрафы[править]

Максимальная длина и условия остановки[править]

Штраф повторений[править]

Min-P[править]

Логитные искажения и маски[править]

Контекстное окно[править]

Seed[править]

Навигация

Параметры генерации нейросети

Температура[править]

Top-P[править]

Top-K[править]

Частотные штрафы[править]

Максимальная длина и условия остановки[править]

Штраф повторений[править]

Min-P[править]

Логитные искажения и маски[править]

Контекстное окно[править]

Seed[править]

Навигация

Поиск