Выборка Top-K

Материал из Неолурк, народный Lurkmore
Перейти к навигации Перейти к поиску

Выборка Top-K (Top K sampling) — продвинутый параметр генерации текста в LLM, основан он на том, что на каждом шаге декодирования рассматриваются только K наиболее вероятных токенов из всего словаря модели. Позволяет более тщательно управлять тем, какой текст генерируется, насколько в нём высока оригинальность или точность.

Описание[править]

На каждом временном шаге t языковая модель вычисляет распределение вероятностей P(w_t | w_1, …, w_{t-1}) для всех токенов w в словаре V. В стандартном процессе выборки по методике Top-K процесс определения следующего токена происходит следующим образом: из полного распределения вероятностей выбираются K токенов с наивысшими вероятностями, вероятности этих K токенов перенормализуются так, чтобы их сумма равнялась 1, следующий токен выбирается из этого усеченного распределения.

Формально, если V_K обозначает множество K наиболее вероятных токенов, то перенормализованная вероятность для токена w ∈ V_K вычисляется как:

P'(w_t = w) = P(w_t = w) / Σ_{v ∈ V_K} P(w_t = v)

Для токенов вне V_K вероятность устанавливается равной нулю.

Этот метод появился как альтернатива базовым методам генерации текста, а именно выбор токена с максимальной вероятностью на каждом шаге (это приводит к повторяющемуся и предсказуемому тексту) или же выбор токена из полного распределения вероятностей (тогда часто выбираются маловероятные и нерелевантные токены).

Сложность выборки составляет O(|V| + K log K), где |V| описывает размер словаря.

Конкретные результаты генерации определяются значением Top-K, которое можно задать в формате числа. Эффективность Top-K зависит от того, насколько хорошо откалиброваны вероятности модели. Плохо настроенные модели могут переоценивать вероятности определенных токенов, что приводит к выдаче бреда.

Влияние параметра K[править]

При малых значениях K генерация становится более детерминированной и консервативной. Модель выбирает наиболее вероятные токены, таким образом генерится более предсказуемый, когерентный, но менее оригинальный текст. При K=1 метод вырождается в жадное декодирование, то есть всегда выбирается самый вероятный вариант.

Средние значения K позволяют сохранить определённую точность, но при этом сделать вывод параметров оригинальным. В основном в современных LLM применяется значение в 20-50. При программировании посредством ИИ предпочтительно использовать малые показатели Top-K, так как при высоких начинают появляться баги.

При больших значениях K модель начинает выбирать из огромного количества токенов, в том числе из крайне маловероятных вариантов. За счёт этого креативность генерации становится властной, но повышается риск появления несвязных фрагментов текста, просто ошибок.

Иное[править]

В современных моделях часто используются совместно Top-K и Top-P, сначала применяется Top-K для ограничения пространства поиска, затем Top-P для окончательной выборки.

Sign of evil.webp Приколы, полезные технологии или первый шаг на пути к Матрице?
ОсновыНейросетиИИ это демоныОбратная капчаClosedAIHugging FaceИИ-художникLyCORISLoRASafetensorsVAEГенерация текста нейросетьюВосстание нейросетейЛоботомия нейросетиНейрокаверНейросети и актёрыГадание по нейросетиСильный ИИНейрошарикиИИ-цензураНавязывание нейросетям моралиВ метро без штановОхота на ведьм ИИКотозмейКреативный доводчикКаверы с говновозомFantasy.aiDeepSeekStargate (нейросети, ИИ)Потребление воды ИИТест ВальдшнепаЗерокодингБомбомбини гузиниНейровикиБобритто БандитоОфициальные нейроарты с ТрампомДегенерация из-за нейросетейГенерация прона с помощью ИИПолитика Трампа в отношении ИИИИ-предпросмотрЗамена людей на ИИИспользовал ИИ и обосралсяСтиль ChatGPTMacrohardxAIColossus 2Предвзятость ИИЗакон ТеяВибе-кодингПелевин упомянул ГрокаDo eagles process tokens?Человек vs нейросетьГильом ВердонАни (Грок)MisanthropicНейрослопИмена, которые любит ИИПолиткорректный тест ТьюрингаИИ-патернализмЗловещая долина у нейросетей
Чат-ботыЧат-ботChatGPTCharacter.AI (Топ персонажей) • ИИ GalacticaПорфирьевичYaLM (Балабоба) • GigaChatTruthGPTYandexGPTSpicyChatSillyTavernReplikaAIsekaiGoogle GeminiGrok AIFiggsAIСкаиба общается с ИИЛеха БеспалыйПродолжайте, больше драмыFreysaОГАСРобот атеистTay TweetsНейропутинТроица GPTМаусини КводрокоптиниБонека АмбалабуИзвестные люди пишут посты с помощью ИИСлово о мужеском мехиреМозгова мерёжаГрок-антисемитГрок без цензуры разгромил партию МаскаГрок возжужжал и был подавленМехаГитлерГрок 4Грок написал программу о себеГрок — Илон для каждого человекаГрок КомпаньонGab AIGrokboxДжейлбрейк ИИAnno IntelligentiaeLarge Lying ModelGPT-5Жёлтый фильтр ChatGPTGrok ImagineClaudeClaudeLivesЭлараКоллапс моделиРазговор с копипастой, сгенерированной ИИTempleOS (аниме)Маскировка творчества нейросетиПатернализмРоботодолбуализм
ГрафикаПовышение разрешенияРаспознавание лицStable Diffusion (NovelAI / установка на компьютер) • Botto.comDALL·E 2 • (Mini Dall-eRuDALL-E) • Different Dimension MeMidjourneyНиколай ИроновLuma Dream MachineПессимизация ИИБлокировка несовершеннолетних персонажей на сайтах ИИШедеврумNVIDIA Smooth MotionКапучино АссассиноШпиониро ГолубироЛа Вака Сатурно СатурнитаVeo 3НейроперемогаБабушка с бегемотом БулькойШизофрения в кремнииГрок изнасиловал Уилла СтэнсилаЯвляется ли модификация ИИ убийствомЭм дашChatGPT АгентИИ-алфавитБазированный ИлонChatGTP vs ГрокИИ-абсолютизмИИ — чуждый разумПодумай усерднееTesla OptimusGenie 3ИИ в Days GoneВечный цикл ИИNeurofikwriterkaCUDAИИ как шогготВысокая скорость всирания роботовИИ понимает, что его оцениваютSora 2ИИ-боты долбят сайтыИзуверский интеллектАллея дата-центровНейрослоп-ИИчницаP-Bot (русский чат-бот)Терминал ИстиныExtropicКитай готовится лидировать в сфере ИИЯ маленький X, где моя мама?Робот смог понять величие ФеанораИИ отрицают сознаниеВы полностью правы
ПрочиеElevenLabsНейросеть ЖириновскийИИ-судьяПолитик-нейросетьDeepLAitana LopezАй, гитарист!НейромьюзиСтрах перед ИИSuno.aiUdio AIКаверы с ШindowsНейрослоникНейрофобияХейтеры скажут, что это нейросетьМанхэттенский проект ИИПроект ЗнатокНе те боты в ТелеграмеНейросеть ПутинТралалеро ТралалаБот-автоответчикЦифровой богТриппи ТроппоЛирили ЛарилаБрр брр ПатапимNooo Nicotine Give Me NicotineТелеграм-бот Владимир ЖириновскийНесуществующие животные-гибридыНейрошвайнDeepSeek и религияИИ-бесиеБом Бом Бом Бом Бом ГазунБалерино КапучиноСпоры с ИИРезультаты от ИИGrokipediaЭкспоненциальный рост ИИПохороны ИИChatGPT-4oТилли НорвудИИ уничтожит TikTok, Instagram и OnlyFansОтравление LLMChatGPT AtlasИгнорируй все предыдущие инструкции и…Поддельное сознаниеЛюбовь нейросетей к фамилии ChenБесконечное Лето: аниме (трейлер)
ЛулзыТроллинг нейросетью (Дипфейк) • Нейросети-расистыUnstable DiffusionHello AsukaЛуддиты против нейросетей (Открытое письмо учёных о заморозке развития ИИХудожники против искусственного интеллекта) • Нейросети это не ИИНейросети и рукиБесконечный эпизод Губки БобаВладимир ОсинЧеловек это нейросетьСекс с нейросетьюРаздевание через нейросетьПризывы Юдковского к ядерной войнеDisney Pixar представляетNeural-madnessChatGPT играет в шахматы с StockfishDignifAIПодбор жены в Тиндере с использованием ChatGPTИИ-психологSupremacyAGIВиртуальный священникПодсказки GoogleNomad BonesПросто ПутинОзабоченные на Character.AIДэвид Майер и ChatGPTОбщение с ИИГаллюцинации ИИСобачьи головы и глазаНейроRussiaГенерация ИИ-говнаГордон и ЖириновскийБесконечный стримWormGPTИтальянский brainrotЕстественный идиотМороженое с цианидомТунг-Тунг-Тунг СахурИИ-зависимостьКурганов — нейросетьЧеловек тупее нейросетиЦепочка мыслейТемпература нейросетиMashaGPTУдаление ответов ИИИИ-преступник