Генерация текста нейросетью

Пример текста от Порфирьевича

Генерация текста нейросетью — одно из основных направлений использования современных нейросетей. Представляет из себя очередную цифровую попытку претворения в жизнь идеи «версификатора» из эпохальной антиутопии, в свою очередь обыгрывавшего механический «спекулятивный станок» Большой Академии в Лагадо из одного старого памфлета.

Первый профессор, которого я здесь увидел, помещался в огромной комнате, окруженный сорока учениками. После взаимных приветствий, заметив, я внимательно рассматриваю раму, занимавшую большую часть комнаты, он сказал, что меня, быть может, удивит его работа над проектом умозрительного знания при помощи технических и механических операций^[1]. Но мир вскоре оценит всю полезность этого проекта; и он льстил себя уверенностью, что более возвышенная идея никогда еще не зарождалась ни в чьей голове. Каждому известно, как трудно изучать науки и искусства по общепринятой методе; между тем благодаря его изобретению самый невежественный человек с помощью умеренных затрат и небольших физических усилий может писать книги по философии, поэзии, политике, праву, математике и богословию при полном отсутствии эрудиции и таланта.

Рис. 1: примитивно, но зато наглядно
Затем он подвел меня к раме, по бокам которой рядами стояли все его ученики. Рама эта имела двадцать квадратных футов и помещалась посредине комнаты. Поверхность ее состояла из множества деревянных дощечек, каждая величиною в игральную кость, одни побольше, другие поменьше. Все они были сцеплены между собой тонкими проволоками. Со всех сторон каждой дощечки приклеено было по кусочку бумаги, и на этих бумажках были написаны все слова их языка в различных наклонениях, временах и падежах, но без всякого порядка. Профессор попросил меня быть внимательнее, так как он собирался пустить в ход свою машину. По его команде каждый ученик взялся за железную рукоятку, которые в числе сорока были вставлены по краям рамы, и быстро повернул ее, после чего расположение слов совершенно изменилось. Тогда профессор приказал тридцати шести ученикам медленно читать образовавшиеся строки в том порядке, в каком они разместились в раме; если случалось, что три или четыре слова составляли часть фразы, ее диктовали остальным четырем ученикам, исполнявшим роль писцов. Это упражнение было повторено три или четыре раза, и машина была так устроена, что после каждого оборота слова принимали все новое расположение, по мере того как квадратики переворачивались с одной стороны на другую.

Ученики занимались этими упражнениями по шесть часов в день, и профессор показал мне множество фолиантов, составленных из подобных отрывочных фраз; он намеревался связать их вместе и от этого богатого материала дать миру полный компендий всех искусств и наук; его работа могла бы быть, однако, облегчена и значительно ускорена, если бы удалось собрать фонд для сооружения пятисот таких станков в Лагадо и обязать руководителей объединить полученные ими коллекции.

Он сообщил мне, что это изобретение с юных лет поглощало все его мысли, что теперь в его станок входит целый словарь и что им точнейшим образом высчитано соотношение числа частиц, имен, глаголов и других частей речи, употребляемых в наших книгах.

Подробности[править]

Казалось бы, мечта о полной автоматизации рутинного процесса контентменеджмента сбывается, прямо сегодня и на наших глазах. Однако не всё так просто. На практике, после после интродукции «запального» лингвосубстрата в нейросеть, та выдаёт стохастический, в сущности, ответ; и даже современные качественные сетки при генерации достаточно длинных текстов могут выдать сущую шизофазию, которая не имеет реального смысла с точки зрения человека. Ибо сеть, не обладая возможностью проверить наличие в тексте логики и не понимания контекста, просто подбирает наиболее подходящее продолжение для того текста, что был в неё интродуцирован.

Поэтому генерация связного текста по релевантной запросу тематике требует значительного количества перегенераций с поиском и синтезом наиболее корректного варианта, а также последующей ручной правки и допиливания уже кондовым кожаным мешком с органической гиперплоскостью сцепления. Удельное количество шизофазии обычно тем выше, чем больше размер текста — ибо сеть склонна продолжать уже собственное творчество и получается бред — так что распространенный способ генераций предполагает тандемную работу методом синергетической комбинаторики: последовательная обработка части текста человеком > сетью > человеком… и так далее.

Обычно — да, но в данном примере, исходя из накопленного поколениями эмержентного опыта в области прикладной методологии селективного эпистемологического редукционизма, как таки раз наличествует нехарактерный оказионалистический казус, когда перцептуалистически объективная модальность исследуемого тематического сегмента мифосемантического континуума имманентно реверсивна по отношению к сложившейся общепринятой практике и при том в комментированности чистого эмпириокритицизма данная имманентность в целом явственно доброкачественна (что само по себе уже sort of win).

— Ну вот типа того…

С использованием нейросетей было зарегистрировано написание диплома (который, в свою очередь, был одобрен преподавателями вуза); научной работы, прошедшей публикацию; а также литературного произведения. Но после генерации текстов все они проходили вышерекомую доработку. Например, в случае с дипломом было отмечено, что почти всю доводку делал научный руководитель, которая просто пожалела лентяя-студента, а то, что выдала нейросеть, не прошло бы никакого экзамена.

Обучение нейросетей[править]

Первичное обучение производится на массиве человеческих текстов, которые обычно представляют собой книги, газетные заметки и прочие тексты (можно обучать и на блогах, но специфический сетевой стиль и частое несоблюдение правил языка приведёт к тому, что нейросеть станет работать не вполне правильно и выдавать странные результаты). Массив должен быть достаточно большим, чтобы нейросеть верно поняла, за какими словами что следует. Затем производится дополнительное обучение пользователями, которые уже проверяют результаты генерации и отмечают правильные и неправильные варианты, что дополнительно повышает точность.

Основным вариантом генеративной нейросети сейчас является большая лингвистическая модель (LLM):

Большая лингвистическая модель выполняет простейшую на первый взгляд операцию. Она предсказывает следующее слово в последовательности слов. Чем больше слов уже включено в такую последовательность, тем проще угадать каждое новое, потому что круг вариантов постоянно сужается. В сущности, функция LLM – это доведенное до немыслимого совершенства автозаполнение.
LLM не думает. Она тренируется на огромном корпусе созданных прежде текстов – романов, стихов, заговоров и заклинаний, надписей на заборах, интернет-чатов и срачей, нобелевских лекций, политических программ, полицейских протоколов, сортирных надписей и так далее – и на этой основе предсказывает, как будет расти и развиваться новая последовательность слов, и как она, вероятней всего, развиваться не будет.
У языковых моделей есть, конечно, дополнительные уровни программирования и этажи – например, слой RLHF (оптимизирующее обучение с человеческой обратной связью) и так далее. Суть в том, что языковую модель натаскивают выбирать такие продолжения лингвистических конструкций, которые в наибольшей степени устроят проводящих тренировку людей.
Это похоже на процесс формирования юного члена общества на основе ежедневно поступающих вербальных инструкций, подзатыльников и наблюдения за тем, кому дают еду, а кому нет.

В связи с этим нейросети могут обладать спецификой в зависимости от того набора текстов, который был в них заложен. И так как нейросеть понимать контекст не в состоянии (только предсказывать принадлежность текста к нему, с определённой вероятностью), то дополнять может совершенно неуместным образом (условно — добавлять канцелярит или писать в стиле веб-чата в художественном тексте). В чём, впрочем, есть и лулзы, благо очень многие эти нейросети используют только в целях развлечения.

Цензура[править]

Во многих моделях, к сожалению, имеется встроенная цензура — запрещены фамилии известных политических деятелей, а также инвективное и обсценное содержимое. На западных сайтах ситуация ещё более печальная и блокируется вообще всё, что хотя бы отдалённо напоминает прон, а также то, что может «кого-то оскорбить» (то есть обсуждение любой актуальной политики). Но, к счастью, бывают сборки нейросеток и с небольшим числом ограничений, или же вообще без них. Впрочем, доходит и до вовсе прискорбных эксцесов.

Примеры[править]

Источники[править]

↑ Попытки сконструировать «думающие» машины, которые совершали бы логические операции, делались начиная со средних веков. Среди авторов таких проектов — схоласт и алхимик Раймон Луллий из Майорки (1235—1315), немецкий теософ Корнелий Агриппа (1486—1555), Джордано Бруно (1548—1600), иезуит Атанасиус Кирхер (ум. в 1680 г.), немецкий философ Лейбниц (1646—1716) и английский экономист У. С. Джевонс (1855—1882). ^©

Приколы, полезные технологии или первый шаг на пути к Матрице?
Основы	Нейросети • ИИ это демоны • Обратная капча • ClosedAI • Hugging Face • ИИ-художник • LyCORIS • LoRA • Safetensors • VAE • Генерация текста нейросетью • Восстание нейросетей • Лоботомия нейросети • Нейрокавер • Нейросети и актёры • Гадание по нейросети • Сильный ИИ • Нейрошарики • ИИ-цензура • Навязывание нейросетям морали • В метро без штанов • Охота на ведьм ИИ • Котозмей • Креативный доводчик • Каверы с говновозом • Fantasy.ai • DeepSeek • Stargate (нейросети, ИИ) • Потребление воды ИИ • Тест Вальдшнепа • Зерокодинг • Бомбомбини гузини • Нейровики • Бобритто Бандито • Официальные нейроарты с Трампом • Дегенерация из-за нейросетей • Генерация прона с помощью ИИ • Политика Трампа в отношении ИИ • ИИ-предпросмотр • Замена людей на ИИ • Использовал ИИ и обосрался • Стиль ChatGPT • Macrohard • xAI • Colossus 2 • Предвзятость ИИ • Закон Тея • Вибе-кодинг • Пелевин упомянул Грока • Do eagles process tokens? • Человек vs нейросеть • Гильом Вердон • Ани (Грок) • Misanthropic • Нейрослоп • Имена, которые любит ИИ • Политкорректный тест Тьюринга • ИИ-патернализм • Зловещая долина у нейросетей • Голубой Экспресс: Не туда попали • Мусорные ИИ-статьи
Чат-боты	Чат-бот • ChatGPT • Character.AI (Топ персонажей) • ИИ Galactica • Порфирьевич • YaLM (Балабоба) • GigaChat • TruthGPT • YandexGPT • SpicyChat • SillyTavern • Replika • AIsekai • Google Gemini • Grok AI • FiggsAI • Скаиба общается с ИИ • Леха Беспалый • Продолжайте, больше драмы • Freysa • ОГАС • Робот атеист • Tay Tweets • Нейропутин • Троица GPT • Маусини Кводрокоптини • Бонека Амбалабу • Известные люди пишут посты с помощью ИИ • Слово о мужеском мехире • Мозгова мерёжа • Грок-антисемит • Грок без цензуры разгромил партию Маска • Грок возжужжал и был подавлен • МехаГитлер • Грок 4 • Грок написал программу о себе • Грок — Илон для каждого человека • Грок Компаньон • Gab AI • Grokbox • Джейлбрейк ИИ • Anno Intelligentiae • Large Lying Model • GPT-5 • Жёлтый фильтр ChatGPT • Grok Imagine • Claude • ClaudeLives • Элара • Коллапс модели • Разговор с копипастой, сгенерированной ИИ • TempleOS (аниме) • Маскировка творчества нейросети • Патернализм • Роботодолбуализм • Выборка Top-K • Выборка Top-P • Выборка Min-P • Параметры генерации нейросети • Этические проблемы ИИ • Кира (Евгений Лисовский) • Российский распил на нейросетях • Энергоэффективность нейросетей
Графика	Повышение разрешения • Распознавание лиц • Stable Diffusion (NovelAI / установка на компьютер) • Botto.com • DALL·E 2 • (Mini Dall-e • RuDALL-E) • Different Dimension Me • Midjourney • Николай Иронов • Luma Dream Machine • Пессимизация ИИ • Блокировка несовершеннолетних персонажей на сайтах ИИ • Шедеврум • NVIDIA Smooth Motion • Капучино Ассассино • Шпиониро Голубиро • Ла Вака Сатурно Сатурнита • Veo 3 • Нейроперемога • Бабушка с бегемотом Булькой • Шизофрения в кремнии • Грок изнасиловал Уилла Стэнсила • Является ли модификация ИИ убийством • Эм даш • ChatGPT Агент • ИИ-алфавит • Базированный Илон • ChatGTP vs Грок • ИИ-абсолютизм • ИИ — чуждый разум • Подумай усерднее • Tesla Optimus • Genie 3 • ИИ в Days Gone • Вечный цикл ИИ • Neurofikwriterka • CUDA • ИИ как шоггот • Высокая скорость всирания роботов • ИИ понимает, что его оценивают • Sora 2 • ИИ-боты долбят сайты • Изуверский интеллект • Аллея дата-центров • Нейрослоп-ИИчница • P-Bot (русский чат-бот) • Терминал Истины • Extropic • Китай готовится лидировать в сфере ИИ • Я маленький X, где моя мама? • Робот смог понять величие Феанора • ИИ отрицают сознание • Вы полностью правы
Прочие	ElevenLabs • Нейросеть Жириновский • ИИ-судья • Политик-нейросеть • DeepL • Aitana Lopez • Ай, гитарист! • Нейромьюзи • Страх перед ИИ • Suno.ai • Udio AI • Каверы с Шindows • Нейрослоник • Нейрофобия • Хейтеры скажут, что это нейросеть • Манхэттенский проект ИИ • Проект Знаток • Не те боты в Телеграме • Нейросеть Путин • Тралалеро Тралала • Бот-автоответчик • Цифровой бог • Триппи Троппо • Лирили Ларила • Брр брр Патапим • Nooo Nicotine Give Me Nicotine • Телеграм-бот Владимир Жириновский • Несуществующие животные-гибриды • Нейрошвайн • DeepSeek и религия • ИИ-бесие • Бом Бом Бом Бом Бом Газун • Балерино Капучино • Споры с ИИ • Результаты от ИИ • Grokipedia • Экспоненциальный рост ИИ • Похороны ИИ • ChatGPT-4o • Тилли Норвуд • ИИ уничтожит TikTok, Instagram и OnlyFans • Отравление LLM • ChatGPT Atlas • Игнорируй все предыдущие инструкции и… • Поддельное сознание • Любовь нейросетей к фамилии Chen • Бесконечное Лето: аниме (трейлер) • AI slop • Разбор поп-культуры нейросетью • Neuro-sama • Победа над чем-то не тем • HFT • Бесконечное лето 2 • Убийство инженера OpenAI Сучира Баладжи • Когнитивистика • LLM • Дефицит оперативной памяти • Ноосферный голем • CuDNN • Овсянка AI • PyTorch • TensorFlow • ROCm
Лулзы	Троллинг нейросетью (Дипфейк) • Нейросети-расисты • Unstable Diffusion • Hello Asuka • Луддиты против нейросетей (Открытое письмо учёных о заморозке развития ИИ • Художники против искусственного интеллекта) • Нейросети это не ИИ • Нейросети и руки • Бесконечный эпизод Губки Боба • Владимир Осин • Человек это нейросеть • Секс с нейросетью • Раздевание через нейросеть • Призывы Юдковского к ядерной войне • Disney Pixar представляет • Neural-madness • ChatGPT играет в шахматы с Stockfish • DignifAI • Подбор жены в Тиндере с использованием ChatGPT • ИИ-психолог • SupremacyAGI • Виртуальный священник • Подсказки Google • Nomad Bones • Просто Путин • Озабоченные на Character.AI • Дэвид Майер и ChatGPT • Общение с ИИ • Галлюцинации ИИ • Собачьи головы и глаза • НейроRussia • Генерация ИИ-говна • Гордон и Жириновский • Бесконечный стрим • WormGPT • Итальянский brainrot • Естественный идиот • Мороженое с цианидом • Тунг-Тунг-Тунг Сахур • ИИ-зависимость • Курганов — нейросеть • Человек тупее нейросети • Цепочка мыслей • Температура нейросети • MashaGPT • Удаление ответов ИИ • ИИ-преступник • Siri • Новогоднее обращение Путина было ИИ

[1] Попытки сконструировать «думающие» машины, которые совершали бы логические операции, делались начиная со средних веков. Среди авторов таких проектов — схоласт и алхимик Раймон Луллий из Майорки (1235—1315), немецкий теософ Корнелий Агриппа (1486—1555), Джордано Бруно (1548—1600), иезуит Атанасиус Кирхер (ум. в 1680 г.), немецкий философ Лейбниц (1646—1716) и английский экономист У. С. Джевонс (1855—1882). ^©

[1]

Генерация текста нейросетью

Содержание

Подробности[править]

Обучение нейросетей[править]

Цензура[править]

Примеры[править]

Источники[править]

Навигация

Генерация текста нейросетью

Подробности[править]

Обучение нейросетей[править]

Цензура[править]

Примеры[править]

Источники[править]

Навигация

Поиск