Вордфильтр
<Henry Kane> О, прикольный тест. Определяет физическую подготовку по сердцполюбиению.
<Allgood> по чему? :-о
<Henry Kane> сердц е б и ение, блеать...
<Henry Kane> Я уже полюбил местный антимат.
Вордфильтр (англ. word filter — словяной фильтр) — примочка к форумам, чатам и подобным прочим местам, заменяющая нецензурные слова на установленную админом комбинацию символов, например ***. Список запрещенных слов формируется админом.
Также возможно автовыпиливание поста и автоматические действия по отношению к написавшему, например автоматический бан.
Типы[править]
Судя по всему, делятся на два типа:
- Заменяющие точно те слова, которые есть в списке запрещенных. Менее эффективно, но более точно.
- Заменяющая по шаблону все запрещенные комбинации символов, даже если это кусок слова. Типа, чтобы сразу выпилить и само слово, и его формы, и самого автора поста. Такая форма люто доставляет.
- Крайняя форма строгости, при которой вордфильтр игнорирует пробелы, или же сверяется с своим огромным словарем матерного (и не только) языка с целью выяснить, насколько сильно вот это слово написано с ошибкой — комбинация символов может быть не точь-в-точь как эталонный матюк, а отличаться на (не)приемлемые N символов (1/2/3/4/ect) — вдруг у нас матершинники безграмотные, или торопятся куда-то, или клавиатура у них заедает. А сам словарь такой, что ему каждое второе слово матерным покажется. И залепить туда ещё и словарь суффиксов, приставок, окончаний, склонений, спряжений и прочих морфем, который активируется следующим образом: матюк запикивается символами «██████████████», и если к ним что-то прилегает — это прочие морфемы матерного слова, подлежащие удалению через замену на те же «█████», вместе с куском пробелов, чтоб висящие в воздухе остатки слов глаза не мозолили. И чтоб высматривал буквы насквозь строк: одна буква на первой строчке, вторая на десятой, третья вообще в самом конце, а складывается матюк, дабы ENTER не спасал. И научить его использовать мудрёный викификатор и символами из таблицы символов и юникода, просматривать содержимое картинок и блокировать непроверенные ссылки. В общем — есть ещё много способов сделать вордфильтр ещё более старательным, но даже сами управляющие и владельцы фильтра понимают, что это уже перелет, так что обычно это или пародия на обычный вордфильтр, или делается смеху ради, или как троллинг при помощи пользовательского бота с фильтром, или же в случае совсем уж параноидального администратора, иными словами — в крайне редких случаях.
Лулзы[править]
Очевидно, что пока в русском языке и прочих расовых мунспиках есть слова типа оскорблять, подстрахуй, колебания, скипидар, команда, потребитель и прочие подобные, вордфильтры второго типа дебильны не могут не давать постоянного притока лулзов, вызванных цензурированием тех или иных нормальных слов.
- В оммоэрпоге Tales of Pirates и русском Lineage II мат-фильтры выдают такой перл: парикма***ская или, как вариант, ко-_-.
- В оммоэрпоге World of Warcraft персонаж по имени «Змеебой» и квест с ним был обозван «Зме$%^ой». Лулз в том, что таким образом под цензуру попали сами разработчики. В одном из последующих патчей он был переименован в «Змеевержца».
- На одном из весьма популярных серверов китайской расовой игры Perfect World в чатах как минимум раз в 5 минут проскакивало слово «место***ождение».
- В свое время на местечковом сервере Lineage II получил блок чата за слово сабля.
- На photosight.ru вордфильтр заменял «бля» на «ёлы-палы». Одним из результатов была «ёлы-палымба».
- Слово «рублями» некоторое время было типичной жертвой на форуме, ни много ни мало, биржи FOREX.
- На forum.ixbt.com фильтр игнорировал пробелы и резал фразы «Уступи дорогу» и «подсоедини его, в настройках».
- В английском языке широко встречаются вордфильтры, порождающие перлы типа «Consbreastution of the United States», «clbuttic» и «buttbuttination» [1].
- В MMORPG вордфильтры часто мешают русскоязычным игрокам, общающимся на транслите. Классический случай, когда написанное транслитом слово «щит» заменяется на #$@%. В World of Warcraft, например, в список запрещенных, также, попадают слова «nazi», «nigger», «gay» и «KKK», то бишь «ку-клукс-клан» — страшно матерное выражение (хотя его употребляют в значении «окей-окей-окей»).
- Ещё один случай с вордфильтрами второго типа — непропуск японского имени «Асука». Факт бы не доставлял столько лулзов, если бы форум не был посвящен играм GTA и если бы Асука не была важным персонажем мира GTA.
- На форуме «Нивала» матфильтр особенно любил слово скипидар, потом (после модернизации матфильтра) под раздачу попадали слова «употреблять», «алебарда» и слова с корнями «трах» и «хрен». Модераторы форума объясняли это тем, что это в интересах самих же пользователей — вдруг напьешься, пошлешь весь форум в пространных выражениях — и матфильтр спасет тебя от пожизненного бана, ага.
- Без AG, не обошлось, разумеется. Нейтральный «адский» с какого-то хуя заменялся на «диавольский», так появился неведомый ёбаный зверь — Колордьявольский жук.
- В одной из текстовых игр сочетание «зая» заменялось на «краля». Поэтому там появилось слово «кралявка».
- В локализованной версии расово верного корейского онлайн-шутера Point Blank эпически тупой антимат запрещает употреблять слово «команда».
- В чате группы «АлисА» нейтральная фраза из пейсни — «сколько троп и дорог для меня заплелись в одну».
- В поздние 90-е на гостевой одного из футбольных клубов были заменены звездочками две первых буквы в фамилии расового адыгейского футболиста Каплана Хуако.
- Ну и совсем параноидальный случай имел место на сайте одного из белорашкинских новостных ресурсов, когда вордфильтр сработал в сообщении о завоевании каким-то местным спортсменом олимпийской медали в стрельбе из лука.
- В игре «Танки Онлайн» местный сабж до недавнего времени блокировал слово ребаланс — то есть создание баланса пушек и корпусов заново.
- В Dark Souls цензурится безобидное слово «knight». Список можно посмотреть тут (список доставляет). Зато можно писать транслитом и капсом русские маты.
- На сайте о кряках к играм crackwatch.com благодаря особо обученным обезьянам закрывается звёздочками часть слова whistle. Видать, кто-то там умудрился усмотреть слово shit.
- В чате игры Star Wars: The Old Republic выпиливается фамилия одного из компаньонов персонажа — Киры Karsen.
- В Warface при попытке написать «элитные ботинки» выдавался бан чата на один день.
- В «Аллодах Онлайн» были известны случая приравнивания к матерным слов наподобие «ребенок», «Гипат», «wow» и т. д. До сих пор на их форуме аббревиатура WoW и сочетание «World of Warcraft» заменяются звездочками.
- В браузерке Overkings очень любят заменять название других игр на «Overkings». Таким образом, например, слово «район» превращается в «рoverkings».
- В ММО Skyforge он тоже есть, притом работа его загадочна и туманна. Например, слово «shit» однозначно запикивается, а вот «fuck» считается вполне себе нормальным. Русский же вордфильтр наши разрабы научили-таки не вырезать слоги из слов.
- На официальном форуме одной из ныне почивших мобильных игр стоял эпичный вордфильтр, заменявший буквосочетание «ass» на «gluteus maximus». И когда кто-то писал, к примеру, слово «assassin»…
- В 2015 году в комментах к статьям на Lenta.ru из-за антимата было крайне сложно обсуждать такую актуальную на тот момент тему, как курс рубля.
Таким образом, можно находить мат и лулзы там, где их в помине не было.
Фильтры первого типа настраивать сложнее, ибо список слов должен быть намного больше. Потому зачастую админы просят сочувствующих «обучить» вордфильтр, наполнив его релевантным контентом. Данный процесс приносит ещё ряд лулзов, поскольку в перечне слов наверняка окажутся, в зависимости от аудитории, Путин, Буш Дядя Обама, Леня Космос, Янукович, матан, фамилия директора школы и прочие подобные вещи.
Противоборство[править]
В зависимости от степени долбоебизма стараний быдлокодера, который писал вордфильтр, его с переменным успехом можно обходить. Основные методы включают в себя:
- Применение б-гмерзких многоточий, звездочек, !@#$% и прочей хуиты.
- Замену православных РусскихЪ БуковицЪ на идентичные буквы латинского алфавита или арабские цифры. Бонусные очки, если припахать всю остальную таблицу Юникода. Таким образом, «хуй» превращается в «xYu», «пизда» в «пN3дy», «Лев Николаевич Гумилев» — в «Лeв Hикoлæвич Гyмилeв». Ну вы понели.
- 1337, 265, etc.
- Наконец, символы можно представить в кодах. К примеру, «хуй» превратится в брутальное «хуй».
Расстановка точек[править]
Использование быдлофильтров указывает на некомпетентность администратора форума, ибо налицо непонимание оным простых фактов:
- В случае выпиливания по регекспам надо либо строить нефиговое выражение, состоящее из матана чуть более, чем полностью, либо мириться с 9000 жалоб пользователей, что фильтр неверно реагирует на слово «оскорблять», но не реагирует на слово «ибацца». Примеры выше намекают.
- В случае выпиливания целиком список должен быть таким, что выполнение поиска по нему начнет занимать весьма нехуевое время, что, конечно же, скажется на скорости работы форума.
- И в том и в другом случае пользователи все равно обойдут вордфильтр, как ни старайся.
Как следствие можно вывести, что вордфильтр есть очередная неудачная попытка автоматизации работы модератора и де-факто нахуй не нужен, проще найти вахтёра с аллергией на мат.
Есть и еще одно применение вордфильтру — прикрытие задницы владельца. Так, например, на форумах главного сайта РБК запикиваются фамилии Путин, Медведев и Зюганов. Многие согласятся, что слова эти не слишком приличные, но основная причина в том, чтобы некто не мог найти оскорбления вышеозначенных персонажей и выписать соответствующую награду за экстремизм.
И наконец, есть исключительные случаи, когда автозамена изпользуется для лулзов или с целью избавить содержание постов от наиболее употребляемых слов. Например, на 2ch.so слово «школьник» автоматически превращалось в сосницкий; а «быдло» — в элита.
Также ворлдфильтр может применяться для того, что бы не матерились боты: были зарегистрированы случаи, когда самообучающие чат-боты начинали материться (нахватались от троллей), нахватались фашисткого бреда (тоже от троллей) или перешли на свой собственный язык, для человека выглядящий как бессмысленный набор слов (слишком долго говорили друг с другом, не получая сигналы поощрения за использование английского языка — и разучились на нем говорить), а в теории возможен случай внезапного перехода бота с одного языка на другой (скажем, если российский бот будет говорить с китайцами чаще, чем с русскоговорящими, то тот, теоретически, может перейти на китайский) — и в результате таких событий случившееся считали возмутительным или непонятным, а ботов отключали, и зачастую от греха подальше не включали обратно. Соответственно, ворлдфильтр должен фильтовать речь бота, дабы тот глупости не наговорил — шанс того, что он будет пытаться обойти ворлдфильтр и выкручиваться небольшой.
См. также[править]
- Вордфильтры на разных имиджбордах
ВиталикАвгустина- BOBBA
- Премодерация
- Меня пидорнули модераторы
- Энциклонги
- Scunthorpe problem
- Замены, среди прочего, — одно из любимых развлечений в больничке