Большие данные
Большие данные (биг дата, big data) — перспективное направление в компьютерной обработке данных, обозначает работу с гигантскими базами данных, содержащими информацию, обработка которых отдельными людьми практически невозможна. Анализ такого количества данных позволяет вычленить отдельные закономерности.
Описание[править]
В начале компьютерной техники обхем хранимых данных имел значения, так как хранилища были маленькими. Поэтому приходилось выбирать, что сохранять, а что просто отбрасывать. Однако к концу 2000-х технологии создания накопителей стали достаточно продвинутыми, чтобы позволять хранить буквально любую информацию, которая только существует, вообще ничего не отбрасывая, а коли уж информация существует, то и её анализировать с использованием специальных закономерностей.
Для специальных служб настоящим открытием в области больших данных стали социальные сети, где многие люди необоснованно сообщают о себе чрезмерное количество личной информации. В результате получилось возможным достаточно точно определить, например, является ли человек содомитом по его подпискам на группы в соцсети. Эта информация позволяет получить очень много данных о состоянии общества, использовать их как в целях рекламы, так и в целях слежения и подавления воли.
Большие данные могут использоваться и в видеоиграх, например для написания неотличимых от человека ботов может использоваться гигантский набор данных, собранных от реальных пользователей, после чего бот просто максимально подстраивается под реального человека.
Характерным примером использования больших данных является обучение нейросетей: чем больше данных используется в конкретной нейросети, тем более качественные и точные результаты она будет выдавать. Из-за этого огромную ценность приобрели те же банки изображений с тегами и описаниями, что позволяет обучить рисовательную нейросеть.