Статистика
Есть три вида лжи: явная, скрытая и статистика.
Я ваш преподаватель статистики. Статистика это очень важная наука. Например, я могу доказать, что население Ирландии многократно превышает население Китая. Просто я буду учитывать только рыжих
Статистика (от латинского status — состояние дел), также метрика — наука о данных.
Имеет математическую основу, называемую математической статистикой, она же «матстат», которая вообще говоря, является другой наукой (может включаться в математику, хотя на Западе обычно преподается на отдельных, нематематических, факультетах).
Путаницы добавляет, что сама обработка данных в целях изучения народного хозяйства/национальной экономики тоже может называться статистикой (в России этим занимается Федеральная служба государственной статистики, сокращенно — Роспил Росстат).
В современном обществе является инструментом мощнейших манипуляций общественным мнением («есть малая ложь, большая ложь и статистика», см. также Средняя температура по больнице).
Так же, как и многие современные явления, используется в мемах.
История[править]
Переписи населения проводились в развитых государствах с глубокой древности (собственно с появления этих самых государств), проводился и учет имущества, всё это делалось в целях налогообложения и не только.
Сам термин был введен в 1746 году немецким ученым Готфридом Ахенваллем, который предложил читать студиозиусам в университетах не навязшее в зубах «Государствоведение», а модную, современную и молодежную «Статистику», что прижилось и получило распространение. Так что само слово «статистика» можно считать удачным мемом 18 века. Уже Наполеон Бонапарт говаривал: «статистика — это бюджет вещей».
Математизация[править]
Где числа, там и математика, тем не менее, статистику оказалось математизировать не так просто. Дело в том, что статистика завязана на теорию вероятности, получившую четкую аксиоматику только в XX веке стараниями великого Колмогорова. Также математическая статистика требует применения необычных методов и нетривиальных допущений (в рамках матстатистики на основании отрывочных экспериментальных данных надо делать глобальные выводы о том, что происходит «на самом деле»), поэтому до сих пор не очень ясно насколько можно ее считать математикой.
Хороший импульс придало появление широко известного метода наименьших квадратов, восходящего к «королю математики» Карлу Фридриху Гауссу, не чуждому прикладных исследований, в частности, астрономических расчетов. (Для продвинутых — как оказалось, «метод наименьших квадратов» совпадает с «методом наибольшего правдоподобия», если ошибки измерений независимы и имеют нормальное распределение). Но настоящим основоположником математической статистики стал английский математик Карл Пирсон (1857—1936, биографию можно прочитать в Википедии). Он, в частности, придумал «критерий хи-квадрат» (если Вы учились в универе не на гуманитария, то скорее всего понимаете о чем я).
Сейчас матстат делят на:
- описательную статистику (расчет всяких средних, дисперсий, эксцессов и т. п. и построение красивых графиков и стройных таблиц);
- теорию оценивания (построение оценки искомого параметра по экспериментальным данным);
- и теорию проверки гипотез (популярна у военных, базовая задача: летит на тебя ракета или нет, но вообще обычно оценивается принадлежность наблюдаемой случайной величины к какому-то классу распределений, если опять же понимаете о чем я).
Среди методов матстата, которые, как говорится, «на слуху» — упоминавшийся выше метод максимального правдоподобия, метод главных компонент (тоже заслуга Пирсона), факторный анализ, регрессионный анализ, дисперсионный анализ и т. д. К ним примыкают методы автоматической классификации (типа кластерного анализа) и прочего распознавания образов, что, как ясно из названия, имеет отношение к этому вашему искусственному интеллекту.
В государстве и экономике[править]
Как и было задумано в начале, статистика применяется для анализа и обработки разнообразных экономических показателей. По сути для народа, общества и государства это и есть настоящая статистика (а не матстат, который лишь дает нужный инструментарий). Но где экономика, там и распил/обман народа власть имущими, поэтому статистика становится инструментом разнообразных манипуляций, призванных доказать рост всего хорошего и спад всего плохого и т. д. (оппозиция доказывает с помощью статистики, что наоборот всё плохо). Но виновата в этом, конечно, не статистика, а недобросовестные люди, прикрывающиеся ею. Некорректные экстраполяции, неправильные интерпретации закономерностей, манипуляция со средними — вот это всё. Но и прямые подтасовки данных по-прежнему в моде. Примеров масса, каждый и сам вспомнит. Бывают и неправильные выводы на основе трудно обнаружимых ошибок методологии типа «ошибки выжившего». В Википедии есть хорошая статья на эту тему под названием «Как лгать при помощи статистики». Также на викиресурсе «Руксперт» имеется неплохая, но более политизированная статья «Манипуляция статистикой» .
Цитата (простенький пример манипуляции):
«Электроэнергия доступна более чем 3/4 ферм США». Слово «доступна», никак не определённое в заявлении, обессмысливает его — обычно это означает, что ЛЭП находится на расстоянии 10-100 миль (16-160 км) от фермы, но под доступностью можно понимать и что-то иное. Автор также замечает, что при интерпретации тех же самых данных можно поставить противоположный акцент, написав: «Электроэнергия недоступна четверти ферм США».
Те, кто по роду службы получают, хранят, обрабатывают и публикуют статистические данные, тоже гордо называют себя статистиками, а свое занятие — статистикой, в России этим занимается целое ведомство — Федеральная служба государственной статистики, оно же «Росстат», обладающее примечательным сайтом rosstat.gov.ru, где каждый может ознакомиться с текущим состоянием распилов дел в Российской Федерации. Впрочем, бывший директор НИИ статистики Росстата Василий Симчера однажды таки устроил срыв покровов, заявив: «В стране взяла верх государственная идеология дезинформации» и что «ему надоело бороться с лжецами», рассказав также:[1]
основные фонды изношены более чем на 80%, доля предприятий с участием иностранного капитала в стране достигает 70%, а пропасть между богатыми и бедными слоями населения составляет 44 раза — почти втрое больше, чем по официальным оценкам.
.
Несколько особняком стоит демография и применяемая в ней демографическая статистика, хотя по сути — это тоже статистика. Выделяют правовую статистику, медицинскую статистику и всякую прочую, но это уже детали (ведь многим хочется иметь свою научную делянку, а то и целое поле, для диссертаций и финансирования с собственной терминологией и классиками).
Медицинская статистика — это особенный способ взгляда на реальность, савмещенный с обычным медицинским цинизмом. Именно медстатистика дает уверенность в том, что все люди — идиоты.
Галерея мемов[править]
Если смешать бочку говна и бочку статистики, получишь две бочки статистики. Кто не понял, для тех картинки: