mp3
mp3 (устар. MPEG 1 Layer III, быдл. Эм Эр Зэ, aka МРаЗь.) — формат сжатия звука, в своё время запиленный арийскими учеными в институте Фраунгофера.
Кто не знает может попробовать догадаться, как в этом формате сжатия звука должна расшифровываться аббревиатура «mp». Правильный ответ — «двигающаяся картинка».
Сегодня является безоговорочным королём форматов сжатия звука с потерей качества (т. н. «lossy»). Битрейт 320 kbps (максимальный битрейт в пределах мп3) некоторых и сейчас устраивает больше, чем занимающий на диске в три раза больше места файл в lossless-формате сжатия. Соотношение объективности и инвалидности в утверждении «Ведь качество не отличается» — это отдельный повод для вялых холиваров. Качество отличается, на хорошей аппаратуре, и особенно в наушниках — слышно сразу. Кстати, в обсуждениях этих самых наушников (или звуковух, или усилков…) среднего и верхнего ценового сегмента популярным, но литературным способом обосрать продукт является снисходительное «ну, эмпэтри на этом слушать, конечно, можно».
Кто не любит mp3[править]
И без учёта случая ненависти за компанию («мой брат сказал, что mp3 гавно, а wma руль»), существуют следующие примеры господ, граждан и товарищей, горящих нелюбовью, с морем разнообразных на то причин.
- Копирасты — за распространённость. Одним из признаков победной поступи формата исторически стал вал сайтов, на которых любой мог качать музыку. Профит генерировался и уходил при этом сайту через просмотры баннеров, клики, переходы, подцепленные вирусы, пожертвования, ЧСВ. А дядя-правообладатель на суде потом говорит, что так к нему в магазин пришёл один человек, из покупки которого сделан материал для сайта, а могли прийти 175 тысяч, которые показывает счётчик скачиваний с сайта; на эту разницу он и подаёт иск. Потом пошли Торренты и Айтюнсы, путающие карты морализаторам, но страдания и жгучее желание отмщения (ради профита-то) можно и сымитировать.
- Аудиофилы и меломаны — за низкое качество звучания, срез частот выше 17 кГц, артефакты сжатия. Если обычному человеку будет похуй, с его наушниками-«затычками» или китайскими колонками «SVEN» или «Genius», то более искушённый слушатель, с нормальными ушами за 9000 и более-менее хорошей техникой, разницу таки слышит.
- Ещё одна причина не любить mp3 аудиофилам заключается в том, что максимальное число каналов в этом вашем mp3… всего ДВА! Стерео! А то и вообще куцый joint stereo, который кодируется с использованием суммы и разности сигналов левого и правого каналов, что тоже ведет к неизбежной потере звуковой информации. Имея колонки от 5.1, аудиофил от звука в два канала получить оргазм не может. На самом деле — хуйня, большинство музыкальный произведений сегодня записывается в стерео, случаи записи квадро и 5.1 — очень редки.
- Кровавая гэбня — за распространённость. Востребованность таких форматов толкнула вперёд технологии гаджетов (сейчас сабжевый формат, пожалуй, не понимают только микроволновки и стиральные машины), и теперь у каждого плебея есть опасная игрушка «гаджет», которая может быть употреблена в целях дестабилизации режима (хоть обычным террористом, взрывающим аэропорты, хоть по-настоящему опасными мутителями рассудков). В части звука для применений по двойному назначению есть и более шустрые и эффективные специализированные кодеки типа AMR, AMR-WB и иже с ними, а также свободные Speex и Opus.
- Линуксоиды — за распространённость и проприетарность кодека. Подавители свободы Патенты (а точнее — немецкий НИИ, в котором придумали сабж), своими когтями впившиеся в такую распространённую сущность, оскверняют публичное пространство и создают лишний гемор в обвесе дистрибутивов, от стремления к распространённости тоже не отказавшихся.
Собственно, о формате[править]
Основан на идее «сделать из *.wav *.mid», а именно разбиения сигнала по частотам с помощью БПФ, то бишь кагбэ по нотам, и потом кодирование этих «нот». Это примерно как перевод растровой картинки в векторный вид с отбрасыванием незначительных деталей.
Для усиления эффективности сжатия выпиливаются самые «тихие» (по мнению разработчиков энкодера) «ноты», а также всего того, что ухо среднестатистического обывателя не в состоянии услышать.
Но есть и такие, кто слышит и обдает окружающих потоком негодования, противопоставляя mp3 lossless форматы, где всё остаётся на месте. Справедливости ради стоит заметить, что разработан также режим кодирования mp3HD, который по сути является lossless-сжатием, но в то же время совместимым с битстримом MP3 (правда, нужна поддержка VBR >320kbs).
К врождённым недостаткам формата относится плохое обращение с высокими частотами. Зависит качество обращения с высокими частотами в первую очередь от стереопанорамы, то есть от разницы между двумя стереоканалами, при нулевой разнице (псевдо-моно) лоу-пасс фильтра срежет что-либо зависимо от настроек, но всё, что останется, психоакустический кодер не попортит, либо зацепит минимально. При плавающей панораме около 90 градусов и насыщенности средними частотами есть высокие шансы, что высокие «хлюпать» будут и в битрейте 320. Школота особенно остро ощущает этот недостаток (конечно, если не убила слух громким звуком из наушников), так как с возрастом чувствительность к ним пропадает. ВЧ или звенят металлическим звоном или же как бы отсутствуют. Имеется также врождённый дефект кодека (гуглить sfb21), создающий принципиальную проблему с кодированием частот выше 16 кГц из CD аудио — их надо либо срезать, либо кодировать кривовато, либо раздувать битрейт. Это свойство мп3шного сжатия обычно используется для опознания качества источника записи. Кстати, эта проблема решена в формате-наследнике — AAC, да и вообще много где, но всем похуй. Если высокие частоты срезаны на частоте сильно выше 16 кГц, то, вероятно, перед нами звук качества CD-DA. В любом случае, взгляд на спектрограмму часто позволяет опознать якобы оригинал, сделанный из mp3, а для особо ленивых есть специальные программы.
На самом деле высокие частоты режутся специально, ибо при таких битрейтах они превращаются в кашу и лучше их просто отрезать. Плюс на несоответствующей аппаратуре их не услышать. AAC делает то же самое, но там зависит от используемого кодировщика. Если так нужны высокие частоты — есть lossless, или на крайний случай Ogg Vorbis, который стремится хоть как-то их сохранить.
Другие форматы[править]
Существуют более эффективные способы сжимать музыку. AAC, (OGG)Vorbis/OPUS, MPC, WavPack. Однако по распространённости MP3 затыкает всех за пояс. Поэтому массы выбирают mp3, а аудиофилы негодуют. Впрочем, линуксоиды часто выбирают OGG, ибо свободный и сжимает аудио аккуратнее даже при учете меньшего битрейта у выходного файла. Так, OGG 96 kbit по качеству сравним с mp3 128—160 kbit. В последнее время, однако, ситуация коренным образом изменилась, смартфоны на андроиде без проблем крутят и AAC и OGG, притом декодируя их аппаратно. Ябблотехника даже самых древних моделей поддерживает AAC и ALAC. Не так давно еще появился Opus, но он больше заточен для передачи голоса (потому и используется в Whatsapp для передачи голосовых сообщений), вот у него с распространенностью дела действительно плохи.
Технология[править]
Появление mp3 напрочь убило ранние системы звукозаписи. Наступление шло по двум фронтам:
- технологическому (больше записи в том же объеме данных, что позволило резко уменьшить носители или резко увеличить объем в минутах)
- коммерческому (меньший объем данных + развитие интернета сделали доступным невозбранное скачивание аудиофайлов).
Современные технологии позволили внедрить mp3 во всё, что угодно, вплоть до хлебопечек и холодильников. Mp3-плеер 21 века — это не только специальное устройство (клипса с проводком в наушники), но и свойство телефона, компьютера, КПК — просто так, в качестве приятного и почти бесплатного бонуса. Большинство продвинутых устройств, кроме проигрывания, умеет и записывать, что, естественно, вин.
Проблема в том, что записывать звук на твердотельную память теперь умеет всё, что угодно, кроме, собственно, диктофонов. То есть записывай что угодно, но говном. А нормальные цифровые диктофоны с чувствительностью кассетных нужно заказывать из Пиндостана. Впрочем, в последнее время появляются они и в этой стране.
Декодеры[править]
Звучание декодеров разных плееров слабо отличается, так как большинство из них давно соответствуют стандарту, декодируя одинаково с точностью лучше шестнадцати бит, то есть услышать разницу не получится при всём желании. Когда всё только начиналось и процессоры в PC были послабее, некоторые разработчики следовали естественному желанию понизить точность арифметики при декодировании, что вызывало накопление ошибки в процессе. Сейчас такие трюки полностью утратили актуальность, и разница в звучании современных плееров, помимо зачастую очень существенных отличий в аналоговой части, объясняется только настройками, а не «качеством»: настройками эквалайзеров, расширением стереобазы, динамической компрессией, живительным ревербом и прочими улучшайзерами, но не декодерами. В таких условиях, например, держаться за старые плееры под Windows смысла немного, потому что относительно новых они могут быть совсем уже не торт, как когда-то легендарный Apollo пруф.
Вообще можно покурить этот сайт http://mp3decoders.mp3-tech.org/decoders.html и не разводить на эту тему срачи более. Фанатам Winamp читать тут и радоваться.
Mp3 на фоне быдла и аудиофилов[править]
Прослушивание mp3 с мобильников через динамик является достаточным признаком для причисления пациента к сонму быдла, которое бывает нескольких видов, но чаще всего это либо объебосы, либо гопники. Mp3 в телефонах бессердечно вытравливает духовные скрепы давних традиций бряцать кассетными магнитофонами «Весна», изрыгавшими «Ласковый Май» или «Модерн Токинг» (сейчас бы на их месте были «весёленькие песни про тюрьму» или плейлист радио «Восток FM»). Предположительно, претензий к качеству звука на подобных сейншенах у аудитории не возникает. Им главное, чтобы заряда аккумулятора хватало надолго. Заряда аккумулятора хватает надолго.
Аудиофилы (от греческого «любители слушать») утверждают, причем небезосновательно (и вообще они скромные люди), что на хорошей акустике можно без проблем различить звучание mp3 и оригинального CD. Чтобы услышать отличия, требуется сразу несколько факторов из списка:
- нормальная акустика;
- нешумное помещение без дребезжащего стекла в серванте; Либо годные наушники;
- нормальный слух;
- насыщенная деталями и/или глубиной музыка;
- оригинальный CD, не являющийся сборником конвертированных MP3;
- зашкаливающее ЧСВ (последнее в списке, но не по значению).
Ощущается как изменение деталей, стереопанорамы, диапазона частот по сравнению с исходным CD. На любом битрейте, а уж ниже 256 — и говорить нечего! Многие найдут различия между оригинальным CD-звуком и пожатой мп3шкой, даже если пожато было с оригинального CD и прямыми руками, а уж если с постоянным пережатием mp3-wav-mp3-wav-mp3-wav, и с битрейтом менее 160кбит/с — вообще «тушите свет».
Важно отметить, что попсень, говнорок, шансон и клубняк — короче, все громкое, но предельно простое жмется с меньшими отличиями от CD, а вот Бетховены, индастриал, звуки природы и этнических дудок (а также тихие саундтреки к фильмам) в силу своей частотной извращенности ниже 256 кбит не жмутся вообще, а на 256 и выше жмутся кое-как (на высоких мр3 всегда будет шепелявить как беззубый старпер). Есть и другое мнение — как раз таки всё громкое жмётся плохо, а вот ненасыщенное частотами и резким их изменением — жмётся лучше.
Не занимайся самостоятельно кодированием, если не любишь себя озадачивать тонкостями кодирования и любишь софт с одной БОЛЬШОЙ кнопкой «Сконвертировать в МП3». По-умолчанию большинство МР3-кодировщиков включают lowpass и highpass фильтры, а также используют быстрые алгоритмы кодирования, что неслабо ухудшает качество, и потом, такой МР3 на выходе превращается в уродство, убогость которого можно не заметить лишь на убогих дубовых наушниках (или аудиосистеме). Перед кодированием стоит основательно покурить Man, чтоб без запинки мог рассказать по памяти, что значит «lame.exe -V 0 -b320 --highpass 0.001 --lowpass 24 -m s -q 0».
Для глухих же людей с поражёнными медведём ушами рекомендуется кодировщик LAME последней версии с использованием пресетов. Умные разрабы и сотни тестеров уже позаботились о тебе, анон. Если не слышишь разницы, смело используй пресеты. Разница с оригиналом неуловима на большинстве мобильников, с которых ты наверняка будешь слушать любимого Guf_а. Ну тыпонел.
Урок истории[править]
Давным-давно, когда компьютерные игры занимали на жёстких дисках целых 50 мегабайт, процессоры едва-едва тянули 3D шутеры с унылым графоном, а CD-R были запредельной роскошью, люди пользовались так называемыми «музыкальными центрами», в которые вставляли компакт-диски формата CD-DA (74 минуты звучания несжатого звука), купленные в магазине. Обычным делом было записать коллекцию любимых песен с CD на кассету и слушать потом эту кассету в компактном плеере, радуясь шипению, убитым басам с верхами и скорому размагничиванию записи (однако, кассета, записанная на тру-деке, и потом проигранная на тру-плеере, типа SONY Волкмен, играла не хуже, чем этот ваш Айпод, правда не долго). Тру меломаны покупали блочные радиокомплексы, в которые обычно входил хороший, годный усилитель звука ватт этак под 100, кассетная дека, эквалайзер, проигрыватель CD, опционально также мог наличествовать проигрыватель винила, FM-радиотюнер, PC. В некоторых блочных CD-проигрывателях был так называемый «CD-чейнджер», в который вставлялось 3-5 компактов, и который по окончании одного диска подсовывал лазеру следующий, можно было слушать музыку, управляя процессом кнопочками на пульте и даже создавать плей-листы путём программирования процесса воспроизведения (подобное было и на кассетах, но там это всё работало через задницу в виду аналоговости стандарта). В автомобиле надо было либо иметь вторую коллекцию тех же дисков (по пятнадцать баксов за диск, и, нет, песни отдельно из альбома покупать нельзя), либо носить диски туда-сюда, либо не выпендриваться и слушать кассеты.
Прогресс, однако, на месте не стоял. Вскоре жёсткие диски выросли до пары гигабайт, а Pentium 100 МГц перестал быть чем-то сверхъестественным. Внезапно обнаружилось, что музыку можно хранить на HDD, и не только в несжатом виде (WAV с качеством, аналогичным CD-DA) или унылом формате ADPCM, но и что-то куда получше. На тот момент самым свежим аудиокодеком оказался MPEG-1 layer 3. Как нетрудно догадаться, это был третий по счёту кодек MPEG для аудио после layer 2 и layer 1. В нём исправили некоторые недостатки layer 2 и добавили режим joint stereo (то есть кодировать сумму и разницу между каналами — это очень выгодно, когда всё самое интересное звучит в середине стереопанорамы), поэтому использовать layer 2 смысла не было. Сыграло огромную роль появление досовского энкодера l3enc.exe, который давал пристойное качество даже в бесплатной версии с битрейтом 112 кбит/с (конечно, обычно его крякали). Пипл не смутило, что порождаемые файлы были т. н. элементарным потоком, в который пришлось запихивать абы как теги, то есть сопроводительную информацию типа названия песни, — это потом вышло боком, когда появился новый «стандарт» на запихивание. Определение длины в секундах и переход на конкретное время также перестали быть тривиальными задачами, как только в моду вошёл переменный битрейт[1]. Однако всё это казалось ерундой по сравнению с тем, что теперь можно было собирать коллекцию любимых песен огромного размера по сравнению с кассетами и минидисками (похожее на mp3 сжатие на магнитооптике, появился за несколько лет до mp3, ныне официально мёртв — Сони протупила тему), делать плейлисты в удобном виндовом интерфейсе, легко обмениваться музыкой в хорошем качестве с друзьями и даже скачивать её из интернета. Для быдла наступило светлое будущее, а меломаны как крутили CD на своих блочниках, плюясь в сторону Sound Blaster 2.0 с качеством звука китайской аудиокассеты, так и порою крутят до сих пор, хотя уже давно есть годные форматы со сжатием без потерь качества (flac и иже).
Ближе к середине 00-х mp3 стало доступно любому быдлу: теперь не надо покупать компьютер, чтобы слушать mp3: файлы, записанные на обычный компакт диск в режиме CD-ROM смогли научиться проигрывать бытовые музыкальные центры и «магнитолы с CD», чуть позднее — DVD-плееры, пиратские «mp3-диски» стояли рядом с Audio CD и медленно, но верно, завоёвывали популярность, а потом всем пришёл Интернет, и mp3-диски тоже начали вымирать, а музыкальные центры научились читать mp3 файлы с USB-flash и SD-карты. У меломанов же появились хорошие внешние звуковые карты за пару десятков «косарей» с хорошим ЦАП и форматы со сжатием без потерь, так что сегодня надобность в дисках формата Audio CD отпала. Но их всё равно ещё любят — полиграфия и физичность носителя, за который отданы деньги (компакт-диск можно потрогать, понюхать, полизать, а файл — нельзя) делают своё дело.
Ещё немного истории[править]
MPEG-1 layer 2 используется до сих пор в телевещании — потому что лучше, чем layer 3, на высоких битрейтах и для единообразия, если битрейт не столь высок.
После опубликования стандарта MPEG-1 layer 3 группа MPEG, понятное дело, продолжила свою деятельность. В группе стандартов MPEG-2 аудио был слегка расширен собственно mp3, а также появился многоканальный MPEG аудио на основе layer 2. Увы, требование обратной совместимости (что очень вредило эффективности сжатия), а главное, неспособность Philips вовремя написать качественный энкодер обеспечили стандарту полный фейл. Говорят, где-то в Австралии всё же успели издать пару DVD с таким звуком.
Следующим шагом MPEG стал AAC (Advanced audio coding). Было ясно, что мощность процессоров уже достаточна и будет расти, поэтому фантазия авторов развернулась на полную — кодек, вначале введённый в семействе MPEG-2, а потом дополненный в MPEG-4, включал в себя всё, что только могло прийти в голову. Правда, не обошлось без конфуза — основной профиль кодека оказалось неудобно реализовывать на специализированных процессорах, поэтому в качестве основы (к которой присоединяют т. н. расширения) используют профиль пониженной сложности AAC LC, а AAC Main Profile остался курьёзом. На обратную совместимость забили, так что AAC LC решал известные проблемы mp3, включая нелепые, типа sfb21:
- неудачно выбранные размеры длинных и коротких фреймов — в первом случае страдала эффективность, во втором даже на 320 кбит/с можно услышать «пре-эхо» перед резкими звуками;
- недостаточно гибкий режим joint stereo — теперь он мог включаться только на тех частотах, где надо;
- многоканальность, конечно.
В результате качество AAC LC на 128 кбит/с заметно лучше mp3, а на низких битрейтах mp3 нынче совсем в пролёте. Также в MPEG-4 предлагался вменяемый формат «обёртки» — с тегами и индексом. Основным локомотивом продвижения AAC для музыки в массы стал Apple. Получается, правда, так себе, хотя идея в целом правильная.
В AAC запилили два расширения специально для низких битрейтов, AAC LC с ними называется AAC HE:
- PS (параметрическое стерео), дающее значительно лучший результат, чем старый режим intensity stereo, — звук кодируется в моно, а в расширении идёт информация, как из него реалистично сделать стерео;
- SBR — кодируется только нижняя половина частот, при декодировании она дублируется в качестве верхней, подкручивается по сохранённой кривой, и добавляются тональные сигналы по необходимости. Звучит безумно, но это реально работает.
Оба расширения требуют совсем небольшую добавку битрейта. Результат — пристойное качество стерео при 32 кбит/с, хорошее при 48 кбит/с. Однако, в силу костыльной сущности, на битрейтах от 128 кбит/с и выше использовать эти расширения настоятельно не рекомендуется, качество станет хуже.
Само собой, некоторым хитрожопым бизнесменам пришла в голову мысль настричь бабла на закрытых расширениях mp3, но так, чтобы файлы как-то игрались на обычных устройствах. Первой попыткой стал mp3Pro — mp3 + SBR (алгоритм тот же, но формат, понятно, не такой, как в AAC). Было выпущено даже несколько портативных плееров. Однако париться с закрытым форматом с неясным будущим никто не захотел — ёмкость жёстких дисков продолжала расти. Результат — фейл. Второй попыткой был mp3HD — музыка обыкновенно кодировалась в mp3, а разница с исходным сигналом кодировалась другим алгоритмом и помещалась в один из тегов (похожим образом работает, например, DTS HD MA). Проблема в том, что объём тегов не может превышать 256 мегабайт, так что немногие в теме посмеялись и забыли.
Копирасты[править]
В 2002 году произошла история с объявлением формата MP3 платным. Компания решила сделать платными не только кодеры, но и декодеры формата.
На сайте www.mp3licensing.com была вывешена таблица, в которой указана стоимость, которую производители программ должны выплатить за каждый плеер. Для свободного софта это, естественно, было неприемлемо.
Этим воспользовались разработчики свободного кодека Vorbis, прорекламировав свой православный кодек. Позднее представители корпорации объяснили, что произошло недоразумение, на странице с условиями не оказалось правила, согласно которому некоммерческое распространение происходит безвозмездно.
Тем не менее, поскольку Linux может распространяться и коммерчески, для некоторых дистрибутивов (почти всех основных, кроме Slackware, где Патрегу похуй, Gentoo, который вообще source-based, и некоторых других) оказалось неприемлемо помещение кодеков MP3 в стандартную поставку[2].
Смысл сжатия в 2020-х[править]
Есть мнение, что смысла сжимать аудио в 2020-х годах просто нет, разве что только при просмотре кино, и то, наличие раздач фильмов со звуковой дорожкой во flac на RuTracker какбе намекает на то, что и там уже сжатие сдаёт позиции перед lossless. Объём флеш-памяти уже в 2021-м перевалил за терабайты, и её цена с каждым годом снижается. В компьютерах вовсю используются жёсткие диски, по нескольку штук в одной машине, на 2-4 терабайта каждый. Скоростные Интернеты вполне позволяют проигрывать lossless онлайн. Так что, для бытового использования смысла сжимать lossless-аудио в lossy в 2020-е годы нет вообще, а уж с битрейтом ниже 256 kbps — и подавно. Копрорации не перешли на lossless по двум причинам: во-первых, не хотят тратить деньги на закупку дискового пространства для хранения данных, а во-вторых — ты, это ты готов слушать lossy-говно с калтакта, хуяндекс-чмузыки и чмотифая.