Какие форматы файлов используют для хранения оцифрованного звука

Обновлено: 04.07.2024

Существуют различные понятия звукового формата.

Формат представления звуковых данных в цифровом виде зависит от способа квантования цифро-аналоговым преобразователем (ЦАП). В звукотехнике в настоящее время наиболее распространены два вида квантования : импульсно-кодовая модуляция и сигма-дельта-модуляция. Зачастую разрядность квантования и частоту дискретизации указывают для различных звуковых устройств записи и воспроизведения как формат представления цифрового звука (24 бита/192 кГц; 16 бит/48 кГц).

Формат файла определяет структуру и особенности представления звуковых данных при хранении на запоминающем устройстве ПК. Для устранения избыточности аудио данных используются аудиокодеки, при помощи которых производится сжатие аудиоданных. Выделяют три группы звуковых форматов файлов:

  • аудиоформаты без сжатия, такие как WAV, AIFF
  • аудиоформаты со сжатием без потерь (APE, FLAC)
  • аудиоформаты, с применением сжатия с потерями (mp3, ogg)

Особняком стоят модульные музыкальные форматы файлов. Созданные синтетически или из сэмплов заранее записанных живых инструментов, они, в основном, служат для создания современной элетронной музыки (MOD). Также сюда можно отнести форматMIDI, который не является звукозаписью, но при этом с помощью секвенсора позволяет записывать и воспроизводить музыку, используя определенный набор команд в текстовом виде.

Форматы носителей цифрового звука применяют как для массового распространения звуковых записей (CD, SACD), так и в профессиональной звукозаписи (DAT, минидиск).

Для систем пространственного звучания также можно выделить форматы звука, в основном являющиеся звуковым многоканальным сопровождением к кинофильмам. Такие системы имеют целые семейства форматов от двух крупных конкурирующих компаний Digital Theater Systems Inc. - DTS и Dolby Laboratories Inc. - Dolby Digital.

Также форматом называют количество каналов в системах многоканального звука (5.1; 7.1). Изначально такая система была разработана для кинотеатров, но впоследствии была расширена для систем домашнего кинотеатра.

Как всегда, начну со старческого брюзжания. Вот лет двадцать назад… Собственно говоря, двадцать лет назад и выбора-то особо не было.

реклама

Потому что были компакт-диски, которые превращались в WAV-файлы, занимавшие пространство среднего «винчестера» – ну и на ОС немножко места оставалось. И на BBS. И на игры. И на архив файлов. И все. Потому что средний размер жесткого диска тогда составлял какие-то сказочные сегодня 850 мегабайт. Да, именно что 850 – и именно мегабайт. Толчок всему дало появление формата MP3 в 1997 году, и это был очень знаменательный год!

450x101 10 KB. Big one: 900x201 26 KB

Я очень хорошо помню те времена. Тогда мы с другом «возрадовались до плеши» и принялись активно кодировать компакт-диски в самые популярные 128 кбит/с с joint stereo (это когда фактически пишется один канал, и к нему добавляется информация об отличиях второй дорожки – если они есть). Еще бы, теперь альбом занимал смешные 50-70 мегабайт, и компьютерные пластиковые колонки казались вершиной прогресса. Различные звуковые карты за 200,500 или 800 долларов в журналах казались чем-то страшным и далеким. Зачем? Ведь есть MP3 128 кбит/с, смотрите, какое крутое качество!

Шли месяцы и годы (скорее ближе к месяцам). Менялись колонки, развивался MP3, и мы тогда, юные падаваны старшего школьного и начального студенческого возраста, экспериментировали с битрейтами и появившимся тогда первым конкурентом MP3 – таинственным Vorbis OGG. Сколько часов на самой разной акустике (а мы тогда уже открыли, что даже советская «Вега» уделывала все эти пластиковые недоразумения за десять баксов) было отслушано – не сосчитать.

132x126 8 KB. Big one: 132x126 8 KB

В итоге выводы выкристаллизовались такие: OGG круче MP3 на средних битрейтах, а на высших все равны. Но преимущество OGG было в том, что на средних битрейтах файл не только лучше звучал, но и занимал меньше места. Недостатком – то, что при всех этих достоинствах OGG питался большим количеством оперативной памяти и ресурсов процессора. А в те времена мощности были, как понимаете, совсем не те.

MSI RTX 3070 сливают дешевле любой другой, это за копейки Дешевая 3070 Gigabyte Gaming - успей пока не началось

Почему я так подробно пишу об отличиях OGG от MP3? Потому что уже начался рассказ про форматы, и все эти выводы справедливы и по сей день. Ну вот, теперь вы знаете почти все про OGG: а больше знать и не надо, поскольку его сегодня поддерживают не так уже много устройств.

450x303 20 KB. Big one: 550x370 34 KB

И да, небольшой дисклеймер. Я не буду разводить воду про виды квантования и прочие страшные слова: если вам это интересно, то все прекрасно написано в Википедии. И форматов файлов на самом деле намного больше, чем будет перечислено далее. Вопрос в том, что они не только никому неизвестны, но и никем не поддерживаются. Почти.

И еще. Я не буду рассказывать о форматах многоканального звука. На сегодняшний день эта тема все еще в зачатке по причине своей дороговизны. И дисков выпускается мало, и также редко они перекодируются в звук. На коне по-прежнему старое доброе стерео. Очевидно, всем этого хватает. Ну или почти всем, но кто считает?

реклама

Сжатие с потерями и без

Для начала нужно определиться с тем, о чем мы будем говорить. Главное и основное: все форматы звуковых файлов сегодня делятся на:

  • Форматы без сжатия (WAV, AIFF);
  • Со сжатием без потерь – lossless в простонародье (FLAC, APE);
  • Со сжатием с потерями – он же lossy (MP3, OGG).

Все, это была минутка Википедии.

И да, я раскрою вам правду на то, стоит ли тратить терабайты на lossless.

MP3: скорее отстреляться

Конечно, начать надо с MP3. И, перефразируя название фильма, – «и это все об MP3». Безусловно, все вы про него знаете, и быть Капитаном Очевидность здесь не вижу смысла. Все, что воспроизводит звук сегодня, поддерживает MP3, вплоть до максимума.

450x170 29 KB. Big one: 950x358 109 KB

В чем его главные нарекания и минусы? В основном – в срезе верхних частот и «прореживании» всех остальных.

В этом и проявляется хваленая гибкость формата: можно сделать маленький файл и слушать покромсанную Верку Сердючку из динамика смартфона. А можно сделать большой файл, где сжатие с минимальными потерями и слушать… не на динамике смартфона как минимум.

450x173 39 KB. Big one: 1000x385 121 KB

У MP3 есть один, самый весомый и безусловный плюс, не считая хорошего качества звука и гибкости при кодировании – можно забить на качество и сделать тысячи MP3 128 кбит/с на одной флэшке. Или не забить на качество и сделать несколько сотен в 320 кбит/с.

Но плюс в том, что у него нет DRM и прочих видов защит от копирования, которые редиски-владельцы авторских прав могут ставить на свою музыку.

450x173 45 KB. Big one: 1000x385 156 KB

Отдельного абзаца заслуживает VBR. VBR – это сокращение от Variable BitRate, переменный битрейт. Основная идея VBR – то, что кодек автоматически выбирает нужный битрейт в зависимости от контента. Это происходит еще на этапе кодирования, и главное декларируемое преимущество технологии – меньший размер файла при вроде бы том же высоком качестве (разумеется, кодирование происходит все-таки «вокруг» заданной частоты).

В реальности же качество VBR заметно проигрывает своему оппоненту CBR (Constant BitRate – постоянный битрейт), плюс ко всему заметно нагружает процессор. Конечно, на современных многоядерных ЦП это не так что бы заметно, но – «как-то, доктор, неаккуратненько». В общем, смысл тут прост: VBR лучше не пользоваться, поскольку выигрыш в размерах минимален, microSD сегодня дешевы, HDD тоже не состояние стоят, а проблем от них больше. И, опять же, качество хромает.

Чем сегодня кодируют MP3? На заре формата было очень много разных декодеров, сегодня их тоже можно найти, если постараться, кто-то постоянно тоже изобретает велосипед, но безусловный авторитет уже долгие годы – LAME. Несмотря на стебный перевод названия (вольно – «хромуля»), кодек справляется со своей задачей блестяще.

Какой программой пользоваться для кодирования – тоже понятно, общепринятым авторитетом является грозный EAC (Exact Audio Copy, и он точно соответствует своему названию). И то, и другое распространяется совершенно бесплатно (более того – LAME в принципе встроен почти во все по умолчанию), так что можете попробовать свои силы в кодировании того, что и так уже сто раз кодировано.

реклама

450x394 45 KB. Big one: 505x442 53 KB

WMA: все плохо, как всегда

Компания Microsoft разработала WMA как альтернативу MP3. Но, как и в случае с платформой Windows Phone, люди посмотрели на него, потыкали пальцем – и забросили на полку.

Потому как файл WMA изобилует мелкими неприятностями, которые сами по себе вроде бы и не так страшны (например, плохая устойчивость к ошибкам: чуть поврежденный файл про кодировании или передаче становится непригодным полностью), но в совокупности WMA становится несерьезным. К тому же, опять же декларировалось, что при меньшем битрейте WMA будет качественным. Серьезно?

Конечно, WMA сегодня поддерживает все, что поддерживает MP3. Конечно, декларируется, что поддерживается lossless-кодирование, начиная с версии 9.1. Ну поддерживается. А дальше-то что? Кто-то этим пользуется?

450x247 41 KB. Big one: 1440x789 254 KB

реклама

Плюс ко всему – в WMA можно зашивать DRM-защиту. От такого фактора потирают жадные лапки правообладатели, но говорят «фи» рядовые пользователи. Еще один гвоздь в крышку гроба WMA.

В общем, формат мутный и явно нежизнеспособный. Как и платформа Windows Phone. Как и Surface. У Microsoft хорошо получалось делать операционные системы, но вот сторонние проекты – слабовато.

Из истории. Говорят, что самые первые опыты по сохранению звука проводили еще древние греки. Они пытались сохранить звук в амфорах. Выглядело это примерно так: в амфору произносили слова и быстро её закупоривали. Увы, не одной такой записи не дошло до наших дней.

В двух словах объясню, откуда берется звук в цифровом формате. В процессе звукозаписи микрофон преобразует механические колебания (собственно звук) в аналоговый электрический сигнал. Аналоговый сигнал в самом общем случае похож на синусоиду, которая всем нам знакома со времен средней школы. В эру аналогового звука именно этот сигнал записывался на различные носители и затем воспроизводился.

С развитием микропроцессорной техники появилась возможность записывать и хранить аудиоинформацию в цифровых форматах. Получают эти форматы с помощью процесса аналого-цифрового преобразования (АЦП).

В ходе АЦП аналоговый сигнал (нашу синусоиду из средней школы) преобразуют в дискретный (проще говоря, разрезают на части). На следующем этапе дискретный сигнал квантуют, т.е. каждому получившемуся отрезку синусоиды сопоставляют цифровое значение. На третьем этапе квантованный сигнал оцифровывают, т.е. кодируют в виде последовательности 0 и 1. Применительно к цифровой звукозаписи оцифровке подвергаются сведения об амплитуде и частоте звука.

На сегодняшний день, для записи и хранения цифровой аудиоинформации, применяют цифровые аудиоформаты. Под аудиоформатом понимают набор требований к представлению звуковых данных в цифровом виде.

При рассуждении о качестве звучания цифровые форматы делят на 3 категории:

  • Форматы без дополнительного сжатия (CDDA, DSD, WAV, AIFF и др.);
  • Форматы, сжатые без потери качества (FLAC, WavPack, ADX и др.);
  • Форматы, в которых применено сжатие с потерями (MP3, AAC, RealAudio и др.).

Звук высокого качества получается при воспроизведении музыки, сохраненной в форматах из первой и второй категорий. В форматах третьей категории, для уменьшения объема данных, намеренно исключают часть информации. Например, информацию о скрытых частотах.

Скрытыми называют частоты, лежащие за пределами диапазона восприятия среднестатистического человека: 20 Гц – 22 кГц. Для аудиофилов этот диапазон в силу индивидуальных психофизиологических особенностей бывает шире.

Для комплектации домашней аудиотеки следует выбирать записи, сохраненные в файлах с расширениями:

Последняя пятилетка дала большой толчок в развитие портативных и стационарных аудио систем, а с этим и поддержку разнообразных цифровых аудио форматов. Крошечные карманные гаджеты обзавелись огромной внутренней памятью, а стационарная аудио техника стала еще умнее и переборчивее. Именно по этому, теперь, мы можем не экономить место на плеере и загружать песни «весом» в 15-30 Мб каждая, а дома, слушать цифровую музыку в качестве, равном по звучанию аналогового винила.

Описание популярных цифровых аудио форматов

И тем не менее, аудио форматы, получившие наибольшее распространение, все еще имеют свои плюсы и минусы, и даже в таком актуальном вопросе, как цифровое аудио, еще не найдена «панацея». Классически цифровые аудио форматы делятся на «сжатый» и «несжатый» поток, а так же форматы типа «lossless», которые исключают потерю звучания.

Описание цифровых аудио форматов
Описание цифровых аудио форматов

Аудио формат wav

Waveform Audio File Format (WAVE, WAV, от англ. waveform - «в форме волны») - это формат файлов для хранения записи оцифрованного несжатого аудиопотока. По большому счету, это наиболее распространенный формат для работы в студийной сфере и радиовещании, т.к. позволяет получить самое честное качество звучания.
К примеру, стандартным форматом Audio-CD, является аудиопоток в формате LPCM, с параметрами: 2 канала (стерео), 44 100 Гц, 16 Бит.

Аудио формат mp3

MPEG-1/2 Audio Layer 3 - (MP3) – наиболее популярный цифоровой формат, для хранения сжатого аудио. В формате MP3 используется особый алгоритм, разработанный для значительного уменьшения размера исходного файла. Этот формат позволяет сохранить аудио, близкое к оригинальному звучанию, но благодаря множеству настроек, предельно малых размеров.
В сравнении со стандартным форматом Audio-CD, файл в фомате MP3 и битрейте 128кбит/с, по размеру будет примерно равен 1/11 исходного файла.

Аудио формат flac

FLAC (англ. Free Lossless Audio Codec) — популярный свободный кодек, предназначенный для сжатия аудиоданных без потерь. Что это значит? В отличие от аудиокодеков, обеспечивающих сжатие с потерями, например MP3 или OGG, аудиокодек FLAC не удаляет никакой информации из аудиопотока. Этот формат идеально подходит для аудиофилов, которые собирают собственные музыкальные коллекции и прослушивают музыку на высококачественной аппаратуре.

Аудио формат ogg

OGG – формат, который не получил массовую популярность, но тем не менее, используется достаточно большой аудиторией. Формат OGG, аналогично MP3, сжимает аудио с потерями качества, но принципиально отличается в практических пересчетах конвертации. Это дало возможность получить лучшее качество, при меньшем объеме файла и вывести данный кодек, как абсолютно независимый. Также как и подобные форматы, конвертирующие аудио с потерями, OGG имеет возможность тонкой настройки свойств контейнера.

Аудио формат aiff

Audio Interchange File Format (AIFF) – достаточно универсальный формат аудиофайлов, разработанный компание Apple, применяемый для хранения звуковых данных. Как и его аналог, формат WAV, это несжатое аудио и широко применяется в профессиональной сфере звукозаписи и музыкального продьюсинга.
Файлы с расширением .aiff и .aif, созданные Apple Loops, используются для музыкальных редакторов GarageBand и Logic Audio.

Аудио формат m4a

Apple Losseles (также известный как Apple Lossless Encoder, ALE, или Apple Lossless Audio Codec, ALAC) (m4a) – еще одна разработка от компании Apple. Этот аудиоформат относится к несжатому аудио, обеспечивающему проигрывание без потери качества. Это достаточно специфический формат, который поддерживается преимущественно продукцией от компании-создателя, и в некоторых случаях, как в системных звуках iPhone, где возможно использование исключительно формата m4a.

Читайте также: