Какой должна быть частота дискретизации звукового файла у которого длительность звучания 2 минуты

Обновлено: 07.07.2024

Статья взята из открытых источников. Интересны ваши мнения!

К вопросу о выборе частоты дискретизации при сэмплировании аудио.

К вопросу о выборе частоты дискретизации при сэмплировании аудио. Конечно, ничего нового и неизведанного в этом нет, какой частотой дискретизации пользоваться при записи музыкальной композиции (подразумеваем, что стремимся мы что-то записать как можно качественней, а не только для информационной наполненности).

Конечно, здесь немалое значение будет иметь сама, на то компьютера способность своевременно обрабатывать входящий аудиопоток, а также свойства аудиокарты.

Но суть, наверное, не в том, «хорошо ли курить или нет», а в самом «виде вывернутых лёгких» — недолгом и наглядном исследовании формы волны, после того, когда возникла полемика насчёт того, насколько лучше качество оцифровки в 96 кГц относительно стандартных 44-х…

После этого приятель «закачал» файл формата DVD-AUDIO на мой компьютер, а я сделал экстракт в «wave» и поместил полученный файл под микроскоп, с названием «Adobe Audition»,
Но об этом чуть позже…

До визуального исследования я полагал (предвзято), что если и будет наблюдаться какое-либо улучшение восприятия подобного звучания, то совсем незначительное, ввиду того, что с увеличением частоты за гранью восприятия звука она (частота) будет почти недосягаемой для «фиксации» мозгом и одел предложенные приятелем наушники (Zennheiser PMX 100) подключенные просто к выходу “дефолтной” звуковой карты компьютера.

Так вот я слушал и слушал, и убеждался в том, что разницу ещё нужно постараться поймать и пошёл к своему компьютеру загружать принятый недавно по «локале» файл. Преобразовал исходный файл в стандарт «wav», сохранив исходные 96 кГц. Теперь сигнал был подан уже через усилитель Pioneer и такие же Zennheiser PMX 100.

…И вот тут-то почувствовал, как преобразился звук, (а ещё я любитель приподнять немного высоких и низких частот…) звук казался «аналоговым». Сразу после этого включаю конвертированный до 44 кГц тот же файл, и… четко понимаю, что это не MP3, а «wave», причём стандарта качества CD-AUDIO, и, тем не менее, контрастом стало ощущение 44 кГц относительно 96-ти. Причём напоминало звучание MP3. И это даже не через высококлассные студийные мониторы и усилители…

А вот и сами «вывернутые лёгкие», загруженные в Аудишн:

Видим чётко, что попадает к нам в уши в обоих вариантах. Сколько нюансов теряется («домысливается», «дорисовывается (кротчайший, вероятный) путь» между соседними сэмплами) и упрощается по известным алгоритмам звуковой волны, где «были» те нюансы, которых мы теперь не слышим… (я про 44..).

Ещё важный момент: не обязательно впадать в фанатизм по поводу качества исходников. Хотя, это безусловно важно, но Оцифрована должна быть прежде всего Ваша идея… я о золотой середине… во всяком случае исходники (например в работе с мультитреком) ниже 48 кГц нежелательны. Если мощность компьютера заведомо недостаточна, то и устанавивать, к примеру, 192 кГц в новой сессии, конечно же неразумно.

Наш сегодняшний пример пришёл на исследование после оцифровки виниловой грамзаписи в формат DVD-AUDIO (понятно, что звуковой картой, «что надо» и «головой» соответствующей) и переконвертированный из этого формата в формат WAV.

Ещё одно мнение на эту тему - отрывок из этой статьи:

Частота дискретизации

На сегодняшний день даже бюджетные аудио интерфейсы поддерживают частоту дискретизации 192 кГц. Но на различных музыкальных форумах по прежнему ведутся споры о том, стоит ли переходить с частоты дискретизации 44.1 кГц на 48, 88.2 или 96 кГц. Многие музыканты придерживаются комбинации 24-бит/44.1 кГц, потому как продолжают создавать музыку в основном с помощью внешних MIDI клавиатур и программных семплеров, которые работают с семплами 44.1 кГц. Так что они не видят никакого смысла в увеличении частоты дискретизации, тем более что окончательным носителем музыки все равно становится 16-бит/44.1 кГц аудио диск. Однако даже те, кто используют электронные инструменты, оценят более аккуратную компрессию и ограничение пиков на повышенной частоте дискретизации, да и эквалайзер будет работать более точно и звучать приближеннее к аналогу. Музыканты, использующие программные синтезаторы и генераторы формы волны также отметят более чистое звучание.

Для записи живой классической и любой другой акустической музыки большинство серьезных звукоинженеров используют режим 24-бит/96 кГц. В этом особенно есть смысл, если конечным носителем музыки оказывается DVD релиз с частотой дискретизации 48 или 96 кГц (в зависимости от количества каналов). Высокая частота дискретизации гарантирует Вам отличное качество записи на высоких частотах, детали звучания инструментов и пространственную локализацию (возможность различать на записи положение в пространстве каждого инструмента), чем при частоте дискретизации 44.1 кГц или 48 кГц. Также при большой частоте дискретизации высокочастотные сигналы выше 20 кГц делают звучание более натуральным. Однако помните, что качество звука определяется самым худшим звеном в цепи, так что если остальные устройства у Вас не высшего класса, то увеличение частоты дискретизации может Вам абсолютно ничего не дать.

Также стоит помнить, что при использовании частоты дискретизации, например, 192 кГц все плагины и программные синтезаторы будут потреблять в 4 раза больше ресурсов компьютера, занимать в 4 раза больше места на диске и в 4 раза уменьшать возможное время записи в отличие от использования частоты дискретизации 44.1 кГц.

разрешающая способность экрана,

Во всех подобных задачах требуется найти ту или иную величину.

Видеопамять - это специальная оперативная память, в которой формируется графическое изображение.

Объем видеопамяти рассчитывается по формуле: V=I*X*Y, где I – глубина цвета отдельной точки, X, Y – размеры экрана по горизонтали и по вертикали (произведение х на у – разрешающая способность экрана).

Экран дисплея может работать в двух основных режимах: текстовом и графическом .

В графическом режиме экран разделяется на отдельные светящиеся точки, количество которых зависит от типа дисплея, например 640 по горизонтали и 480 по вертикали. Светящиеся точки на экране обычно называют пикселями , их цвет и яркость может меняться. Графические режимы характеризуются такими показателями как:

- разрешающая способность (количество точек, с помощью которых на экране воспроизводится изображение) - типичные в настоящее время уровни разрешения 800*600 точек или 1024*768 точек.

- глубина цвета (количество бит, используемых для кодирования цвета точки), например, 8, 16, 24, 32 бита. Каждый цвет можно рассматривать как возможное состояние точки, Тогда количество цветов, отображаемых на экране монитора может быть вычислено по формуле K=2I , где K – количество цветов, I – глубина цвета или битовая глубина.

Кроме перечисленных выше знаний учащийся должен иметь представление о палитре:

- палитра (количество цветов, которые используются для воспроизведения изображения).

Виды информации и способы представления ее в компьютере.


В компьютере все виды информации кодируются на машинном языке, в виде логических последовательностей нулей и единиц.
Информация в компьютере представлена в двоичном коде, алфавит которого состоит из двух цифр (0 и 1). Каждая цифра машинного двоичного кода несет количество информации, равное 1 бит.
Например. Латинская буква А представлена в двоичном коде – 01000001.
Русская буква А представлена в двоичном коде - 10000000.
0 - 00110000
1 – 00110001

Задачи на кодирование информации:

уровень 1 - легкие (элементарные)

уровень 2 - простые

уровень 3 - средней сложности

1. Определить размер (в байтах) цифрового аудио-файла, время звучания которого составляет 10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит. Файл сжатию не подвержен. Формула для расчета размера (в байтах) цифрового аудиофайла (монофоническое звучание): (частота дискретизации в Гц)*(время записи в секундах)*(разрешение в битах)/8. 2. В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудио-файл с длительностью звучания 1 минута. Какой должна быть частота дискретизации и разрядность? 3. Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудио-файла, записанного с частотой дискретизации 22,05 кГц? 4. Определить объем памяти для хранения цифрового аудио-файла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит.
Решение:
44100*(2*60)*16=

10МБайт
Ответ:
5. Одна минута записи цифрового аудио-файла занимает на диске 1,3 Мб, разрядность звуковой платы — 8. С какой частотой дискретизации записан звук?
6. Две минуты записи цифрового аудио-файла занимают на диске 5,1 Мб. Частота дискретизации — 22050 Гц. Какова разрядность аудио-адаптера?
7. Объем свободной памяти на диске — 0,01 Гб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудио-файла, записанного с частотой дискретизации 44100 Гц?
8. Оцените информационный объем моноаудиофайла длительностью звучания 1 мин. если "глубина" кодирования и частота дискретизации звукового сигнала равны соответственно:
а) 16 бит и 8 кГц;
б) 16 бит и 24 кГц.
Решение:
а).
1) Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 8 000 = 128000 бит = 16000 байт = 15,625 Кбайт/с
2) Информационный объем звукового файла длительностью 1 минута равен:
15,625 Кбайт/с х 60 с = 937,5 Кбайт
б).
1) Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 24 000 = 384000 бит = 48000 байт = 46,875 Кбайт/с
2) Информационный объем звукового файла длительностью 1 минута равен:
46,875 Кбайт/с х 60 с =2812,5 Кбайт = 2,8 Мбайт
Ответ: а) 937,5 Кбайт; б) 2,8 Мбайт
9. Какой объем памяти требуется для хранения цифрового аудио-файла с записью звука высокого качества при условии, что время звучания составляет 3 минуты? (таблица)
10. Цифровой аудио-файл содержит запись звука низкого качества (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб? (таблица)

Временная дискретизация – процесс, при котором, во время кодирования непрерывного звукового сигнала, звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Чем больше амплитуда сигнала, тем громче звук.

Глубина звука (глубина кодирования) - количество бит на кодировку звука.

Уровни громкости (уровни сигнала) - звук может иметь различные уровни громкости. Количество различных уровней громкости рассчитываем по формуле N = 2 I где I – глубина звука.

Частота дискретизации – количество измерений уровня входного сигнала в единицу времени (за 1 сек). Чем больше частота дискретизации, тем точнее процедура двоичного кодирования. Частота измеряется в герцах (Гц). 1 измерение за 1 секунду -1 ГЦ.

1000 измерений за 1 секунду 1 кГц. Обозначим частоту дискретизации буквой D . Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.

Считается, что диапазон частот, которые слышит человек, составляет от 20 Гц до 20 кГц .

Качество двоичного кодирования – величина, которая определяется глубиной кодирования и частотой дискретизации.

Аудиоадаптер (звуковая плата) – устройство, преобразующее электрические колебания звуковой частоты в числовой двоичный код при вводе звука и обратно (из числового кода в электрические колебания) при воспроизведении звука.

Характеристики аудиоадаптера: частота дискретизации и разрядность регистра.).

Разрядность регистра - число бит в регистре аудиоадаптера. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического тока в число и обратно. Если разрядность равна I , то при измерении входного сигнала может быть получено 2 I = N различных значений.

Размер цифрового моноаудиофайла ( A ) измеряется по формуле:

A = D * T * I /8 , где D – частота дискретизации (Гц), T – время звучания или записи звука, I разрядность регистра (разрешение). По этой формуле размер измеряется в байтах.

Размер цифрового стереоаудиофайла ( A ) измеряется по формуле:

A =2* D * T * I /8 , сигнал записан для двух колонок, так как раздельно кодируются левый и правый каналы звучания.

Учащимся полезно выдать таблицу 1 , показывающую, сколько Мб будет занимать закодированная одна минута звуковой информации при разной частоте дискретизации:


3. Объём свободной памяти на диске – 2,6 Мб, глубина кодирования – 8 бит. Какова длительность звучания цифрового аудио-файла, записанного с частотой дискретизации 11 кГц. (Ответ записать в мин)

2 группа

1. Рассчитайте время звучания моноаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен 700 Кбайт.

2. Оцените информационный объем стериоаудиофайла длительностью звучания 30 сек, если глубина кодирования 8 бит и частота дискретизации звукового сигнала 8 кГц. (Ответ записать в Кбайтах)

3. Две минуты записи цифрового аудио-файла занимает на диске 2,6 Мбайт, глубина звука 16 бит. С какой частотой дискретизации записан звук. (Ответ записать в кГц)

3 группа

1. Рассчитайте частоту дискретизации звука, если известно, что объём стериоаудиофайла длительностью звучания в 5 сек. равен 470 Кбайт, глубина звука 8 бит. (Ответ записать в кГц)

2. Определите информационный объем моноаудиофайла длительностью звучания 1 мин, если глубина кодирования 16 бит и частота дискретизации звукового сигнала 48 кГц. (Ответ записать в Мбайтах)

3. Аналоговый звуковой сигнал был дискретизирован сначала с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции), а затем с использованием 65536 уровней интенсивности сигнала (качество звучания аудио-CD). Во сколько раз различаются информационные объемы оцифрованного звука?

4 группа

1. В распоряжении пользователя имеется память объёмом 2,6 Мбайта. Необходимо записать цифровой аудио-файл с длительностью звучания 1 минута. Какой должна быть частота дискретизации, если глубина кодирования 16 бит. (Ответ записать в кГц)

2. Подсчитать время звучания звукового файла объемом 3.5 Мбайт, содержащего стереозапись с частотой дискретизации 44 100 Гц, и если глубина кодирования 16 бит.

3. Чему равен объем моноаудиофайла с 10 минутной речью записанного с частотой дискретизации 11025 Гц и если глубина кодирования 4 бита. (Ответ записать в Мбайтах)

Читайте также: