Как связаны частота дискретизации с потерей информации и объемом файла

Обновлено: 07.07.2024

Проверяемые элементы содержания: Умение определять объём памяти, необходимый для хранения графической и звуковой информации

Типичные ошибки и рекомендации по их предотвращению:

"Если вычисления получаются слишком громоздкими, значит, Вы неправильно решаете задачу. Удобно выделить во всех множителях степени двойки, тогда умножение сведётся к сложению
показателей степеней, а деление – к вычитанию"

ФГБНУ "Федеральный институт педагогических измерений"

Кодирование текстовой информации

Кодирование графической информации

Рассмотрим некоторые понятия и формулы, необходимые для решения ЕГЭ по информатике данной темы.

  • Пиксель – это наименьший элемент растрового изображения, который имеет определенный цвет.
  • Разрешение – это количество пикселей на дюйм размера изображения.
  • Глубина цвета — это количество битов, необходимое для кодирования цвета пикселя.
  • Если глубина кодирования составляет i битов на пиксель, код каждого пикселя выбирается из 2 i возможных вариантов, поэтому можно использовать не более 2 i различных цветов.

Формула для нахождения количества цветов в используемой палитре: Найдем формулу объема памяти для хранения растрового изображения:

Или можно формулу записать так:

* для указания объема выделенной памяти встречаются разные обозначения (V или I).

1 Мбайт = 2 20 байт = 2 23 бит,
1 Кбайт = 2 10 байт = 2 13 бит

Кодирование звуковой информации

Познакомимся с понятиями и формулами, необходимыми для решения заданий 7 ЕГЭ по информатике.

    Оцифровка или дискретизация – это преобразование аналогового сигнала в цифровой код.

Дискретизация

Дискретизация, объяснение задания 7 ЕГЭ

Разрядность кодирования

I = 8000*16*128 = 16384000 бит
I = 8000*16*128/8 = 2 3 * 1000 * 2 4 * 2 7 / 2 3 = 2 14 / 2 3 =2 11 =
= 2048000 байт

Определение скорости передачи информации

  • Канал связи всегда имеет ограниченную пропускную способность (скорость передачи информации), которая зависит от свойств аппаратуры и самой линии связи(кабеля)
Объем переданной информации I вычисляется по формуле:

и измеряется в бит/с

Решение заданий 7 ЕГЭ по информатике


Плейлист видеоразборов задания на YouTube:
Задание демонстрационного варианта 2022 года ФИПИ

Тема: Кодирование изображений

7_1: ЕГЭ по информатике 2017 задание 7 (9) ФИПИ вариант 1 (Крылов С.С., Чуркина Т.Е.):

Какой минимальный объем памяти (в Кбайт) нужно зарезервировать, чтобы можно было сохранить любое растровое изображение размером 160 х 160 пикселей при условии, что в изображении могут использоваться 256 различных цветов? В ответе запишите только целое число, единицу измерения писать не нужно.

Результат: 25

Детальный разбор задания 7 ЕГЭ по информатике предлагаем посмотреть в видео:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 7.2 (источник: вариант 11, К. Поляков):

Рисунок размером 128 на 256 пикселей занимает в памяти 24 Кбайт (без учёта сжатия). Найдите максимально возможное количество цветов в палитре изображения.

i = I / (M*N)

Результат: 64

Смотрите видеоразбор задания:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 7.3 (источник: 9.1 вариант 24, К. Поляков):

После преобразования растрового 256-цветного графического файла в 4-цветный формат его размер уменьшился на 18 Кбайт. Каков был размер исходного файла в Кбайтах?

Результат: 24

Подробный разбор 7 задания ЕГЭ смотрите на видео:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 7.4 (источник: 9.1 вариант 28, К. Поляков, С. Логинова):

Цветное изображение было оцифровано и сохранено в виде файла без использования сжатия данных. Размер полученного файла – 42 Мбайт. Затем то же изображение было оцифровано повторно с разрешением в 2 раза меньше и глубиной кодирования цвета увеличили в 4 раза больше по сравнению с первоначальными параметрами. Сжатие данных не производилось. Укажите размер файла в Мбайт, полученного при повторной оцифровке.

Результат: 42

Тема: Кодирование изображений:

ЕГЭ по информатике задание 7.5 (источник: 9.1 вариант 30, К. Поляков, С. Логинова):

Изображение было оцифровано и сохранено в виде растрового файла. Получившийся файл был передан в город А по каналу связи за 72 секунды. Затем то же изображение было оцифровано повторно с разрешением в 2 раза больше и глубиной кодирования цвета в 3 раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б, пропускная способность канала связи с городом Б в 3 раза выше, чем канала связи с городом А.
Сколько секунд длилась передача файла в город Б?

Результат: 32

Другой способ решения смотрите в видеоуроке:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 7.6 (источник: вариант 33, К. Поляков):

Камера делает фотоснимки размером 1024 х 768 пикселей. На хранение одного кадра отводится 900 Кбайт.
Найдите максимально возможное количество цветов в палитре изображения.

  • Количество цветов зависит от глубины кодирования цвета, которая измеряется в битах. Для хранения кадра, т.е. общего количества пикселей выделено 900 Кбайт. Переведем в биты:
  • Посчитаем общее количество пикселей (из заданного размера):
  • Определим объем памяти, необходимый для хранения не общего количества пикселей, а одного пикселя ([память для кадра]/[кол-во пикселей]):

Результат: 512

Смотрите подробное решение на видео:

Тема: Кодирование изображений:

7_8: Демоверсия ЕГЭ 2018 информатика:

Автоматическая фотокамера производит растровые изображения размером 640×480 пикселей. При этом объём файла с изображением не может превышать 320 Кбайт, упаковка данных не производится.
Какое максимальное количество цветов можно использовать в палитре?

Результат: 256

Подробное решение данного 7 (9) задания из демоверсии ЕГЭ 2018 года смотрите на видео:

7_21: : ЕГЭ по информатике задание 7.21 (источник: К. Поляков, 9.1 вариант 58):

Для хранения в информационной системе документы сканируются с разрешением 300 ppi. Методы сжатия изображений не используются. Средний размер отсканированного документа составляет 5 Мбайт. В целях экономии было решено перейти на разрешение 150 ppi и цветовую систему, содержащую 16 цветов. Средний размер документа, отсканированного с изменёнными параметрами, составляет 512 Кбайт.

Определите количество цветов в палитре до оптимизации.

Результат: 1024

Тема: Кодирование звука

7_7: ЕГЭ по информатике 2017 задание 7 (9) ФИПИ вариант 15 (Крылов С.С., Чуркина Т.Е.):

На студии при четырехканальной (квадро) звукозаписи с 32-битным разрешением за 30 секунд был записан звуковой файл. Сжатие данных не производилось. Известно, что размер файла оказался 7500 Кбайт.

С какой частотой дискретизации (в кГц) велась запись? В качестве ответа укажите только число, единицы измерения указывать не нужно.

Результат: 16

Для более детального разбора предлагаем посмотреть видео решения данного 7 задания ЕГЭ по информатике:

Тема: Кодирование звука:

ЕГЭ по информатике задание 7_9 (источник: 9.2 вариант 36, К. Поляков):

Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 2 раза выше и частотой дискретизации в 3 раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд; пропускная способность канала связи с городом Б в 4 раза выше, чем канала связи с городом А.

Сколько секунд длилась передача файла в город A? В ответе запишите только целое число, единицу измерения писать не нужно.

  • Для решения понадобится формула нахождения скорости передачи данных формулы:

где:
I — объем
β — глубина кодирования
ƒ — частота дискретизации
t — время
S — кол-во каналов (если не указывается, то моно)

\[ t_А = \frac * 3 * 4 \]

Результат: 90

Подробное решение смотрите на видео:

Тема: Кодирование звука:

ЕГЭ по информатике задание 7.10 (источник: 9.2 вариант 43, К. Поляков):

Музыкальный фрагмент был записан в формате стерео (двухканальная запись), оцифрован и сохранён в виде файла без использования сжатия данных. Размер полученного файла – 30 Мбайт. Затем тот же музыкальный фрагмент был записан повторно в формате моно и оцифрован с разрешением в 2 раза выше и частотой дискретизации в 1,5 раза меньше, чем в первый раз. Сжатие данных не производилось.

Укажите размер файла в Мбайт, полученного при повторной записи. В ответе запишите только целое число, единицу измерения писать не нужно.

I — объем
β — глубина кодирования
ƒ — частота дискретизации
t — время
S -количество каналов

Результат: 20

Смотрите видеоразбор данной задачи:

Тема: Кодирование звуковых файлов:

ЕГЭ по информатике задание 7_11 (источник: 9.2 вариант 72, К. Поляков):

Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи за 100 секунд. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 3 раза выше и частотой дискретизации в 4 раз меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд.

Во сколько раз скорость (пропускная способность канала) в город Б больше пропускной способности канала в город А?

I — объем
β — глубина кодирования
ƒ — частота дискретизации
t — время

Ответ: 5

Результат: 5

Подробный видеоразбор задания:

Тема: Кодирование звука:

ЕГЭ по информатике задание 7_12 (источник: 9.2 вариант 80, К. Поляков):

Производится четырёхканальная (квадро) звукозапись с частотой дискретизации 32 кГц и 32-битным разрешением. Запись длится 2 минуты, её результаты записываются в файл, сжатие данных не производится.

Определите приблизительно размер полученного файла (в Мбайт). В качестве ответа укажите ближайшее к размеру файла целое число, кратное 10.

I — объем
β — глубина кодирования
ƒ — частота дискретизации
t — время
S — количество каналов

Результат: 60

Смотрите подробное решение:

Тема: Кодирование звука:

7_19: Государственный выпускной экзамен ГВЭ 2018 (информатика ГВЭ ФИПИ, задание 7):

Производится двухканальная (стерео) цифровая звукозапись. Значение сигнала фиксируется 48 000 раз в секунду, для записи каждого значения используется 32 бит. Запись длится 5 минут, её результаты записываются в файл, сжатие данных не производится.

Какая из приведённых ниже величин наиболее близка к размеру полученного файла?

1) 14 Мбайт
2) 28 Мбайт
3) 55 Мбайт
4) 110 Мбайт

Результат: 4

Подробное решение ГВЭ задания 7 2018 года смотрите на видео:

Тема: Кодирование звука:

7_20: Решение 7 задания ЕГЭ по информатике (диагностический вариант экзаменационной работы 2018 года, С.С. Крылов, Д.М. Ушаков):

Производится двухканальная (стерео) звукозапись с частотой дискретизации 4 кГц и 64-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится.

Определите приблизительно размер получившегося файла (в Мбайтах). В качестве ответа укажите ближайшее к размеру файла целое число, кратное 2.

Результат: 4

Тема: Кодирование видео

7_22: : ЕГЭ по информатике задание 7.22 (источник: К. Поляков, 9.1 вариант 47):

Камера снимает видео без звука с частотой 120 кадров в секунду, при этом изображения используют палитру, содержащую 2 24 = 16 777 216 цветов. При записи файла на сервер полученное видео преобразуют так, что частота кадров уменьшается до 20, а изображения преобразуют в формат, использующий палитру из 256 цветов. Другие преобразования и иные методы сжатия не используются. 10 секунд преобразованного видео в среднем занимают 512 Кбайт.

Сколько Мбайт в среднем занимает 1 минута исходного видео?

  • Посмотрим, как изменялись параметры файла до преобразования и после:
  • Поскольку после преобразования количество кадров в секунду уменьшилось в 6 раз (120 / 20 = 6), а количество бит на пиксель уменьшилось в 3 раза (24 / 8 = 3), то и объем уменьшился в целом в 18 раз (6 * 3 = 18).
  • Вычислим объем файла, передаваемого за 10 секунд, до его преобразования:
  • Чтобы получить объем, переданный за 1 минуту, необходимо полученное значение умножить на 6:

Результат: 54

Тема: Скорость передачи данных

ЕГЭ по информатике задание 7_13 (источник: 9.V вариант 5, К. Поляков):

Скорость передачи данных через ADSL-соединение равна 128000 бит/с. Передача текстового файла через это соединение заняла 1 минуту.

Определите, сколько символов содержал переданный текст, если известно, что он был представлен в 16-битной кодировке Unicode.

Нажмите, чтобы узнать подробности

Презентация к уроку "Кодирование звуковой информации". Раскрываются такие понятия как: оцифровка звука; интервал и частота дисретизации; разрядность кодирования.

Просмотр содержимого документа
«Кодирование звуковой информации»

Кодирование звуковой информации

Кодирование звуковой информации

Аналоговый сигнал – это произвольное изменение некоторой величины в заданном диапазоне.

В любой момент времени сигнал на выходе микрофона (ток или напряжение) может принимать любое значение в некотором интервале.

Оцифровка звука Число T называется интервалом дискретизации , а обратная ему величина 1/ T – частотой дискретизации . Частота дискретизации обозначается буквой f и измеряется в герцах (Гц) и килогерцах (кГц). Один герц – это 1 раз в секунду, а 1 кГц – 1000 раз в секунду. Чем больше частота дискретизации, тем точнее мы записываем сигнал, тем меньше информации теряем. Однако при этом возрастает количество отсчетов, то есть информационный объем закодированного звука. Оцифровка – это преобразование аналогового сигнала в цифровой код.

Число T называется интервалом дискретизации , а обратная ему величина 1/ Tчастотой дискретизации . Частота дискретизации обозначается буквой f и измеряется в герцах (Гц) и килогерцах (кГц). Один герц – это 1 раз в секунду, а 1 кГц – 1000 раз в секунду. Чем больше частота дискретизации, тем точнее мы записываем сигнал, тем меньше информации теряем. Однако при этом возрастает количество отсчетов, то есть информационный объем закодированного звука.

Оцифровка – это преобразование аналогового сигнала в цифровой код.

Для кодирования звука в компьютерах чаще всего используются следующие частоты дискретизации: 8 кГц (плохое качество, но достаточно для распознавания речи); 11 кГц, 22 кГц, 44,1 кГц (звуковые компакт-диски); 48 кГц (фильмы в формате DVD) ; также 96 кГц и 192 кГц (высококачественный звук в формате DVD‐audio). Выбранная частота влияет на качество цифрового звука.

Для кодирования звука в компьютерах чаще всего используются следующие частоты дискретизации:

  • 8 кГц (плохое качество, но достаточно для распознавания речи);
  • 11 кГц, 22 кГц, 44,1 кГц (звуковые компакт-диски);
  • 48 кГц (фильмы в формате DVD) ;
  • также 96 кГц и 192 кГц (высококачественный звук в формате DVD‐audio).

Выбранная частота влияет на качество цифрового звука.

Представим себе, что на один отсчет выделяется 3 бита. При этом код каждого отсчета – это целое число от 0 до 7. Весь диапазон возможных значений сигнала, от 0 до максимально допустимого, делится на 8 полос, каждой из которых присваивается номер (код). Все отсчеты, попавшие в одну полосу, имеют одинаковый код

Представим себе, что на один отсчет выделяется 3 бита. При этом код каждого отсчета – это целое число от 0 до 7. Весь диапазон возможных значений сигнала, от 0 до максимально допустимого, делится на 8 полос, каждой из которых присваивается номер (код). Все отсчеты, попавшие в одну полосу, имеют одинаковый код

Преобразование измеренного значения сигнала в число называется дискретизацией по уровню. Эту операцию выполняет аналого-ифровой преобразователь (АЦП) звуковой карты. Разрядность кодирования - это число бит, используемое для хранения одного отсчета. Недорогие звуковые карты имеют разрядность 16-18 бит, большинство современных - 24 бита, что позволяет использовать 2 24 = 16 777 216 различных уровней. Объем информации, полученный после оцифровки звука, зависит от разрядности и частоты дискретизации. Например, если используется 16-разрядное кодирование с частотой 44 кГц , за 1 с выполняется 44000 измерений сигнала, и каждое из измеренных значений занимает 16 бит (2 байта). Поэтому за 1 секунду накапливается 44000 х 2 = 88000 байт информации, а за 1 минуту 88000 х 60 = 5 280 000 байт = 5 Мбайт . Если записывается стерео звук (левый и правый каналы), это число нужно удвоить . С помощью оцифровки можно закодировать любой звук, который принимает микрофон. В частности, это единственный способ кодирования человеческого голоса и различных природных звуков (шум прибоя и т.п.).

Преобразование измеренного значения сигнала в число называется дискретизацией по уровню. Эту операцию выполняет аналого-ифровой преобразователь (АЦП) звуковой карты.

Разрядность кодирования - это число бит, используемое для хранения одного отсчета.

Недорогие звуковые карты имеют разрядность 16-18 бит, большинство современных - 24 бита, что позволяет использовать 2 24 = 16 777 216 различных уровней.

Объем информации, полученный после оцифровки звука, зависит от разрядности и частоты дискретизации. Например, если используется 16-разрядное кодирование с частотой 44 кГц , за 1 с выполняется 44000 измерений сигнала, и каждое из измеренных значений занимает 16 бит (2 байта). Поэтому за 1 секунду накапливается 44000 х 2 = 88000 байт информации, а за 1 минуту

88000 х 60 = 5 280 000 байт = 5 Мбайт . Если записывается стерео звук (левый и правый каналы), это число нужно удвоить .

С помощью оцифровки можно закодировать любой звук, который принимает микрофон. В частности, это единственный способ кодирования человеческого голоса и различных природных звуков (шум прибоя и т.п.).

Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1.1).

Рис. 1.1. Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).

Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 10 14 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица "децибел" (дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Таблица 5.1. Громкость звука

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек" (рис. 1.2).

Рис. 1.2. Временная дискретизация звука

Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую диалогового сигнала.

Частота дискретизации звука - это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 I . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2 I = 2 16 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

Звуковые редакторы. Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3.

При сохранении звука в форматах со сжатием отбрасываются "избыточные" для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).

Контрольные вопросы

1. Как частота дискретизации и глубина кодирования влияют на качество цифрового звука?

Задания для самостоятельного выполнения

1. Задание с выборочным ответом. Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из 65 536 возможных уровней интенсивности сигнала?

1) 16 битов; 2) 256 битов; 3) 1 бит; 4) 8 битов.

2. Задание с развернутым ответом. Оценить информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука:

а) моно, 8 битов, 8000 измерений в секунду;

б) стерео, 16 битов, 48 000 измерений в секунду.

3. Задание с развернутым ответом. Определить длительность звукового файла, который уместится на дискете 3,5" (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байтов каждый):

а) при низком качестве звука: моно, 8 битов, 8000 измерений в секунду;

б) при высоком качестве звука: стерео, 16 битов, 48 000 измерений в секунду.


В данный момент вы не можете посмотреть или раздать видеоурок ученикам

Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобрев в каталоге.

Получите невероятные возможности



2. Раздавайте видеоуроки в личные кабинеты ученикам.


3. Смотрите статистику просмотра видеоуроков учениками.

Конспект урока "Представление звука в компьютере"

· оцифровка вводимого звукового сигнала;

· качество цифрового звука;

· виды кодирования звуковых файлов.

С начала 90-ых годов персональные компьютеры получили возможность работать со звуковой информацией.


Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.


С помощью специальных программных средств (редакторов звукозаписей) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и, в результате, появляется возможность управления компьютером при помощи голоса.


А как же представляется звук в компьютере?

Вообще звук – это процесс колебания воздуха или любой другой среды, в которой он распространяется. Звук характеризуется амплитудой (силой) и частотой (количеством колебаний в секунду).

Под звукозаписью понимают процесс сохранения звуковой информации на каком-либо носителе с помощью специальных устройств.

Ввод звука в компьютер производится с помощью звукового устройства, микрофона или радио, выход которого подключается к порту звуковой карты.


Рассмотрим подробнее процесс ввода звука в компьютер.

Звуковые сигналы непрерывны. С помощью микрофона звуковой сигнал превращается в непрерывный электрический сигнал. Но, как вы помните компьютер может работать только с цифровой информацией, поэтому если нам нужно обработать звук на компьютере, то его необходимо дискретизировать – то есть превратить в прерывистую, состоящую из отдельных частей, последовательность нулей и единиц.

Процессом преобразования звука из непрерывной формы в дискретную при записи и из дискретной в непрерывную при воспроизведении занимается звуковая карта или аудио адаптер.


Звуковая карта – это устройство для записи и воспроизведения звука на компьютере. То есть задача звуковой карты — с определённой частотой производить измерения уровня звукового сигнала и результаты измерения записывать в память компьютера. Этот процесс называют оцифровкой звука.

Промежуток времени между двумя измерениями называется периодом измерений — обозначается буквой Т и измеряется в секундах.

Таким образом на качество преобразования звука влияет несколько условий:

• Частота дискретизации, то есть сколько раз в секунду будет измерен исходный сигнал.

• Разрядность дискретизации – количество битов, выделяемых для записи каждого результата измерений.


Результаты таких измерений представляются целыми положительными числами с конечным количеством разрядов. Как мы уже говорили, в таком случае получается дискретное конечное множество значений в ограниченном диапазоне.

Размер этого диапазона зависит от разрядности ячейки — регистра памяти звуковой карты.


То есть обратите внимание, снова работает главная формула информатики:


здесь i — это разрядность регистра. Также число i называют разрядностью дискретизации. Записанные данные сохраняются в файлах специальных звуковых форматов.

Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации ровна 22050 Герц. Нужно найти разрядность аудиоадаптера.


При воспроизведении звукового файла цифровые данные преобразуются в электрический аналог звука. К звуковой карте подключаются наушники или звуковые колонки. С их помощью электрические колебания преобразуются в механические звуковые волны, которые воспринимают наши уши.

Таким образом, чем больше разрядность и частота дискретизации, тем точнее представляется звук в цифровой форме и тем больше размер файла, хранящего его.

Рассмотрим такой пример: Нужно определить качество звука (то есть какое это качество радиотрансляции или качество аудио-CD) если известно, что объём моноаудиофайла длительностью звучания в 10 секунд равен 940 Кб. Разрядность аудиоадаптера ровна 16 бит.


Рассмотрим ещё один пример. Аналоговый звуковой сигнал был дискретизирован сначала с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции), а затем с использованием 65536 уровней интенсивности сигнала (качество звучания аудио-CD). Нужно найти во сколько раз различаются информационные объёмы оцифрованного звука?


Для работы со звуковой информацией на компьютере используются различные программы. Одни из них позволяют записать звук на цифровой носитель, другие — воспроизвести. Существуют программы, которые выполняют более сложную обработку звука. Такие программы называются редакторы звука. Например, можно вырезать фрагмент музыкального произведения или речи, объединить фрагменты, изменить тембр звучания, длительность воспроизведения создавать различные музыкальные эффекты, очищать звук от шумов, согласовывать с изображениями для создания мультимедийных продуктов и так далее.

При хранении оцифрованного звука приходится решать проблему уменьшения объёма звуковых файлов. Существует два способа кодирования звука: кодирования данных без потерь, позволяющего осуществлять стопроцентное восстановление данных из сжатого потока. А также кодирование данных с потерями. Позволяет добиться схожести звучания восстановленного сигнала с оригиналом при максимальном сжатии данных. Здесь используются различные алгоритмы, сжимающие оригинальный сигнал путём выкидывания из него слабо слышимых элементов.

Существует множество различных аудио форматов. Наиболее часто используются такие форматы как WAV и MP3. Тип формата обычно определяется расширением файла (то, что идёт после точки в имени файла mp3, wav, ogg, wma)

WAV – один из первых аудио-форматов. Обычно используется для хранения несжатых аудиозаписей, идентичных по качеству звука записям на компакт-дисках. В среднем одна минута звука в формате wav занимает около 10 Мб.


MP3 – наиболее распространённый в мире звуковой формат. MP3, как и многие другие форматы кодирует звук с потерей качества, то есть урезает звук, который не слышится человеческим ухом, тем самым уменьшая размер файла.


На текущий момент mp3 не является лучшим форматом по соотношению размера файла к качеству звучания, но в силу своей распространённости и поддерживаемости большинством устройств, многие хранят свои записи именно в нём.


Звуковая карта – это устройство для записи и воспроизведения звука на компьютере. Задача звуковой карты — с определённой частотой производить измерения уровня звукового сигнала и результаты измерения записывать в память компьютера. Этот процесс называют оцифровкой звука.

Качество оцифрованного звука зависит от:

• Частоты дискретизации, то есть сколько раз в секунду будет измерен исходный сигнал.

• и Разрядности дискретизации – то есть от количества битов, выделяемых для записи каждого результата измерений.

Существует два способа кодирования звука:

• кодирования данных без потерь, здесь осуществляется стопроцентное восстановление данных из сжатого потока;

• кодирование данных с потерями. Это способ позволяет добиться схожести звучания восстановленного сигнала с оригиналом при максимальном сжатии данных.

Как люди, непосредственно связанные с AV сферой, мы постоянно говорим об аудио-кодировании и аудиокодеках, а что же это такое? Аудиокодек – это, по сути, устройство или алгоритм, способный кодировать и декодировать цифровой аудиосигнал.


На практике аудиоволны, которые передаются по воздуху, являются продолжительными аналоговыми сигналами. Сигналы преобразуются в цифровой формат устройством, которое называется аналого-цифровой преобразователь (АЦП), а устройство обратного преобразования – цифро-аналоговый преобразователь (ЦАП). Кодек находится между этими двумя функциями и именно он позволяет откорректировать некоторые важные параметры для успешного захвата, записи и трансляции звукового сигнала: алгоритм кодека, частота дискретизации, разрядность и скорость передачи данных.

Три наиболее популярных аудиокодека: Pulse-Code Modulation ( PCM), MP3 и Advanced Audio Coding ( AAC ). Выбор кодека определяет степень сжатия и качество записи. PCM – кодек, который используется компьютерами, CD-дисками, цифровыми телефонами и иногда SACD-дисками. Источник сигнала для PCM сэмплируется через равные интервалы, и каждый сэмпл представляет собой амплитуду аналогового сигнала в цифровом значении. PCM – это наиболее простой вариант для оцифровки аналогового сигнала.

При наличии правильных параметров этот оцифрованный сигнал может быть полностью реконструирован обратно в аналоговый без каких-либо потерь. Но этот кодек, обеспечивающий практически полную идентичность оригинальному аудио, к сожалению, не очень экономичен, что выражается в очень больших объемах файлов, а такие файлы не подходят для потокового вещания. Мы рекомендуем использовать PCM для записи цифровых образов для ваших источников или когда вы занимаетесь постобработкой аудио.

К счастью, у нас всегда есть возможность выбрать другой кодек, который может сжимать цифровые данные (по сравнению с PCM) на основании некоторых полезных наблюдений о поведении звуковых волн. Но в этом случае приходится идти на компромисс: все альтернативные алгоритмы сопряжены с «потерями», так как невозможно полностью восстановить исходный сигнал, но, тем не менее, результат всё равно хорош настолько, что большинство пользователей не смогут уловить разницу.

MP3 – это формат аудио-кодирования с использованием как раз такого алгоритма сжатия цифровых данных, который позволяет сохранять аудиосигнал в меньшие по объему файлы. Кодек MP3 чаще всего используется пользователями для записи и хранения музыкальных файлов. Мы рекомендуем применять MP3 для трансляций аудио-контента, так как ему требуется меньшая пропускная способность сети.

AAC – это более новый алгоритм кодирования аудиосигнала, ставший «преемником» MP3. AAC стал стандартом для форматов MPEG-2 и MPEG-4. По сути это тоже кодек сжатия цифровых данных, но с меньшей, чем у MP3, потерей качества при кодировании с одинаковыми битрейтами. Мы рекомендуем использовать этот кодек для онлайн трансляций.

Частота дискретизации (кГц, kHz)

Частота дискретизации (или частота сэмплирования) - частота, с которой происходит оцифровка, хранение, обработка или конвертация сигнала из аналога в цифру. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (сэмплов), взятых через равные промежутки времени.

Измеряется в герцах (Гц, Hz) или килогерцах (кГц, kHz,) 1 кГц равен 1000 Гц. Например, 44 100 сэмплов в секунду можно обозначить как 44 100 Гц или 44,1 кГц. Выбранная частота дискретизации будет определять максимальную частоту воспроизведения, и, как следует из теоремы Котельникова, для того, чтобы полностью восстановить исходный сигнал, частота дискретизации должна в два раза превышать наибольшую частоту в спектре сигнала.

Как известно, человеческое ухо способно улавливать частоты между 20 Гц и 20 кГц. Учитывая эти параметры и значения, показанные в таблице ниже, можно понять, почему именно частота 44,1 кГц была выбрана в качестве частоты дискретизации для CD и до сих пор считается очень хорошей частотой для записи.

Есть ряд причин для выбора более высокой частоты дискретизации, хотя может показаться, что воспроизводить звук вне диапазона человеческого слуха – пустая трата сил и времени. При этом среднестатистическому слушателю будет вполне достаточно 44,1 – 48 кГц для качественного решения большинства задач.

Разрядность

Наряду с частотой дискретизации есть такое понятие как разрядность или глубина звука. Разрядность – это количество бит цифровой информации для кодирования каждого сэмпла. Проще говоря, разрядность определяет «точность» измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. С минимальной возможной разрядностью есть только два варианта измерения точности звука: 0 для полной тишины и 1 для звучания в полном объеме. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 = 65 536) различных значений.

Разрядность закреплена в кодеке PCM, но для кодеков, которые предполагают сжатие (например, MP3 и AAC) этот параметр рассчитывается при кодировании и может меняться от сэмпла к сэмплу.

Битрейт

Битрейт - это показатель количества информации, которым кодируется одна секунда звучания. Чем он выше, тем меньше искажений и тем ближе закодированная композиция к оригиналу. Для линейного PCM битрейт рассчитывается очень просто.

битрейт = частота дискретизации × разрядность × каналы

Для таких систем как Epiphan Pearl Mini, которые кодируют линейный PCM 16-бит (разрядность 16), этот расчет может быть использован для определения, сколько дополнительных полос пропускания может потребоваться для PCM аудио. Например, для стерео (два канала) оцифровка сигнала производится с частотой 44,1 кГц на 16-бит, а битрейт при этом рассчитывается таким образом:

44,1 кГц × 16 бит × 2 = 1 411,2 кбит/с

Между тем алгоритмы сжатия аудиосигнала, такие как AAC и MP3, имеют меньшее количество бит для передачи сигнала (в этом и заключается их цель), поэтому они используют небольшие битрейты. Обычно значения находятся в диапазоне от 96 кбит/с до 320 кбит/с. Для этих кодеков чем выше битрейт вы выбираете, тем больше аудио бит вы получаете на сэмпл, и тем выше будет качество звучания.

Частота дискретизации, разрядность и битрейты в реальной жизни.

Аудио CD-диски, одни из первых наиболее популярных изобретений для простых пользователей для хранения цифрового аудио, использовали частоту 44,1 кГц (20 Гц – 20 кГц, диапазон человеческого уха) и разрядность 16-бит. Данные значения были выбраны, чтобы при хорошем качестве звука иметь возможность сохранять как можно больше аудио на диске.

Когда к аудио добавилось видео и появились DVD, а позднее Blu-Ray диски, был создан новый стандарт. Записи для DVD и Blu-Rays обычно используют линейный формат PCM с частотой 48 кГц (стерео) или 96 кГц (звук 5.1 Surround) и разрядность 24. Эти значения были выбраны в качестве идеального варианта, чтобы сохранять аудио с синхронизацией с видео и при этом получать максимально возможное качество с использованием дополнительного доступного дискового пространства.

Наши рекомендации

CD, DVD и Blu-Ray диски преследовали одну цель – дать потребителю высококачественный механизм воспроизведения. Задачей всех разработок было предоставить высокое качество аудио и видео, не заботясь о величине файла (лишь бы он умещался на диск). Такое качество мог обеспечить линейный PCM.

Напротив, у мобильных средств информации и потокового медиа совсем другая цель – использовать максимально низкий битрейт, при этом достаточный для поддержания приемлемого для слушателя качества. Для этой задачи лучше всего подходят алгоритмы сжатия. Теми же принципами вы можете руководствоваться для своих записей.


При записи аудио с видео…

В случае если запись будет использоваться для последующей обработки , выбирайте кодек PCM с частотой 48 кГц и максимальной разрядностью (16 или 24), чтобы обеспечить наилучшее качество аудио. Мы рекомендуем данные параметры для Epiphan Pearl Mini.

При потоковой передаче аудио с видео…

При потоковой передаче или записи для последующей трансляции можно получить хорошее звучание аудио при меньшей полосе пропускания, используя кодеки AAC или MP3 с частотой 44,1 кГц и битрейт 128 кбит/с или выше. Такие параметры гарантируют, что звук будет достаточно хорош и не скажется на качестве трансляции.

Читайте также: