В режиме создания звука в звуковой карте используются методы

Обновлено: 07.07.2024

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

1. Амплитудные преобразования. Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

2. Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну.

3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или «объёмности» звука.

4. Временные преобразования. Реализуются путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

Практическую обработку сигналов можно разделить на два типа: обработка «на лету» и пост-обработка. Обработка «на лету» подразумевает мгновенное преобразование сигнала (то есть с возможностью осуществлять вывод обработанного сигнала почти одновременно с его вводом). Простой пример – гитарные «примочки» или реверберация во время живого исполнения на сцене. Такая обработка происходит мгновенно, то есть, скажем, исполнитель поет в микрофон, а эффект-процессор преобразует его голос и слушатель слышит уже обработанный вариант голоса. Пост-обработка – это обработка уже записанного сигнала. Скорость такой обработки может быть сильно ниже скорости воспроизведения. Такая обработка преследует те же цели, то есть придание звуку определенного характера, либо изменение характеристик, однако применяется на стадии мастеринга или подготовки звука к тиражированию, когда не требуется спешка, а важнее качество и скрупулезная проработка всех нюансов звучания. Существует множество различных операций над звуком, которые вследствие недостаточной производительности сегодняшних процессоров нельзя реализовать «на лету», поэтому такие преобразования проводят лишь в пост-режиме .

Аналоговый и дискретный способы представления звука

Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме.

При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно.

При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.


Примером аналогового хранения звуковой информации является виниловая пластин­ка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

Восприятие звука человеком

Звуковые волны улавливаются слуховым органом и вызывают в нем раздражение, которое передается по нервной системе в головной мозг, создавая ощущение звука.

Колебания барабанной перепонки в свою очередь передаются во внутреннее ухо и раздражают слуховой нерв. Так образом человек воспринимает звук.

В аналоговой форме звук представляет собой волну, которая характеризуется:

  • Высота звука определяется частотой колебаний вибрирующего тела.
  • Г ромкость звука определяется энергией колебательных движений, то есть амплитудой колебаний.
  • Длительность звука - продолжительность колебаний.
  • Тембром звука называется окраска звука.

Герц (Гц или Hz) — единица измерения частоты колебаний. 1 Гц= 1/с

Человеческое ухо может воспринимать звук с частотой от 20 колебаний в секунду (20 Герц, низкий звук) до 20 000 колебаний в секунду (20 КГц, высокий звук).



Кодирование звуковой информации

Для того чтобы комп ьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).


  • В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.
  • Таким образом, при двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала.

Качество кодирования звуковой информации зависит от :

1)частотой дискретизации, т.е. количества измерений уровня сигнала в единицу времени. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

2)глубиной кодирования, т.е. количества уровней сигнала.

Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле: N = 2 i = 2 16 = 65536, где i — глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

Количество измерений в секунду может лежать в диапазоне от 8000 до 48 000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц. При частоте 8 кГц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц — качеству звучания аудио-С D . Следует также учитывать, что возможны как моно-, так и стерео-режимы.

РСМ. РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко. Но РСМ является основополагающей для всех звуковых файлов.

WAV. Самое простое хранилище дискретных данных. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости, в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали - это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

RIFF. Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

IFF. Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga - одна из первых, в которой стали задумываться о программно-сэмплернойэмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

MOD. Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента.

AIF или AIFF. Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

МР3. Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.

VQF. Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

RA. Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.


В данный момент вы не можете посмотреть или раздать видеоурок ученикам

Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобрев в каталоге.

Получите невероятные возможности



2. Раздавайте видеоуроки в личные кабинеты ученикам.


3. Смотрите статистику просмотра видеоуроков учениками.

Конспект урока "Представление звука в компьютере"

· оцифровка вводимого звукового сигнала;

· качество цифрового звука;

· виды кодирования звуковых файлов.

С начала 90-ых годов персональные компьютеры получили возможность работать со звуковой информацией.


Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.


С помощью специальных программных средств (редакторов звукозаписей) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и, в результате, появляется возможность управления компьютером при помощи голоса.


А как же представляется звук в компьютере?

Вообще звук – это процесс колебания воздуха или любой другой среды, в которой он распространяется. Звук характеризуется амплитудой (силой) и частотой (количеством колебаний в секунду).

Под звукозаписью понимают процесс сохранения звуковой информации на каком-либо носителе с помощью специальных устройств.

Ввод звука в компьютер производится с помощью звукового устройства, микрофона или радио, выход которого подключается к порту звуковой карты.


Рассмотрим подробнее процесс ввода звука в компьютер.

Звуковые сигналы непрерывны. С помощью микрофона звуковой сигнал превращается в непрерывный электрический сигнал. Но, как вы помните компьютер может работать только с цифровой информацией, поэтому если нам нужно обработать звук на компьютере, то его необходимо дискретизировать – то есть превратить в прерывистую, состоящую из отдельных частей, последовательность нулей и единиц.

Процессом преобразования звука из непрерывной формы в дискретную при записи и из дискретной в непрерывную при воспроизведении занимается звуковая карта или аудио адаптер.


Звуковая карта – это устройство для записи и воспроизведения звука на компьютере. То есть задача звуковой карты — с определённой частотой производить измерения уровня звукового сигнала и результаты измерения записывать в память компьютера. Этот процесс называют оцифровкой звука.

Промежуток времени между двумя измерениями называется периодом измерений — обозначается буквой Т и измеряется в секундах.

Таким образом на качество преобразования звука влияет несколько условий:

• Частота дискретизации, то есть сколько раз в секунду будет измерен исходный сигнал.

• Разрядность дискретизации – количество битов, выделяемых для записи каждого результата измерений.


Результаты таких измерений представляются целыми положительными числами с конечным количеством разрядов. Как мы уже говорили, в таком случае получается дискретное конечное множество значений в ограниченном диапазоне.

Размер этого диапазона зависит от разрядности ячейки — регистра памяти звуковой карты.


То есть обратите внимание, снова работает главная формула информатики:


здесь i — это разрядность регистра. Также число i называют разрядностью дискретизации. Записанные данные сохраняются в файлах специальных звуковых форматов.

Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации ровна 22050 Герц. Нужно найти разрядность аудиоадаптера.


При воспроизведении звукового файла цифровые данные преобразуются в электрический аналог звука. К звуковой карте подключаются наушники или звуковые колонки. С их помощью электрические колебания преобразуются в механические звуковые волны, которые воспринимают наши уши.

Таким образом, чем больше разрядность и частота дискретизации, тем точнее представляется звук в цифровой форме и тем больше размер файла, хранящего его.

Рассмотрим такой пример: Нужно определить качество звука (то есть какое это качество радиотрансляции или качество аудио-CD) если известно, что объём моноаудиофайла длительностью звучания в 10 секунд равен 940 Кб. Разрядность аудиоадаптера ровна 16 бит.


Рассмотрим ещё один пример. Аналоговый звуковой сигнал был дискретизирован сначала с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции), а затем с использованием 65536 уровней интенсивности сигнала (качество звучания аудио-CD). Нужно найти во сколько раз различаются информационные объёмы оцифрованного звука?


Для работы со звуковой информацией на компьютере используются различные программы. Одни из них позволяют записать звук на цифровой носитель, другие — воспроизвести. Существуют программы, которые выполняют более сложную обработку звука. Такие программы называются редакторы звука. Например, можно вырезать фрагмент музыкального произведения или речи, объединить фрагменты, изменить тембр звучания, длительность воспроизведения создавать различные музыкальные эффекты, очищать звук от шумов, согласовывать с изображениями для создания мультимедийных продуктов и так далее.

При хранении оцифрованного звука приходится решать проблему уменьшения объёма звуковых файлов. Существует два способа кодирования звука: кодирования данных без потерь, позволяющего осуществлять стопроцентное восстановление данных из сжатого потока. А также кодирование данных с потерями. Позволяет добиться схожести звучания восстановленного сигнала с оригиналом при максимальном сжатии данных. Здесь используются различные алгоритмы, сжимающие оригинальный сигнал путём выкидывания из него слабо слышимых элементов.

Существует множество различных аудио форматов. Наиболее часто используются такие форматы как WAV и MP3. Тип формата обычно определяется расширением файла (то, что идёт после точки в имени файла mp3, wav, ogg, wma)

WAV – один из первых аудио-форматов. Обычно используется для хранения несжатых аудиозаписей, идентичных по качеству звука записям на компакт-дисках. В среднем одна минута звука в формате wav занимает около 10 Мб.


MP3 – наиболее распространённый в мире звуковой формат. MP3, как и многие другие форматы кодирует звук с потерей качества, то есть урезает звук, который не слышится человеческим ухом, тем самым уменьшая размер файла.


На текущий момент mp3 не является лучшим форматом по соотношению размера файла к качеству звучания, но в силу своей распространённости и поддерживаемости большинством устройств, многие хранят свои записи именно в нём.


Звуковая карта – это устройство для записи и воспроизведения звука на компьютере. Задача звуковой карты — с определённой частотой производить измерения уровня звукового сигнала и результаты измерения записывать в память компьютера. Этот процесс называют оцифровкой звука.

Качество оцифрованного звука зависит от:

• Частоты дискретизации, то есть сколько раз в секунду будет измерен исходный сигнал.

• и Разрядности дискретизации – то есть от количества битов, выделяемых для записи каждого результата измерений.

Существует два способа кодирования звука:

• кодирования данных без потерь, здесь осуществляется стопроцентное восстановление данных из сжатого потока;

• кодирование данных с потерями. Это способ позволяет добиться схожести звучания восстановленного сигнала с оригиналом при максимальном сжатии данных.

Рассмотрим другие компоненты стандартной звуковой карты и их роль в процессах преобразования звука.

Как и во многом другом оборудовании, так и звуковых картах в дополнение к основным компонентам необходимым для звуковой обработки включены, расширяющие возможности и быстродействие оборудования, дополнительные аппаратные средства, такие как:

Цифровой сигнальный процессор (DSP) : Как графический процессор (GPU) в видеокарте, так и DSP - специализированный микропроцессор в звуковой карте снимает часть рабочей нагрузки на ЦП (CPU) компьютера, выполняя вычисления для аналогового и/или цифрового преобразования. DSP может обрабатывать различные звуки, или каналы, одновременно в отличии от звуковых карт, у которых нет их собственного DSP и им приходиться использовать ЦП компьютера для обработки звука.

Память : Опять же, как и видеокарта, звуковая карта может использовать свою собственную память, чтобы обеспечить более быструю обработку данных.

Цифровой интерфейс Sony/Philips (S/PDIF), протокол передачи файлов для аудиоданных. Использует коаксиальные или оптические соединения для ввода/вывода данных от звуковой карты.

Цифровой интерфейс музыкальных инструментов (MIDI), используется для подключения музыкальных синтезаторов или другие электронных инструментов к компьютерам.

FireWire и соединения USB, соединяют цифровое аудио или видео устройства к звуковой карте.

3-D звук используется разработчиками компьютерных игр, чтобы обеспечить быстро изменяющийся - динамический звук в зависимости от позиции пользователя в игре. Эта технология позволяет воссоздавать реалистичные звуки, перемещающегося вокруг или через препятствия игрока либо его окружения. При воссоздании объемного звука используется несколько динамиков, но создаваемое при этом акустическое окружение изменяется всегда сосредоточенно на пользователе. Объемный звук наиболее распространен в системах домашнего кинотеатра.

И опять же, как и видеокарта, звуковая карта использует программное обеспечение, чтобы взаимодействовать с приложениями и с другим оборудованием компьютера. Это программное обеспечение обычно включает:

- драйверы карты, которые позволяют ей взаимодействовать с операционной системой.

- прикладные программы (API), являются наборами библиотек, правил и стандартов, облегчающих взаимодействие на программном уровне, карты и операционной системой. Наиболее распространенные наборы API включают:

Labs QSound: QSo

Далее следует сказать, что современная материнская плата компьютера имеет интегрированную звуковую карту, у которой есть собственный DSP, способный обработать многократные потоки данных и есть возможность поддерживать 3-D позиционный и объемный звук системы Dolby. Однако, несмотря на эти функции, большинство специалистов и просто меломанов и я, в том числе сходятся в едином мнении о том, что, отдельные звуковые карты обеспечивают лучшее качество звука.

И завершении статьи немного о звуковых картах ноутбуков. Звуковые процессоры в ноутбуках интегрированы на системных платах или маленьких звуковых картах. Малое пространство и температурные особенности мобильных ПК делают использование первоклассных внутренних карт непрактичным. Поэтому те пользователи ноутбуков, которые заинтересованы в отличном качестве звука могут купить внешние звуковые контроллеры и использовать их через соединение FireWire или USB. Эти внешние модули могут значительно улучшить качество звука ноутбука.

2. Внутренняя регистровая память, состоящая из восьми 16–разрядных регистров; четыре из них допускают раздельное использование своих младших и старших байтов, обеспечивая тем самым возможность обработки как 16–разрядных слов, так и байтов информации;

3. Устройство управления, включающее в себя:

буфер команд, который представляет собой регистровую память, предназначенную для хранения выполняемой в данный момент команды (аналогично регистру команд в структуре классической ЭВМ) и заполняемую очередными командами из оперативной памяти по мере своего освобождения;

дешифратор кода операций, определяющий тип выполняемой команды;

блок управления операциями, который на основании расшифрованного дешифратором кода операции формирует управляющие сигналы, организующие работу всех блоков микропроцессора;

указатель команд, определяющий адрес выполняемой команды в сегменте команд оперативной памяти;

регистр флагов, содержащий признаки результата выполненных команд и некоторую управляющую информацию.

Форм-фактор накопителя на жестких дисках

Применяют два основных вида накопителей на жестких дисках – форм–фактора 3,5" и 2,5". Кроме отличия в физических размерах накопители обладают разным энергопотреблением, скоростью вращения шпинделя, производительностью, интерфейсом, объемом кэш–памяти, тепло– и шумовыделением, а так же различной стоимостью. Технические характеристики современных накопителей на жёстких дисках весьма схожи, так что выбор между ними в основном сводится к сопоставлению уровня шума, ударостойкости, потребляемой мощности и удельной стоимости хранения единицы информации. Винчестеры форм–фактора 2,5" были изначально разработаны для применения в мобильных вычислительных системах, но за счет миниатюризации компонентов и популяризации идеи бесшумных и экономичных персональных компьютеров, настольные модели также стали оснащаться винчестерами данного форм–фактора.

Качество звука, оцифрованного звуковой картой, определяется такими параметрами, как:

частота дискретизации - это количество измерений громкости звука за одну секунду (частота взятия отсчетов при преобразовании аналогового звукового сигнала в цифровой). Выражается числом отсчетов в секунду или в герцах, частота дискретизации по времени формата компакт–диска – 44,1 кГц.

уровень громкости звука. Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2k. Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно: N = 2k = 216 = 65 536. В процессе кодирования каждому уровню громкости звука присваивается свой 16–битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему – 1111111111111111.

глубина кодирования - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

В режиме создания звука в звуковой карте используются методы:

частотной модуляции FM (Frequency Modulation – частотная модуляция) – синтез при помощи нескольких генеpатоpов сигнала (обычно синусоидального) со взаимной модуляцией. Каждый генеpатоp снабжается схемой управления частотой и амплитудой сигнала и образует "опеpатоp" – базовую единицу синтеза. Достоинства метода: отсутствие заранее записанных звуков и памяти для них, большое pазнообpазие получаемых звучаний, повторяемость тембров.

волновых таблиц (сэмплов) WT (WaveTable – таблица волн) – воспроизведение заранее записанных в цифровом виде звучаний – самплов (samples). Инструменты с малой длительностью звучания обычно записываются полностью, а для остальных может записываться лишь начало/конец звука и небольшая "средняя" часть, которая затем пpоигpывается в цикле в течение нужного времени. Для изменения высоты звука оцифровка пpоигpывается с разной скоростью, а чтобы при этом сильно не изменялся хаpактеp звучания – инструменты составляются из нескольких фрагментов для разных диапазонов нот.

Графический планшет (от англ. graphics tablet или graphics pad, drawing tablet, digitizing tablet, digitizer - дигитайзер, диджитайзер) — это устройство для ввода рисунков от руки непосредственно в компьютер. Состоит из пера и плоского планшета, чувствительного к нажатию или близости пера. Также может прилагаться специальная мышь.

Звуковая карта — это периферийное устройство, которое еще несколько лет назад считалось экзотическим, а теперь стало почти стандартным и включено в состав основного набора микросхем системных плат. Звуковая карта обеспечивает качество записи и воспроизведения звуковой информации не хуже звукового компакт-диска. Имеет 16-битный стереофонический цифро-аналоговый и аналогоцифровой преобразователи для записи и воспроизведения звуковой информации с цифрового или аналогового носителей и микрофона. Поддерживает функции создания звуковых эффектов для игровых программ. Имеет стандартные выходы для подключения акустической системы компьютера и внешних усилителей звуковых частот.

Звуковая карта работает в трех основных режимах: создание, запись и воспроизведение звуковых сигналов. В режиме создания звука плата действует как музыкальный инструмент, синтезирующий сложный звуковой сигнал. Для синтеза используются два метода. Первый метод получил название FM -синтеза. FM -синтез осуществляется с помощью специальных генераторов, которые могут изменять частоту и амплитуду тона. Эти генераторы могут моделировать звучание определенного музыкального инструмента. На звуковой плате устанавливаются от 4 до 18 генераторов, которые, соответственно, могут имитировать одновременное звучание 2—9 инструментов. Звук, син-
тезированный FM -методом, имеет некоторый «металлический» оттенок и не похож на звучание настоящего музыкального инструмента.

Второй метод, получивший название WT -синтез, обеспечивает более высокое качество звучания. В основе этого синтеза лежат записанные ранее и хранящиеся в виде файлов образцы звучания му-
зыкальных инструментов ( MIDI-файлы). WT -синтезаторы манипулируют записанными образцами, создавая сложные музыкальные образы. Достоинство этого метода не только в высоком качестве синтезированного звука, но и в том, что количество и типы музыкальных инструментов можно расширить, установив на компьютер дополнительные MIDI-файлы.

В режиме записи звуковая карта принимает звук от внешнего источника и производит его оцифровку, т.е. преобразует его из аналоговой (непрерывной) формы в цифровую (дискретную) и сохраняет числовые данные в виде файлов на диски Качество оцифрованного звука во многом зависит от разрядности преобразования и частоты дискретизации.

При воспроизведении звуковая карта может принимать оцифрованный или непрерывный сигнал. Для этого карта имеет специальные разъемы для подключения источников непрерывного сигнала,
вход для подключения, выход CD -диска и усилитель, позволяющий выводить сигнал на внешние акустические системы.

Качество оцифровываемого и воспроизводимого сигнала зависит от таких параметров звуковой карты, как частота дискретизации, которая должна составлять не менее 44 кГц, разрядность оцифрованного сигнала (12—16 бит) и возможность стереофонической записи и воспроизведения.

Читайте также: