Почему midi файл могут звучать по разному на разной аппаратуре

Обновлено: 05.07.2024

Сводить/писать с адекватным мониторингом и знанием источника на котором работаешь . И еще иметь ввиду частотные характеристики других источников , на которых будут слушать. А для этого нужно хотя бы для своих наушников поставить коррекцию АЧХ в каком нибудь DSONIQ как пример ( но опять же зависит от многих факторов ) . Либо путь такой , рендеришь творчество и идешь слушать на всех источниках что сможешь достать и приводишь к общему знаменателю . Но это все лирика , лучше и правда поставить хотя бы коррекцию и будет более менее адекватно .

Kokarev Maxim

ex cool
Что делать если звучание финального трека отличается на разных устройствах воспроизведения? Для начала нужно разобраться, в чём именно проблема. На разных устройствах музыка неизбежно звучит по разному. Со звуковым примером можно будет дать более точный совет по звуку.

Methafuzz

Loading. Please, wait.
Посадили как-то двух звукорежиссеров в тюрьму. В одну камеру на 20 лет. задумался, интересно, а за что? За убийство вокалистки, которая сказала "У вас микрофоны фальшивят"? ))
New Member
задумался, интересно, а за что? За убийство вокалистки, которая сказала "У вас микрофоны фальшивят"? ))

mariUSkale

Member
Что делать если звучание финального трека отличается на разных устройствах воспроизведения? Я свожу треки в студийных наушниках (Pioneer), и, когда включаю трек на мониторах (они как раз таки не студийные), то голос в треке может отличаться от голоса, который я слышал в наушниках. Но если я слушаю музыку в спотифае в наушниках и на мониторах, то она почти ничем не отличается. Помогите, пожалуйста. Это нормально, так и должно быть, на разном оборудовани, будет звучать по разному.

_MaxiM_

Well-Known Member

Мой совет наверное будет вредным) Без правильной комнаты и мониторов, этого не избежать. По этому я после финального микса, слушаю его где только возможно, записываю в блокнот все свои наблюдения, далее иду опять к акустики на чем сводил и пробую вносить эти исправления, иногда помогает иногда нет, вот как это у меня примерно выглядит)

Аирподсы
Что-то с клэпом слишком порезан (узкий) может его вообще убрать

! На jbl в местах где открывается бас сделать автоматизации по громкости ппц он громкий. Плюс может открыть его чуть сильнее добавить саба! Или сделать бас чутка громче!
Короче проблема с низами нужно или кик тише и бас громче или открыть его больше с 80 лп малооо или сильно порезал низа эквалайзером на группе.

Основной лид не много выбивается может его скомпрессировать посильнее? Пересмотреть может на группу глю повесить! Добавить к нему велосити для движения!

В третем брейке врубить кик

. Ещё громче надо делать микс не дотягивает до референса с эпл мюзик в наушниках

Когда идёт стаб заделать его по ярче и громче и основной синт в часте три тоже, после чекнут в моно

Необходимость в таком стандарте возникла примерно к концу 70-х годов. В то время синтезаторы управлялись напряжением с помощью интерфейса CV/Gate. Существовало несколько его видов, однако, наибольшую популярность получил вариант, предложенный фирмой Roland: в нем при увеличении напряжения на 1 В, частота генерируемого тона увеличивалась на одну октаву. Главным недостатком такого интерфейса является то, что с помощью него можно управлять только одним голосом полифонии. Для извлечения дополнительной ноты нужно добавлять еще один интерфейс CV/Gate. Кроме того, таким способом передается только сам факт нажатия клавиши и ее высота, чего однозначно мало для выразительной игры.

Другим недостатком синтезаторов того времени была сложность настройки. Для каждого нового звука музыкантам приходилось настраивать инструмент заново, что было очень не удобно на живых выступлениях. На концертах тех времен часто можно было увидеть целые стеллажи из синтезаторов — так музыканты выходили из ситуации. Со временем в инструменты были встроены мини-компьютеры, с помощью которых можно было сохранять положения ручек в пресеты.
Однако, есть еще один момент, который оказал большое влияние на разработку MIDI.

Несомненно, у каждого синтезатора свой характер звучания, каждый из них был силен в определенных типах звуков. Поэтому многие музыканты того времени практиковали игру сразу на двух инструментах, как бы используя лучшее из разных моделей. Наслоение звуков из различных синтезаторов стало исполнительским приемом, визитной карточкой многих музыкантов. [1]

2 История появления

К началу 80-х большинство производителей осознали необходимость создания единого интерфейса. Задача стояла такая: разработать стандарт передачи действий исполнителя в цифровой форме между всеми типами электромузыкальных инструментов. [1]

  • Июнь 1981 — на выставке NAMM произошел первый разговор на тему единого интерфейса между главами Sequential Circuits, Roland и Oberheim.
  • Осень 1981 — первая версия интерфейса под названием UMI (Universal Musical Interface).
  • Июнь 1982 — на выставке NAMM были представлены плоды международной разработки. Ввиду возможных юридических проблем от названия UMI пришлось отказаться в пользу MIDI.
  • Октябрь 1982 — закончена предварительная спецификация MIDI.
  • Декабрь 1982 — выпушен первый синтезатор, оборудованный MIDI-интерфейсом — Sequencial Circuits Prophet 600.
  • 1983 — сформированы комитет по MIDI-стандартам (JMSC), международная группа пользователей MIDI (IMUG), выпущена спецификация MIDI 1.0.
  • 1984 — сформирована ассоциация MIDI-производителей (MMA).
3 Основы

Сам протокол состоит из трех частей [1]: спецификация формата данных, аппаратная спецификация интерфейса и спецификация хранения данных. В данной статье будет идти речь только о первой части.

4 Недостатки

Часть 2. Open Sound Contol

«Open Sound Control — это новый, оптимизированный для современных сетевых технологий протокол для взаимодействия компьютеров, звуковых синтезаторов и других мультимедиа устройств» — так был представлен OSC на международной конференции по компьютерной музыке в 1997 году [3]. OSC не является протоколом в том виде, каким является MIDI, так как он не описывает требований к аппаратному обеспечиванию — спецификации описывают лишь формат передачи данных. В этом плане OSC больше схож с XML или JSON, нежели с MIDI [8].

Пока оставим технические подробности и начнем с самого начала, с истории.

1 История, области применения

Open Sound Control был создан в 1997 году Мэттью Райтом (Matthew Wright) и Эдрианом Фридом (Adrian Freed) в Университете Калифорнии в центре новой музыки и аудио технологий (CNMAT — Center of New Music and Audio Technologies). Разработчики хотели использовать высокоскоростные сетевые технологии в интерактивной компьютерной музыке [4]. OSC не важно, по какому протоколу передаваться, так как он представляет собой всего лишь формат данных (binary message format), хотя большинство реализаций используют TCP/IP или UDP. Другой причиной создания было то, что MIDI с его нотами, каналами и контроллерами логично не подходил к разрабатывающемуся в то время синтезатору CAST (CNMAT Additive Synthesis Tools), оно и понятно, ведь MIDI — это клавишно-ориентированный протокол, который разрабатывался для управления одним синтезатором с другого [1].

  • Языки программирования: C/C++, Java, Php, Python, Ruby.
  • Среды визуального программирования и синтеза: Bidule, Chuck, Common Music CPS, Intakt, Max/MSP, Open Sound World, Pd, SuperCollider, Reaktor, VVVV.
  • Устройства для работы с сенсорами: EtherSense, Gluion, IpSonLab Kroonde, Lemur, Smart, Controller, Teabox, Toaster.
  • Другие программы: EyesWeb, Picker, SonART, SpinOSC.
2 Особенности

/synth1/noteoff 54
/synth1/noteon 60

Фактически они могут прийти в обратном порядке:

/synth1/noteoff 60
/synth1/noteon 54

4 Pattern matching

  • "?" — соответствует любому одному символу.
  • "*" — соответствует последовательности из нуля или любого другого числа символов.
  • Символы в квадратных скобках (например, "[string]") — соответствует любому символу в строке. В квадратных скобках дефис (-) и восклицательный знак (!) имеют специальное значение:

дефис между двумя символами означает диапазон чисел в ASCII последовательности (дефис в конце строки не имеет специального значения);

Существует еще один, принципиально иной способ кодирования звука, который можно применить только для кодирования инструментальных мелодий. Он основан на стандарте MIDI (англ. Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов). В отличие от оцифрованного звука в таком формате хранятся последовательность нот, коды инструментов (можно использовать 128 мелодических и 47 ударных инструментов), громкость, тембр, время затухания каждой ноты и т. д. Фактически это программа, предназначенная для проигрывания звуковой картой, в памяти которой хранятся образцы звуков реальных инструментов (волновые таблицы, англ, wave tables).

Современные звуковые карты поддерживают многоканальный звук, т. е. в звуковом файле может храниться несколько «дорожек», которые проигрываются одновременно. Таким образом, получается полифония — многоголосие, возможность проигрывать одновременно несколько нот. Количество голосов для современных звуковых карт может достигать 1024.

Звук, закодированный с помощью стандарта MIDI, хранится в файлах с расширением mid. Существуют специальные клавиатуры, которые позволяют вводить звук и сразу сохранять его в формате mid.

Для проигрывания MIDI-файла используют синтезаторы — электронные устройства, имитирующие звук реальных инструментов (рис. 2.28). Простейшим синтезатором является звуковая карта компьютера.


Рис. 2.28

Главные достоинства инструментального кодирования:

• кодирование мелодии (нотной записи) происходит без потери информации;
• файл имеет значительно меньший объём по сравнению с оцифрованным звуком той же длительности.

Однако произвольный звук (например, человеческий голос) в таком формате закодировать невозможно. Кроме того, производители сами выбирают образцы звуков (так называемые сэмплы, от англ, samples — образцы), которые записываются в память звуковой карты (нет единого стандарта). Поэтому звучание MIDI-файла может немного отличаться на разной аппаратуре.

Кодирование видеоинформации

Для того чтобы сохранить видео в памяти компьютера, нужно закодировать звук и изменяющееся изображение, причём требуется обеспечить их синхронность (одновременность). Для кодирования звука чаще всего используют оцифровку с частотой 48 кГц. Изображение состоит из отдельных растровых рисунков, которые меняются с частотой не менее 25 кадров в секунду, так что глаз человека воспринимает смену кадров как непрерывное движение. Это значит, что для каждой секунды видео нужно хранить в памяти 25 изображений.

Если используется размер 768 х 576 точек (стандарты PAL/SECAM) и глубина цвета 24 бита на пиксель, то закодированная 1 секунда видео (без звука) будет занимать примерно 32 Мбайт, а 1 минута — около 1,85 Гбайт. Это недопустимо много, поэтому в большинстве форматов видеоизображений используется сжатие с потерями. Это значит, что некоторые незначительные детали теряются, но «обычный» человек (непрофессионал) не почувствует существенного ухудшения качества. Основная идея такого сжатия заключается в том, что за короткое время изображение изменяется очень мало, поэтому можно запомнить базовый кадр, а затем сохранять только изменения. Как только изображение существенно изменится, выбирается новый базовый кадр.

В последние годы часто используются форматы видео высокой чёткости (англ. HD — High Definition) — 1280 х 720 точек и 1920 х 1080 точек, предназначенные для просмотра на широкоформатных экранах с соотношением сторон 16:9.

Наиболее известны следующие видеоформаты:

• AVI (англ. Audio Video Interleave — чередующиеся звук и видео; файлы с расширением avi) — формат видеофайлов, разработанных фирмой Microsoft для системы Windows; может использовать разные алгоритмы сжатия;
• WMV (англ. Windows Media Video-, файлы с расширением wmv) — система кодирования видео, разработанная фирмой Microsoft; может использовать разные алгоритмы сжатия;
• MPEG (файлы с расширением mpg, mpeg) — формат кодирования видеоинформации, использующий один из лучших алгоритмов сжатия, который разработала экспертная группа по вопросам движущегося изображения (англ. Motion Picture Experts Group);
• MP4 (файлы с расширением mp4) — формат видеофайлов, позволяющий хранить несколько потоков видео высокой чёткости, а также субтитры;
• MOV (англ. Quick Time Movie; файлы с расширением mov) — формат видеофайлов, разработанный фирмой Apple;
• WebM — открытый (не требующий оплаты лицензии) видеоформат, который поддерживается в современных браузерах без установки дополнительных модулей.

Вопросы и задания

1. Что такое аналоговый сигнал?
2. Какие вы знаете аналоговые приборы?
3. Почему аналоговые компьютеры были вытеснены цифровыми?
4. Что такое оцифровка? Если ли потеря информации при оцифровке? Почему?
5. Что такое интервал дискретизации и частота дискретизации?
6. Как связаны частота дискретизации с потерей информации и объёмом файла?
7. Какие частоты дискретизации сейчас используются?
8. От чего зависит выбор частоты дискретизации?
9. Почему частоты дискретизации более 48 кГц применяются очень редко?
10. Как происходит вывод закодированного звукового сигнала на колонки или наушники?
11. Что такое дискретизация по уровню?
12. Какое устройство выполняет дискретизацию при записи звука?
13. Что такое разрядность кодирования звука? На что она влияет?
14. В чём достоинства и недостатки оцифровки?
15. Какие форматы файлов для хранения оцифрованного звука вы знаете?
16. Что такое потоковый звук?
17. Что такое инструментальное кодирование?
18. Что такое волновая таблица?
19. Что такое многоканальный звук?
20. В файлах с каким расширением хранится звук, закодированный с помощью стандарта MIDI?
21. Что такое синтезатор?
22. В чём достоинства и недостатки инструментального кодирования звука?
23. Почему MIDI-файлы могут звучать по-разному на разной аппаратуре?
24. Что такое синхронность?
25. Какая частота дискретизации звука чаще всего используется при кодировании видеофильмов?
26. Почему при кодировании видео используется частота не менее 25 кадров в секунду?
27. Почему компьютерные фильмы чаще всего хранятся в сжатом виде?
28. Что означает сжатие с потерями? В чём состоит его основная идея при кодировании видео?
29. Какие форматы видео вы знаете?


а) «Как устроена звуковая карта?»

б) «Стандарт MIDI»

в) «Что такое кодек?»

г) «Что такое медиаконтейнер?»

е) «Свободные звуковые и видеоформаты»

Задачи

1. Заполните пустые ячейки таблицы, вычислив объёмы звуковых файлов (без сжатия):


2. Заполните пустые ячейки таблицы, вычислив время звучания записи (объёмы файлов приведены без учёта сжатия):


3. Заполните пустые ячейки таблицы, вычислив глубину кодирования звука (объёмы файлов приведены без учёта сжатия):


4. Заполните пустые ячейки таблицы, вычислив частоту дискретизации звука (объёмы файлов приведены без учёта сжатия):


5. Кадры видеозаписи закодированы в режиме истинного цвета (24 бита на пиксель) и сменяются с частотой 25 кадров в секунду, запись содержит стереофонический звук. Остальные параметры для разных вариантов заданы в таблице. Оцените объём 1 минуты видеозаписи в мегабайтах (с точностью до десятых). Сколько минут такой записи поместится на стандартный CD-диск объёмом 700 Мбайт?


Как Вам, наверное, уже известно, при работе с музыкой используется два основных вида представления звука – это Аудио и MIDI.

Аудио (лат. audio «слышу») — общий термин, относящийся к звуковым технологиям. Зачастую под термином аудио понимают звук, записанный на звуковом носителе; реже под аудио подразумевается запись и воспроизведение звука, звукозаписывающая и звуковоспроизводящая аппаратура.

audio_midi.jpg

Аудио аппаратура работает с сигналами, включающими частоты до 20 кГц, поскольку звук большей частоты не воспринимается слухом.

MIDI (англ. Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов) — стандарт на аппаратуру и программное обеспечение, позволяющее воспроизводить (и записывать) музыку путем выполнения/записи специальных команд, а также формат файлов, содержащих такие команды. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

Аудио – это то, что раньше записывали на магнитофоны, виниловые диски, то есть, аудио вначале имело аналоговую природу. С внедрением компьютера в работу со звуком, аудио стало цифровым и звуковые карты компьютера работают только с цифровым звуком. Поток цифр стал определять множество параметров воспроизведения звука. О достоинствах и недостатках цифрового звука можно спорить до хрипоты, но факт остается фактом – цифровая запись и воспроизведение сегодня используется повсеместно, как и цифровое фото и видео. Все CD и DVD, которые Вы слушаете/смотрите, записаны цифровым способом.

О многоканальном и трёхмерном звуке здесь я говорить не буду – это отдельная тема. И о том, что звук бывает моно и стерео, тоже, надеюсь, в общих чертах все имеют об этом представление. Замечу, что моно – это одноканальный звук, а стерео – это два независимых аудио-канала.

Звук на компьютере может быть записан и воспроизведён с заданным (определённым) уровнем частоты дискретизации и разрядности.

Частота дискретизации (или частота семплирования) - это означает, сколько раз передается информация о звуке за одну секунду, то есть, частота отсчетов непрерывного сигнала. Например, стандартная частота для музыкального CD - 44100 Герц или 44,1 КГц. Это значит, что при воспроизведении звука, на звуковую карту, за одну секунду, 44100 раз передается информация о файле.

Разрядность звука – это означает, сколько бит информации о звуке передается каждый раз, при каждой передаче. 16 Бит является стандартом CD. И если Вы увидите изображение параметров в таком виде – 16/44, то это отображение разрядности звука (16 бит) и частоты дискретизации (44 КГц, округленно).

И чем выше параметры частоты/дискретизации, тем качественнее звук. В студиях звукозаписи для получения лучшего качества работают с высокими показателями - 24, 32 бита и 96 КГц и более. А затем, при подготовке музыки к изданию на CD, переводят в более низкие показатели стандарта CD - 16/44.

Аудиоформатов существует достаточно много.

Самыми распространёнными являются такие, как:

CDA (Audio CD) – обычный CD со звуком высокого качества.

WAV - стандартный файл Windows, используемый на компьютере.

Форматы со сжатием с потерями:

MP3 (MPEG-1, Layer3) - обеспечивающий приемлемое качество звука при высоком коэффициенте сжатия. Самый популярный сегодня формат. Качество звучания сжатого звука зависит от показателя битрейта (величины потока данных). Самый низкий, приемлемый битрейт – 128 кБит в секунду. Соответственно, чем выше битрейт, тем лучше качество звука.

WMA (Windows Media Audio) - формат от Microsoft. При меньших размерах файла примерно идентичен качеству MP3.

OGG Vorbis – этот формат по качеству превосходит MP3 на аналогичных битрейтах, но исторически так сложилось, что MP3 завоевал мировой рынок раньше.

RealAudio - это формат передачи звука в Интернет. Сверхнизкий битрейт и, как Вы понимаете, соответствующее качество, но для медленного интернета очень хорошо пригоден.

Теперь о MIDI интерфейсе.

Внедрение в музыку цифровых технологий породило принципиально новый для звукозаписи формат MIDI (Musical Instruments Digital Interface), что означает цифровой интерфейс музыкальных инструментов.

Нужно отчетливо понимать, что формат MIDI не является звукозаписью, как таковой. В потоке миди-команд отражаются исключительно только «приказы» семплеру или синтезатору по выполнению действий направленных на извлечение звуков. И по протоколу MIDI не передается сам звук с его колебаниями, а только команды на его воспроизведение.

Данных «приказов» в процессе звукоизвлечения поступает по современным компьютерным понятиям не так много и охватывают они основные параметры звука: тембр инструмента, высота тона, громкость, длительность, панорама, частотная модуляция и еще множество других.

Практически все современные электронные инструменты и звуковые карты работают с форматом MIDI. Он был создан для того, чтобы инструменты разных фирм (синтезаторы, семплеры) могли одинаково хорошо реагировать на одни и те же команды. При воспроизведении миди-файла поток данных передаётся устройству, генерирующему звук (секверсору/семплеру/синтезатору) – о номере канала, тембре, о том, какую клавишу нажать, с какой силой, какой продолжительностью, какую нажать педаль и еще довольно много различной информации. Одновременно могут звучать 16 различных инструментов.

В 1982 году, ассоциацией производителей MIDI-инструментов был разработан стандарт General MIDI (GM). Это самый распространенный стандарт, несмотря на то, что позже были созданы еще три разновидности. GM имеет 16 каналов, стандартный банк музыкальных инструментов, где за каждым инструментом закреплен свой неизменный порядковый номер. В банке 128 мелодических тембров (включая электронные) и 47 ударных инструментов, расположенных на 10 канале (каждой клавише соответствует свой ударный инструмент).

Часто используемый формат - стандартный MIDI файл (SMF - Standard MIDI FIle). Это формат, предназначенный для хранения записанных данных с секвенсора, будь то аппаратный или программный. В нем существует 16 каналов, с миди-треками различных инструментов. Каждый трек – это записанная музыкальная партия какого-либо инструмента. И любой секвенсор, совместимый с GM, читает примерно одинаково эти музыкальные файлы. То есть, он считывает информацию об использованном инструменте, высоте звуков, их длительности, громкости и т.д. Например, если записана гитара, то в любом секвенсоре будет звучать именно гитара и никак не другой инструмент. Другое дело, что гитара эта может быть разного качества звучания – это зависит от качества используемого семплера или синтезатора. И еще, на любой трек можно назначать любой инструмент (их 128) из стандартного банка GM и лишь только 10 канал используется исключительно для ударных инструментов.

Можно сказать, что MIDI-запись – это как бы нотная запись для секвенсора или звуковой карты компьютера, читающего миди-формат, с высокой точностью фиксации каждого параметра звука.

И еще добавлю немаловажный факт, что миди-информация очень мала по объему занимаемой памяти, что очень удобно и экономно.

Файлы MIDI являются набором команд для синтезатора (секвенсора) установленного на компьютере.

Установленный по умолчанию на компьютере "Программный синтезатор" не дает желаемых результатов, из-за скудного "банка звуков". Для улучшения звука требуется установить синтезатор с нормальным "банком звуков" и настроить караоке плеер, чтобы он работал используя установленный нами синтезатор.

Читайте также: