Lame кодек какой лучше

Обновлено: 07.07.2024

Какой кодек мп3 предпочесть?

Какую версию кодера Lame,посоветуют знатоки?
Сейчас пользуюсь версией 3,хх,но что мне она не очень..
Сильно свежую и проф.версии думаю,не стоит пользовать,что бы избежать проблем с декодированием файлов.
Жму ЕАК-ом,как наиболее мне удобной прогой,(все в одном),т.е. кодер пристегиваю к ЕАК-у.

Если не секрет, для каких целей производится выбор?
Если для юзанья чего-то мобильного (во всех ипостасях), то может просто забить на нюансы, типа, ужалось и ладно (юзал 3.89b - вполне)?

Я всегда пользуюсь самой последней версией Lame на текущий момент. Пережимаю всегда с помощью пресетов. Как ни странно, lame --preset medium дает по качеству результат прослушивания значительно лучше, чем пожатие с тем же переменным битрейтом или даже на шаг выше. Да и на сайте авторы lame писали, что все версии 3.хх заточены под использование пресетов. Обязательно попробуйте.

У меня (да и не только у меня) с Lame не уживался некоторый софт, в частности, Ulead Media Studio. Я на него обиделся и с тех пор использую Fraunhofer IIS Mpeg layer-3 Codec. Да и Audio soft как правило включает свои кодеки, например Sony Vegas.

Если не секрет, для каких целей производится выбор?
Если для юзанья чего-то мобильного (во всех ипостасях), то может просто забить на нюансы, типа, ужалось и ладно (юзал 3.89b - вполне)?

не секрет.
На рабочем месте напрягает постоянно менять диски в СД-юке.
Поэтому приобрел мп3 Кларик,чтобы со флэшки гонять музончик.

Candidate, ничего не понял насчет пресетов.
Я жму ЕАК-ом,там можно выбрать битрейт.
Кстати,обратил внимание,что при проигрывании на компе VBR-файлов,во время фрагментов насыщенных ВЧ-возрастает нагрузка на ЦП..
В автономных девайсах процы попроще чем Пентиум-4, могут ли они не "переваривать" треки с переменным битрейтом,из-за ограничения мощности (быстродействия) их процессора? Как думаете?
"Не переваривать"-имеется ввиду,декодировать с огрехами,например с бОльшими искажениями на ВЧ,по сравнению с постоянным битрейтом.

Free

История

Разработка LAME началась примерно в середине 1998 года. Майк Ченг начал его как патч против источников кодировщика 8hz-MP3. После некоторых проблем с качеством, поднятых другими разработчиками, он решил начать с нуля, основываясь на источниках dist10. Эта ветвь (патч со ссылочными источниками) получила название LAME 2.0. К выпуску LAME 3.81 весь код dist10 был удален, что сделало LAME совершенно новой программой, а не просто патчем существующего кодера.

См. также: Что такое Lossless?

Проект быстро стал коллективным усилием. Майк Ченг в конце концов оставил лидерство и начал работать над tooLAME, кодировщиком MP2. Марк Тейлор стал лидером и выпустил версию 3.0 с новой разработанной им психоакустической моделью gpsycho.

В настоящее время LAME считается лучшим MP3-кодировщиком на средних и высоких битрейтах и ​​имеет лучшую модель VBR среди реализаций MP3, в основном благодаря преданной работе талантливых разработчиков Такехиро Томинага, Наоки Шибата, Дарина Моррисона, Габриэля Бувиня, Роберта Хегеманна и других. Разработка продолжается.

См. также: Что такое Ogg Vorbis?

Рекомендуемые настройки кодера

Максимальное качество и архивация

Максимальное качество достигается, когда, независимо от условий прослушивания, вы не можете обнаружить разницу между MP3 и оригиналом. Как показали слепые тесты ABX, MP3-файлы с кодировкой LAME обычно достигают этого уровня прозрачности при кодировании с настройками по умолчанию, при битрейтах значительно ниже максимальных. Кодирование с более высокими настройками битрейта не повлияет на воспринимаемое качество.

Для архивирования идеальны только форматы без потерь, такие как WavPack,Wave, FLAC и т.д.; они сохранят звук без изменений, сэмпл за сэмплом, независимо от настроек кодера. Напротив, форматы с потерями, такие как MP3, предназначены для экономии места путем изменения звука тонкими, часто незаметными способами, даже при максимальных настройках кодера.

Высокое качество (Hi-Fi, домашнее прослушивание с лучшим размером файла):

190 кбит/с) или -V3 (

Эти настройки VBR обычно дают прозрачные результаты. Звуковые различия между этими пресетами могут существовать, но они редки.

Очень высокое качество с максимальным размером файла:

Этот режим CBR максимизирует битрейт MP3 и общий размер файла. Дополнительное пространство может позволить сжать некоторые части аудио с меньшими потерями, но на сегодняшний день никто не дал результатов испытаний ABX, демонстрирующих, что воспринимаемое качество всегда лучше, чем самые высокие профили VBR, описанные выше.

Портативный (прослушивание в шумных условиях, меньший битрейт, меньший размер файла):

130 кбит/с) или -V6 (

115 кбит/с). -V6 производит «приемлемое» качество, в то время как -V4 должно быть близко к прозрачности восприятия.

Очень низкий битрейт, небольшие размеры:

Понимание настроек битрейта

MP3 разделены на кадры, каждый из которых имеет определенный размер, выраженный в битрейте. Если битрейт каждого кадра одинаков во всем файле, то файл считается с постоянным битрейтом (CBR). В противном случае это переменная скорость передачи (VBR). LAME предлагает режимы кодирования CBR и VBR, а также специальный режим кодирования VBR, называемый ABR (средняя скорость передачи в битах).

VBR (переменный битрейт) настройки

VBR: режим переменной скорости передачи данных. Используйте режимы с переменным битрейтом, когда целью является достижение фиксированного уровня качества с использованием минимально возможного битрейта. VBR лучше всего использовать для определенного уровня качества, а не определенного битрейта. Окончательный размер файла для VBR-кодирования менее предсказуем, чем для ABR, но качество обычно лучше.

См. также: Что такое передискретизация?

В отличие от других MP3-кодеров, которые выполняют VBR-кодирование на основе прогнозов качества вывода, метод VBR по умолчанию LAME проверяет фактическое качество вывода, чтобы гарантировать, что всегда достигается желаемый уровень качества.

Целевой битрейт и фактический типичный битрейт для каждого уровня качества VBR:

Technical details for recommended LAME settings

Если вам нужен предсказуемый битрейт (например, в потоковом приложении), используйте режимы ABR или CBR, описанные ниже.

Настройки ABR (среднего битрейта)

Важно: настройка ABR настраивается с 320 кбит/с до 80 кбит/с.

Настройки CBR (постоянный битрейт)

Кодирование CBR не эффективно. В то время как режимы VBR и ABR могут предоставлять больше битов для сложных музыкальных фрагментов и сохранять биты на более простых, CBR кодирует каждый кадр с одинаковой скоростью передачи.

См. также: Что такое частота дискретизации?

CBR рекомендуется только для использования в потоковых ситуациях, когда необходимо строго соблюдать верхний битрейт. За кулисами все еще есть некоторая изменчивость в битрейте благодаря использованию LAME функции резервуара битов формата MP3, но она гораздо менее гибкая, чем фактический VBR.

Использование: -b <битрейт> где <битрейт> (битрейт в кбит/с) должен быть выбран из следующих значений: 8, 16, 24, 32, 40, 48, 64, 80, 96, 112, 128, 160, 192, 224, 256 или 320.

Важно: настройка CBR настроена с 320 кбит/с до 80 кбит/с.

Заметка

Resampling (ресемплирование)

Когда входная частота дискретизации превышает 48 кГц, LAME повторно изменит ее до максимальной частоты 48 кГц (максимум, поддерживаемый MP3). В режимах VBR с 7 по 9,999 и при битрейтах CBR ниже 104 кбит/с вход повторно дискретизируется до 32000, 24000, 22050, 16000, 12000, 11025 или 8000, в зависимости от целевого уровня качества или битрейта. Так как это требуется при повторной дискретизации, всегда применяется фильтр для удаления частот, превышающих половину частоты дискретизации. Приведенная выше информация о нижних частотах указывает, выполняется ли какая-либо дополнительная фильтрация.

Внутренний ресэмплер LAME не идеален. Если требуется повторная выборка, лучшие результаты (особенно при нацеливании на низкие битрейты) можно получить с помощью высококачественного преобразователя частоты дискретизации, такого как SoX или SSRC.

Несовместимость декодера Фраунгофера

Разные интерпретации неясной части спецификации MP3 привели к тому, что специфичная для Windows версия MP3-декодера Fraunhofer IIS не смогла правильно воспроизводить определенные MP3-файлы, созданные с определенными версиями LAME.

См. также: Что такое битрейт?

Чтобы продемонстрировать проблему, проблемный MP3 должен быть создан с LAME 3.97 или более ранней версии и должен содержать кадр с определенными параметрами и очень большим объемом данных, например кадр 320 кбит/с, который интенсивно использует бит резервуар. Декодером должен быть фильтр DirectShow l3codecx.ax версии 1.5.0 или ниже, используемый проигрывателем Windows Media в версиях Windows, предшествующих Windows Vista. Обновление безопасности для Windows XP и Server 2003, выпущенное в августе 2010 года, обновило этот фильтр до версии 1.6.0, которая может воспроизводить проблемные файлы MP3. Windows Vista поставляется с более старой версией, но проигрыватель Windows Media использует другой фильтр, и в более поздних версиях Windows этот фильтр вообще не используется.

Обходной путь был реализован в LAME 3.98.0 бета 1 до LAME 3.98.2 и в LAME 3.99 альфа 1, в результате чего кадры со скоростью 320 кбит/с были ограничены в том, какой объем битового резервуара они могли использовать. Это привело к потере впустую пространства, когда резервуар вырастет за пределы. В LAME 3.98.3 и более поздних версиях, а также в LAME 3.99 alpha 2 и более поздних версиях метод был изменен таким образом, что резервуар для долота не может расти выше предела.

VBR заголовок и тег LAME

LAME поддерживает стандарт де-факто добавления дополнительного кадра молчания к началу файлов MP3. Этот «заголовок VBR» или «информационный тег» предоставляет домашнюю страницу для точной информации о продолжительности звука и таблицу точек поиска. Это в основном для инженеров, работающих с файлами VBR. Декодеры обычно рассматривают кадр как информационный, а не воспроизводящий звук.

LAME использует формат Xing для этого заголовка и расширяет его, встраивая 20-байтовый «тег LAME» с дополнительной информацией:

  • Короткая строка версии (9 байтов ASCII).
  • CRC аудио и информационных тегов (начиная с LAME 3.90).
  • Отдельные значения задержки и заполнения для воспроизведения без пауз (начиная с LAME 3.90).
  • Различные настройки кодировщика (начиная с LAME 3.90, расширен в 3.94 для включения предустановок). До LAME 3.94 заголовок VBR записывался только в файлах VBR. Начиная с версии 3.94, они также записываются в файлы CBR, вначале с «Info» вместо «XING».

В последних версиях LAME предусмотрены более удобные параметры командной строки, поэтому рекомендуется придерживаться одного из значений, описанных в тексте или показанных в таблице выше.

Например, следующие параметры командной строки будут выдавать одинаковые выходные данные:

Внимание: это старая версия статьи, новая доступна на моём сайте.

На дворе 2011-й год, с момента появления первого MP3 кодировщика прошло уже 17 лет. Но то, что большинство из нас до сих пор спокойно слушает музыку в формате MP3 — вовсе не значит, что прогресс всё это время топтался на месте. И это касается не только развития алгоритма кодирования MP3, но и эволюции кодирования аудио с потерями вообще — в виде новых, более совершенных кодеков, действительно позволяющих получить лучшее качество при меньшем размере. Такие форматы как OGG Vorbis, AAC, WMA, Musepack давно оставили позади устаревший MP3 с его многочисленными ограничениями и недостатками.

Параллельно, всё большие обороты набирает кодирование без потерь (lossless). Но из-за больших объемов данных на сегодняшний день оно всё еще непригодно для полномасштабного использования — особенно для портативных устройств с ограниченным объемом памяти, для потокового вещания в сети, и просто для быстрого обмена музыкой в интернете (надо признать, что не у всех и не всегда под рукой есть 100-мегабитный доступ в интернет).

И так, MP3 устарел, и ему определенно созрела замена. Только как быть пользователю непосвященному, но желающему добиться максимально качественного звучания с минимальными затратами объемов памяти? Ведь альтернативных кодеков довольно много (как минимум 3 из них действительно достойны внимания): Apple продвигает с помощью своего iTunes Store формат AAC (Advanced Audio Coding — позиционируется как преемник MP3), Microsoft — свой собственный лицензируемый WMA (Windows Media Audio), кроме того, всё большую известность приобретает OGG Vorbis, а особо просветленные используют даже такой формат как Musepack. Который из этих кодеков выбрать?

Однозначного ответа на этот вопрос нет — и именно поэтому я пишу сию статью.

Выбор того или иного кодека зависит от конкретной задачи. А именно:

1. От оборудования и ПО, с помощью которого будет воспроизводиться звук. Т.е. от наличия поддержки того или иного формата аудио, а также качества воспроизведения (им желательно руководствоваться при выборе битрейта).

2. От объема памяти, который будет выделен под конечный материал. Соответственно подбирается больший или меньший целевой битрейт/качество.

Ну и, конечно же, необходимо кроме формата и битрейта подобрать оптимальный кодировщик и параметры кодирования. При этом надо понимать, что различные форматы/кодеры по-разному проявляют себя на разных диапазонах битрейта.

Таким образом, алгоритм примерно следующий:

1) Выяснить, какие форматы поддерживает целевое устройство.
2) Определиться, сколько места вы сможете выделить под аудио материал, а также определить суммарную продолжительность аудио предназначенного для кодирования.
3) Вычислить нужный битрейт по формуле: битрейт = дисковое_пространство(в килобитах) / суммарная_продолжительность(в секундах).
4) В соответствии с битрейтом выбрать из поддерживаемых форматов оптимальный (об этом далее).
5) Подобрать наилучший кодер и параметры к нему.

image

  • поддержка более широкого набора форматов (вплоть до 48 каналов) и частот дискретизации звука (от 8 кГц до 96 кГц);
  • более эффективный и простой банк фильтров: гибридный банк фильтров МР3 был заменен обычным MDCT (модифицированным дискретным косинусным преобразованием);
  • более широкие пределы варьирования частотно-временного разрешения в банке фильтров — в восемь раз (в МР3 — в три раза) — привели к улучшению кодирования транзиентов (переходных процессов) и стационарных участков аудиосигнала;
  • более качественное кодирование частот выше 16 кГц;
  • более гибкий режим кодирования стереосигналов, позволяющий переключаться в режим M/S («joint stereo») независимо в различных частотных полосах;
  • дополнительные возможности стандарта, повышающие эффективность компрессии: технология формирования шума во временной области (TNS), предсказание MDCT-коэффициентов по времени (long term prediction), режим параметрического кодирования стереосигнала (parametric stereo), синтез шумов (perceptual noise substitution), технология восстановления высоких частот (SBR).
OGG Vorbis

image

Ogg Vorbis — это относительно новый универсальный формат аудио компрессии, официально вышедший летом 2002 года. Он принадлежит к тому же типу форматов, что и МР3, AAC, VQF и WMA, то есть к форматам компрессии с потерями. Психоакустическая модель, используемая в Ogg Vorbis, по принципам действия близка к МР3 и иже с ними, но и только — математическая обработка и практическая реализация этой модели в корне отличаются, что позволяет авторам объявить свой формат совершенно независимым от всех предшественников.
Главное неоспоримое преимущество формата Ogg Vorbis — это его полная открытость и свободность. Более того, в нем использована новейшая и наиболее качественная психоакустическая модель, из-за чего соотношение битрейт/качество значительно ниже, чем у других форматов. Как результат — качество звука лучше, но размер файла меньше.
В формате имеется большое количество достоинств. Например, формат Ogg Vorbis не ограничивает пользователя только двумя аудио каналами (стерео — левый и правый). Он поддерживает до 225 отдельных каналов с частотой дискретизации до 192kHz и разрядностью до 32bit (чего не позволяет ни один формат сжатия с потерями), поэтому Ogg Vorbis великолепно подходит для кодирования 6-ти канального звука DVD-Audio. К тому же, формат OGG Vorbis — sample accurate. Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений или дополнительных/потерянных сэмплов относительно друг друга. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно входит в другой) — в итоге сохранится целостность звука.
Возможностью потокового вещания сейчас никого не удивишь, но у этого формата она заложена с самых основ. Это дает формату достаточно полезный побочный эффект — в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.
Отдельно стоит упомянуть достаточно гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в UTF-8, что позволяет писать хоть на всех языках одновременно и исключает возможные проблемы с кодировками. Это значительно удобнее различных ухищрений типа id3 тегов.
Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жесткими значениями, и он может варьироваться даже на 1kbps. При этом стоит заметить, что форматом жестко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьироваться от 400kbps до 700kbps. Такой же гибкостью обладает частота дискретизации — пользователям предоставляется любой выбор в пределах от 2000Hz до 192000Hz.
Ogg Vorbis был разработан сообществом Xiphophorus для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то, что это самый молодой формат из всех конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех известных платформах (Windows, PocketPC, Symbian, DOS, Linux, MacOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Популярность на сегодняшний день значительно превосходит все альтернативные решения.
Стоит заметить, что Ogg Vorbis является всего лишь небольшой частью мультимедиа проекта Ogg Squish, в который также входят свободные кодировщики: Speex — для сжатия голоса; FLAC — для сжатия звука без потерь; Theora — для сжатия видео.

Musepack
  • Формат не производит второе dct-преобразование, он фактически не страдает артефактами pre-echo, в отличие от таких форматов как MP3, Vorbis, AAC и WMA.
  • Более эффективные алгоритмы переменного битрейта. Если проследить, как изменяется битрейт во время проигрывания треков MPC, можно заметить, что для более простых участков кодер выделяет меньший битрейт, а для сложных — значительно больший, иногда выше 400 (!) кбит/с. Так же тут стоит упомянуть один интересный факт: кодер МР3 в режиме VBR для тишины выделяет битрейт 32 кбит/с (при частоте дискретизации 44100 Гц), AAC и OGG Vorbis — 2кбит/с, Musepack же кодирует тишину с минимальными затратами, <1 кбит/с (например, минута тишины займет каких-то 514 байт). Всё это говорит о чрезвычайной «экономности» этого кодера.
  • Мощная и гибкая психоакустическая модель. Тут можно упомянуть, например, динамический НЧ фильтр на базе фреймов (в других кодерах устанавливается фиксированная полоса пропускания для каждой предустановки качества).
  • Более продвинутое сжатие, основанное на оптимизированных таблицах Хаффмана (тот же LAME MP3 впустую тратит около 20% битрейта — только лишь из-за несовершенного математического сжатия)

image

Windows Media Audio — лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудиоинформации.

Изначально формат WMA рекламировался как альтернатива MP3, но на сегодняшний день Microsoft противопоставляет ему формат AAC. Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке, качество форматов всё-таки не является однозначно эквивалентным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft.

Теперь непосредственно к сути дела.

Чтобы облегчить вам выбор, я хотел бы поделиться своим опытом, полученным в ходе многочисленных сравнений, прослушиваний, а также на основе анализа результатов открытых слуховых тестов.

И так, ниже я расскажу о наиболее подходящих для каждого отдельного случая кодерах, а также о правильном выборе параметров. Для конвертирования рекомендую использовать foobar2000 (подробно настройка конвертера описана здесь), собственно параметры указаны как раз для него. Кроме того, для foobar2000 есть большое количество полезных DSP, которые могут нам пригодиться для предварительной обработки аудио.

Для тех же, кто собирается конвертировать через консоль или другую программу: переменную %s надо заменить на имя файла-источника (или аналогичную переменную), а %d — на имя выходного файла.

Обратите внимание, что для каждого диапазона битрейта указаны возможные варианты форматов: первый — самый приоритетный. Если же ваш плеер не поддерживает первый вариант — обратите внимание на следующий, и т.д. Как я уже писал, внимания на самом деле сегодня достойны только три кодека — это AAC, OGG Vorbis и Musepack. WMA же, по причине своей закрытости, особым качеством не отличается, но всё же в большинстве случаев лучше, чем MP3. Учитывая, что некоторые устройства из альтернатив поддерживают только WMA, я буду давать рекомендации для каждого из четырех форматов.

Насчет битрейтов: надо понимать, что оптимальным режимом кодирования является т.н. True VBR, т.е. режим с целевым качеством, а не битрейтом. В идеале результатом является трек с переменным битрейтом, но постоянным качеством (не приравнивайте эти два понятия — более сложным фрагментам трека для поддержания качества нужно больше бит). Таким образом битрейт а выходе — трудно предсказуем. Потому значения битрейтов ниже указаны только как примерные, по возможности — средние для большого количества композиций различной сложности.

Упоминаемые в этой статье, а также некоторые другие кодеры, с русскими описаниями основных параметров и рекомендациями можно найти здесь.

Сверхнизкие битрейты (

Этот диапазон прекрасно подходит для кодирования аудиокниг. И тут вариант может быть только один — AAC, а точнее, Nero AAC. Параметры следующие:

-lc -q 0.35 -ignorelength -if - -of %d

При этом материал должен быть предварительно преобразован в моно и ресемплирован до частоты 22050 Гц (желательно ресемплером SoX). На выходе получим обычное Low Complexity AAC с битрейтом около 25 кбит/с.

Для музыки в этом диапазоне тоже есть варианты:

1) Nero AAC. Тут никаких преобразований не нужно:

-q 0.15 -ignorelength -if - -of %d

На выходе — High Efficiency AAC v2 (с параметрическим стерео и синтезом ВЧ),

35 кбит/с. Прекрасный вариант для какого-нибудь интернет-радио. Только тут надо не забывать, что декодер в плеере должен поддерживать HE-AACv2, иначе получите полное отсутствие ВЧ и монофонию.

2) OGG Vorbis AoTuV — данная модификация libvorbis включает усовершенствование алгоритма кодирования с низкими битрейтами и, даже без технологии SBR, не сильно уступает HE-AACv2. Командная строка:

Полученные таким образом файлы должны быть полностью совместимы со стандартными декодерами OGG Vorbis. Битрейт — аналогичный — около 35 кбит/с.

3) WMA 10 Pro. Для таких случаев у Microsoft тоже есть что-то наподобие SBR (синтез ВЧ), звучит не так плохо, как могло бы. Правда битрейт чуть выходит за рамки — 48 кбит/с.

-silent -a_codec WMA9PRO -a_mode 3 -a_setting 48_44_2_16 -input %s -output %d

Учтите, что старые (особенно «железные») декодеры не поддерживают WMA 10. Для такого случая можно использовать WMA 9.2 (кодер тот же), правда, его качество на низких битрейтах значительно хуже.

-silent -a_codec WMA9STD -a_mode 3 -a_setting 48_44_2 -input %s -output %d

Низкий битрейт,

1) QuickTime AAC — победитель (если не считать новоиспеченный Opus/CELT) того самого теста. Ниже указаны настройки для кодера QAAC:

-s -v 64 --he -q 2 --ignorelength - -o %d

На выходе имеем HE-AAC (с SBR, но без Parametric Stereo), что должно поддерживаться различными iPod'ами и тому подобным.

2) OGG Vorbis AoTuV — хоть и оказался довольно далеко от QAAC, но всё же:

3) И на всякий случай WMA 10 Pro:

-silent -a_codec WMA9PRO -a_mode 3 -a_setting 64_44_2_16 -input %s -output %d

Для старых декодеров — WMA 9 Standard:

-silent -a_codec WMA9STD -a_mode 3 -a_setting 64_44_2 -input %s -output %d

Чуть выше,

А этот битрейт я рассматриваю уже из-за Vorbis.

1) Как показали тесты, лучше всего с ним справляется кодер OGG Vorbis AoTuV:

2) Nero AAC — очень неплохой результат. В местах, где высокие выражены не так ярко, может звучать даже лучше Vorbis'а (на высоких проигрывает из-за синтеза).
30 -ignorelength -if — -of %d

Используемый профиль — HE-AAC.

Стандарт де-факто, 128 кбит/с

Интересный факт: многие утверждают, что для MP3 128 кбит/с — «пограничный битрейт», с которого начинается неотличимое от оригинала качество. Пожалуй, это так… для пластмассовых китайских колонок с блатняком. Реально же этот порог находится где-то около 200 кбит/с, при чем новые форматы дают на этом битрейте более стабильное качество.

Современным кодерам эту планку в 128 кбит/с удалось занизить чуть ли не в два раза (опять же, по заявлениям разработчиков). Но, тем не менее, если у вас более-менее приличная акустика (или наушники), на сложных фрагментах разницу можно уловить и при 128 кбит/с.

-q 0.40 -ignorelength -if - -of %d

Профиль — обычный AAC LC.

-silent -a_codec WMA9PRO -a_mode 3 -a_setting 128_44_2_24 -input %s -output %d

Для старых декодеров — WMA 9 Standard:

-silent -a_codec WMA9STD -a_mode 3 -a_setting 128_44_2 -input %s -output %d

В этом диапазоне разница межу кодерами Nero, QuickTime AAC и Vorbis практически сходит на нет. Но здесь уже на сцену выходит тот самый Musepack. Как раз на этих битрейтах начинает проявляться его преимущество (за счет необычайно гибкого VBR режима, а также принципиально другого алгоритма сжатия):

1) Musepack --silent --quality 5 - %d

2) Nero AAC -q 0.50 -ignorelength -if - -of %d

-silent -a_codec WMA9STD -a_mode 3 -a_setting 160_44_2 -input %s -output %d

Порог прозрачности:

То, о чем я говорил. При этом битрейте практически все кодеры дают прозрачный для большинства слушателей звук. И именно этот диапазон является оптимальным в плане размер/качество.

Кстати, у LAME MP3 в этом районе тоже находится подобный порог (VBR V2), но у этого кодека очень большие проблемы с пре-эхом (искажения предшествующие резким всплескам сигнала), а на слух часто ощущается Noise Shaping (шумы от ошибок квантования таким образом переносятся в высокочастотную область).

У таких же кодеков, как Vorbis, AAC и MPC на этом пороге начинается четкая прорисовка в композициях даже фоновых шумов.

1) Musepack --silent --quality 6 - %d

2) Nero AAC -q 0.55 -ignorelength -if - -of %d

-silent -a_codec WMA9PRO -a_mode 3 -a_setting 192_44_2_24 -input %s -output %d

WMA 9 Standard, максимальный битрейт воспринимаемый старыми декодерами:

-silent -a_codec WMA9STD -a_mode 3 -a_setting 192_44_2 -input %s -output %d

Разумный максимум:

225 кбит/с повышение битрейта чаще всего уже не дает слышимого прироста качества, а размер файлов, естественно увеличивается. Но всё же, для особенно сложных композиций (и хорошей аппаратуры/ушей) существуют более высокие настройки качества. На этих битрейтах для таких кодеров как Museppack и Vorbis мне даже не удалось найти киллер-семплов (проблемные семплы, на которых явно проявляются недостатки алгоритма кодирования). И так:

2) Musepack --silent --quality 10 - %d

3) QAAC -s -V 127 -q 2 --ignorelength - -o %d

4) WMA 10 Pro -silent -a_codec WMA9PRO -a_mode 3 -a_setting 384_44_2_24 -input %s -output %d

Опережая ваши вопросы: да, для некоторых из этих кодеров существуют и более высокие настройки качества, но дальнейшее их повышение уже не имеет никакого смысла. Разве что вам действительно не важен объем занимаемый музыкой памяти, а поддержкой lossless ваше устройство не располагает.

Вот, собственно, и всё, чем я хотел с вами поделиться. Пробуйте, комментируйте, задавайте вопросы.

Я некоторое время (2 года назад) пользовался бесплатным но не опенсорс MP3 кодеком SCMPX. И заметил что параметры 128VBR + JointStereo давали такой-же размер файла как кодек LAME при 128 постоянного битрейта. Но при этом качество MP3 файла получалось даже лучше чем у LAME при 192 постоянного битрейта. Не помню почему я не делал переменный битрейт в LAME. Толи он ещё не умел толи я не понял как им пользоватся.

Какова ситуация сейчас? Как другие кодеки? Они лучше или хуже? Например у кого есть опыт с кодеком Blade.

И ещё какие минимальные параметры для OGG поставить что-бы качество было как у SCMPX при 128VBR JointStereo? Только сначала "зацените" это качество на ОДНОМ файле.


Я вообще в LAME ставлю --abr 192, размеры получаются небольшие с
хорошим качеством, а для особо привередлевых есть возможность
покрутить ATH и PSY, ну и поиграться еще с lowpass или highpass.

> размеры получаются небольшие с хорошим качеством

"небольшие" это сколько? Как у LAME MP3 при 128 постоянного битрейта?

> ставлю --abr 192

Я не помню на память ключей LAME'a. Что этот параметр означает? Битрейт? Переменный? Постоянный?

> для особо привередлевых есть возможность покрутить ATH и PSY, ну и поиграться еще с lowpass или highpass

Я не привередливый. Но это наверно всё для конкретного файла смотреть надо?


Два года назад сравнивал lame, blade, fraunhofer в разных режимах. На мой слух лучшие результаты дал lame именно с постоянным битрейтом. На своей аппаратуре я уже переставал слышать разницу в записях начинвя с битрейта 192, на нем и остановился, и пишу сейчас только с ним.
Кроме сравнения на слух, сравнивал еще и анализаторами спектра. На вид пришел к тем же выводам.
Кроме того, на iXBT регулярно печатали результаты тестирования разных кодеков. Результаты у них совпали с моими (в целом, т.к. естественно у профи измерялось больше параметров, и разброс результатов был шире, чем у меня).
Кодек, который вы указали, никогда мне не попадался.
Да, худшим оказался blade.
Кроме того, помимо качества, lame оказался и самым быстрым, что тоже немаловажно.

А как на счет ogg? Как у него качество? (нопример стандартная ogg vorbis tool - oggenc)

Читайте также: