Enhanced full rate codec что это

Обновлено: 06.07.2024

EFR CODEC (Enhanced Full Rate) - кто-нибудь пользовался?

Enhanced Full Rate, EFR — стандартизованный алгоритм цифрового кодирования голоса в широкополосном GSM, а также кодек, реализованный на его основе. Является продолжением развития алгоритма Full Rate (FR), разработан на его основе. Работает со скоростью 12,2 Кбит/с и обеспечивает хорошее качество связи, свободное от посторонних шумов. Хотя кодек Enhanced Full Rate значительно улучшает качество связи, он имеет бо’льшую вычислительную сложность, которая приводит к увеличению потребления энергии мобильным аппаратом примерно на 5 % по сравнения со «старым» Full Rate кодеком.

Half Rate, HR - значительно ухудшает качество речи, но экономит аккумулятор где-то на 30%. Опять же, должен поддерживаться сотовым оператором. Второе название: Альтернативный кодек звукового качества (alternative sound quality codec)

В Мегафоне мне сказали что услуга поддерживается сетью, но не всеми телефонами.

Клавишу посыла вызова не нажимать!
Если аппарат поддерживает услугу он должен перезагрузиться сам.

Отсюда возникает вопрос: кто-нибудь пользовался данными услугами и если да, то на каком телефоне?

Последний раз редактировалось mmy3 28 окт 2011, 11:28, всего редактировалось 2 раза.

Как профессиональный связник который себе зубы сьел в том числе и на голосовом кодировании я могу сказать что кодек этот как неуловимый джо, нахрен никому не нужен. Более того, я никогда не видел чтобы кто-то им активно пользовался, хотя почти все оборудование его поддерживает.

Ибо самым ценным ресурсом в любой сети передачи данных является полоса пропускания, и все прогрессивные разработки преследуют цель более эффективной утилизации полосы.

GSM HR весит вдвое меньше чем GSM FR. Этим все сказано.

На перегруженой сети (а сети все перегружены) даже если вам удастся включить full rate кодек и оператор позволит вашему телефону им работать в качестве связи вы потеряете.

Свящщени котэ посылае волшебны пяни, мелки, сочни и сладки

Затраты на хранение данных зачастую становятся основным пунктом расходов при создании системы видеонаблюдения. Впрочем, они были бы несравнимо больше, если бы в мире не существовало алгоритмов, способных сжимать видеосигнал. О том, насколько эффективны современные кодеки, и какие принципы лежат в основе их работы, мы и поговорим в сегодняшнем материале.

Для большей наглядности начнем с цифр. Пускай видеозапись будет вестись непрерывно, в разрешении Full HD (сейчас это уже необходимый минимум, во всяком случае, если вы хотите полноценно использовать функции видеоаналитики) и в режиме реального времени (то есть, с фреймрейтом 25 кадров в секунду). Предположим также, что выбранное нами оборудование поддерживает аппаратное кодирование H.265. В этом случае при разных настройках качества изображения (высоком, среднем и низком) мы получим примерно следующие результаты.

Кодек

Интенсивность движения в кадре

Использование дискового пространства за сутки, ГБ

H.265 (Высокое качество)

H.265 (Среднее качество)

H.265 (Низкое качество)

Но если бы сжатия видео не существовало в принципе, мы бы увидели совсем иные цифры. Попробуем разобраться, почему. Видеопоток представляет собой не что иное, как последовательность статичных картинок (кадров) в определенном разрешении. Технически каждый кадр является двумерным массивом, содержащим информацию об элементарных единицах (пикселях), формирующих изображение. В системе TrueColor для кодирования каждого пикселя требуется 3 байта. Таким образом, в приведенном примере мы бы получили битрейт:

Учитывая, что в сутках 86400 секунд, цифры выходят поистине астрономические:

148×86400/1024=12487 ГБ

Итак, если бы мы записывали видео без сжатия в максимальном качестве при заданных условиях, то для хранения данных, полученных с одной единственной видеокамеры в течение суток нам бы потребовалось 12 терабайт дискового пространства. Но даже система безопасности квартиры или малого офиса предполагает наличие, как минимум, двух устройств видеофиксации, тогда как сам архив необходимо сохранять в течение нескольких недель или даже месяцев, если того требует законодательство. То есть, для обслуживания любого объекта, даже весьма скромных размеров, потребовался бы целый дата-центр!

К счастью, современные алгоритмы сжатия видео помогают существенно экономить дисковое пространство: так, использование кодека H.265 позволяет сократить объем видео в 90 (!) раз. Добиться столь впечатляющих результатов удалось благодаря целому стеку разнообразных технологий, которые давно и успешно применяются не только в сфере видеонаблюдения, но и в «гражданском» секторе: в системах аналогового и цифрового телевидения, в любительской и профессиональной съемке, и многих других ситуациях.

Наиболее простой и наглядный пример — цветовая субдискретизация. Так называют способ кодирования видео, при котором намеренно снижается цветовое разрешение кадров и частота выборки цветоразностных сигналов становится меньше частоты выборки яркостного сигнала. Такой метод сжатия видеоданных полностью оправдан как с позиции физиологии человека, так и с точки зрения практического применения в области видеофиксации. Наши глаза хорошо замечают разницу в яркости, однако гораздо менее чувствительны к перепадам цвета, именно поэтому выборкой цветоразностных сигналов можно пожертвовать, ведь большинство людей этого попросту не заметит. В то же время, сложно представить, как в розыск объявляют машину цвета «паука, замышляющего преступление»: в ориентировке будет написано «темно-серый», и это правильно, ведь иначе прочитавший описание авто даже не поймет, о каком оттенке идет речь.

А вот со снижением детализации все оказывается уже совсем не так однозначно. Технически квантование (то есть, разбиение диапазона сигнала на некоторое число уровней с последующим их приведением к заданным значениям) работает великолепно: используя данный метод, размер видео можно многократно уменьшить. Но так мы можем упустить важные детали (например, номер проезжающего вдалеке автомобиля или черты лица злоумышленника): они окажутся смазаны и такая запись будет для нас бесполезной. Как же поступить в этой ситуации? Ответ прост, как и все гениальное: стоит взять за точку отсчета динамические объекты, как все тут же становится на свои места. Этот принцип успешно используется со времен появления кодека H.264 и отлично себя зарекомендовал, открыв ряд дополнительных возможностей для сжатия данных.

Это было предсказуемо: разбираемся, как H.264 сжимает видео

Вернемся к таблице, с которой мы начали. Как видите, помимо таких параметров, как разрешение, фреймрейт и качество картинки решающим фактором, определяющим конечный размер видео, оказывается уровень динамичности снимаемой сцены. Это объясняется особенностями работы современных видеокодеков вообще, и H.264 в частности: используемый в нем механизм предсказания кадров позволяет дополнительно сжимать видео, при этом практически не жертвуя качеством картинки. Давайте посмотрим, как это работает.

Кодек H.264 использует несколько типов кадров:

I-кадры (от английского Intra-coded frames, их также принято называть опорными или ключевыми) — содержат информацию о статичных объектах, не меняющихся на протяжении длительного времени.
P-кадры (Predicted frames, предсказанные кадры, также именуемые разностными) — несут в себе данные об участках сцены, претерпевших изменения по сравнению с предыдущим кадром, а также ссылки на соответствующие I-кадры.
B-кадры (Bi-predicted frames, или двунаправленные предсказанные кадры) — в отличие от P-кадров, могут ссылаться на I-, P- и даже другие B-кадры, причем как на предыдущие, так и на последующие.

[НАЧАЛО СЪЕМКИ] I-P-P-P-P-P-P-P-P-P-P-P-P-P- .

Поскольку в процессе вычитания возможны ошибки, приводящие к появлению графических артефактов, то через какое-то количество кадров схема повторяется: вновь формируется опорный кадр, а вслед за ним — серия кадров с изменениями.

Полное изображение формируется путем «наложения» P-кадров на опорный кадр. При этом появляется возможность независимой обработки фона и движущиеся объектов, что позволяет дополнительно сэкономить дисковое пространство без риска упустить важные детали (черты лиц, автомобильные номера и т. д.). В случае же с объектами, совершающими однообразные движения (например, вращающимися колесами машин) можно многократно использовать одни и те же разностные кадры.

Независимая обработка статических и динамических объектов позволяет сэкономить дисковое пространство

Данный механизм носит название межкадрового сжатия. Предсказанные кадры формируются на основе анализа широкой выборки зафиксированных состояний сцены: алгоритм предвидит, куда будет двигаться тот или иной объект в поле зрения камеры, что позволяет существенно снизить объем записываемых данных при наблюдении за, например, проезжей частью.

Кодек формирует кадры, предсказывая, куда будет двигаться объект

В свою очередь, использование двунаправленных предсказанных кадров позволяет в несколько раз сократить время доступа к каждому кадру в потоке, поскольку для его получения будет достаточно распаковать только три кадра: B, содержащий ссылки, а также I и P, на которые он ссылается. В данном случае цепочку кадров можно изобразить следующим образом.

[НАЧАЛО СЪЕМКИ] I-B-P-B-P-B-P-B-P-B-P-B-P-B-P-B-P-…

Такой подход позволяет существенно повысить скорость быстрой перемотки с показом и упростить работу с видеоархивом.

В чем разница между H.264 и H.265?

В H.265 используются все те же принципы сжатия, что и в H.264: фоновое изображение сохраняется единожды, а затем фиксируются лишь изменения, источником которых являются движущиеся объекты, что позволяет значительно снизить требования не только к объему хранилища, но и к пропускной способности сети. Однако в H.265 многие алгоритмы и методы прогнозирования движения претерпели значительные качественные изменения.

Так, обновленная версия кодека стала использовать макроблоки дерева кодирования (Coding Tree Unit, CTU) переменного размера с разрешением до 64×64 пикселей, тогда как ранее максимальный размер такого блока составлял лишь 16×16 пикселей. Это позволило существенно повысить точность выделения динамических блоков, а также эффективность обработки кадров в разрешении 4K и выше.

Кроме того, H.265 обзавелся улучшенным deblocking filter — фильтром, отвечающим за сглаживание границ блоков, необходимым для устранения артефактов по линии их стыковки. Наконец, улучшенный алгоритм прогнозирования вектора движения (Motion Vector Predictor, MVP) помог заметно снизить объем видео за счет радикального повышения точности предсказаний при кодировании движущихся объектов, чего удалось достичь за счет увеличения количества отслеживаемых направлений: если ранее учитывалось лишь 8 векторов, то теперь — 36.

Помимо всего перечисленного выше, в H.265 была улучшена поддержка многопоточных вычислений: квадратные области, на которые разбивается каждый кадр при кодировании, теперь могут обрабатываться независимо одна от другой. Появилась и поддержка волновой параллельной обработки данных (Wavefront Parallelel Processing, WPP), что также способствует повышению производительности сжатия. При активации режима WPP обработка CTU осуществляется построчно, слева направо, однако кодирование каждой последующей строки может начаться еще до завершения предыдущей в том случае, если данных, полученных из ранее обработанных CTU, для этого достаточно. Кодирование различных строк CTU с временной задержкой со сдвигом, наряду с поддержкой расширенного набора инструкций AVX/AVX2 позволяет дополнительно повысить скорость обработки видеопотока в многоядерных и многопроцессорных системах.

Флэш-карты для видеонаблюдения: когда значение имеет не только размер

И вновь вернемся к табличке, с которой мы начали сегодняшний разговор. Давайте подсчитаем, сколько дискового пространства нам понадобится в том случае, если мы хотим хранить видеоархив за последние 30 дней при максимальном качестве видеозаписи:

138×30/1024 = 4

По нынешним меркам 4 терабайта для винчестера индустриального класса — практически ничто: современные жесткие диски для видеонаблюдения имеют емкость до 14 терабайт и могут похвастаться рабочим ресурсом до 360 ТБ в год при MTBF до 1.5 миллионов часов. Что же касается карт памяти, то здесь все оказывается не так однозначно.

В IP-камерах флэш-карты играют роль резервных хранилищ: данные на них постоянно перезаписываются, чтобы в случае потери связи с видеосервером недостающий фрагмент видеозаписи можно было восстановить из локальной копии. Такой подход позволяет существенно повысить отказоустойчивость всей системы безопасности, однако при этом сами карты памяти испытывают колоссальные нагрузки.

При бытовом использовании подобное попросту невозможно, поэтому даже самая бюджетная карта памяти способна прослужить вам несколько лет к ряду без единого сбоя. А все благодаря алгоритмам выравнивания износа (wear leveling). Схематично их работу можно описать следующим образом. Пусть в нашем распоряжении есть новенькая флеш-карта, только что из магазина. Мы записали на нее несколько видеороликов, использовав 7 из 16 гигабайт. Через некоторое время мы удалили часть ненужных видео, освободив 3 гигабайта, и записали новые, объем которых составил 2 ГБ. Казалось бы, можно задействовать только что освободившееся место, однако механизм выравнивания износа выделит под новые данные ту часть памяти, которая ранее никогда не использовалась. Хотя современные контроллеры «тасуют» биты и байты куда более изощренно, общий принцип остается неизменным.

Напомним, что кодирование битов информации происходит путем изменения заряда в ячейках памяти за счет квантового туннелирования электронов сквозь слой диэлектрика, что вызывает постепенный износ диэлектрических слоев с последующей утечкой заряда. И чем чаще меняется заряд в конкретной ячейке, тем раньше она выйдет из строя. Выравнивание износа как раз направлено на то, чтобы каждая из доступных ячеек перезаписывалась примерно одинаковое количество раз и, таким образом, способствует увеличению срока службы карты памяти.

Нетрудно догадаться, что wear leveling перестает играть хоть сколько-нибудь значимую роль в том случае, если флэш-карта постоянно перезаписывается целиком: здесь на первый план уже выходит выносливость самих чипов. Наиболее объективным критерием оценки последней является максимальное количество циклов программирования/стирания (program/erase cycle), или, сокращенно, циклов P/E, которое способно выдержать флеш-память. Также достаточно точным и в данном случае наглядным (так как мы можем заранее рассчитать объемы перезаписи) показателем является коэффициент TBW (Terabytes Written). Если в технических характеристиках указан лишь один из перечисленных показателей, то вычислить другой не составит особого труда. Достаточно воспользоваться следующей формулой:

TBW = (Емкость × Количество циклов P/E)/1000

Так, например, TBW флеш-карты емкостью 128 гигабайт, ресурс которой составляет 200 P/E, будет равен: (128 × 200)/1000 = 25,6 TBW.

Давайте считать дальше. Выносливость карт памяти потребительского уровня составляет 100–300 P/E, и 300 — это в самом лучшем случае. Опираясь на эти цифры, мы можем с достаточно высокой точностью оценить срок их службы. Воспользуемся формулой и заполним новую таблицу для карты памяти емкостью 128 ГБ. Возьмем за ориентир максимальное качество картинки в Full HD, то есть в сутки камера будет записывать 138 ГБ видео, как мы выяснили ранее.

Мы включили HD-Voice на сети «Билайн» в Москве. Ниже записи звука до и после, а также технические детали.

В основе режима HD-voice лежит технология AMR-WB (Adaptive Multi Rate Wadeband) – широкополосное адаптивное кодирование с переменной скоростью, также данный кодек известен как стандарт G.722.22. В теории человек может услышать звуки в диапазоне 20Гц – 20кГц, но на практике достаточно передавать звук в существенно более узком диапазоне. При кодировании речи в AMR-WB используется диапазон частот 50Гц-7кГЦ, этого абсолютно достаточно для полноценной передачи голоса. Для примера, в кодеке AMR используется диапазон 300-3кГц. Метод может использоваться в сетях 2G и 3G.

Проще говоря, теперь человеческий голос будет звучать естественнее, потому что перестанет «ужиматься» в довольно узкую полосу, необходимость которой была когда-то продиктована ограничениями инфраструктуры. Кроме того, при HD-кодировании, внешние шумы оказывают меньшее воздействие на разборчивость речи.

Как мы дошли до HD-Voice, и как это работает?

Самым первым голосовым кодеком, использовавшимся в мобильных сетях, был «Full Rate» — FR. Одновременно с FR, был введен и кодек «Half Rate», единственное предназначение которого – увеличение количества одновременно обслуживаемых абонентов, и, как понятно из его названия, он занимает в радиоканале половину полосы кодека FR. Однако качество голоса после перекодирования в FR, было не очень высоким, а для некоторых стран (к примеру, арабских, где скорость речи высокая и много высочастотных звуков), и вовсе неприемлемым. Поэтому кодек FR был переработан, и появился «Enhanced Full Rate», обеспечивающий существенно лучшее качество голоса, при меньшем создаваемом битрейте.

С ростом проникновения мобильных сетей, требования к качеству голосовых услуг стали расти, и проявилась проблема с ухудшением качества голоса, при низком уровне радиосигнала от базовой станции. Для решения этой задачи, был разработан новый кодек — «Adaptive Multi Rate», который использовал тот же диапазон частот для анализа и сжатия, но алгоритм был реализован таким образом, что битрейт кодека динамически менялся, в зависимости от качества принимаемого сигнала. Благодаря этому, появилась возможность при хороших радиоусловиях предоставить отличное качество голоса, а при плохих – сохранять разговор даже там, где кодеки FR/EFR не смогли бы работать вовсе.

Все сети 3G работают только с использованием кодека AMR или последующих его реализаций, например AMR-WB. Но поскольку в сети остается большое количество абонентов использующих телефоны поддерживающие только работу с кодеками EFR/HR, сеть 2G продолжает работать со всеми кодеками (FR/EFR/HR/AMR FR/AMR HR) сразу, обеспечивая голосовой связью любой телефон.

Hint для любознательных программистов: образец реализации кодека AMR на языке Си имеется в стандарте 3GPP TS 26.073 (его можно легко найти, скачать и попробовать реализовать).

На диаграмме ниже можно увидеть сравнение качества голоса, по шкале MOS (Mean Opinion Score), в зависимости от используемого кодека. Шкала MOS – субъективная оценка качества голоса от 0 до 5, где 0 – полное отсутствие слышимости, а 5 – живая речь. Кодек G.711 – применяется в проводной телефонии, то есть это качество которое вы должны слышать со своего городского телефона (если он, конечно, не переведен на IP канал, но это тема совсем другого разговора).

Update: В комментариях справедливо указали что средняя оценка MOS для кодека G.711 — около 4.1, эта картинка немного искажает действительность.
Как видно из диаграммы (и учитывая информацию из Update), кодек AMR-WB, обеспечивает, при хороших радиоусловиях, качество голоса аналогичное тому, к которому мы привыкли при использовании проводного домашнего телефона.

Для примера – два фрагмента музыкальной композиции, которые сжимались кодеками AMR и AMR-WB, можете сами сравнить качество звука, и визуально оценить разницу в звуковой картине, создаваемой разными кодеками.

Верхний трек, кодированный в AMR

Нижний трек, кодированный в AMR-WB

Тесты

Мы не первые, кто запускает эту технологию в России, поэтому кое-какие наработки уже были. Наш первый участок сети с HD-Voice был построен в пределах МКАД, на оборудовании Ericsson. Активирование AMR-WB заняло длительное время: сначала проходило тестирование на одном контроллере (с многочисленными драйв-тестами по измерению качества речи). И даже после того как на одном контроллере все было протестировано, последующая активация проходила поэтапно, контроллер за контроллером. Весь процесс активирования занял почти полгода.

Вот эталонные сэмплы с финала тестов, которые оценивались аппаратно с помощью точных замеров в разные моменты.

Это уже работает?

Да, сейчас технология реализована в сети 3G для Москвы. Для того, чтоб воспользоваться режимом, не нужно производить дополнительных настроек, он активизируется сам, если оба абонента находятся в сети 3G и оба их телефона поддерживают работу кодека.

На схеме изображены условия, которые нужны для функционирования AMR-WB. Сейчас как говорилось выше, кодек запущен в сети 3G, следующий этап обеспечить работу кодека между сетью 2G и 3G, далее — между сетями и между операторами.

Какие устройства поддерживаются?

Alcatel One Touch 903
Alcatel One Touch 916/916D
Alcatel One Touch 918
Alcatel One Touch 983
Alcatel One Touch 985/985D
Alcatel One Touch 991/991D/991T
Alcatel One Touch 992D
Alcatel One Touch 993/993D
Alcatel One Touch 995/996
Alcatel One Touch Idol
Alcatel One Touch Idol Ultra
Alcatel One Touch Scribe Easy
Alcatel One Touch Scribe HD
Alcatel One Touch Star
Alcatel One Touch Tribe
Alcatel One X'POP
Apple iPhone 5
Apple iPhone 5S
Apple iPhone 5C
BlackBerry Q10
BlackBerry Q5
BlackBerry Torch 9810
BlackBerry Z10
BlackBerry Z30
HTC Desire 500
HTC ChaCha
HTC Desire C
HTC Desire HD
HTC Desire S
HTC Desire X
HTC Desire Z
HTC EVO 3D
HTC Incredible
HTC One
HTC One mini
HTC One S
HTC One SV
HTC One V
HTC One X
HTC One X+
HTC One XL
HTC One (M8)
HTC Radar
HTC Raider
HTC Rhyme
HTC Sensation
HTC Sensation XE
HTC Sensation XL
HTC Titan
HTC Touch HD
HTC Wildfire S
HTC Windows Phone 8X
HTC Windows Phone 8S
Huawei Ascend D Quad
Huawei Ascend D2 LTE (VoLTE)
Huawei Ascend G510
Huawei Ascend G740
Huawei Ascend P1 U9200
Huawei Ascend P2
Huawei Ascend P6
Huawei Boulder U8350
LG A310
LG Nexus 4 E960
LG Nexus 5
LG Optimus 3D
LG Optimus G
LG Optimus G Pro
LG Optimus L4 II
LG Optimus L5
LG Optimus L5 II
LG Optimus L7
LG Optimus L7 II
LG Optimus L9
LG Optimus LTE2 F160LV (VoLTE)
LG Optimus F7
LG Optimus F180S (VoLTE)
LG Optimus Vu2 F200 (K,L,S) (VoLTE)
LG Optimus Vu3 F300 (K,L,S) (VoLTE)
LG Optimus GX F310L (VoLTE)
LG Optimus G2 F320S (VoLTE)
LG Optimus G Pro F240S (VoLTE)
LG Optimus LTE III F260S (VoLTE)
LG Optimus G Flex F340S (VoLTE)
LG Optimus 3D Max (P720)
LG Optimus 3D (P920)
LG Optimus 4X HD (P880)
LG Prada (P940)
LG Prada 3.0
Motorola Quench
Motorola RAZR (XT910)
Motorola RAZR i (XT890)
Motorola Moto G
Nokia 300
Nokia 301
Nokia 302
Nokia 500
Nokia 515
Nokia 600
Nokia 603
Nokia 700
Nokia 701
Nokia 808 PureView
Nokia 5230
Nokia 5330 Mobile TV Edition
Nokia 5530 XpressMusic
Nokia 5630 XpressMusic
Nokia 5730 XpressMusic
Nokia 6260 Slide
Nokia 6600i slide
Nokia 6700 classic
Nokia 6700 slide
Nokia 6710 Navigator
Nokia 6720 classic
Nokia 6760 slide
Nokia 6790 slide
Nokia 7230
Nokia Asha 300
Nokia Asha 301
Nokia Asha 302
Nokia Asha 303
Nokia Asha 311
Nokia C2-01
Nokia C3-01 Touch and Type
Nokia C5-03
Nokia C5-04
Nokia C6-00
Nokia C6-01
Nokia C7-00
Nokia E5-00
Nokia E52
Nokia E55
Nokia E6-00
Nokia E63
Nokia E7 Communicator
Nokia E7-00
Nokia E71x
Nokia E72
Nokia E73 Mode
Nokia Lumia 510
Nokia Lumia 520
Nokia Lumia 520.2
Nokia Lumia 521
Nokia Lumia 610
Nokia Lumia 610 NFC
Nokia Lumia 620
Nokia Lumia 625
Nokia Lumia 710
Nokia Lumia 720
Nokia Lumia 800
Nokia Lumia 810
Nokia Lumia 820
Nokia Lumia 822
Nokia Lumia 900
Nokia Lumia 920
Nokia Lumia 920T
Nokia Lumia 925
Nokia Lumia 925 Superman Edition
Nokia Lumia 925T
Nokia Lumia 928
Nokia Lumia 929 LTE-A (Cat 4)
Nokia Lumia 1020.2
Nokia Lumia 1020 3G
Nokia Lumia 1020 LTE
Nokia Lumia 1520
Nokia N7
Nokia N8
Nokia N86 8MP
Nokia N9
Nokia N97
Nokia N97 mini
Nokia X3-02
Nokia X5
Nokia X6-00
Nokia X7-00
Samsung Galaxy Star
Samsung Galaxy Light
Samsung Ativ S
Samsung Galaxy Ace
Samsung Galaxy Ace 2
Samsung Galaxy Express
Samsung Galaxy Fame
Samsung Galaxy Mini
Samsung Galaxy Mini 2
Samsung Galaxy Nexus
Samsung Galaxy Note
Samsung Galaxy Note II
Samsung Galaxy Note 3
Samsung Galaxy Note 10.1
Samsung Galaxy S II
Samsung Galaxy S III
Samsung Galaxy S4
Samsung Galaxy S4 Mini
Samsung Galaxy S5
Samsung Galaxy S Advance
Samsung Galaxy S Plus
Samsung Galaxy W
Samsung Galaxy Y
Samsung Omnia 7
Samsung Omnia Pro B7350
Samsung S5610
Samsung Wave 3
Samsung Trend Plus
Sony Ericsson Elm
Sony Ericsson Hazel
Sony Ericsson Live with Walkman
Sony Ericsson Xperia X8
Sony Ericsson Xperia X10 Mini
Sony Ericsson Xperia X10 mini pro
Sony Ericsson Xperia acro
Sony Ericsson Xperia active
Sony Ericsson Xperia Arc
Sony Ericsson Xperia arc S
Sony Ericsson Xperia mini
Sony Ericsson Xperia Mini Pro
Sony Ericsson Xperia neo
Sony Ericsson Xperia neo V
Sony Ericsson Xperia Play
Sony Ericsson Xperia ray
Sony Ericsson W995
Sony Xperia A SO-04E
Sony Xperia acro S
Sony Xperia E
Sony Xperia E dual C1605
Sony Xperia Go (ST27i)
Sony Xperia i1 HSPA+ C6902
Sony Xperia i1 LTE
Sony Xperia ion
Sony Xperia J
Sony Xperia L
Sony Xperia M
Sony Xperia M35t (VoLTE)
Sony Xperia miro
Sony Xperia P
Sony Xperia S
Sony Xperia Sola
Sony Xperia SP
Sony Xperia T
Sony Xperia Tipo
Sony Xperia Tipo Dual
Sony Xperia U
Sony Xperia V
Sony Xperia Z
Sony Xperia ZL
Sony Xperia ZR
Sony Xperia Z1
Sony Xperia Z1S (T Mobile US only)
Sony Xperia Z1 Compact LTE-A D5503
Sony Xperia Z2 LTE-A D6543/D6503
TechFaith Wildfire 80
ZTE Blade V880
ZTE Crescent (San Francisco 2 on Orange)
ZTE Era
ZTE F160 Atlanta
ZTE Grand X
ZTE Grand X IN
ZTE Orbit
ZTE R252 / Orange Tara
ZTE Kis Pro / Orange Zali
ZTE Skate (Monte Carlo on Orange)
ZTE Smart Netphone 701
ZTE Tania
ZTE TMN smart A15

Проблемы распознавания

Человеческая речь такова, что в радиоэфире и на узкой полосе аудиоспектра плохо различаются звуки «С» и «Ф». Также страдают пары «Т» и «П», «М» и «Н». Отсюда мнемонический системы с именами: «Диктую, номер два-ноль-ноль три Ольги, как понял, приём?». Отсюда же растут вещи вроде назначения наиболее ответственным частям позывных с «р» — например, снайпер, который ни в коем случае не должен перепутать свой позывной, скорее всего, будет «тридцать третьим», потому что в эфире это очень хорошо различимо в условиях узкой полосы.

Также с HD-Voice растёт узнаваемость голоса. Это важно и для личного общения, и для набирающей популярность дополнительной аутентификации по голосу, к примеру, в банках.

Полная скорость ( FR или GSM-FR или GSM 06.10 или иногда просто GSM ) была первым стандартом цифрового кодирования речи, используемым в цифровой системе мобильной связи GSM . Он использует кодирование с линейным предсказанием (LPC). Битрейт кодека составляет 13 кбит / с или 1,625 бит / аудиосэмпл (часто дополняется до 33 байтов / 20 мс или 13,2 кбит / с). Качество закодированной речи довольно низкое по современным стандартам, но во время разработки (начало 1990-х годов) это был хороший компромисс между вычислительной сложностью и качеством, требующий всего порядка миллиона сложений и умножений в секунду. Кодек до сих пор широко используется в сетях по всему миру. Постепенно FR будет заменен стандартами Enhanced Full Rate (EFR) и Adaptive Multi-Rate (AMR), которые обеспечивают гораздо более высокое качество речи при более низкой скорости передачи данных.

СОДЕРЖАНИЕ

Технологии

GSM-FR определен в ETSI 06.10 (ETS 300 961) и основан на парадигме кодирования речи RPE-LTP ( регулярное импульсное возбуждение - долгосрочное прогнозирование ). Как и многие другие речевые кодеки с линейным кодированием с предсказанием (LPC), в фильтре синтеза используется линейное предсказание . Однако, в отличие от большинства современных речевых кодеков, порядок линейного предсказания составляет только 8. В современных узкополосных речевых кодеках порядок обычно равен 10, а в широкополосных речевых кодеках порядок обычно равен 16.

Кодек работает со 160 кадрами выборки, которые охватывают 20 мс, так что это минимальная возможная задержка транскодера даже с бесконечно быстрыми процессорами и нулевой сетевой задержкой. Эксплуатационное требование заключается в том, чтобы задержка транскодера была менее 30 мс. Задержка транскодера определяется как временной интервал между моментом, когда речевой кадр из 160 выборок был принят на входе кодера, и моментом, когда соответствующие 160 восстановленных речевых выборок были выданы речевым декодером с частотой дискретизации 8 кГц.

Реализации

Бесплатный кодек libgsm может кодировать и декодировать звук GSM Full Rate. "libgsm" был разработан в 1992–1994 гг. Юттой Дегенер и Карстеном Борманом, затем в Техническом университете Берлина . Поскольку речевой кадр GSM составляет 32,5 байта, эта реализация также определила 33-байтовое представление кадра GSM с заполнением полубайтами (которое при частоте кадров 50 / с является основанием для неверного утверждения о том, что скорость передачи данных GSM равна 13,2 кбит / с). Этот кодек также может быть скомпилирован в Wine для обеспечения поддержки звука GSM.

Также существует плагин Winamp для необработанного GSM 06.10 на основе libgsm.

GSM 06.10 также используется в программном обеспечении VoIP , например, в Ekiga , QuteCom , Linphone , Asterisk (PBX) , Ventrilo и других.

Читайте также: