Минимальная задержка voip что это

Обновлено: 06.07.2024

Один из самых важных факторов, которые необходимо рассмотреть при создании сети для пакетной передачи данных — планирование пропускной способности. В рамках планирования пропускной способности, результаты расчета пропускной способности также являются важным фактором, который следует учитывать при проектировании и устранении неполадок в сетях пакетной передачи данных для обеспечения высокого качества голоса.

В этом документе описывается расчет пропускной способности голосового кодека, а также функции, обеспечивающие изменение или экономию пропускной способности при использовании VoIP.

Предварительные условия

Требования

Для данного документа нет особых требований.

Используемые компоненты

Данный документ не ограничивается отдельными версиями программного и аппаратного обеспечения.

Условные обозначения

Дополнительные сведения об условных обозначениях см. в документе Технические рекомендации Cisco. Условные обозначения.

VoIP — потребление пропускной способности на один вызов

Для расчета используются следующие исходные параметры заголовков протокола:

Заголовки: 40 байт для IP (20 байт) / UDP (8 байт) / RTP (12 байт).

Протокол cRTP уменьшает заголовки IP/UDP/RTP до 2 или 4 байт (cRTP нельзя использовать через Ethernet).

6 байт для протокола MP или FRF.12 Layer 2 (L2).

1 байт для флага конца кадра MP и Frame Relay.

18 байт для заголовков Ethernet L2, включая 4 байта для функции Frame Check Sequence (FCS) или Cyclic Redundancy Check (CRC).

Данные о кодеке

Расчеты пропускной способности

Скорость кодека (Кбит/с)

Величина выборки кодека (байт)

Интервал выборки кодека (мс)

Значение MOS (Mean Opinion Score)

Размер полезной части голосового пакета (байт)

Размер полезной части голосового пакета (мс)

Число пакетов в секунду (PPS)

Пропускная способность для MP или FRF.12 (Кбит/с)

Пропускная способность для MP или FRF.12 с исп. cRTP (Кбит/с)

Пропускная способность для Ethernet (Кбит/с)

Объяснение терминов

Скорость кодека (Кбит/с)

В зависимости от используемого кодека, это количество бит, передаваемых в секунду, которое необходимо передать для доставки голосового вызова. (скорость кодека = значение выборки кодека / интервал выборки кодека).

Значение выборки кодека (байт)

Значение выборки зависит от используемого кодека, это количество байт, которое DSP обрабатывает в течение каждого интервала выборки кодека. Например, кодер G.729 работает с интервалом выборки 10 мс, что соответствует значению выборки 10 байт (80 бит) и скорости 8 Кбит/с. (скорость кодека = значение выборки кодека / интервал выборки кодека).

Интервал выборки кодека (мс)

Интервал выборки, с которым работает кодек. Например, кодер G.729 работает с интервалом выборки 10 мс, что соответствует значению выборки 10 байт (80 бит) и скорости 8 Кбит/с. (скорость кодека = значение выборки кодека / интервал выборки кодека).

MOS — это система классификации качества голоса для телефонных подключений. При использовании MOS большая группа слушателей оценивает качество образца звука от 1 (плохое) до 5 (отлично). В результате усреднения оценок получается значение MOS для кодека.

Размер полезной части голосового пакета (байт)

Размер полезной части голосового пакета обозначает количество байт (или бит) в пакете, которое используется для голосовых данных. Размер полезной части голосового пакета должен быть кратен значению выборки кодека. Например, пакеты G.729 могут использовать следующие значения полезной нагрузки голосовых данных: 10, 20, 30, 40, 50 или 60.

Размер полезной части голосового пакета (мс)

Размер полезной части голосового пакета также можно представить в виде выборок кодека. Например, размер полезной части голосового пакета для G.729, составляющий 20 мс (две выборки длиной 10 мс), представляет размер полезной части пакета 20 байт [ (20 байт * 8) / (20 мс) = 8 Кбит/с ]

Значение PPS (пакетов в секунду) представляет количество пакетов, которое необходимо передавать каждую секунду, для поддержки скорости кодека. Например, для вызова G.729 с размером полезной части голосового пакета 20 байт (160 бит), за каждую секунду необходимо передавать 50 пакетов [50 pps = (8 Кбит/с) / (160 бит на пакет) ]

Формулы расчета пропускной способности

Используются следующие расчеты:

Общий размер пакета = (Заголовок L2: MP, FRF.12 или Ethernet) + (заголовок IP/UDP/RTP) + (размер полезной части голосового пакета)

PPS = (скорость кодека) / (размер полезной части голосового пакета)

Пропускная способность = общий размер пакета * PPS

Пример расчета

Например, для вызова G.729 (скорость кодека 8 кбит/с) с cRTP, MP и стандартной 20-байтной полезной частью голосового пакета необходимая полоса пропускания составляет:

Общий размер пакета (байт) = (заголовок MP, 6 байт) + (сжатый заголовок IP/UDP/RTP, 2 байт) + (размер полезной части пакета, байт

Общий размер пакета (бит) = (28 байт) * 8 бит = 224 бита

PPS = (скорость кодека, 8 Кбит/c) / (160 бит) = 50 pps

Примечание: 160 бит = 20 байт (стандартный размер полезной части голосового пакета) * 8 бит

Пропускная способность на один вызов = размер голосового пакета (224 бит) * 50 pps = 11,2 Кбит/с

Настройка размера полезной части голосового пакета для шлюзов Cisco CallManager и IOS

Размер полезной части голосового пакета можно настроить на шлюзах Cisco CallManager и Cisco IOS.

Примечание: Если шлюз Cisco IOS настроен в качестве шлюза MGCP с помощью Cisco CallManager, все параметры кодека (тип кодека, размер полезной части пакета, обнаружение голосовой активности и т. п.) определяются приложением Cisco CallManager.

В приложении Cisco CallManager размер полезной части голосового пакета настраивается для всей системы. Этот атрибут настраивается в окне Cisco CallManager Administration (Service > Service Parameters > select_server > Cisco CallManager) с помощью трех следующих сервисных параметров:

PreferredG711MillisecondPacketSize—(Значение по умолчанию: 20 мс. Доступные значения: 10, 20 и 30 мс.)

PreferredG729MillisecondPacketSize—(Значение по умолчанию: 20 мс. Доступные значения: 10, 20, 30, 40, 50 и 60 мс.)

PreferredG723MillisecondPacketSize—(Значение по умолчанию: 30 мс. Доступные значения: 30 и 60 мс.)

В Cisco CallManager размер полезной части голосового пакета настраивается на основе выборок в миллисекундах (мс). В таблице ниже приводятся выборки в миллисекундах и соответствующие им размеры полезной части пакета для различных кодеков.

Размер полезной части голосового пакета (мс)

Размер полезной части голосового пакета (байт)

20 мс (по умолчанию)

20 мс (по умолчанию)

30 мс (по умолчанию)

Для шлюзов Cisco IOS в ПО Cisco IOS версии 12.0(5)T была добавлена функция, которая позволяет изменять размер полезной части VoIP-пакетов (в байтах) через интерфейс командной строки (CLI). Новая команда имеет следующий синтаксис:

Последствия изменения размера полезной части голосового пакета

Количество выборок на пакет — еще один фактор, определяющий время задержки и пропускную способность вызова VoIP. Кодек определяет размер выборки, но общее количество выборок в пакете влияет на количество пакетов, которые отправляются за секунду.

При увеличении размера полезной части пакета, пропускная способность VoIP уменьшается, а общая задержка увеличивается. Это поясняется на следующем примере:

Вызов G.729 с размером полезной части голосового пакета 20 байт (20 мс). (Заголовки IP/UDP/RTP, 40 байт + размер полезной части голосового пакета, 20 байт)* 8 бит * 50 pps = 24 Кбит/с

Вызов G.729 с размером полезной части голосового пакета 40 байт (40 мс). (Заголовки IP/UDP/RTP, 40 байт + размер полезной части голосового пакета, 40 байт) * 8 бит * 25 pps = 16 Кбит/с

Примечание: Заголовки L2 не учитываются в данном расчете.

Примечание: Расчеты показывают, что при удвоении размера полезной части пакета, необходимое количество пакетов в секунду уменьшается наполовину.

Примечание: Как указано в спецификации ITU-T G.114, рекомендуемая общая задержка передачи голоса должна составляет 150 мс. Для частной сети приемлемым показателем будет 200 мс, максимальное значение — 250 мс.

Определение голосовой активности

В коммутируемых голосовых сетях все голосовые вызовы используют каналы с фиксированной пропускной способностью 64 Кбит/с, независимо от соотношения речи и тишины в разговоре. В сетях VoIP речь и тишина преобразуются в пакеты. Обнаружение голосовой активности (VAD) позволяет подавлять пакеты, которые не содержат голосовых данных.

Со временем и при усреднении более чем по 24 вызовам функция VAD может обеспечить экономию пропускной способности до 35 %. Экономия незаметна для отдельных голосовых вызовов и ее нельзя определить с помощью точечных методов измерения. При проектировании сети и планировании пропускной способности не следует рассматривать функцию VAD, особенно на каналах, передающих менее 24 голосовых вызовов. Такие возможности, как музыка на удержании и факс делают функцию VAD неэффективной. Если сеть проектируется для полной полосы пропускания голосового вызова, все ресурсы, сэкономленные VAD, будут доступны для информационных приложений.

Кроме того, функция VAD генерирует комфортный шум (CNG). Поскольку тишину можно легко перепутать с отключенным вызовом, функция CNG выполняет локальную генерацию белого шума, благодаря которому обе стороны воспринимают вызов как активный . Стандарты G.729 Annex-B и G.723.1 Annex-A содержат встроенную функцию VAD, но в остальном выполняют те же функции, что G.729 и G.723.1.

В Cisco CallManager функцию VAD можно включить (по умолчанию она отключена) с помощью следующего сервисного параметра:

SilenceSuppressionSystemWide—Этот параметр включает VAD skinny-терминалами (например, IP-телефоны Cisco IP и шлюзы Skinny)

SilenceSuppressionWithGateways—Этот параметр функцию VAD для всех шлюзов MGCP. Он не влияет на шлюзы H.323. Функцию VAD для шлюзов H.323 необходимо отключать на самих шлюзах.

Эти сервисные параметры можно найти в окне Cisco CallManager Administration (Service > Service Parameters > select_server > Cisco CallManager).

Сжатие заголовков RTP или cRTP

Все VoIP-пакеты состоят из двух компонентов: голосовые выборки и заголовки IP/UDP/RTP. Хотя голосовые выборки сжимаются в DSP и могут иметь различный размер, в зависимости от используемого кодека, заголовки имеют постоянную длину 40 байт. С учетом размера голосовой выборки стандартного вызова G.729 20 байт, объем служебных данных, которые эти заголовки добавляют в пакет, можно считать значительным. С помощью cRTP заголовки можно сжать до двух или четырех байтов. Такое сжатие обеспечивает значительную экономию пропускной способности VoIP. Например, стандартный вызов G.729 VoIP использует пропускную способность 24 Кбит/c без cRTP и 12 Кбит/с с использованием cRTP.

Поскольку cRTP сжимает вызовы VoIP на поканальной основе, на обоих концах IP-канала необходимо использование cRTP.

В версии Cisco IOS 12.0.5T и ниже протокол cRTP использует коммутацию процессов, что значительно ограничивает масштабируемость cRTP-решений пределами производительности ЦП. Большинство этих проблем были решены благодаря различным улучшениям производительности cRTP, добавленным в версиях 12.0.7T–12.1.2T программного обеспечения Cisco IOS . История изменений.

cRTP использует коммутацию процессов в Cisco IOS версии 12.0.5T и ниже.

В ПО Cisco IOS версий 12.0.7T и 12.1.1T, введена поддержка быстрой коммутации и коммутации Cisco Express Forwarding для протокола cRTP.

В программном обеспечении Cisco IOS версии 12.1.2Т вводятся алгоритмические средства улучшения производительности.

Перевод протокола cRTP на путь быстрой коммутации позволяет значительно увеличить число сеансов RTP (вызовов VoIP), которые могут быть обработаны шлюзами VoIP и промежуточными маршрутизаторами.

Эвристические правила сжатия

Поскольку протокол RTP не имеет собственного заголовка, поток RTP (для cRTP) отделяется от потока UDP (cUDP) с помощью эвристических правил. В настоящий момент используются точные эвристические правила для определения RTP-пакетов, подлежащих сжатию. Это достигается следующим образом:


Задержка — это задержка или отставание. Задержка происходит в компьютерных сетях и во время голосовой связи. Задержка в вызовах VoIP (голос по Интернет-протоколу) — это время между передачей голосового пакета и моментом, когда он достигает пункта назначения. Высокая задержка преобразуется в задержку и эхо, вызванные медленными сетевыми связями. Задержка является основной проблемой VoIP-связи, когда речь идет о качестве звонков.

Задержку телефонного разговора иногда называют задержкой «от рта к уху», и задержка звука, связанная с Интернетом, также определяется термином « качество опыта» (QoE) .

Как измерить задержку

Задержка измеряется в миллисекундах (мс), что составляет тысячные доли секунды. Задержка в 20 мс является нормой для вызовов VoIP; задержка в 150 мс едва заметна и поэтому приемлема. Однако, чем выше, тем лучше качество начинает ухудшаться. При 300 мс или выше задержка становится совершенно неприемлемой.

Задержка измеряется двумя способами:

  • Задержка в одном направлении — это время, за которое пакет проходит один путь от источника до пункта назначения.
  • Задержка прохождения туда -обратно — это время, которое требуется пакету для перемещения в пункт назначения и обратно к источнику (Один и тот же пакет не возвращается, но происходит подтверждение.)

Влияние задержки на голосовые вызовы

Негативное влияние задержки на качество звонков включает в себя:

  • Медленные и прерванные телефонные разговоры
  • Пересекающиеся шумы, когда один динамик прерывает другой
  • эхо
  • Нарушенная синхронизация между голосом и другими типами данных, особенно во время видеоконференций

Причины задержки и исправления

Исключить задержку сложно и включает в себя несколько факторов, многие из которых находятся вне вашего контроля. Например, вы не выбираете, какие кодеки использует ваш поставщик услуг.

Соединение не имеет достаточной пропускной способности

Когда интернет-соединение медленное и ему не хватает пропускной способности , пакетам данных требуется больше времени для прохождения через Интернет. Это заставляет качество страдать. Часто пакеты поступают в неправильном порядке, что делает невозможной повторную сборку, если порядок не восстановлен.

Брандмауэр блокирует трафик

Контрольные точки всегда являются узким местом, поэтому разрешите очистку приложений VoIP в программном обеспечении брандмауэра .

Используются неправильные кодеки

Кодеки — это программы, используемые для кодирования речевых сигналов в цифровые данные для передачи по сети. Ваш провайдер может использовать не тот. Вы ничего не можете с этим поделать; однако, если вы используете приложение VoIP, которое позволяет настраивать кодеки, измените их.

Используется старое оборудование

Старое оборудование с новым программным обеспечением или новые сети могут работать не очень хорошо, поэтому часто возникают задержки и задержки. Используйте другой телефонный адаптер или телефон (если вы используете IP-телефон или любое другое оборудование, специфичное для VoIP). Ваш центр также может быть виновником. Гарнитуры также часто вызывают задержку.

Скорость передачи, которую предусматривают имеющиеся сегодня узкополосные кодеки, лежит в пределах 1.2-64 кбит/с. Естественно, что от этого параметра прямо зависит качество воспроизводимой речи. Существует множество подходов к проблеме определения качества. Так, например, для прослушивания экспертам предъявляются разные звуковые фрагменты - речь, музыка, речь на фоне различного шума и т. д. Искажения оценивают путем опроса разных групп людей по пятибалльной шкале единицами субъективной оценки MOS (Mean Opinion Score ). Оценки интерпретируют следующим образом:

  • 4-5 - высокое качество; аналогично качеству передачи речи в ISDN , или еще выше;
  • 3,5-4 - качество ТфОП (toll quality); аналогично качеству речи, передаваемой с помощью кодека АДИКМ при скорости 32 кбит/с. Такое качество обычно обеспечивается в большинстве телефонных разговоров. Мобильные сети обеспечивают качество чуть ниже toll quality;
  • 3-3,5 - качество речи по-прежнему удовлетворительно, однако его ухудшение явно заметно на слух;
  • 2,5-3 - речь разборчива, однако требует концентрации внимания для понимания. Такое качество обычно обеспечивается в системах связи специального применения (например, в вооруженных силах).

В рамках существующих технологий качество ТфОП (toll quality) невозможно обеспечить при скоростях менее 5 кбит/с.

При диалоге один его участник говорит в среднем только 35 процентов времени. Таким образом, если применить алгоритмы, которые позволяют уменьшить объем информации, передаваемой в периоды молчания, то можно значительно сузить необходимую полосу пропускания. В двустороннем разговоре такие меры позволяют достичь сокращения объема передаваемой информации до 50 %, а в децентрализованных многоадресных конференциях (за счет большего количества говорящих) - и более. Нет никакого смысла организовывать многоадресные конференции с числом участников больше 5-6, не подавляя периоды молчания.

Генератор CNG позволяет избежать таких неприятных эффектов.

Большинство узкополосных кодеков обрабатывает речевую информацию блоками, называемыми кадрами ( frames ), и им необходимо производить предварительный анализ отсчетов, следующих непосредственно за отсчетами в блоке, который они в данный момент кодируют.

Размер кадра важен, так как минимальная теоретически достижимая задержка передачи информации (алгоритмическая задержка) определяется суммой этого параметра и длины буфера предварительного анализа.

С другой стороны, кодеки с большей длиной кадра более эффективны, так как здесь действует общий принцип: чем дольше наблюдается явление (речевой сигнал), тем лучше оно отображается на объеме дополнительной служебной информации, которая добавляется к кадру.

Потери пакетов являются неотъемлемым атрибутом IP-сетей. Но потери пакетов и потери кадров не обязательно напрямую связаны между собой, так как существуют подходы, например, применение кодов с исправлением ошибок ("forward error correction "), позволяющие уменьшить число потерянных кадров при заданном числе потерянных пакетов. Необходимая для этого дополнительная служебная информация распределяется между несколькими пакетами, так что при потере некоторого числа пакетов кадры могут быть восстановлены.

Кодеры типа G.723.1 разработаны так, что они функционируют без существенного ухудшения качества в условиях некоррелированных потерь до 3 % кадров, однако при превышении этого порога качество ухудшается катастрофически.

3.8. Кодеки IP-телефонии

Наибольшее распространение получили кодеки следующих типов.

Кодек G.711 - один из первых цифровых кодеков речевых сигналов, который является минимально необходимым. Это означает, что любое устройство VoIP должно поддерживать этот тип кодирования.

Рекомендация G.723.1 утверждена ITU -T в ноябре 1995 г. Кодек G.723.1 является базовым для приложений IP-телефонии .

Кодек G.723.1 предусматривает две скорости передачи: 6.3 кбит/с и 5.3 кбит/с. Режим работы может меняться динамически от кадра к кадру.

Для этих кодеков оценка MOS ( Mean Opinion Score ) составляет 3,9 в режиме 6.3 кбит/с и 3,7 в режиме 5.3 кбит/с.

Кодек G.726 обеспечивает кодирование цифрового потока со скоростью 40, 32, 24 или 16 кбит/с, гарантируя оценки MOS на уровне 4,3 (32 кбит/с), что принимается за эталон уровня качества телефонной связи (toll quality ). Однако в приложениях IP-телефонии этот кодек практически не используется, так как он не обеспечивает достаточной устойчивости к потерям информации (см. выше).

Кодек G.728 специально разрабатывался для оборудования уплотнения телефонных каналов, при этом было необходимо обеспечить возможно малую величину задержки (менее 5 мс), чтобы исключить необходимость применения эхокомпенсаторов.

Кодек G.729 очень популярен в приложениях передачи речи по сетям Frame Relay . Кодек использует кадр длительностью 10 мс и обеспечивает скорость передачи 8 кбит/с. Однако для кодера необходим предварительный анализ сигнала продолжительностью 5 мс.

Существуют две разновидности кодека:

Количественными характеристиками ухудшения качества речи являются единицы QDU ( Quantization Distortion Units): 1 QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры ИКМ; значения QDU для основных методов компрессии приведены в таблице 3.2.

Дополнительная обработка речи всегда ведет к дальнейшей потере качества. Согласно рекомендациям МСЭ-Т, для международных вызовов величина QDU не должна превышать 14 , причем передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU . При передаче разговора по национальным сетям должно теряться не более 5 QDU . Поэтому для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является обязательным требованием регулирующих органов по отношению к корпоративным сетям, подключенным к сетям общего пользования.

Современная аппаратура IP-телефонии применяет разные кодеки, как стандартные, так и нестандартные. Конкурентами являются кодеки GSM (13,5 кбит/с) и кодеки МСЭ-Т серии G, использование которых предусматривается стандартом H.323 для связи по IP -сети.

3.9. Оценка качества воспринимаемой информации

Значения MOS для различных стандартов кодеров приведены в таблице 3.3.

В каналах Интернета важными для IP-телефонии параметрами являются следующие:

В статье рассматриваются вопросы качества передачи речи по IP-сетям. Обсуждаются такие проблемы, как обеспечение качества связи, причины задержки, потеря пакетов, подавление эха, комфортный шум, разговор между разноязыкими абонентами, а также использование беспроводной ЛВС в качестве канала передачи. Описаны также стандарты сжатия речи G.711, G.726, G.729A, G.723.1 и G.722.

Необходимо отметить, что беспроводная локальная вычислительная сеть (ЛВС) — только часть всего канала передачи, по которому голосовые пакеты проходят между источником и получателем. Качество связи зависит от характеристик всех элементов тракта. Что бы мы ни обсуждали — потерю пакетов или причины задержки — качест­во функционирования каждого элемента тракта обусловливает его общее качество работы. Что бы ни было причиной потери пакета — приемный буфер, локальная сеть или глобальная сеть — результат один: этот пакет адресат не получил. Аналогично, задержка, внесенная беспроводной ЛВС (БЛС), суммируется с задержками проводной ЛВС, глобальной сети и проводной ЛВС со стороны получателя.
В статье обсуждаются основные элементы, влияющие на качество передачи речевых пакетов. В частности, мы рассмотрим существующие требования к задержке, джиттеру и потерям, а также определим рабочие характеристики различных сетевых служб, влияющих на передачу речевых пакетов. К счастью, богатый опыт эксплуатации локальных и глобальных сетей для передачи речевых пакетов позволяет нам с высокой степенью уверенности локализовать проблему до того, как абоненты станут жаловаться на плохую связь.

Использование пакетной технологии связано с тремя основными проблемами голосовой службы: качеством передачи голоса, задержкой и подавлением эха.

Качество передачи голоса. В первую очередь качество сигнала при голосовом соединении определяется методом речевого кодирования и долей не дошедших до приемника пакетов, подлежащих декодированию. При передаче голоса по IP-сетям пакеты теряются по следующим двум причинам.
1. Сети теряют пакеты из-за ошибок или переполнения буфера.
2. Приемный буфер колебаний задержки, работающий по протоколу RTP (Real-Time Transport Protocol — транспортный протокол реального времени), может пропустить пакеты, если они поступают с задержкой, превышающей ту, на которую рассчитан буфер. Таким образом, поступление пакета с запозданием равносильно его отсутствию.
То, как сказывается потеря пакетов на передаче сигнала, зависит от метода кодирования голоса. Вопрос о допустимой потере пакетов, а также другие проблемы кодирования голоса мы рассмотрим ниже.
Задержка передачи. Это суммарная задержка голосового сигнала при его передаче. Она определяется рядом факторов, связанных с особенностями работы локальной и глобальной сети. К их числу относятся кодирование/сжатие голоса, генерация пакетов, конфликт каналов (в БЛС), сетевой транспорт/буферизация сети и устранение джиттера. Необходимо знать, что если задержка в односторонней связи превышает 150 мс, она начинает сказываться на темпе разговора. Расстояние, буферизация маршрутизаторов и конфликты в БЛС являются факторами, влияющими на суммарную задержку передачи. Этот показатель — в числе тех основных, качество которых вызывает нарекания в пакетной телефонии.
Еще одной проблемой, связанной со временем передачи сигнала, является джиттер, или изменение величины задержки от пакета к пакету, вызванное динамической буферизацией в пакетной сети. Если не устранить этот эффект, голос станет неразборчивым. Протокол RTP помогает устранить джиттер, однако в процессе использования RTP накапливается дополнительная задержка передачи.
Управление эхом. Во всех телефонных сетях возникает эффект эха. Однако если задержка в односторонней передаче превышает 35…40 мс, этот эффект становится очень заметным и раздражающим. Если задержка превышает значение этого параметра, необходимо использовать оборудование для подавления эха. Фактически во всех сетях передачи речевых пакетов задержка в одном направлении превышает 40 мс, поэтому при разработке системы следует предусмотреть механизм управления эхом.

Человеческий голос имеет аналоговую природу. Когда мы говорим, голосовые связки генерируют вибрации, представляющие собой некую последовательность сжатий и разряжений воздушной среды, т.е. аналоговый (непрерывно изменяющийся) сигнал. Прежде чем передать его по пакетной сети с цифровыми данными, требуется кодек (кодер и декодер) для преобразования этого сигнала в цифровое представление.
При выборе системы кодирования голоса следует определить три следующих основных требования.
1. Скорость передачи цифровых данных.
2. Задержку из-за процесса кодирования.
3. Допустимые потери, или относительное количество потерянных пакетов, до того как качество голоса станет ниже порогового значения.
Любой метод преобразования голоса в цифровое представление ухудшает качество звука. Вообще говоря, это ухудшение сигнала неразличимо для человеческого уха. Однако если некоторые биты изменяются из-за ошибок передачи или теряются при отбрасывании пакетов, это отражается на качестве восстановленного сигнала. Существующие методы кодирования голоса отличаются производительностью, надежностью и величиной задержки. Эти параметры представлены в таблице 1 для основных способов модуляции сигнала.

Для администраторов корпоративных сетей основным вопросом является выбор технологии пакетной передачи речи - по Frame Relay (VoFR) или IP (VoIP). Зачастую этот выбор зависит не от нас. Крупные поставщики услуг связи, которые должны иметь возможность подключать к своей сети различных клиентов, для передачи телефонного трафика однозначно выбирают протокол IP, т.к. он и обеспечивает передачу пакетов независимо от содержащейся в них информации над любыми канальными протоколами. Пользователи Интернет тоже передают речь с помощью протокола IP - это стандарт Сети.

В основном, выбор той или иной технологии зависит от параметров каналов связи (полоса пропускания, качество), а не от существующего "железа", т.к. производители сетевого оборудования предлагают продукты, объединяющие в себе функции устройств доступа к сетям Frame Relay и IP. Поэтому, не будем пока говорить о плюсах и минусах VoFR и VoIP, лучше рассмотрим параметры каналов связи в качестве критериев при выборе технологии пакетной передачи разнородного трафика.

Полоса пропускания

Одноканальный вариант
Предприятия обычно не имеют собственных линий связи между территориально распределенными объектами и для организации своей сети должны арендовать каналы у других операторов или создавать спутниковую сеть. Арендная плата за каналы составляет основную долю расходов на содержание сети, поэтому экономия полосы пропускания является в большинстве случаев основным критерием при выборе технологии пакетной передачи голоса и данных.

Скорость пакетной передачи речи зависит от нескольких факторов: скорости кодирования сигнала, размера речевого пакета, объема служебной информации протоколов канального, сетевого и транспортного уровней, наличия или отсутствия механизма сжатия заголовков пакетов, числа передаваемых по линии телефонных каналов, степени использования механизма детектирования речевого сигнала (Voice Activity Detection - VAD), a также от того, какова допустимая доля потерянных пакетов при перегрузке выходного порта мультиплексора Frame Relay или маршрутизатора.

В случае использования протокола Frame Relay речевой пакет помещается в кадр этого протокола с заголовком 6 байт (общий объем полей служебной информации конкретного протокола). На этом подготовка к передаче речевой информации заканчивается. Затем кадры VoFR поступают в сетевой порт вместе с кадрами данных, если, конечно, речь передается совместно с данными.

Скорость передачи одного телефонного канала для варианта VoFR определяем по известному полному объему кадра в битах и времени, в течение которого он должен быть передан. Например, если речевой пакет содержит две элементарные последовательности битов полезной нагрузки, общее время анализа речевого сигнала составит 2*10= 20 мс, а объем передаваемой информации - 8*(22 + 6) = 224 бит, в результате скорость передачи будет равна 11,2 Кбит/с. При длине речевого пакета 62 байт скорость равнялась бы 9,07 Кбит/с.

Когда речь передается с помощью протокола IP, речевые пакеты по стандарту G.729 формируются точно так же, как и для варианта VoFR, однако последующие процедуры гораздо сложнее. Прежде всего речевой пакет помещается в поле данных пакета протокола RTP (Realtime Transfer Protocol), заголовок которого имеет размер 12 байт. Затем этот пакет помещается в поле данных пакета протокола транспортного уровня UDP с заголовком длиной 8 байт, и, наконец, наступает очередь собственно протокола IP, пакет которого имеет заголовок 20 байт. Таким образом, общая величина накладных расходов протоколов IP/UDP/RTP составляет 40 байт.

Но пакет IP по сети перемещается при помощи протокола канального уровня: РРР, HDLC, Frame Relay, ATM или любого другого. В поле данных кадров этих протоколов помещается пакет IP, после чего он готов для передачи по сети. Типичным вариантом организации IP-сетей является использование протокола РРР с заголовком длиной 8 байт. В результате для рассмотренного ранее случая передачи речевых пакетов стандарта G.729 с полезной нагрузкой 20 байт полная длина IP-пакета составит 22 + 40 + 8 = 70 байт. Передать эти данные за те же 20 мс можно при условии, что скорость в канале будет равна 28 Кбит/с - это примерно в 2,5 раза больше, чем при передаче такого же речевого пакета посредством технологии VoFR.

Увеличивая объем полезной нагрузки, можно снизить требования к пропускной способности одного телефонного канала VoIP, например до 14,7 Кбит/с при объеме 60 байт. Однако за это придется расплачиваться увеличением времени задержки речевого сигнала (об этом будет сказано отдельно). Но в любом случае необходимая полоса пропускания должна быть существенно больше скорости кодирования речевого сигнала, которая в нашем случае, напомним, равна 8 Кбит/с.

Для улучшения этой ситуации разработаны и применяются протоколы сжатия заголовков IP-пакетов. Они позволяют уменьшить суммарный заголовок IP/UDP/RTP до 4 байт. Однако сжатие любых данных сопровождается задержкой сигнала, значение которой точно определить трудно, поскольку оно зависит от используемого алгоритма сжатия и его фирменной реализации. Приблизительно она равна 10 мс. Еще следует читывать, что протоколы сжатия заголовков, реализованные в оборудовании разных производителей, как правило, несовместимы, либо вообще отсутствуют.

Многоканальный вариант
Если пакетные технологии используют для передачи трафика многоканальные телефонные линии, то большую роль играет механизм VAD (Voice Activity Detection) - детектирование речевого сигнала. Уделим этому механизму особое внимание. Общаясь по телефону, каждый абонент в среднем бывает активен только 40% времени разговора. Использование VAD позволяет подавлять паузы в разговоре и в периоды молчания абонентов передавать информацию, причем не только данные, но и речевые пакеты других каналов. Подавление пауз осуществляется по месту нахождения речевых кодеков: либо в мультиплексорах Frame Relay, а в случае VoIP - в речевых шлюзах (в случае использования оборудования фирмы Cisco Systems роль таких шлюзов выполняет маршрутизатор).

Положительным является то, что эффективность использования механизма VAD не зависит от конкретной технологии пакетной передачи речи - VoFR или VoIP. Но с другой стороны включение данного механизма в ряде случаев является причиной несовместимости двух кодеков одного стандарта из-за неодинаковой реализации VAD в оборудовании разных фирм.

Качество

Любая телефонная линия всегда снижает качество диалога - ухудшаются такие параметры, как разборчивость и узнаваемость речи, а также ряд других параметров. Дополнительно сама пакетная форма передачи речи сопровождается рядом специфических явлений, ухудшающих качество разговора. К ним относятся задержка сигнала во входном буфере кодера и в других элементах тракта передачи, потеря части пакетов при перегрузках сетевых портов (абоненты не замечают потери пакетов, если их доля не превышает 3%), нестабильность интервала времени между началом обработки двух соседних пакетов в декодере (джиттер), эхосигнал, который при задержках выше 50 мс становится ощутимой помехой в трубке говорящего абонента. Эхосигнал устраняется методом компенсации. Потери пакетов в контролируемой корпоративной сети могут быть сведены к допустимому уровню или полностью исключены выбором достаточной пропускной способности линии. Влияние джиттера тоже устраняется, если на входе декодера использовать специальный сглаживающий буфер. В результате единственным фактором, отрицательное влияние которого на качество пакетной передачи речи нельзя устранить, остается задержка сигнала.

Задержка сигнала
Установлено, что задержку менее 120-150 мс разговаривающие по телефону абоненты просто не замечают. Однако, задержка в 400 мс и более является уже неприемлемой. Рассмотрим, из чего же формируется такое значение задержки.

Во входном буфере кодера задержка сигнала определяется объемом полезной нагрузки речевого пакета и скоростью кодирования. Например, для кодека G.729 при объеме нагрузки 20 байт задержка равна 20 мс. Выполняющиеся затем процедуры формирования речевого пакета и его инкапсуляции в кадр Frame Relay или пакет IP вместе с собственно сжатием сигнала увеличивают задержку еще примерно на 5 мс. Далее кадр или пакет поступает в сетевой порт, который может быть занят передачей другого пакета - либо речевого, либо канала данных. Время этой передачи зависит от длины пакета и скорости сетевого порта. Если последняя выбрана из расчета обслуживания только одного телефонного канала, то пакет с полезной нагрузкой 20 байт будет передаваться 20 мс. В случае, например, десятиканальной линии без использования механизма VAD это время за счет увеличения скорости порта уменьшится в 10 раз и составит 2 мс. Однако в многоканальном варианте при одновременной загрузке всех каналов кадр или пакет одного из них должен подождать, пока равноприоритетные кадры других каналов будут переданы через порт. В результате максимальное время ожидания в очереди на передачу кадра некоего канала в многоканальной линии останется равным тем же 20 мс, как если бы линия была одноканальной, а полное время задержки сигнала, связанное с его передачей в линию, составит 22 мс (20 + 2). В случае применения механизма VAD при активности всех каналов среднее число поступающих в порт пакетов уменьшится вдвое, а максимальное время их пребывания в очереди сократится примерно в полтора раза. Рассмотренная ситуация относится к периодам пика телефонной нагрузки, в остальное время задержка речевых пакетов в очереди к сетевому порту будет существенно меньше.

Помимо рассмотренных составляющих задержки речевых пакетов, а также задержки при декодировании, равной 4 мс, должно учитываться время распространения сигнала в среде передачи, которое составляет 1 мс на каждые 300 км линии связи. В наземных линиях это время измеряется единицами миллисекунд. В спутниковых каналах время распространения сигнала равно примерно 250 мс, и поэтому задержку во всех остальных элементах тракта передачи нужно свести к минимуму, и в сумме она не должна быть больше 150 мс, чтобы ее результирующее значение не превысило допустимый порог в 400 мс.

Анализ показывает, что если скорости сетевых портов мультиплексора Frame Relay и маршрутизатора выбраны достаточными для того, чтобы число потерянных речевых пакетов не превышало допустимый уровень, то значения задержки в одинаковых элементах тракта передачи при прочих равных условиях для технологий VoFR и VoIP практически не различаются. Однако маршрутизаторы, как обязательные устройства третьего уровня модели OSI, выполняют ряд операций, которые отсутствуют в мультиплексорах. Это проверка контрольной суммы, считывание IP-адреса получателя, поиск в таблице маршрутизации адреса порта, на который должен быть отправлен пакет, передача пакета на нужный порт. Каждая из этих операций вносит дополнительную задержку, общее же значение задержки для типичного случая классической маршрутизации имеет порядок 30 мс и даже больше. Коммутаторы Frame Relay на транзитных узлах сети обрабатывают данные на втором уровне OSI и задерживают сигнал лишь на доли миллисекунды. Учитывая указанные обстоятельства, можно сделать вывод, что при связи абонентов оконечных узлов корпоративной сети по технологии VoIP задержка сигнала примерно на 90 мс больше по сравнению с той, какая имеется в случае использования технологии VoFR при одинаковой величине речевого пакета.

Из всего изложенного выше кратко можно сделать следующие выводы:

  1. При передаче одинакового количества данных по одному телефонному каналу, используя кодек G.729, для VoIP требуется пропускная способность канала связи, примерно, в 2.5 раза больше, чем для VoFR. Разумно увеличивая объем передаваемой полезной нагрузки можно добиться уменьшения требуемой пропускной способности канала. А используя сжатие заголовков IP-пакетов, уменьшим время задержки сигнала.
  2. Желательно использовать однородное оборудование на обоих концах тракта передачи голоса по IP, т.к. при несовместимости механизмов VAD и протоколов сжатия заголовков IP-пакетов необходимая полоса пропускания увеличивается в 3-4 раза.
  3. В наземных сетях при использовании кодеков G.729 применение технологии VoFR порождает задержку речевого сигнала менее 150 мс, которая, абонентами не ощущается. В случае VoIP задержка всегда заметна для абонентов, хотя она и не доходит до недопустимого уровня.
  4. Спутниковые сети - случай особый. Значение задержки составляет 250 мс. При использовании технологии VoFR общая задержка останется приемлемой, тогда как в случае VoIP даже при малой длине речевого пакета она превысит допустимый порог в 400 мс.

P.S.
Технология VoIP по всем основным параметрам менее эффективна, чем VoFR. Почему же тогда IP-телефония так популярна, а качество предоставляемой провайдерами соответствующей телематической услуги не хуже качества обычной международной телефонной связи?

При отсутствии дефицита пропускной способности линии связи обеспечить высокое качество IP-телефонии не составляет труда. Если отказаться от сжатия речи по стандарту G.729 в пользу стандарта G.711 со скоростью кодирования 64 Кбит/с, а также от других механизмов возможной несовместимости оборудования разных производителей - сжатия заголовков IP-пакетов и подавления пауз в речи - и в добавление к этому осуществлять связь по выделенным линиям без одновременной передачи данных, то проблем с качеством речи не возникнет.

Задержка входного буфера кодера стандарта G.711 составляет 8 мс. За это время передается 64 байт полезной нагрузки, и при общей длине всех заголовков речевого пакета и пакетов протоколов РРР, IP, UDP и RTP 50 байт полная длина такого пакета составит 114 байт. Тогда необходимая для одного канала пропускная способность линии должна быть равной 114 Кбит/с. Выделение такого ресурса сети вполне возможно при организации международной и междугородной связи по выделенным каналам ВОЛС (волоконно-оптическим линиям связи).

В корпоративных сетях ситуация иная. Там об избытке пропускной способности говорить не приходится, поэтому если сравнивать технологии VoFR и VoIP с точки зрения эффективности использования ресурсов при условии обеспечения качества речи, то следует предпочесть VoFR.

Читайте также: