Закрытые интернет-пейджеры с поддержкой VoIP выпускают крупнейшие интернет-корпорации – Yahoo! Google, MSN и AOL. Программу Skype также можно занести в этот список, потому что теперь она принадлежит богатейшей интернет-корпорации eBay. Каждое из этих приложений закрыто от других, но корпорации вкладывают миллионы долларов в развитие и продвижение именно своей программы. Это настоящая битва стандартов на фоне конкуренции между финансовыми гигантами.

К сожалению, приверженцы открытых стандартов не обладают такими огромными финансовыми ресурсами, поэтому VoIP-программы, работающие на открытых стандартах и совместимые друг с другом, такие как Gizmo или SIPphone, пока не получили широкого распространения. Однако многие эксперты считают, что будущее именно за ними.

Протоколы, кодеки, алгоритмы

Разберемся, каким образом работает интернет-телефония. Общая схема такова.

1. Голос переводится в цифровую форму (оцифровка) и сжимается (компрессия).

2. Цифровой поток разбивается на пакеты, которые отправляются по компьютерной сети в пункт назначения.

3. Система адресата получает пакеты с голосовым потоком, осуществляет их «сборку», после чего переводит информацию обратно из цифровой формы в аналоговую.

Расскажем подробнее о каждом из этих этапов.

Оцифровка и сжатие

Оцифровка аналогового сигнала означает, что колебания воздуха превращаются в ряд нулей и единиц. На первом этапе колебания воздуха ваш голос фиксируется мембраной микрофона. На втором этапе задействован обычно блок аналого-цифрового преобразования (АЦП) звуковой карты компьютера.

Процесс оцифровки имеет следующие стадии.

1. Выборка.

2. Квантование сигнала.

3. Кодирование.

Самый известный стандарт кодирования звука называется PCM (Pulse Code Modulation – импульсно-кодовая модуляция), известный также как стандарт G.711. Он предполагает выборку 8000 образцов речи в секунду. Каждый из образцов имеет размер 8 бит, так что результатом работы PCM является цифровой поток 64 000 бит/с (рис. 1.1).

Рис. 1.1. Запись голосового сигнала на компьютере после оцифровки


Одновременно с оцифровкой звука кодек PCM обеспечивает и эффективное сжатие цифрового сигнала. Основной принцип сжатия звука основан на том, что человеческое ухо не воспринимает большую часть звукового спектра. Кроме того, голос человека занимает лишь узкую полосу в диапазоне всех слышимых звуков.

Диапазон слышимых частот составляет примерно 200-20 000 Гц. Частоты человеческого голоса лежат в пределах 200-10 000 Гц, а типичные частоты телефонного сигнала – в диапазоне 300-3000 Гц.

Только за счет эффективной выборки частот уже можно сжать сигнал в несколько раз. Применяются и другие, более сложные методы компрессии. Как уже было сказано, кодек PCM обеспечивает цифровой поток 64 000 бит/с. Существуют и другие стандарты оцифровки звукового сигнала. Вот некоторые из кодеков, которые входят в базовый набор Н.323 (рис. 1.2):

• G.711 (PCM) – 64 Кбит/с;

• G.721 (ADPCM) – 32 Кбит/с;

• G.723 (ADPCM) – 24 Кбит/с;

• G.726 (ADPCM) – 16 Кбит/с;

• G.728 (LD-CELP) – 16 Кбит/с;

• G.729 (CS-ACELP) – 8 Кбит/с.

Рис. 1.2. Архитектура Н.323 и основные стандарты, входящие в этот набор


Набор стандартов Н.323 используется в некоторых программах для интернет-телефонии, таких как NetMeeting и Ekiga. Однако сегодня Н.323 не является единственным общепризнанным стандартом, хотя и рекомендован к использованию ITU.

Существует еще стандарт SIP (о нем будет рассказано позже), а также различные кодеки и коммерческие протоколы для передачи трафика, которые не являются признанными стандартами. Сегодня в мире насчитывается более 650 различных VoIP-сервисов, зачастую несовместимых между собой. Самый известный – это Skype. Существуют национальные VoIP-сервисы, например в России.