Одной из самых неприятных, а также самых трудноустранимых проблем при проведении видеоконференций является т. н. эффект «эха». Он заключается в том, что микрофоны в зале улавливают голос удалённого участника видеоконференции и отправляют его «обратно», в результате чего выступающий слышит как бы эхо своих слов с небольшой задержкой, обусловленной кодированием/декодированием и передачей данных по сети Интернет.
На сегодняшний день существуют достаточно сложные и качественные алгоритмы — эхоподавители (английское название — AEC, Automatic Echo Canceller), сравнивающие звуковой сигнал, поступающий от микрофонов, с сигналом, поступающим от удалённых участников, и «вычищающие» голоса удалённых участников из сигнала локальных микрофонов. Однако, эти алгоритмы требуют существенных вычислительных мощностей (читай — дорогостоящей аппаратной части), поэтому ими оснащаются кодеки ВКС и аудиоплатформы топ-класса, такие как Cisco, Polycom, Biamp и т. д. Бюджетные же решения, в т. ч. программные клиенты ВКС (Trueconf, Skype и т. д.), рассчитаны в основном на персональное применение, т. е., на один микрофон и пару колонок, и всё это в радиусе метра. В случае, когда программным клиентам приходится сталкиваться с несколькими микрофонами и несколькими колонками, они очень часто не справляются с подавлением эха.
В конференц-зале головного офиса АО «ГЕНБАНК» в Симферополе не удавалось справиться с эффектом «эха» при применении программного клиента Trueconf. Проблема усугублялась тем, что в зале установлены не обычные микрофоны на «гусиной шее», которые, как правило, отключаются сразу после выступления, а микрофоны граничного слоя, которые кроме повышенной чувствительности постоянно включены. Таким образом, голос выступающего улавливался в основном одним-двумя микрофонами, а голос удалённых участников — всеми микрофонами сразу, и алгоритм эхоподавления не справлялся с этой ситуацией.
Мы предложили вместо имевшегося в зале простейшего аналогового микшера установить цифровую аудиоплатформу. В отличие от микшера в ней предусмотрены модули динамической обработки сигнала, полноценные эквалайзеры и модуль эхоподавления, рассчитанный на работу в конференц-залах, т. е., с множеством микрофонов и колонок. Отдельная динамическая обработка каждого входного канала позволила расширить динамический диапазон, т. е., увеличить разницу в усилении микрофонов, которые непосредственно ловят звук, и тех, в которые прилетают отражения голоса от стен и потолка, это позволило поднять разборчивость голоса. Эхоподавитель полностью устранил эффект «эха» даже при избыточной громкости потолочных акустических систем. Поскольку в зале не применяются акустические отделочные материалы, в нём наблюдается достаточно заметная реверберация, и идеального звука добиться не получилось, но по утверждению удалённых участников первой же видеоконференции — стало существенно лучше, чем было.