С. В. Белов, С. С. Катунин, И. Ю. Кучин, М. Ф. Руденко, “Тестирование эффективности гибридной методики шумоподавления в речевом сигнале для системы видеоконференций”, Вестн. Астрахан. гос. техн. ун-та. Сер. управление, вычисл. техн. информ., 2025, номер 1,страницы 93

КОМПЬЮТЕРНОЕ ОБЕСПЕЧЕНИЕ И ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА

Тестирование эффективности гибридной методики шумоподавления в речевом сигнале для системы видеоконференций

С. В. Белов, С. С. Катунин, И. Ю. Кучин, М. Ф. Руденко

Астраханский государственный технический университет, Астрахань, Россия

Аннотация: Рассмотрен вопрос качества аудиосигнала во время проведения видеоконференций. Описано влияние шумов на качество и разборчивость речевого сигнала. Проведен анализ процесса шумоподавления в аудиосигнале в реальном времени. Выделены основные подходы к решению задачи шумоподавления в реальном времени, а именно подход с распознаванием и устранением шумов и подход с распознаванием голоса и устранением звуков, отличающихся от речевого сигнала. Разработан алгоритм интеллектуального шумоподавления с применением методов искусственного интеллекта, отличающийся наличием механизмов регулировки «интенсивности» воздействия шумоподавления на речевой сигнал, а также регулировки «чувствительности» к шуму, позволяющий влиять на эффективность работы алгоритма для специфичных условий эксплуатации без необходимости переобучения модели нейросети алгоритма. Разработано программное обеспечение, реализующее гибридную методику шумоподавления, в виде модуля, который был внедрен в ранее разработанный программный комплекс для организации и проведения видеоконференций. Выделено три типовых сценария, для каждого из которых отобраны эталонный (незашумленный) речевой сигнал, а также набор шумов для этих сценариев для проведения двух видов испытаний с целью тестирования эффективности модуля шумоподавления в различных условиях его применения. Проведены испытания с тестом эффективности шумоподавления сегментов шума во время речевых пауз с применением методов среднеквадратичного значения громкости сигнала RMS и визуального анализа спектрограммы с подсчетом процента количества сэмплов шумов в выходном сигнале. Проведены испытания с тестом эффективности шумоподавления зашумленного речевого сигнала с использованием объективных методов оценки качества речевого сигнала ViSQOL и NISQA. Результаты испытаний представлены в виде таблиц.

Ключевые слова: видеоконференция, речевой сигнал, шумоподавление, качество сигнала, спектр, фильтрующий коэффициент, полоса частот, шкала Барка, рекуррентные нейронные сети.

УДК: 004.773.5

Поступила в редакцию: 15.10.2024
Принята в печать: 20.01.2025

DOI: 10.24143/2072-9502-2025-1-93-102