Аннотация:
Рассмотрен вопрос качества аудиосигнала во время проведения видеоконференций. Описано влияние шумов на качество и разборчивость речевого сигнала. Проведен анализ процесса шумоподавления в аудиосигнале в реальном времени. Выделены основные подходы к решению задачи шумоподавления в реальном времени, а именно подход с распознаванием и устранением шумов и подход с распознаванием голоса и устранением звуков, отличающихся от речевого сигнала. Разработан алгоритм интеллектуального шумоподавления с применением методов искусственного интеллекта, отличающийся наличием механизмов регулировки «интенсивности» воздействия шумоподавления на речевой сигнал, а также регулировки «чувствительности» к шуму, позволяющий влиять на эффективность работы алгоритма для специфичных условий эксплуатации без необходимости переобучения модели нейросети алгоритма. Разработано программное обеспечение, реализующее гибридную методику шумоподавления, в виде модуля, который был внедрен в ранее разработанный программный комплекс для организации и проведения видеоконференций. Выделено три типовых сценария, для каждого из которых отобраны эталонный (незашумленный) речевой сигнал, а также набор шумов для этих сценариев для проведения двух видов испытаний с целью тестирования эффективности модуля шумоподавления в различных условиях его применения. Проведены испытания с тестом эффективности шумоподавления сегментов шума во время речевых пауз с применением методов среднеквадратичного значения громкости сигнала RMS и визуального анализа спектрограммы с подсчетом процента количества сэмплов шумов в выходном сигнале. Проведены испытания с тестом эффективности шумоподавления зашумленного речевого сигнала с использованием объективных методов оценки качества речевого сигнала ViSQOL и NISQA. Результаты испытаний представлены в виде таблиц.