Аннотация:
Рассматривается проблема формирования оптимального набора признаков, позволяющих классифицировать пользовательскую активность по зашифрованному потоку данных, генерируемому приложениями быстрого обмена сообщениями в глобальной системе информационного обмена. Предложен структурно-статистический подход формирования признаков, комбинирующий методологию DPI, SPI и статистического подхода классификации трафика и использующий семантический и корреляционный отбор наиболее значимых признаков. Разработан метод формирования и снижения размерности набора признаков для многоклассовой классификации пользовательской активности, позволяющий достигать качества классификации $ F_1 \in [0{,}8, 0{,}95] $ на простой математической модели.