RUS  ENG
Полная версия
ЖУРНАЛЫ // Управление большими системами // Архив

УБС, 2024, выпуск 109, страницы 67–88 (Mi ubs1202)

Информационные технологии в управлении

Машинный мониторинг текстовых чатов и предсказание аномалий

Е. С. Мозаидзеa, С. В. Зуевb

a ФГБОУ ВО Белгородский государственный технологический университет им. В.Г. Шухова, Белгород
b ФГАОУ ВО Крымский федеральный университет им. В.И. Вернадского, Симферополь

Аннотация: Целью работы является разработка нового метода предсказания аномалий в текстовых чатах, не использующего корпусы текстов. Поставленные задачи: краткое представление статистического описания повторяемости аномалий, развитого в прошлых работах авторов, введение метода парных (обобщенных) N-грамм на коллекциях «существительное – глагол», синтез указанных методов в новый метод предсказания аномалий в системах обмена короткими сообщениями, тестирование метода. Предложен новый метод предсказания аномалий в потоке текстовых сообщений, не использующий корпус текстов для обучения, и, кроме того, допускающий онлайн-обучение. Материалом для работы были чаты, группы и каналы в Telegram, на которые подписан один из авторов работы, с большим объемом текстового материала. Метод использует статистическое распределение повторения аномалий, а также метод тематического моделирования на основе статистики пар «существительное – глагол». Оба метода предложены ранее в работах авторов. Проведенный эксперимент показал соответствие результатов, предсказанных с помощью предлагаемого метода, фактически зарегистрированным аномалиям. Применение предложенного метода может быть полезно в исследованиях и анализе появления аномалий в сложных социальных системах, взаимодействие в которых отражается в коммуникациях через социальные сети и мессенджеры. Подобного рода задачи являются актуальными как для государственных структур, так и для бизнеса, и могут позволить сгладить острые социальные и производственные проблемы. Особенно полезен предложенный метод для журналистов – он позволяет определить время наиболее вероятного появления значимых социальных явлений.

Ключевые слова: предсказание аномалий, тематическое моделирование, вероятности редких событий, повторяемость редких событий, аномалии в текстовых чатах.

УДК: 004.8
ББК: 22.17

Поступила в редакцию: 19 октября 2023 г.
Опубликована: 31 мая 2024 г.

DOI: 10.25728/ubs.2024.109.4



© МИАН, 2026