Аннотация:
В настоящей работе авторы изучают проблему как оценки качества выделения неявных сообществ на графе, полученном при импорте данных из социальных сетей и мессенджеров, так и методов анализа таких сетей на предмет выявления информационного воздействия на их акторов. Рассматриваются два подхода к оценке корректности разбиения графа на сообщества. Первый способ оценки основан на методах теории информации и заключается в подсчете нормализованной взаимной информации (NMI) и асимметрично-нормализованной взаимной информации (ANRMI). В рамках второго подхода рассмотрены три метода оценки качества выделения неявных сообществ, основанные на анализе текстовых массивов сопоставленных сообществ. Определяются и сравниваются коэффициенты попарной ранговой корреляции для словарей разных текстовых массивов. Применяется анализ соответствий для исследования корпусов текстов сообществ. Третий метод анализа заключается в подсчете психолингвистических характеристик текстовых массивов неявных сообществ. На примерах реальных данных показана применимость методов исследования для оценки качества разбиений графа взаимодействующих объектов социальных сетей и мессенджеров на сообщества и анализа информационного воздействия в такой сети.