Аннотация:
В статье описывается методика расчета коэффициентов семантической близости
между научными статьями, основанная на использовании семантического анализа
текстовых элементов, а также анализе структурных элементов научной статьи.
Научная статья представляется как нечеткое множество, элементами которого
являются термины, где каждому термину присвоена степень принадлежности,
характеризующая степень его важности для данного документа. В рамках
описываемой методики предлагается новый способ расчета весовых коэффициентов
терминов в тексте. Также вводится метрика измерения расстояния между
научными статьями, которая учитывает неявные семантические связи между
сравниваемыми документами. Для получения семантических характеристик
терминов в исследовании в качестве тезауруса используется Викисловарь.