Аннотация:
В статье предлагается метод автоматического построения тезауруса научной терминологии, основанный на алгоритмах извлечения
многословных терминов из специальных энциклопедий и научных
публикаций.
Представлены результаты работы алгоритмов создания и пополнения тезауруса на примере обработки математических текстов.
Предложен алгоритм сравнительного семантического анализа
научных публикаций, а также способы количественной оценки их
семантического сходства.
Ключевые слова:
аспектно-ориентированный анализ, научный
лексикон, семантический граф, классификация научных текстов,
автоматическая обработка неструктурированных текстов