Е. В. Вопилова, Е. Н. Крючкова, “Методы и алгоритмы автоматического извлечения информации из научных текстов для создания тезауруса научной терминологии”, Интеллектуальные системы. Теория и приложения, 2024, том 28, выпуск 4,страницы 21

Часть 1. Общие проблемы теории интеллектуальных систем

Методы и алгоритмы автоматического извлечения информации из научных текстов для создания тезауруса научной терминологии

Е. В. Вопилова, Е. Н. Крючкова

Алтайский государственный технический университет им. И. И. Ползунова

Аннотация: В статье предлагается метод автоматического построения тезауруса научной терминологии, основанный на алгоритмах извлечения многословных терминов из специальных энциклопедий и научных публикаций. Представлены результаты работы алгоритмов создания и пополнения тезауруса на примере обработки математических текстов. Предложен алгоритм сравнительного семантического анализа научных публикаций, а также способы количественной оценки их семантического сходства.

Ключевые слова: аспектно-ориентированный анализ, научный лексикон, семантический граф, классификация научных текстов, автоматическая обработка неструктурированных текстов