Аннотация:
Статья посвящена сравнительному анализу методов извлечения ключевых слов из текстовых данных с использованием статистических и нейросетевых подходов, таких как YAKE, и языковых моделей на основе трансформеров (например, BERT). В работе исследуются их точность, производительность и применимость к различным типам текстов. Основное внимание уделено разработке рекомендаций по оптимизации этих методов для повышения эффективности обработки текстов в условиях роста объемов данных. Результаты основаны на экспериментах с реальными текстами из научных статей.
Ключевые слова:
обработка естественного языка, извлечение ключевых слов, YAKE, BERT, точность, производительность.