RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2025, том 35, выпуск 4, страницы 60–72 (Mi ssi994)

Движение, скорость и траектории представлений ключевых слов в векторном пространстве языковой модели

М. М. Шарнин, Н. В. Сомин

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Предложен метод расчета положений, скоростей и эволюционных траекторий ключевых слов в векторном пространстве статической языковой модели. Семантическое расстояние между векторами слова в моменты времени $t_1$ и $t_2$ определяется как косинусное расстояние между этими векторами. Скорость семантических изменений вычисляется как семантическое расстояние, деленное на $t_2-t_1$. Скорость семантических изменений выражает, насколько быстро меняется значение / семантика слова, его контекст, положение в векторном пространстве и семантически близкие слова. Метод позволяет рассчитывать скорости и эволюционные траектории тем, представляющих совокупность нескольких родственных ключевых слов. Для расчета скоростей и траекторий в анализируемый исходный текст вставляются специальные эволюционные метки рядом со словами из интересующей темы. Рассматривается случай скоростей и траекторий ключевых слов в области «машинного обучения», полученных из библиотеки PubMed. Векторы ключевых слов и их изменения во времени рассчитываются с помощью нейросети Word2Vec. Представлена семантическая карта, позволяющая визуально оценить эволюционные траектории и скорости. Она основана на алгоритме PCA (Principal Component Analysis), позволяющем получить проекцию траекторий на двумерную (2D) плоскость.

Ключевые слова: скорость семантических изменений, эволюционные траектории, векторное пространство, статическая языковая модель.

Поступила в редакцию: 23.06.2025
Принята в печать: 15.10.2025

DOI: 10.14357/08696527250405



© МИАН, 2026