Аннотация:
Предложен метод расчета положений, скоростей и эволюционных траекторий ключевых слов в векторном пространстве статической языковой модели. Семантическое расстояние между векторами слова в моменты времени $t_1$ и $t_2$ определяется как косинусное расстояние между этими векторами. Скорость семантических изменений вычисляется как семантическое расстояние, деленное на $t_2-t_1$. Скорость семантических изменений выражает, насколько быстро меняется значение / семантика слова, его контекст, положение в векторном пространстве и семантически близкие слова. Метод позволяет рассчитывать скорости и эволюционные траектории тем, представляющих совокупность нескольких родственных ключевых слов. Для расчета скоростей и траекторий в анализируемый исходный текст вставляются специальные эволюционные метки рядом со словами из интересующей темы. Рассматривается случай скоростей и траекторий ключевых слов в области «машинного обучения», полученных из библиотеки PubMed. Векторы ключевых слов и их изменения во времени рассчитываются с помощью нейросети Word2Vec. Представлена семантическая карта, позволяющая визуально оценить эволюционные траектории и скорости. Она основана на алгоритме PCA (Principal Component Analysis), позволяющем получить проекцию траекторий на двумерную (2D) плоскость.