RUS  ENG
Полная версия
ЖУРНАЛЫ // Вычислительные методы и программирование // Архив

Выч. мет. программирование, 2012, том 13, выпуск 4, страницы 559–571 (Mi vmp62)

Вычислительные методы и приложения

Ранжирование документов по запросу на основе лога действий пользователей поисковой системы

М. С. Агеев

Московский государственный университет им. М. В. Ломоносова, Научно-исследовательский вычислительный центр Московский

Аннотация: Предложен алгоритм улучшения качества ранжирования поисковой системы на основе предсказания релевантности документов запросу. Для предсказания релевантности используются методы машинного обучения и извлечения информации из логов. Высокая эффективность алгоритма продемонстрирована на реальных, полномасштабных данных поисковой системы. Алгоритм распараллеливается по технологии MapReduce, что позволяет обрабатывать логи и производить машинное обучение на кластерной архитектуре. Разработанная методика формирования факторов ранжирования может применяться для различных задач извлечения знаний из логов.

Ключевые слова: поисковые системы; машинное обучение; анализ логов.

УДК: 519.61

Поступила в редакцию: 19.10.2012



© МИАН, 2026