RUS  ENG
Полная версия
ЖУРНАЛЫ // Известия Кабардино-Балкарского научного центра РАН // Архив

Известия Кабардино-Балкарского научного центра РАН, 2025, том 27, выпуск 1, страницы 111–119 (Mi izkab927)

Информатика и информационные процессы

Исследование основных методов автоматической обработки, группировки и аннотирования информации

Д. В. Тихонов

Финансовый университет при Правительстве Российской Федерации (Ярославский филиал), 150003, Россия, г. Ярославль, ул. Кооперативная, 12а

Аннотация: В статье исследованы основные методы автоматической обработки, группировки и аннотирования информации. Показано, что методы автоматического анализа Data Mining базируются на использовании определенных статистических закономерностей (классификация, регрессия), поиске ключевых слов, однако не используют алгоритмы лингвистической обработки текстов. Таким образом, автоматический анализ текстовой информации, осуществляемый современными средствами аналитической обработки, не способен прорабатывать содержание текстов. Для сравнения двух простых предложений по содержанию был использован метод резолюций. Как показали исследования, при применении алгоритма унификации содержание предложений не учитывается. Поэтому как решение проблемы сравнительного анализа текстовой информации по содержанию были предложены новые алгоритмы работы с логико-лингвистическими моделями. Научная новизна полученных результатов состоит в методе быстрого извлечения набора локальных дескрипторов, описывающих все части изображения, что позволяет существенно ускорить процесс аннотирования и формировать более полный глобальный визуальный дескриптор изображения.

Ключевые слова: методы, автоматическая обработка, группировка, аннотирование, информация, Data Mining, метод резолюций.

УДК: 004.912

MSC: 68U15

Поступила в редакцию: 25.12.2024
Исправленный вариант: 28.01.2025
Принята в печать: 03.02.2025

DOI: 10.35330/1991-6639-2025-27-1-111-119



Реферативные базы данных:


© МИАН, 2026