RUS  ENG
Полная версия
ЖУРНАЛЫ // Компьютерная оптика // Архив

Компьютерная оптика, 2015, том 39, выпуск 3, страницы 429–438 (Mi co106)

Эта публикация цитируется в 3 статьях

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

Выделение знаний и языковых форм их выражения на множестве тематических текстов: подход на основе меры TF-IDF

Д. В. Михайлов, А. П. Козлов, Г. М. Емельянов

Новгородский государственный университет имени Ярослава Мудрого, Новгород, Россия

Аннотация: Статья посвящена проблеме выделения единиц знаний из множеств (корпусов) тематических текстов. Данная проблема актуальна для построения систем обработки, анализа, оценивания и понимания информации, в частности, изображений. Конечной практической целью здесь является поиск наиболее рационального варианта передачи смысла средствами заданного естественного языка (ЕЯ) для последующей фиксации фрагментов знаний в тезаурусе и онтологии предметной области (ПО). В настоящей статье разбиением слов исходной фразы на классы по значению меры TF-IDF относительно текстов корпуса решается задача поиска в корпусе фраз, максимально близких исходной по описываемому фрагменту фактического знания и формам его выражения в языке.

Ключевые слова: распознавание образов, интеллектуальный анализ данных, теория информации, тест открытой формы, языковое представление экспертных знаний.

Поступила в редакцию: 22.04.2015
Исправленный вариант: 02.06.2015

DOI: 10.18287/0134-2452-2015-39-3-429-438



© МИАН, 2026