RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2025, том 37, выпуск 6(2), страницы 93–106 (Mi tisp1076)

Метод обучения персептрона на табличных данных с пропусками

А. И. Перминов, А. П. Коваленко, Д. Ю. Турдаков

Институт системного программирования им. В.П. Иванникова РАН

Аннотация: Обработка пропусков в табличных данных остаётся важной задачей при построении надёжных моделей машинного обучения. В данной работе рассматривается новый подход к заполнению пропущенных значений, основанный на идее унарной классификации. Предложенный метод использует ансамбль персептронов, обучаемых отдельно для каждого класса, для оценки правдоподобия восстанавливаемых значений относительно эмпирического носителя класса. В качестве фона используется равномерное распределение на ограниченной области признакового пространства. Это позволяет интерпретировать выход модели как аппроксимацию апостериорной вероятности принадлежности объекта к классу и использовать её в процессе итеративного заполнения пропусков и обучения классификатора. Теоретически обоснована состоятельность построенной оценки. Проведены эксперименты на синтетических двумерных выборках с пропусками, распределёнными по механизму MCAR. Полученные результаты демонстрируют преимущества предложенного подхода по сравнению с классическими методами заполнения, особенно при высокой доле пропусков и сложной геометрии классов.

Ключевые слова: пропущенные данные, заполнение пропусков, унарная классификация, персептрон, машинное обучение, байесовский классификатор, оценка апостериорной вероятности, MCAR, нейросетевая регрессия

DOI: 10.15514/ISPRAS-2025-37(6)-22



© МИАН, 2026