Сходимость многослойного персептрона к гистограммной байесовской регрессии
Н. А. Елисеевa,
А. И. Перминовa,
Д. Ю. Турдаковab a Институт системного программирования им. В.П. Иванникова Российской академии наук
b Исследовательский центр доверенного искусственного интеллекта ИСП РАН
Аннотация:
Рассматривается задача повышения интерпретируемости и обоснованности решений байесовского классификатора при аппроксимации
эмпирических данных с использованием многослойного персептрона.
Гистограммная регрессия сохраняет прозрачность и статистическую интерпретацию,
но ограничена требованиями к памяти (
$O(n)$) и низкой масштабируемостью,
тогда как многослойный персептрон обеспечивает эффективное по памяти представление (
$O(1)$)
и высокую вычислительную эффективность при ограниченной интерпретируемости.
Особое внимание уделено унарной схеме обучения, при которой обучающая выборка
состоит из примеров одного целевого класса и дополнительных фоновых точек,
равномерно распределённых на компактном множестве признакового пространства.
Такой подход позволяет обрабатывать каждый класс изолированно и
реализовать механизм отказа от классификации вне носителя данных,
повышая надёжность модели.
Предлагается рассматривать выход персептрона как состоятельный аналог
гистограммного разбиения, индуцированного ячейками линейности персептрона.
Доказывается, что при естественных условиях регулярности и
контролируемом росте архитектуры выходная функция многослойного персептрона
является состоятельной и асимптотически эквивалентной гистограммной оценке.
Теоретическая состоятельность строго доказана для случая
фиксированного первого слоя, а численные эксперименты подтверждают
применимость результатов для моделей со всеми обучаемыми слоями.
Таким образом, гистограммная интерпретация обеспечивает
статистическую верификацию корректности аппроксимации персептрона
и способствует повышению доверия к классификационным решениям
в рамках унарной модели.
Библиография: 15 названий.
Ключевые слова:
многослойный персептрон, гистограммная регрессия, кусочно линейные функции активации, байесовский классификатор, состоятельность, асимптотическая эквивалентность, VC-размерность, случайные гиперплоскости, унарная классификация.
УДК:
004.8+
519.6 Поступила в редакцию: 15.09.2025
DOI:
10.4213/rm10273