Аннотация:
В данной работе представлен метод локальной интерпретации решений обученной
нейронной сети функциями многозначной логики предикатов. Локальная интерпретация
нейронной сети относится к процессу объяснения решений, принимаемых моделью на конкретном
примере или в окрестности конкретного входа. В основе предлагаемого подхода лежит
множество функций многозначной логики, которые представляют собой обобщенные операции,
отвечающие определенным требованиям. Комбинируя эти функции, можно обнаружить
внутренние закономерности в данных и даже корректировать результаты, полученные с помощью
нейронных сетей. Предложенный метод был исследован в контексте задач классификации с
использованием многомерных дискретных признаков. В таких случаях каждый признак может
принимать одно из k возможных значений и иметь равную важность для идентификации класса.
Этот подход открывает новые возможности для понимания и объяснения правил, лежащих в
основе данных, которые не всегда очевидны при использовании обычных нейронных сетей.
Ключевые слова:
интерпретация, многозначная логика, нейронная сеть, обобщенное сложение,
данные