Аннотация:
В настоящее время растет интерес к разработке новых моделей для решения задачи классификации графов, которая является общепринятой для оценки и сравнения эффективности графовых нейронных сетей и графовых ядер. Для обеспечения объективного сравнения моделей существует несколько широко используемых наборов данных, а текущие оценки и выводы значительно зависят от достоверности этих наборов данных. Однако, как мы показываем в настоящей статье, большинство из этих наборов данных содержат изоморфные копии наблюдений, что может привести к ошибочным выводам. Например, относительное ранжирование графовых моделей может существенно измениться при удалении изоморфных графов из тестовой выборки. В данной работы мы предлагаем подходы, которые позволяют исправить данный недостаток. Мы показываем, что явное включение знаний об изоморфизме в наборы данных может значительно повысить эффективность любой графовой модели. Наконец, мы переоцениваем часто используемые графовые модели на основе улучшенных наборов графовых данных и даем рекомендации по разработке новых наборов данных и показателей эффективности для решения задач классификации графов.
Ключевые слова:
модели классификации, обучение на графах, смещение результатов из-за изоморфизма.
УДК:
004.8
Поступило: 27.09.2024 Принято к публикации: 02.10.2024