Аннотация:
Предлагается новый метод быстрого поиска закономерностей в числовых данных большой размерности, названный “туннельной кластеризацией”. Основными преимуществами нового метода являются: относительно невысокая вычислительная сложность; эндогенное определение состава и количества кластеров; высокая степень интерпретируемости конечных результатов. Приведено описание трех различных вариаций: с фиксированными гиперпараметрами, адаптивными, а также комбинированный подход. Рассмотрены три основных свойства туннельной кластеризации. Практическое применение приведено как на синтетических (100.000 объектов), так и на классических тестовых данных.
Ключевые слова:
кластер, кластеризация, кластерный анализ, туннельная кластеризация, степень перехода.
УДК:
004.622
Статья представлена к публикации:Д. А. Новиков Поступило: 05.04.2024 После доработки: 23.07.2024 Принято к публикации: 30.10.2024