RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2025, том 16, выпуск 4, страницы 267–285 (Mi ps483)

Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем

Использование многоуровневых источников данных для подготовки обучающих наборов для обнаружения кибератак

Д. Д. Кононов, С. В. Исаев

Институт вычислительного моделирования СО РАН, Красноярск, Россия

Аннотация: Анализ сетевого трафика является неотъемлемой частью обеспечения безопасности в информационно-телекоммуникационных системах. Использование машинного обучения обеспечивает современным подходам более высокие показатели обнаружения киберугроз.
Предлагается новый подход для формирования обучающих наборов данных, который вводит новую единицу агрегации «сеанс», использует сигнатурный анализ и многоуровневые разнородные источники данных. Сформирован список требований к наборам данных, включающий сохранение первых пакетов соединения, сохранение скрытых областей пакетов, расширенную информацию об источниках трафика (страна, номер автономной системы ASN, тип сети). Дополнительная информация нацелена на выявление атак типа «скрытый канал связи». С использованием предложенного подхода разработан программный комплекс для создания обучающих наборов данных из многоуровневых источников на уровнях L7, L4, L3 модели OSI. В отличие от известных работ, используются реальные данные сетевой активности, а также длительные временные интервалы. Предложенный подход позволяет использовать полученные обучающие наборы для создания более эффективных методов обнаружения и предотвращения вторжения с помощью методов машинного обучения.

Ключевые слова и фразы: Интернет, сетевая безопасность, киберугрозы, анализ сетевого трафика, наборы данных, машинное обучение.

УДК: 004.89+004.056
ББК: 32.972.1

MSC: Primary 68M25; Secondary 68-11, 62N86

Поступила в редакцию: 10.07.2025
Подписана в печать : 03.10.2025

DOI: 10.25209/2079-3316-2025-16-4-267-285



© МИАН, 2026