Аннотация:
Анализ сетевого трафика (NTA) помогает выявлять угрозы безопасности, наблюдать за производительностью сети и планировать емкость сети. Идеальным подходом в такой задаче выступает анализ в реальном времени, однако, он может быть затруднен из-за большого объема данных и сложности обрабатываемых данных. Большие объемы трафика требуют подробного разбора, а анализ данных в реальном времени может привести к пропуску скрытых угроз в трафике. Офлайн анализ может решить эти проблемы. Данный подход во многом зависит от выбора эффективного и подходящего решения для хранения данных. Существует множество систем хранения данных, каждая из которых использует разные подходы и форматы для хранения данных. Эта статья исследует применение различных систем хранения данных для результатов NTA. Рассматриваются три разных типа систем хранения, включая Greenplum, Nebula graph и OpenSearch. Используется сравнительный подход, анализирующий один и тот же набор данных в разных системах хранения. Это позволяет изучить, как различные структуры баз данных и возможности запросов влияют на эффективность и точность NTA. Полученные результаты не только предоставят ценные рекомендации по выбору оптимального решения для хранения данных для конкретных задач NTA, но также послужат основой для будущих исследований в этой области.
Ключевые слова:
анализ сетевого трафика, системы хранения, анализ баз данных, Greenplum, OpenSearch, Nebula graph