RUS  ENG
Полная версия
ЖУРНАЛЫ // Computational nanotechnology // Архив

Comp. nanotechnol., 2025, том 12, выпуск 4, страницы 187–194 (Mi cn605)

ИНФОРМАТИКА И ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ

Анализ форматов хранения многомерных моделей данных в контексте многомерных кубов

В. А. Фролов, Г. И. Афанасьев, Р. З. Хайруллин

Московский государственный технический университет имени Н.Э. Баумана

Аннотация: В статье рассматриваются вопросы эффективного хранения многомерных моделей данных в контексте современных аналитических систем. Особое внимание уделяется архитектуре многомерных кубов, которые предполагают хранение агрегированных фактов на пересечении множества измерений. Проведен обзор современных форматов хранения данных – Parquet, ORC, Iceberg, Delta Lake, Hudi – с позиции их применимости к задачам многомерной аналитики. Показано, что существующие решения ориентированы преимущественно на табличные структуры и не обеспечивают полноценной поддержки многомерных взаимосвязей, иерархий и агрегаций. Анализируются сложности интеграции между различными форматами хранения и отсутствие унифицированного подхода к описанию метаданных. На основе выявленных ограничений сформулированы проектные задачи, стоящие перед форматом хранения многомерных кубов. Предложена концептуальная модель хранения, сочетающая принципы реляционной и многомерной организации данных. Многомерная модель представляет собой таблицы фактов, измерений, а также уровень метаданных и API-интерфейс.

Ключевые слова: многомерные кубы, OLAP-системы, модель хранения данных, метаданные, интеграция, куб данных.

УДК: 004.651

DOI: 10.33693/2313-223X-2025-12-4-187-194



© МИАН, 2026