Аннотация:
Обучение представлений временных рядов играет ключевую роль в прикладных задачах, требующих сложного анализа данных. В таких областях, как нефтегазовая промышленность, эта проблема осложняется наличием пропущенных значений и аномалий, вызванных отказами датчиков в экстремальных условиях. Кроме того, объем размеченных данных в данном случае невелик. В таких случаях методы самообучения становятся естественным решением для извлечения устойчивых представлений данных. Однако, будучи генеративными или контрастивными, эти методы ограничены в применимости полученных представлений, что затрудняет их широкое использование. В данной работе предложены генеративные подходы к самообучению для сложных индустриальных временных рядов. Мы также предлагаем новый метод ансамблирования нескольких генеративных подходов, объединяющий лучшие свойства каждого из них. Предложенная процедура предназначена для решения задач с пропусками и разными масштабами в данных. Для численных экспериментов использованы выборки геофизических исследований скважин различного размера и с различных месторождений. Оценка включает обнаружение точек разладки, кластеризацию и трансферное обучение, при этом последние две задачи рассматриваются впервые. Результаты показывают, что вариационные автокодировщики лучше справляются с кластеризацией, авторегрессионные модели эффективно детектируют разладки, а предложенный ансамбль успешно решает обе задачи.
Ключевые слова:
методы самообучения, генеративное обучение, временные ряды, ансамблирование.
УДК:
550.832
Поступило: 27.09.2024 Принято к публикации: 02.10.2024