АНАЛИЗ И МОДЕЛИРОВАНИЕ СЛОЖНЫХ ЖИВЫХ СИСТЕМ
Advanced neural network models for UAV-based image analysis in remote pathology monitoring of coniferous forests
[Модели нейронных сетей для анализа изображений с БПЛА при дистанционном лесопатологическом мониторинге хвойных лесов]
C. Machuca,
N. G. Markov National Research Tomsk Polytechnic University,
30 Lenina ave., Tomsk, 634050, Russia
Аннотация:
Рассмотрены основные задачи дистанционного лесопатологического мониторинга пораженных насекомыми-вредителями хвойных лесов. Показано, что при их решении необходимо использовать результаты мультиклассификации хвойных деревьев на изображениях высокого и сверхвысокого разрешения, оперативно получаемых при мониторинге путем съемки лесов с космических аппаратов или с беспилотных летательных аппаратов (БПЛА). Проведен аналитический обзор современных моделей и методов мультиклассификации изображений хвойных лесов и с учетом его результатов разработаны три модели полносверточных нейронных сетей Mo-U-Net, At-Mo-U-Net и Res-Mo-U-Net, основанные на классической модели U-Net, а также модифицирована модель трансформера Segformer. По RGB-изображениям поврежденных уссурийским полиграфом
Polygraphus proximus деревьев пихты сибирской
Abies sibirica, полученных с помощью фотокамеры на БПЛА, созданы два набора датасетов: первый набор включает фрагменты изображений и их эталонных масок сегментации размером
$256\times256\times215\times3$ пикселей, а второй — фрагменты размером
$480\times480\times3$ пикселей. Проведены комплексные исследования каждой из обученных моделей нейросетей по точности классификации степени поражения (состояния здоровья) деревьев
A. Sibirica на изображениях и по скорости вычисления моделей с использованием тестовых датасетов из каждого набора. Выявлено, что в случае фрагментов размером
$256\times256\times3$ пикселей предпочтение наряду с моделью Modified Segformer следует отдать модели с механизмом внимания At-Mo-U-Net, а в случае фрагментов размером
$480\times480\times3$ пикселей — гибридной модели с остаточными блоками Res-Mo-U-Net. Из результатов исследований точности классификации и скорости вычислений каждой из разработанных моделей сделан вывод о том, что при решении задачи мультиклассификации пораженных деревьев пихты в производственных масштабах предпочтение следует отдать модели Res-Mo-U-Net. Именно она является компромиссным вариантом, удовлетворяющим противоречащим друг другу требованиям высокой точности классификации деревьев на изображениях и высокой скорости вычислений модели.
Ключевые слова:
патологический мониторинг хвойных лесов, беспилотный летательный аппарат, стволовой вредитель уссурийский полиграф Polygraphus proximus, мультиклассификация изображений деревьев пихты сибирской Abies sibirica, полносверточная нейронная сеть, трансформер
УДК:
004.415.2:004.932.1:582.47
Поступила в редакцию: 19.05.2025
Исправленный вариант: 12.07.2025
Принята в печать: 21.07.2025
Язык публикации: английский
DOI:
10.20537/2076-7633-2025-17-4-641-663