Аннотация:
Изображения, получаемые с беспилотных летательных аппаратов, в настоящее время широко используются во многих приложениях. Однако эти изображения сталкиваются с рядом проблем (плотное распределение мелких объектов, переменные масштабы объектов и незаметные контурные особенности), которые приводят к пропускам объектов и ложному обнаружению объектов. Для решения этих проблем в данной статье предлагается улучшенный алгоритм обнаружения объектов RLD-YOLO, разработанный на основе версии YOLOv11n семейства алгоритмов YOLO. Алгоритм RLD-YOLO включает технологию структурной репараметризации RepConv, сохраняющую способность к многоветочной экспрессии признаков во время обучения и автоматически преобразующуюся в эффективную одноветвевую структуру во время вывода. Этот алгоритм разрабатывает модуль большого ядерного внимания LKAConv для улучшения способности к захвату признаков мелких целей с помощью глубокой разделяемой свертки размера 7$\times$7 и механизма пространственного внимания. Алгоритм RLD-YOLO вводит динамический адаптивный модуль слияния DASI для оптимизации многоуровневого взаимодействия признаков с помощью обучаемого распределения весов. Экспериментальные результаты показывают, что улучшенный алгоритм обнаружения объектов RLD-YOLO, который объединяет модули LKAConv, RepConv и DASI, увеличивает на наборе данных VisDrone2019-DET значения mAP50 и mAP50-95 на 2,02 и 1,17 % соответственно. Скорость постобработки оптимизирована на 9,09 %. Хотя время предварительной обработки увеличивается из-за операций по улучшению признаков, критический этап вывода все еще поддерживает реальное время выполнения 1,7 мс/кадр. Алгоритм RLD-YOLO, интегрированный с модулями LKAConv, RepConv и DASI, очень подходит для задачи обнаружения мелких объектов на изображениях беспилотных летательных объектов.
Ключевые слова:
Обнаружение мелких объектов; YOLOv11; изображения БПЛА; LKAConv.