Аннотация:
Рассмотрены ограничения современных методов аугментации данных при работе с изображениями, полученными с беспилотных летательных аппаратов (БПЛА) в условиях высокой плотности и малого размера объектов. Предложен специализированный метод контекстной аугментации малых объектов (Contextual Small-Object Augmentation, CSOA), ориентированный на интеллектуальное размещение визуально улучшенных объектов в релевантные зоны изображения с сохранением пространственного реализма. В частности, рассмотрен модуль аугментации данных, основанный на применении сетей сверхвысокого разрешения для повышения качества визуального восприятия малых объектов. Для этого были выбраны несколько нейросетевых моделей сверхвысокого разрешения: RCAN, Real-ESRGAN и SwinIR. Проведена оценка их влияния на точность детектирования и классификации объектов моделью SSD MobileNet V2 FPNLite $320\times320$, обученной на различных версиях эталонного датасета VisDrone. Результаты детектирования сравнивались с моделью, обученной на базовом датасете, в соответствии с протоколом оценки библиотеки COCO Evaluation Metrics. Экспериментальные исследования показали, что применение сетей сверхвысокого разрешения в задаче аугментации значительно повышает точность детектирования малых объектов. При этом сохраняется вычислительная эффективность исходной модели.