RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2025, том 527, страницы 31–42 (Mi danma665)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Бортовая сегментация железнодорожной инфраструктуры и препятствий для АСУ ЖД ПС

В. А. Федоров

Уральский федеральный университет, Екатеринбург, Россия

Аннотация: В статье рассмотрена усовершенствованная архитектура YOLOv11 (You Only Look Once) для бортовой сегментации объектов железнодорожной инфраструктуры и препятствий в автоматизированных системах управления железнодорожным подвижным составом (АСУ ЖД ПС). Предложенная архитектура направлена на обеспечение высокой точности сегментации объектов и высокой скорости обработки кадров в режиме реального времени. Она включает три ключевых нововведения: применение эффективного с вычислительной точки зрения блока SimSPPF (Simplified Spatial Pyramid Pooling), внедрение механизма внимания CBAM (Convolutional Block Attention Module) и использование оптимизированных параметров масштабирования. Выполнена всесторонняя оценка на 30 различных конфигурациях моделей, сформированных путем комбинации шести вариантов YOLOv11 (nano, small, medium, large, extra-large и нашей улучшенной версии YOLOv11sim) с пятью разными разрешениями входных данных (от 640 $\times$640 до 1920 $\times$ 1920). Все конфигурации моделей были обучены и проверены на нашем новом наборе данных, содержащем объекты российской железнодорожной инфраструктуры и препятствий. Набор данных состоит из 20 000 аннотированных изображений, охватывающих различные условия эксплуатации подвижного состава в специфичных условиях для железных дорог России. Разработанная версия YOLOv11sim продемонстрировала лучшее соотношение точности и скорости сегментации, особенно при высоких разрешениях: время обработки одного кадра на 15–30% быстрее, чем у сравниваемых базовых моделей, при сохранении 92–96% точности большой модели (YOLOv11 large). Даже в загроможденных средах усовершенствованная архитектура эффективно сегментирует широкий спектр элементов: от крупных компонентов пути до мелких, но критически важных объектов, таких как пикеты и карликовые светофоры, с точными границами масок. Сочетая высокую скорость обработки кадров с точностью, необходимой для безопасной работы железнодорожного транспорта, разработанная версия сверточной нейронной сети напрямую отвечает фундаментальным требованиям к внедряемым системам восприятия для автономных поездов.

Ключевые слова: сегментация объектов, беспилотные поезда, железнодорожная инфраструктура, компьютерное зрение, YOLOv11, GOA4.

УДК: 004.932

Поступило: 09.07.2025
Принято к публикации: 15.09.2025

DOI: 10.7868/S2686954325070033



Реферативные базы данных:


© МИАН, 2026