Аннотация:
Статья посвящена решению проблем, возникающих при формировании обучающего набора данных для моделей машинного обучения и исправлении нехарактерных данных. Предложены методы уточнения и фильтрации меток, улучшающие качество обучающего набора данных. Метод уточнения определенности меток, обеспечивает более точное соответствие между метками и объектами. Метод фильтрации выявляет и устраняет ошибочные или аномальные метки, что приводит к исключению или корректировке соответствующих объектов. Эффективность предложенных методов подтверждена на примерах раннего обнаружения рака молочной железы с помощью радиотермометрии и классификации изображений с использованием стандартного набора данных.
Ключевые слова:
машинное обучение, обучающий набор данных, нехарактерные метки, микроволновая радиотермометрия, рак молочной железы.