Специализированный выпуск по материалам V Международной конференции ''Физика - наукам о жизни'' Санкт-Петербург, 15-19 октября 2023 г. Физические методы в агро- и генетико-селекционных технологиях
Построение последовательности нуклеотидов методами машинного обучения в секвенаторе “Нанофор СПС”
Аннотация:
Рассмотрены способы обработки информации, включающие в себя методы фильтрации изображений, обнаружения кластеров флуоресценции, оценки параметров сигналов флуоресценции как для одиночных кластеров, так и для кластеров, “наложившихся” друг на друга, а также методы построения последовательности буквенных кодов нуклеотидов ДНК по интенсивностям сигналов флуоресценции, полученных непосредственно по результатам обработки изображений. В этих методах использованы классификаторы, основанные на машинном обучении. Показано, что в результате выполненной апробации различных моделей машинного обучения к задаче построения последовательности нуклеотидов, полученные результаты показали достаточно высокие показатели качества генетического анализа. Показатели качества по Phred score оказались в диапазоне от 29 до 35 для референсного генома бактериофага Phix174.
Ключевые слова:
секвенирование, нуклеиновые кислоты, обработка изображений, повышение качества генетического анализа, машинное обучение.
Поступила в редакцию: 12.02.2024 Исправленный вариант: 14.06.2024 Принята в печать: 08.07.2024