Аннотация:
Хотя архитектуры глубокого кодировщика-деколера доминируют в эндоскопической сегментации, их зависимость от полного дообучения или обучения с нуля является вычислительно дорогой и требует больших объемов данных. Данная работа освещает новые детали в этом подходе, демонстрируя, что замороженный кодировщик из фундаментальной предобученной модели с неглубоким декодером способен достичь конкурентных результатов. Наш основной вклад – это систематический послойный анализ для выявления единственного наиболее эффективного источника признаков в иерархии кодировщика, что оспаривает распространенную практику использования последнего, наиболее абстрактного слоя. Мы выявили отчетливый пик производительности на промежуточном слое (слой 12), где достигается оптимальный баланс между высокоуровневым семантическим пониманием и пространственной точностью высокого разрешения, критически важной для сегментации. Несмотря на обучение всего 65 тыс. параметров, наш метод превосходит существующие бенчмарки на сложном многоцентровом наборе данных PolypGen с коэффициентом Дайса 0.972. Эта работа представляет собой основанную на фактических данных методологию для эффективного извлечения признаков, что значительно снижает вычислительные и информационные барьеры для разработки высокопроизводительных клинических инструментов ИИ.