В офтальмологической практике использование цифровых диагностических приборов позволило накопить большую базу данных медицинских изображений, а алгоритмы машинного обучения позволяют применить эти данные для создания автоматизированных решений, повышающих скорость, эффективность и качество скрининговых исследований [1-4]. Так, возможность применить модель автоматизированной системы диагностики для таких заболеваний, как диабетическая ретинопатия, возрастная макулярная дегенерация, ретинопатия недоношенных (РН) и глаукома, осложнения которых являются ведущей причиной слепоты и слабовидения в развитых и развивающихся странах [5, 6], позволит сэкономить временные и кадровые ресурсы, имеет потенциал повысить эффективность диагностического поиска и снизить нагрузку на офтальмологов, занимающихся скринингом в условиях ограниченного времени [7, 8]. Целью данного исследования является формирование датасета из цифровых изображений глазного дна с наличием офтальмологической патологии и без патологии для нейросетевой модели распознавания офтальмологической патологии на изображениях глазного дна. Для реализации поставленной цели были поставлены следующие задачи: собрать материал из открытых баз данных, провести аннотирование с присвоением класса качества и разработать инструменты предобработки данных.
В данном исследовании сбор данных и формирование датасета цифровых изображений глазного дна проводились из открытых облачных баз хранения и обработки данных Kaggle, Mendeley Data, Figshare. Все изображения прошли процедуру обезличивания и псевдонимизации согласно Федеральному закону от 27.07.2006 N 152-ФЗ «О персональных данных» и ГОСТ Р 55036-2012/ISO/TS 25237:2008 (Группа П85. Национальный стандарт Российской Федерации. Информатизация здоровья. Псевдонимизация). Объем собранного набора данных составил 1765 цифровых изображений глазного дна размером 640 × 480 и 2048×2048 пикселей и был переименован в итоговый датасет «OcuDate». Среди изображений с нормальным глазным дном и с заболеваниями были: диабетическая ретинопатия – 215 фотографий, возрастная макулярная дегенерация – 215 фотографий, ретинопатия недоношенных – 825 фотографий и глаукома – 215 фотографий, а также изображения с нормальным глазным дном – 295 фотографий.
Основным методом работы с данными было аннотирование изображений с присвоением им соответствующего класса качества фотографии. Были определены следующие классы: «норма» – класс включал изображения, которые имели нормальную освещенность, контрастность, не имели шумов, размытия и артефактов; «засвет» или «затемнение» – класс изображений, имеющих отклонение в уровне освещенности, либо слишком яркого, либо слишком тусклого; «шум» – класс изображений, имеющих нежелательные аномалии в виде пятен, зернистости или мелких точек; «низкий контраст» или «высокий контраст» – класс изображений, имеющих недостаточную или чрезмерную разницу между самыми светлыми и самыми темными участками изображения; «размытие» – класс изображений, имеющих недостаточную резкость и детализацию изображения; «артефакты» – класс изображений, имеющих разного рода визуальные искажения; не классифицированное отклонение – случаи, не попадающие ни в один из указанных выше типов, которые помечались как «выброс». Аннотирование по классам проводилось на датасете в период с 01.03.2024 по 31.04.2024. Для процесса предобработки данных Image Preprocessing Stage (algorithms for preprocessing images) была написана программа с функциями Contrast Enhancement и Intensity normalization. Данная программа разработана с использованием языка программирования Python и позволяет улучшить качество фотографии, увеличивая разницу между светлыми и темными участками, приводит значения яркости к стандартному диапазону, балансируя контрастность изображения.
Собранный датасет OcuDate был проаннотирован и предварительно обработан, количество отдельных классов составило: «засвет» – 432 фотографии (24,49%), «затемнение» – 513 фотографий (29,13%), «шум» – 113 фотографий (6,38%), «низкий контраст» – 275 фотографий (15,57%), «высокий контраст» – 53 фотографии (3,02%), «размытие» – 212 фотографии (11,98%), «артефакты» – 116 фотографий (6,56%), «выброс» – 51 фотография (2,87%). Итоговый датасет был разделен на обучающую (60% данных) – 1059 фотографии, тестовую (20% данных) – 353 фотографии и валидационную (20% данных) – 353 фотографии, выборки.
В дальнейшем необходимо выработать определение четких критериев для оценки приемлемого качества изображений. Процедура разметки изображений глазного дна и выделения ключевых клинических признаков требует высокой квалификации и временных затрат от врача-офтальмолога, поэтому для создания датасета необходимого качества, достаточного для обучения высокоточной нейросетевой модели, требуется иметь предварительно обработанные данные приемлемого для анализа качества, инструменты предварительной обработки данных, а также расширить объем датасета для проверки точности модели на большем объеме данных [9-11].
В исследовании были выполнены поставленные задачи: сформирован датасет OcuDate, проведено аннотирование изображений по классам качества и разработан инструмент предобработки данных, что в последующем позволит провести обучение нейросетевой модели для классификации изображений глазного дна по категориям качества в данном наборе данных, а также предварительная обработка данных могут быть интегрированы в систему анализа и обработки изображений глазного дна при создании экспертной системы поддержки принятия клинических решений врачами-офтальмологами.
Прикрепленный файл | Размер |
---|---|
Скачать файл | 230.97 кб |