Выпуск №4, 2024 - стр. 38-42

Формирование датасета для нейросетевой модели распознавания офтальмологической патологии на изображениях глазного дна DOI: 10.29188/2712-9217-2024-10-4-38-42

Для цитирования: Гулякин Д.Д., Стецуков Г.Д., Теренин В.С., Пузанкова А.Д., Никиточкина М.Д., Валевская Д.Л., Маркова М.А., Анпилогова Е.А., Дододжонов А.Ю., Сырова А.И., Кулишенко А.А., Загребина Н.А. Формирование датасета для нейросетевой модели распознавания офтальмологической патологии на изображениях глазного дна. Российский журнал телемедицины и электронного здравоохранения 2024;10(4):38-42; https://doi.org/10.29188/2712-9217-2024-10-4-38-42
  • Гулякин Д.Д. – ординатор 2 года, кафедра офтальмологии, ГБУЗ «Морозовская ДГКБ ДЗМ»; Москва, Россия
  • Стецуков Г.Д. – аспирант 4 года по направлению «Биологические науки», ФГБОУ ВО Самарского государственного медицинского университета МЗ РФ; Самара, Россия
  • Теренин В.С. – магистрант 2 года, факультет филологии, «Национальный исследовательский Томский государственный университет»; Томск, Россия
  • Пузанкова А.Д. – студентка 4 курса, Институт клинической медицины им. Н.В. Склифосовского ФГАОУ ВО Первый МГМУ имени И.М. Сеченова Минздрава России (Сеченовский Университет); Москва, Россия
  • Никиточкина М.Д. – магистрант 2 курс, специальность «Интеллектуальные системы в гуманитарной среде», ФГАОУ ВО Первый МГМУ имени И.М. Сеченова Минздрава России (Сеченовский Университет); Москва, Россия
  • Валевская Д.Л. – студентка 4 курса, Биологический факультет, Санкт-Петербургский государственный университет; Санкт-Петербург, Россия
  • Маркова М.А. – студентка 4 курса, Передовая инженерная школа «Интеллектуальные системы тераностики», ФГАОУ ВО Первый МГМУ имени И.М. Сеченова Минздрава России (Сеченовский Университет); Москва, Россия
  • Анпилогова Е.А. – студентка 4 курса, Биологический факультет, Санкт-Петербургский государственный университет; Санкт-Петербург, Россия
  • Дододжонов А.Ю. – студент 6 курса, Лечебный факультет, ФГБОУ ВО «Иркутский государственный медицинский университет» Минздрава России; Иркутск, Россия
  • Сырова А.И. – студентка 4 курса, Лечебный факультет, ФГБОУ ВО «Иркутский государственный медицинский университет» Минздрава России; Иркутск, Россия
  • Кулишенко А.А. – 2 курс магистратуры, Факультет Космических Исследований, ФГБОУ ВО «Московский государственный университет имени М. В. Ломоносова»; Москва, Россия
  • Загребина Н.А. – ординатор 2 года, кафедра офтальмологии, ФГАОУ ВО Первый МГМУ имени И.М. Сеченова Минздрава России (Сеченовский Университет); Москва, Россия
19

ВВЕДЕНИЕ

В офтальмологической практике использование цифровых диагностических приборов позволило накопить большую базу данных медицинских изображений, а алгоритмы машинного обучения позволяют применить эти данные для создания автоматизированных решений, повышающих скорость, эффективность и качество скрининговых исследований [1-4]. Так, возможность применить модель автоматизированной системы диагностики для таких заболеваний, как диабетическая ретинопатия, возрастная макулярная дегенерация, ретинопатия недоношенных (РН) и глаукома, осложнения которых являются ведущей причиной слепоты и слабовидения в развитых и развивающихся странах [5, 6], позволит сэкономить временные и кадровые ресурсы, имеет потенциал повысить эффективность диагностического поиска и снизить нагрузку на офтальмологов, занимающихся скринингом в условиях ограниченного времени [7, 8]. Целью данного исследования является формирование датасета из цифровых изображений глазного дна с наличием офтальмологической патологии и без патологии для нейросетевой модели распознавания офтальмологической патологии на изображениях глазного дна. Для реализации поставленной цели были поставлены следующие задачи: собрать материал из открытых баз данных, провести аннотирование с присвоением класса качества и разработать инструменты предобработки данных.

МАТЕРИАЛЫ И МЕТОДЫ

В данном исследовании сбор данных и формирование датасета цифровых изображений глазного дна проводились из открытых облачных баз хранения и обработки данных Kaggle, Mendeley Data, Figshare. Все изображения прошли процедуру обезличивания и псевдонимизации согласно Федеральному закону от 27.07.2006 N 152-ФЗ «О персональных данных» и ГОСТ Р 55036-2012/ISO/TS 25237:2008 (Группа П85. Национальный стандарт Российской Федерации. Информатизация здоровья. Псевдонимизация). Объем собранного набора данных составил 1765 цифровых изображений глазного дна размером 640 × 480 и 2048×2048 пикселей и был переименован в итоговый датасет «OcuDate». Среди изображений с нормальным глазным дном и с заболеваниями были: диабетическая ретинопатия – 215 фотографий, возрастная макулярная дегенерация – 215 фотографий, ретинопатия недоношенных – 825 фотографий и глаукома – 215 фотографий, а также изображения с нормальным глазным дном – 295 фотографий.

Основным методом работы с данными было аннотирование изображений с присвоением им соответствующего класса качества фотографии. Были определены следующие классы: «норма» – класс включал изображения, которые имели нормальную освещенность, контрастность, не имели шумов, размытия и артефактов; «засвет» или «затемнение» – класс изображений, имеющих отклонение в уровне освещенности, либо слишком яркого, либо слишком тусклого; «шум» – класс изображений, имеющих нежелательные аномалии в виде пятен, зернистости или мелких точек; «низкий контраст» или «высокий контраст» – класс изображений, имеющих недостаточную или чрезмерную разницу между самыми светлыми и самыми темными участками изображения; «размытие» – класс изображений, имеющих недостаточную резкость и детализацию изображения; «артефакты» – класс изображений, имеющих разного рода визуальные искажения; не классифицированное отклонение – случаи, не попадающие ни в один из указанных выше типов, которые помечались как «выброс». Аннотирование по классам проводилось на датасете в период с 01.03.2024 по 31.04.2024. Для процесса предобработки данных Image Preprocessing Stage (algorithms for preprocessing images) была написана программа с функциями Contrast Enhancement и Intensity normalization. Данная программа разработана с использованием языка программирования Python и позволяет улучшить качество фотографии, увеличивая разницу между светлыми и темными участками, приводит значения яркости к стандартному диапазону, балансируя контрастность изображения.

РЕЗУЛЬТАТЫ

Собранный датасет OcuDate был проаннотирован и предварительно обработан, количество отдельных классов составило: «засвет» – 432 фотографии (24,49%), «затемнение» – 513 фотографий (29,13%), «шум» – 113 фотографий (6,38%), «низкий контраст» – 275 фотографий (15,57%), «высокий контраст» – 53 фотографии (3,02%), «размытие» – 212 фотографии (11,98%), «артефакты» – 116 фотографий (6,56%), «выброс» – 51 фотография (2,87%). Итоговый датасет был разделен на обучающую (60% данных) – 1059 фотографии, тестовую (20% данных) – 353 фотографии и валидационную (20% данных) – 353 фотографии, выборки.

В дальнейшем необходимо выработать определение четких критериев для оценки приемлемого качества изображений. Процедура разметки изображений глазного дна и выделения ключевых клинических признаков требует высокой квалификации и временных затрат от врача-офтальмолога, поэтому для создания датасета необходимого качества, достаточного для обучения высокоточной нейросетевой модели, требуется иметь предварительно обработанные данные приемлемого для анализа качества, инструменты предварительной обработки данных, а также расширить объем датасета для проверки точности модели на большем объеме данных [9-11].

ВЫВОДЫ

В исследовании были выполнены поставленные задачи: сформирован датасет OcuDate, проведено аннотирование изображений по классам качества и разработан инструмент предобработки данных, что в последующем позволит провести обучение нейросетевой модели для классификации изображений глазного дна по категориям качества в данном наборе данных, а также предварительная обработка данных могут быть интегрированы в систему анализа и обработки изображений глазного дна при создании экспертной системы поддержки принятия клинических решений врачами-офтальмологами.

ЛИТЕРАТУРА

1. Ting DSW, Pasquale LR, Peng L, Campbell JP, Lee AY, Raman R, et al. Artificial intelligence and deep learning in ophthalmology. Br J Ophthalmol 2019;103(2):167-75. https://doi.org/10.1136/bjophthalmol-2018-313173.
2. Демин, Н.С., Ильясова Н.Ю., Парингер Р.А., Кирш Д.В. Применение искусственного интеллекта в офтальмологи на примере решения задачи семантической сегментации изображения глазного дна. Компьютерная оптика 2023;47(5):824-31. [Demin, N.S., Ilyasova N.Yu., Paringer R.A., Kirsh D.V. Application of artificial intelligence in ophthalmology on the example of solving the problem of semantic segmentation of the fundus image. Komp'yuternaya optika = Computer Optics 2023;47(5):824-31. (In Russian)]. https://doi.org/10.18287/2412-6179-CO-1283.
3. Дорофеев Д.А., Казанова С.Ю., Мовсисян А.Б., Полева Р.П. Искусственный интеллект и нейросети в диагностике глаукомы. Национальный журнал глаукома 2023;22(1):115-28. [Dorofeev D.A., Kazanova S.Yu., Movsisyan A.B., Poleva R.P. Artificial intelligence and neural networks in glaucoma diagnostics. Natsional'nyy zhurnal glaukoma = National journal glaucoma 2023;22(1):115-28. (In Russian)]. https://doi.org/10.53432/2078-4104-2023-22-1-115-128.
4. Дога А.В., Володин П.Л., Никитин О.И., Гарри Д.Д., Тарасов Г.Ю. Первый опыт применения методов искусственного интеллекта в построении трехмерной модели диабетического макулярного отека. Современные технологии в офтальмологии 2020;3(34):19-20. [Doga A.V., Volodin P.L., Nikitin O.I., Garry D.D., Tarasov G.Yu. The first experience of using artificial intelligence methods in constructing a three-dimensional model of diabetic macular edema. Sovremennyye tekhnologii v oftal'mologii = Modern technologies in ophthalmology 2020;3(34):19-20. (In Russian)]. https://doi.org/10.25276/2312-4911-2020-3-19-20.
5. Ивахненко О.И., Нероев В.В., Зайцева О.В. Возрастная макулярная дегенерация и диабетическое поражение глаз. Социально-экономические аспекты заболеваемости. Вестник офтальмологии 2021;137(1):123-9. [Ivakhnenko O.I., Neroev V.V., Zaitseva O.V. Age-related macular degeneration and diabetic eye disease. Socioeconomic aspects of morbidity. Vestnik oftal'mologii = Bulletin of ophthalmology 2021;137(1):123-9. (In Russian)]. https://doi.org/10.17116/oftalma2021137011123
6. Демидова Т. Ю., Кожевников А. А. Диабетическая ретинопатия: история, современные подходы к ведению, перспективные взгляды на профилактику и лечение. Сахарный диабет 2020;23(1):95-105. [Demidova T. Yu., Kozhevnikov A. A. Diabetic retinopathy: history, modern approaches to management, promising views on prevention and treatment. Sakharnyy diabet = Diabetes mellitus 2020;23(1):95-105. (In Russian)]. https://doi.org/10.14341/dm10273.
7. Jin K, Huang X, Zhou J, Li Y, Yan Y, Sun Y, et al. FIVES: A Fundus Image Dataset for Artificial Intelligence based Vessel Segmentation. Sci Data 2022;9(1):475. https://doi.org/10.1038/s41597-022-01564-3.
8. Agrawal R, Walambe R, Kotecha K, Gaikwad A, Deshpande CM, Kulkarni S. HVDROPDB datasets for research in retinopathy of prematurity. Data Brief 2023;52:109839. https://doi.org/10.17632/xw5xc7xrmp.2.
9. Coyner AS, Chen JS, Chang K, Singh P, Ostmo S, Chan RVP, et al. Synthetic Medical Images for Robust, Privacy-Preserving Training of Artificial Intelligence: Application to Retinopathy of Prematurity Diagnosis. Ophthalmol Sci 2022;2(2):100126. https://doi.org/10.1016/j.xops.2022.100126.
10. Каталевская Е.А., Каталевский Д.Ю., Тюриков М.И., Шайхутдинова Э.Ф., Сизов А.Ю. Алгоритм сегментации визуальных признаков диабетической ретинопатии (ДР) и диабетического макулярного отека (ДМО) на цифровых фотографиях глазного дна. Российский журнал телемедицины и электронного здравоохранения 2021;7(4)17-26. [Katalevskaya E.A., Katalevsky D.Yu., Tyurikov M.I., Shaikhutdinova E.F., Sizov A.Yu. Algorithm for segmentation of visual signs of diabetic retinopathy (DR) and diabetic macular edema (DME) in digital fundus photographs. Rossiyskiy zhurnal telemeditsiny i elektronnogo zdravookhraneniya = Russian Journal of Telemedicine and Electronic Health 2021;7(4)17-26. (In Russian)]. https://doi.org/10.29188/2712-9217-2021-7-4-17-26.
11. Нероев В.В., Брагин А.А., Зайцева О.В. Разработка прототипа сервиса для диагностики диабетической ретинопатии по снимкам глазного дна с использованием методов искусственного интеллекта. Национальное здравоохранение 2021;2(2):64-72. [Neroev V.V., Bragin A.A., Zaitseva O.V. Development of a prototype service for diagnosing diabetic retinopathy based on fundus images using artificial intelligence methods. Natsional'noye zdravookhraneniye = National Health 2021;2(2):64-72. (In Russian)]. https://doi.org/10.47093/2713-069x.2021.2.2.64-72.
Прикрепленный файлРазмер
Скачать файл230.97 кб
набор данных; офтальмология; искусственный интеллект; аннотирование; классификация; компьютерное зрение

Я хочу получать электронную версию журнала


Мы в соцсетях

  • VK