Выпуск №4, 2025 - стр. 38-44

Разработка модели машинного обучения для прогноза результата склеропластики у детей DOI: 10.29188/2712-9217-2025-11-4-38-44

Для цитирования: Шихалиева Э.А., Костенев С.В., Кечин Е.В. Разработка модели машинного обучения для про- гноза результата склеропластики у детей. Российский журнал телемедицины и электронного здравоохранения 2025;11(4):38-44; https://doi.org/10.29188/2712-9217-2025-11-4-38-44
Шихалиева Э.А., Костенев С.В., Кечин Е.В.
  • Шихалиева Э.А. – врач-ординатор, ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» имени академика С.Н. Федорова» Минздрава России; Москва, Россия; https://orcid.org/0009-0005-1139-0731
  • Костенев С.В. – сотрудник ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» имени академика С.Н. Федорова» Минздрава России; Москва, Россия; РИНЦ Author ID 580574, https://orcid.org/0000-0002-7387-7669
  • Кечин Е.В. – сотрудник ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» имени академика С.Н. Федорова» Минздрава России; ФГБОУ ДПО РМАНПО МЗ РФ, Москва, Россия, РИНЦ Author ID 894794, https://orcid.org/0000-0002-6732-1226
37

ВВЕДЕНИЕ

Прогрессирующая миопия (близорукость) у детей представляет собой одну из наиболее острых медико-социальных проблем современной офтальмологии. По данным всемирных эпидемиологических исследований, распространенность миопии неуклонно растет, и, согласно прогнозам Института зрения Брайена Холдена, к 2050 году миопией будет страдать около 50% населения земного шара, причем у 10% (около 1 млрд человек) прогнозируется миопия высокой степени [1]. Высокая миопия ассоциирована с риском развития таких угрожающих зрению осложнений, как миопическая макулопатия, отслойка сетчатки, катаракта и глаукома, что делает задачу контроля прогрессирования заболевания приоритетной для систем здравоохранения [2].

В арсенале офтальмологов стран СНГ и ряда государств Восточной Европы склероукрепляющие вмешательства (склеропластика) остаются одним из основных методов патогенетического лечения прогрессирующей близорукости [2, 3]. Механизм действия склеропластики основан на механическом укреплении заднего полюса глаза и стимуляции обменных процессов в склере, хориоидее и сетчатке, что способствует стабилизации рефракции и замедлению роста передне-задней оси (ПЗО) глаза. Несмотря на доказанную эффективность в ряде клинических исследований, результат операции варьирует: у части пациентов прогрессирование останавливается, в то время как у других, несмотря на вмешательство, продолжается градиентный рост миопии [4, 5].

Проблема персонализированного отбора пациентов на хирургическое лечение стоит крайне остро [5-7]. Традиционные методы прогнозирования, основанные на линейном анализе отдельных клинических параметров (возраст, годовой градиент прогрессирования), часто не учитывают сложные нелинейные взаимосвязи между биометрическими показателями глаза. В условиях цифровизации здравоохранения и развития телемедицинских технологий появляется возможность использования методов искусственного интеллекта (ИИ) и машинного обучения (Machine Learning, ML) для создания систем поддержки принятия врачебных решений (СППВР) [8, 9, 11].

Алгоритмы машинного обучения демонстрируют высокую эффективность в задачах медицинской диагностики и прогнозирования, зачастую превосходя возможности традиционной статистики. В офтальмологии ML активно применяется для диагностики диабетической ретинопатии, глаукомы и возрастной макулярной дегенерации [10, 12, 14]. Однако работ, посвященных прогнозированию исходов склеропластических операций с использованием ансамблевых методов ML, в мировой литературе представлено недостаточно [13, 15-17].

Цель исследования – разработать модель машинного обучения для прогнозирования исхода склеропластики у детей через 12 месяцев после операции. Создание такой модели позволит врачам первичного звена и специалистам специализированных центров с высокой точностью определять целесообразность хирургического вмешательства, минимизируя количество неэффективных операций и связанных с ними рисков.

МАТЕРИАЛЫ И МЕТОДЫ

Исследование проводилось как ретроспективное когортное исследование на базе одного из ведущих офтальмологических центров России.

Сформирован набор данных о 128 глазах 128 пациентов, которым провели склеропластику в ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» им. акад. С.Н. Федорова» Минздрава России (г. Москва). Критериями включения в исследование являлись: наличие прогрессирующей миопии, возраст пациентов от 8 до 17 лет, выполнение склероукрепляющей операции по единой методике, наличие полных данных клинического обследования до операции и через 1 год после нее. Критерии исключения: наличие сопутствующей офтальмопатологии (кератоконус, увеиты, врожденная глаукома), ранее перенесенные операции на глазном яблоке.

В качестве целевой переменной был прогноз результата склеропластики в виде бинарного признака: благоприятный (64 глаза) и неблагоприятный (64 глаза) исход. Сбалансированность классов в выборке (50% на 50%) является важным методическим аспектом, позволяющим избежать смещения модели в сторону мажоритарного класса и обеспечивающим адекватность метрики Accuracy.

Критерии эффективности были строго формализованы. Благоприятным исходом признавали результат, который соответствовал значению годового градиента прогрессирования через 12 месяцев после склеропластики более -1,00 дптр, а неблагоприятный – -1,00 дптр и менее.

В контексте миопии градиент прогрессирования обычно оценивается в отрицательных значениях. Значение «более -1,00 дптр» (например, -0,5 дптр или 0 дптр) свидетельствует о стабилизации или медленном прогрессировании. Значение «-1,00 дптр и менее» (например, -1,5 или -2,0 дптр) указывает на быстрое прогрессирование, что интерпретируется как отсутствие эффекта от операции.

Независимыми переменными на основании, которых планировалось разрабатывать модели машинного обучения были следующими: возраст, пол, НКОЗ до, Sph до, Cyl до, МКОЗ до, СЭ до, K min до, K max до, R до, ПЗО до.

Расшифровка переменных:

  • Возраст (лет) – предиктор активности роста глаза.
  • Пол – биологический фактор.
  • НКОЗ до – некорригированная острота зрения до операции.
  • Sph до – сферический компонент рефракции (дптр).
  • Cyl до – цилиндрический компонент рефракции (дптр).
  • МКОЗ до – максимально корригированная острота зрения.
  • СЭ до – сферический эквивалент рефракции.
  • K min / K max – кератометрия (преломляющая сила роговицы в сильном и слабом меридианах).
  • R до – радиус кривизны роговицы.
  • ПЗО до – длина передне-задней оси глаза (мм), ключевой морфометрический параметр миопии.

Процедура машинного обучения

Разработку моделей машинного обучения для бинарной классификации проводили с использованием языка программирования Python 3 и библиотеки PyCaret [11]. Библиотека PyCaret представляет собой low-code инструмент автоматизированного машинного обучения, позволяющий значительно ускорить процесс экспериментирования, сравнения алгоритмов и развертывания моделей.

Всего было разработано 19 моделей: Extra Trees Classifier, Linear Discriminant Analysis, Gradient Boosting Classifier, Naive Bayes, Logistic Regression, CatBoost Classifier, K Neighbors Classifier, MLP Classifier, Decision Tree Classifier, Quadratic Discriminant Analysis, Random Forest Classifier, Ada Boost Classifier, Light Gradient Boosting Machine, Gaussian Process Classifier, Extreme Gradient Boosting, SVM – Radial Kernel, Dummy Classifier, Ridge Classifier, SVM – Linear Kernel.

Использование столь широкого спектра алгоритмов, от линейных (Logistic Regression, Ridge) до сложных ансамблевых методов (Gradient Boosting, CatBoost, Extra Trees), обеспечивает робастность исследования и позволяет найти оптимальную гиперплоскость или решающее правило для разделения классов.

Для разработки и тестирования моделей машинного обучения общий набор данных был разделен на обучающую и тестовую выборку в соотношении 69:31, стратификацию проводили по целевой переменной. Стратификация гарантирует, что соотношение благоприятных и неблагоприятных исходов в обучающей и тестовой выборках будет идентичным исходному набору, что критически важно при небольших выборках.

Для каждой модели машинного обучения осуществляли подбор гиперпараметров с использованием кросс-валидации на 10 подвыборках с использованием библиотеки Optuna, оптимизацию осуществляли по метрике AUC. Optuna – это современный фреймворк для автоматической оптимизации гиперпараметров, использующий байесовскую оптимизацию (TPE – Tree-structured

Parzen Estimator), что эффективнее классического перебора по сетке (Grid Search).

Рассчитывали следующие метрики качества моделей: AUC, accuracy, precision, recall, F1-score.

  • AUC (Area Under the Curve ROC) – интегральная метрика качества классификации, устойчивая к дисбалансу классов.
  • Accuracy – доля правильных ответов.
  • Precision (Точность) – способность модели не присваивать положительную метку отрицательному объекту.
  • Recall (Полнота) – способность модели найти все положительные объекты.
  • F1-score – гармоническое среднее между Precision и Recall.

Оценку важности признаков моделей проводили с использованием метода feature_importances_. Это позволяет интерпретировать модель, объясняя врачу, какие именно клинические параметры повлияли на прогноз.

РЕЗУЛЬТАТЫ

В ходе экспериментального моделирования было проведено обучение и валидация 19 алгоритмов классификации.

Разработаны 19 моделей машинного обучения для бинарной классификации исхода склеропластики у детей через 12 месяцев после операции (благоприятный/неблагоприятный исход), среди которых наилучшее качество по метрике AUC показала модель Extra Trees Classifier (AUC 0,79), все другие метрики качества (Accuracy, Precision, Recall, F1) для данной модели составили 0,70.

Модель Extra Trees (Extremely Randomized Trees) является ансамблевым методом, похожим на Random Forest, но с большей степенью случайности при выборе разделений в узлах деревьев, что часто позволяет снизить дисперсию (variance) модели и уменьшить риск переобучения на малых выборках. Значение AUC 0,79 интерпретируется как «хорошее» качество классификации, позволяющее использовать модель в клинической практике в качестве скринингового инструмента. Метрики Accuracy, Precision, Recall и F1 на уровне 0,70 свидетельствуют о сбалансированности модели: она с одинаковой успешностью выявляет как пациентов, которым операция поможет, так и тех, для кого она будет неэффективна.

Анализ важности признаков

Ключевым аспектом для клинического доверия к модели является интерпретируемость. Наиболее важными признаками для прогноза явились следующие показатели: возраст пациента, сферический компонент рефракции до операции, ПЗО до операции и НКОЗ до операции.

Можно выделить следующую патофизиологическую обоснованность данных признаков:

  1. Возраст. Является мощнейшим предиктором прогрессирования. Известно, что раннее начало миопии (в 7-9 лет) ассоциировано с более агрессивным течением и худшим прогнозом по сравнению с миопией, возникшей в подростковом возрасте34.
  2. ПЗО (длина глаза). Исходная длина глаза коррелирует с запасом прочности склеры. Экстремально длинные глаза могут хуже реагировать на стандартные техники склеропластики из-за истончения оболочек.
  3. Сферический компонент (Sph). Отражает текущую степень миопии.
  4. НКОЗ. Косвенно отражает функциональное состояние зрительного анализатора и степень рефракционных нарушений.

ОБСУЖДЕНИЕ

В эпоху доказательной медицины и перехода к парадигме 4P-медицины (предиктивная, профилактическая, персонализированная, партисипативная), разработка инструментов прогнозирования исходов лечения становится стандартом. Наше исследование показало, что методы машинного обучения способны извлекать скрытые паттерны из стандартных клинических данных для прогноза эффективности склеропластики.

Сравнительный анализ и технические аспекты

Выбор Extra Trees Classifier как лучшей модели согласуется с рядом исследований в области биомедицинской информатики, где ансамблевые методы часто превосходят нейронные сети на табличных данных малого и среднего объема (менее 10 000 наблюдений). Нейронные сети, такие как MLP, требуют значительно больших объемов данных для настройки весов, в то время как деревья решений эффективно работают с нелинейными зависимостями и устойчивы к выбросам.

Достигнутая точность (AUC 0,79) является обнадеживающей, однако указывает на наличие факторов, не учтенных в модели. Вероятно, генетические маркеры, биомеханические свойства корнеосклеральной оболочки (гистерезис роговицы) или уровень повседневной зрительной нагрузки могли бы повысить точность прогноза. Тем не менее, использование только стандартных параметров (рефракция, биометрия, возраст) делает разработанную модель универсальной и доступной для любого офтальмологического кабинета, не оснащенного дорогостоящим оборудованием для генетического анализа или анализа биомеханики глаза.

Значение для телемедицины и электронного здравоохранения

Разработанная модель имеет высокий потенциал для интеграции в телемедицинские сервисы.

  1. Логистика пациентов. Врач районной поликлиники может ввести данные пациента (возраст, рефракцию, ПЗО) в веб-интерфейс или мобильное приложение, подключенное к модели, и получить вероятность успешного исхода операции. Это позволит направлять в федеральные центры только тех детей, у которых прогнозируется высокий эффект от хирургии.
  2. Второе мнение. Система может служить инструментом «второго мнения» для молодых специалистов, снижая вероятность врачебных ошибок.
  3. Оптимизация ресурсов. Снижение числа операций с заведомо низким прогнозируемым эффектом позволит перераспределить ресурсы здравоохранения на более эффективные методы лечения для данной группы пациентов (например, ортокератологию или контроль периферического дефокуса).

Ограничения исследования

К ограничениям работы следует отнести относительно небольшой объем выборки (128 глаз), что характерно для пилотных медицинских исследований, а также ретроспективный дизайн. Валидация модели на внешней выборке из других клинических центров необходима для подтверждения ее обобщающей способности.

ВЫВОДЫ

  1. Интеграция искусственного интеллекта в детскую офтальмохирургию открывает новые горизонты персонализированного лечения.
  2. Разработанная модель показала приемлемое качество для прогнозирования исхода склеропластики у детей через 12 месяцев после операции.
  3. Практическое применение данной модели, особенно в формате телемедицинского сервиса, способно повысить качество оказания офтальмологической помощи, обеспечивая научно обоснованный подход к выбору тактики лечения прогрессирующей миопии.
  4. Дальнейшие исследования должны быть направлены на расширение набора данных, включение новых предикторов (биомеханика, генетика) и проведение проспективных мультицентровых испытаний.

ЛИТЕРАТУРА

1. Morgan IG, Ohno-Matsui K, Saw SM. Myopia. Lancet 2012;379(9827):1739-48.
2. Holden BA, Fricke TR, Wilson DA, et al. Global Prevalence of Myopia and High Myopia and Temporal Trends from 2000 through 2050. Ophthalmology 2016;123(5):1036-42.
3. Шихалиева ЭА, Костенев СВ, Кечин ЕВ. Разработка модели машинного обучения для прогноза результата склеропла стики у детей. Тезисы доклада. ФГАУ «НМИЦ «МНТК «Мик рохирургия глаза» им. акад. С.Н. Федорова». 2023.
4. Grzybowski A, Kanclerz P, Tsubota K, Lanca C, Saw SM. A re view on the epidemiology of myopia in school children world wide. BMC Ophthalmol 2020;20(1):27.
5. Avetisov SE, Tarutta EP, Iomdina EN, et al. Nonsurgical and surgical methods of myopia control. Vestn Oftal- mol 2018;134(6):13-20.
6. Huang J, Wen D, Wang Q, et al. Efficacy Comparison of 16 Interventions for Myopia Control in Children: A Network Meta analysis. Ophthalmology 2016;123(4):697-708.
7. Ward A, Tarutta E, Mayer MJ. The efficacy and safety of posterior pole reinforcement in the treatment of high myopia: a systematic review. J Pediatr Ophthalmol Strabismus 2009;46(6):326-33.
8. Ting DSW, Pasquale LR, Peng L, et al. Artificial intelligence and deep learning in ophthalmology. Br J Ophthal- mol 2019;103(2):167-75.
9. Lin H, Long E, Ding X, et al. Prediction of myopia development among Chinese school-aged children using refraction data: A deep learning study. PLoS Med 2018;15(11):e1002674.
10. Alyoubi WL, Shalabi WM, Alragas AM. Diabetic retinopathy detection through deep learning techniques: A review. Inform Med Unlocked 2020;20:100377.
11. Ali M, Jung LT, Abdel-Aty AH, et al. PyCaret: An open source, low-code machine learning library in Python. PyCaret.org 2020.
12. Akiba T, Sano S, Yanase T, et al. Optuna: A Next-generation Hyperparameter Optimization Framework. Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Dis covery & Data Mining. 2019:2623–2631.
13. Geurts P, Ernst D, Wehenkel L. Extremely randomized trees. Mach Learn 2006;63(1):3-42.
14. Chua SY, Sabanayagam C, Cheung YB, et al. Age of onset of myopia predicts risk of high myopia in later childhood in myopic Singapore children. Ophthalmic Physiol Opt 2016;36(4):388-94.
15. Shwartz-Ziv R, Armon A. Tabular Data: Deep Learning is Not All You Need. Inf Fusion 2022;81:84-90.
16. Iomdina E, Tarutta E. Biomechanics of the sclera in myopia. In: Myopia and the Control of Eye Growth. Karger Publishers 2016:164-87.
17. Walline JJ, Lindsley KB, Vedula SS, et al. Interventions to slow progression of myopia in children. Cochrane Database Syst Rev 2011;(12):CD004916.
миопия; склеропластика; машинное обучение; искусственный интеллект; прогнозирование; PyCaret; офтальмология; телемедицина

Я хочу получать электронную версию журнала


Мы в соцсетях

  • VK