Number №4, 2025 - page 38-44

Разработка модели машинного обучения для прогноза результата склеропластики у детей DOI: 10.29188/2712-9217-2025-11-4-38-44

For citation: Шихалиева Э.А., Костенев С.В., Кечин Е.В. Разработка модели машинного обучения для про- гноза результата склеропластики у детей. Российский журнал телемедицины и электронного здравоохранения 2025;11(4):38-44; https://doi.org/10.29188/2712-9217-2025-11-4-38-44
Шихалиева Э.А., Костенев С.В., Кечин Е.В.
  • Шихалиева Э.А. – врач-ординатор, ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» имени академика С.Н. Федорова» Минздрава России; Москва, Россия; https://orcid.org/0009-0005-1139-0731
  • Костенев С.В. – сотрудник ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» имени академика С.Н. Федорова» Минздрава России; Москва, Россия; РИНЦ Author ID 580574, https://orcid.org/0000-0002-7387-7669
  • Кечин Е.В. – сотрудник ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» имени академика С.Н. Федорова» Минздрава России; ФГБОУ ДПО РМАНПО МЗ РФ, Москва, Россия, РИНЦ Author ID 894794, https://orcid.org/0000-0002-6732-1226
30

Введение. Прогрессирующая миопия (близорукость) у детей представляет собой одну из наиболее острых медико-социальных проблем современной офтальмологии.

Цель исследования – разработать модель машинного обучения для прогнозирования исхода склеропластики у детей через 12 месяцев после операции.

Материалы и методы. Сформирован набор данных о 128 глазах 128 пациентов, которым провели склеропластику в ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» им. акад. С.Н. Федорова» Минздрава России (г. Москва). Разработку моделей машинного обучения для бинарной классификации проводили с использованием языка программирования Python 3 и библиотеки PyCaret.

Всего было разработано 19 моделей: Extra Trees Classifier, Linear Discriminant Analysis, Gradient Boosting Classifier, Naive Bayes, Logistic Regression, CatBoost Classifier, K Neighbors Classifier, MLP Classifier, Decision Tree Classifier, Quadratic Discriminant Analysis, Random Forest Classifier, Ada Boost Classifier, Light Gradient Boosting Machine, Gaussian Process Classifier, Extreme Gradient Boosting, SVM – Radial Kernel, Dummy Classifier, Ridge Classifier, SVM – Linear Kernel. В качестве целевой переменной был прогноз результата склеропластики в виде бинарного признака: благоприятный (64 глаза) и неблагоприятный (64 глаза) исход. Благоприятным исходом признавали результат, который соответствовал значению годового градиента прогрессирования через 12 месяцев после склеропластики более -1,00 дптр, а неблагоприятный – -1,00 дптр и менее. Независимыми переменными на основании, которых планировалось разрабатывать модели машинного обучения были следующими: возраст, пол, НКОЗ до, Sph до, Cyl до, МКОЗ до, СЭ до, K min до, K max до, R до, ПЗО до. Для каждой модели машинного обучения осуществляли подбор гиперпараметров с использованием кросс-валидации на 10 подвыборках с использованием библиотеки Optune, оптимизацию осуществляли по метрике AUC. Рассчитывали следующие метрики качества моделей: AUC, accuracy, precision, recall, F1-score. Для разработки и тестирования моделей машинного обучения общий набор данных был разделен на обучающую и тестовую выборку в соотношении 69:31, стратификацию проводили по целевой переменной. Оценку важности признаков моделей проводили с использованием метода feature_importances_.

Результаты. Разработаны 19 моделей машинного обучения для бинарной классификации исхода склеропластики у детей через 12 месяцев после операции (благоприятный / неблагоприятный исход), среди которых наилучшее качество по метрике AUC показала модель Extra Trees Classifier (AUC 0,79), все другие метрики качества (Accuracy, Precision, Recall, F1) для данной модели составили 0,70. Наиболее важными признаками для прогноза явились следующие показатели: возраст пациента, сферический компонент рефракции до операции, ПЗО до операции и НКОЗ до операции.

Заключение. Разработанная модель показала приемлемое качество для прогнозирования исхода склеропластики у детей через 12 месяцев после операции.


Я хочу получать электронную версию журнала