Прогрессирующая миопия (близорукость) у детей представляет собой одну из наиболее острых медико-социальных проблем современной офтальмологии. По данным всемирных эпидемиологических исследований, распространенность миопии неуклонно растет, и, согласно прогнозам Института зрения Брайена Холдена, к 2050 году миопией будет страдать около 50% населения земного шара, причем у 10% (около 1 млрд человек) прогнозируется миопия высокой степени [1]. Высокая миопия ассоциирована с риском развития таких угрожающих зрению осложнений, как миопическая макулопатия, отслойка сетчатки, катаракта и глаукома, что делает задачу контроля прогрессирования заболевания приоритетной для систем здравоохранения [2].
В арсенале офтальмологов стран СНГ и ряда государств Восточной Европы склероукрепляющие вмешательства (склеропластика) остаются одним из основных методов патогенетического лечения прогрессирующей близорукости [2, 3]. Механизм действия склеропластики основан на механическом укреплении заднего полюса глаза и стимуляции обменных процессов в склере, хориоидее и сетчатке, что способствует стабилизации рефракции и замедлению роста передне-задней оси (ПЗО) глаза. Несмотря на доказанную эффективность в ряде клинических исследований, результат операции варьирует: у части пациентов прогрессирование останавливается, в то время как у других, несмотря на вмешательство, продолжается градиентный рост миопии [4, 5].
Проблема персонализированного отбора пациентов на хирургическое лечение стоит крайне остро [5-7]. Традиционные методы прогнозирования, основанные на линейном анализе отдельных клинических параметров (возраст, годовой градиент прогрессирования), часто не учитывают сложные нелинейные взаимосвязи между биометрическими показателями глаза. В условиях цифровизации здравоохранения и развития телемедицинских технологий появляется возможность использования методов искусственного интеллекта (ИИ) и машинного обучения (Machine Learning, ML) для создания систем поддержки принятия врачебных решений (СППВР) [8, 9, 11].
Алгоритмы машинного обучения демонстрируют высокую эффективность в задачах медицинской диагностики и прогнозирования, зачастую превосходя возможности традиционной статистики. В офтальмологии ML активно применяется для диагностики диабетической ретинопатии, глаукомы и возрастной макулярной дегенерации [10, 12, 14]. Однако работ, посвященных прогнозированию исходов склеропластических операций с использованием ансамблевых методов ML, в мировой литературе представлено недостаточно [13, 15-17].
Цель исследования – разработать модель машинного обучения для прогнозирования исхода склеропластики у детей через 12 месяцев после операции. Создание такой модели позволит врачам первичного звена и специалистам специализированных центров с высокой точностью определять целесообразность хирургического вмешательства, минимизируя количество неэффективных операций и связанных с ними рисков.
Исследование проводилось как ретроспективное когортное исследование на базе одного из ведущих офтальмологических центров России.
Сформирован набор данных о 128 глазах 128 пациентов, которым провели склеропластику в ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» им. акад. С.Н. Федорова» Минздрава России (г. Москва). Критериями включения в исследование являлись: наличие прогрессирующей миопии, возраст пациентов от 8 до 17 лет, выполнение склероукрепляющей операции по единой методике, наличие полных данных клинического обследования до операции и через 1 год после нее. Критерии исключения: наличие сопутствующей офтальмопатологии (кератоконус, увеиты, врожденная глаукома), ранее перенесенные операции на глазном яблоке.
В качестве целевой переменной был прогноз результата склеропластики в виде бинарного признака: благоприятный (64 глаза) и неблагоприятный (64 глаза) исход. Сбалансированность классов в выборке (50% на 50%) является важным методическим аспектом, позволяющим избежать смещения модели в сторону мажоритарного класса и обеспечивающим адекватность метрики Accuracy.
Критерии эффективности были строго формализованы. Благоприятным исходом признавали результат, который соответствовал значению годового градиента прогрессирования через 12 месяцев после склеропластики более -1,00 дптр, а неблагоприятный – -1,00 дптр и менее.
В контексте миопии градиент прогрессирования обычно оценивается в отрицательных значениях. Значение «более -1,00 дптр» (например, -0,5 дптр или 0 дптр) свидетельствует о стабилизации или медленном прогрессировании. Значение «-1,00 дптр и менее» (например, -1,5 или -2,0 дптр) указывает на быстрое прогрессирование, что интерпретируется как отсутствие эффекта от операции.
Независимыми переменными на основании, которых планировалось разрабатывать модели машинного обучения были следующими: возраст, пол, НКОЗ до, Sph до, Cyl до, МКОЗ до, СЭ до, K min до, K max до, R до, ПЗО до.
Расшифровка переменных:
Разработку моделей машинного обучения для бинарной классификации проводили с использованием языка программирования Python 3 и библиотеки PyCaret [11]. Библиотека PyCaret представляет собой low-code инструмент автоматизированного машинного обучения, позволяющий значительно ускорить процесс экспериментирования, сравнения алгоритмов и развертывания моделей.
Всего было разработано 19 моделей: Extra Trees Classifier, Linear Discriminant Analysis, Gradient Boosting Classifier, Naive Bayes, Logistic Regression, CatBoost Classifier, K Neighbors Classifier, MLP Classifier, Decision Tree Classifier, Quadratic Discriminant Analysis, Random Forest Classifier, Ada Boost Classifier, Light Gradient Boosting Machine, Gaussian Process Classifier, Extreme Gradient Boosting, SVM – Radial Kernel, Dummy Classifier, Ridge Classifier, SVM – Linear Kernel.
Использование столь широкого спектра алгоритмов, от линейных (Logistic Regression, Ridge) до сложных ансамблевых методов (Gradient Boosting, CatBoost, Extra Trees), обеспечивает робастность исследования и позволяет найти оптимальную гиперплоскость или решающее правило для разделения классов.
Для разработки и тестирования моделей машинного обучения общий набор данных был разделен на обучающую и тестовую выборку в соотношении 69:31, стратификацию проводили по целевой переменной. Стратификация гарантирует, что соотношение благоприятных и неблагоприятных исходов в обучающей и тестовой выборках будет идентичным исходному набору, что критически важно при небольших выборках.
Для каждой модели машинного обучения осуществляли подбор гиперпараметров с использованием кросс-валидации на 10 подвыборках с использованием библиотеки Optuna, оптимизацию осуществляли по метрике AUC. Optuna – это современный фреймворк для автоматической оптимизации гиперпараметров, использующий байесовскую оптимизацию (TPE – Tree-structured
Parzen Estimator), что эффективнее классического перебора по сетке (Grid Search).
Рассчитывали следующие метрики качества моделей: AUC, accuracy, precision, recall, F1-score.Оценку важности признаков моделей проводили с использованием метода feature_importances_. Это позволяет интерпретировать модель, объясняя врачу, какие именно клинические параметры повлияли на прогноз.
В ходе экспериментального моделирования было проведено обучение и валидация 19 алгоритмов классификации.
Разработаны 19 моделей машинного обучения для бинарной классификации исхода склеропластики у детей через 12 месяцев после операции (благоприятный/неблагоприятный исход), среди которых наилучшее качество по метрике AUC показала модель Extra Trees Classifier (AUC 0,79), все другие метрики качества (Accuracy, Precision, Recall, F1) для данной модели составили 0,70.
Модель Extra Trees (Extremely Randomized Trees) является ансамблевым методом, похожим на Random Forest, но с большей степенью случайности при выборе разделений в узлах деревьев, что часто позволяет снизить дисперсию (variance) модели и уменьшить риск переобучения на малых выборках. Значение AUC 0,79 интерпретируется как «хорошее» качество классификации, позволяющее использовать модель в клинической практике в качестве скринингового инструмента. Метрики Accuracy, Precision, Recall и F1 на уровне 0,70 свидетельствуют о сбалансированности модели: она с одинаковой успешностью выявляет как пациентов, которым операция поможет, так и тех, для кого она будет неэффективна.
Ключевым аспектом для клинического доверия к модели является интерпретируемость. Наиболее важными признаками для прогноза явились следующие показатели: возраст пациента, сферический компонент рефракции до операции, ПЗО до операции и НКОЗ до операции.
Можно выделить следующую патофизиологическую обоснованность данных признаков:
В эпоху доказательной медицины и перехода к парадигме 4P-медицины (предиктивная, профилактическая, персонализированная, партисипативная), разработка инструментов прогнозирования исходов лечения становится стандартом. Наше исследование показало, что методы машинного обучения способны извлекать скрытые паттерны из стандартных клинических данных для прогноза эффективности склеропластики.
Выбор Extra Trees Classifier как лучшей модели согласуется с рядом исследований в области биомедицинской информатики, где ансамблевые методы часто превосходят нейронные сети на табличных данных малого и среднего объема (менее 10 000 наблюдений). Нейронные сети, такие как MLP, требуют значительно больших объемов данных для настройки весов, в то время как деревья решений эффективно работают с нелинейными зависимостями и устойчивы к выбросам.
Достигнутая точность (AUC 0,79) является обнадеживающей, однако указывает на наличие факторов, не учтенных в модели. Вероятно, генетические маркеры, биомеханические свойства корнеосклеральной оболочки (гистерезис роговицы) или уровень повседневной зрительной нагрузки могли бы повысить точность прогноза. Тем не менее, использование только стандартных параметров (рефракция, биометрия, возраст) делает разработанную модель универсальной и доступной для любого офтальмологического кабинета, не оснащенного дорогостоящим оборудованием для генетического анализа или анализа биомеханики глаза.
Разработанная модель имеет высокий потенциал для интеграции в телемедицинские сервисы.
К ограничениям работы следует отнести относительно небольшой объем выборки (128 глаз), что характерно для пилотных медицинских исследований, а также ретроспективный дизайн. Валидация модели на внешней выборке из других клинических центров необходима для подтверждения ее обобщающей способности.