Системы искусственного интеллекта (СИИ), применяемые в здравоохранении России, в основном, – это автоматически обучаемые системы (системы машинного обучения). При правильно выбранном математическом аппарате и методе обучения результат обучения всецело зависит от качества обучающей выборки – набора структурированных оцифрованных медицинских данных (датасета). Обеспечить требуемое качество данных возможно только в случае правильной организации процессов сбора и предварительной подготовки данных. Этой проблеме посвящена настоящая работа.
Основной акцент делается на необходимости создания единого федерального стандарта сбора структурированных оцифрованных медицинских данных, позволяющего унифицировать процессы сбора и формирования датасетов для медицинских организаций.
Необходимость совершенствования сбора и подготовки данных для машинного обучения в здравоохранении
В отрасли здравоохранения для развития СИИ и систем поддержки принятия врачебных решений (СППВР) в первую очередь необходимы качественные датасеты из структурированных оцифрованных медицинских данных с максимальной полнотой охвата набора признаков распознавания, результирующих классов распознаваемых образов, первичных источников данных, результатов решений задач распознавания экспертами, потоков сбора, обработки и выдачи информации.
В этой связи должна быть выстроена логическая цепочка: структурированные оцифрованные медицинские данные – качественные датасеты – ИИ (СППВР) (рис. 1). Сейчас у нас существенный ряд проблем в первом, а соответственно и втором этапах, являющихся фундаментом всего.
Данные для принятия организационно-управленческих решений как в отдельных медицинских организациях, так и по отрасли в целом (медицинские транзакции, факты выполненных работ и расходования ресурсов) оцифрованы и присутствуют во всех медицинских информационных системах (МИС). А данные для врачебных решений в ходе процесса диагностики, маршрутизации и лечения пациентов (жалобы, анамнез, результаты осмотра врача) оцифрованы частично, присутствуют в МИС в основном в текстовом неструктурированном формате, включая:
Единый Федеральный стандарт сбора медицинских данных
Для развития и массового применения СИИ в здравоохранении РФ важно построить систему сбора структурированных и оцифрованных медицинских данных, начиная с анамнеза, жалоб и данных осмотра врача. При этом требуется строить ее не в рамках одной МИС для одной или нескольких МО или регионов, а создать и внедрить единый федеральный стандарт (формат данных, протокол информационного обмена и регламент сбора) для всех программно-информационных и программно-аппаратных медицинских систем страны (МИС МО и других). Тогда становится возможной унификация процессов сбора данных и формирования качественных датасетов для любой медицинской организации в строящемся сейчас домене «Здравоохранение». И вооруженные системами искусственного интеллекта врачи всех регионов смогут читать и использовать их.
В настоящее время получение качественных наборов данных для СИИ является крайне сложной задачей. Как правило, создание наборов данных осуществляется ретроспективно и на основе данных реальной клинической практики (ДРКП, RWD). На рисунке 2 зеленым отмечены структурированные области данных и желтым не оцифрованные. Датасеты, где собрана информация о лечении, очень часто не соответствующем клиническим рекомендациям, к качественной работе систем ИИ не приведут.
Реинжиниринг сбора медицинских данных
При разработке и внедрении комплексной стандартизованной системы структурирования и оцифровки медицинских данных, наборы данных необходимо формировать проспективно с первого дня внедрения, последовательно и полноценно. При широком внедрении процесс сбора необходимых и достаточных для обучения СИИ объёмов данных может быть очень быстрым. На таких базах данных со временем можно будет строить и многофункциональные системы ИИ.
При этом появляется еще одна важная задача: реинжиниринг сбора медицинских данных [1]. Сейчас это делает врач, который является единственным источником данных о здоровье пациента в МИС. Только врач своими руками вводит все данные в МИС, что требует больших затрат времени и приводит к низкому качеству собираемой информации. Необходимо привлечь к этому процессу население – пациентов через имеющийся практически у всех гаджеты, персональные медицинских помощники, носимые устройства и т.п. (рис. 3).
Практически у всего населения есть смартфоны, которые должны стать цифровым инструментом врача в руках пациента. Например, рассмотрим идею создания и внедрения доврачебных диагностических опросников [2] в мобильном приложении, программе на компьютере или терминале в поликлинике.
В результате внедрения приложения с доврачебными диагностическими опросниками можно ожидать следующих эффектов:
Единый состав доврачебных диагностических опросников в мобильных приложениях для различных МИС может позволить использовать эту информацию в федеральном масштабе (рис. 4).
Следующее средство автоматизации сбора структурированных данных – приложение «Врачебный осмотр». Такой стандартизованные модуль для любой МИС домена «Здравоохранение» значительно снизит издержки врача на заполнение первичной медицинской документации. Программное обеспечение позволит практически исключить работу с клавиатурой, основными инструментами ввода данных сделать сенсорную панель, мышь и микрофон.
Предлагаемый подход формирует семейство цифровых помощников, автоматизирующих процесс сбора первичных актуальных структурированных медицинских данных на всех этапах амбулаторной медицинской помощи (табл. 1).
ЭТАПЫ АМП | ЦИФРОВАЯ ПОДДЕРЖКА | ПАЦИЕНТ | ВРАЧ | ЦИФРОВАЯ ПОДДЕРЖКА |
---|---|---|---|---|
Подготовка визита к врачу | Доврачебный диагностический опросник в мобильном приложении/ терминале в регистратуре | Заполнение доврачебного диагностического опросника по профилю врача | СППВР – Диагностические гипотезы – 1 (на базе результатов доврачебного диагностического опросника) | |
Прием врача первичный | Визит к врачу | +Врачебный осмотр +Установка предварительного диагноза +Программа дообследования | Цифровой помощник – «Врачебный осмотр» СППВР – Диагностические гипотезы – 2 (+ данные врачебного осмотра) СППВР – Клинические рекомендации по программе диагностики (выбор из возможных вариантов) | |
Дообследование | Диагностические процедуры | Системы ИИ | ||
Прием врача повторный | Визит к врачу | +Установка диагноза +Назначение лечения | СППВР – Диагностические гипотезы – 3 (+ лабораторные и диагностические данные). СППВР – Клинические рекомендации по протоколам лечения (выбор из возможных вариантов) | |
Амбулаторное лечение | Мониторинговый опросник в мобильном приложении | Амбулаторное лечение | Удаленный мониторинг | Мониторинг состояния через асинхронную коммуникацию |
Прием врача повторный | Визит к врачу | +Контроль эффективности лечения +Рекомендации | Результаты мониторинга | |
Диспансерное наблюдение | Мониторинговый опросник в мобильном приложении | Удаленное наблюдение | Удаленный мониторинг | Мониторинг состояния через асинхронную коммуникацию |
Диспансеризация – первый этап | Доврачебный диагностический опросник в мобильном приложении | Ежегодное заполнение диагностического опросника по программе диспансеризации | Система ИИ Маршрутизация на второй этап |
Методологические проблемы сбора медицинских данных
Проблемы сбора данных для построения систем искусственного интеллекта в отечественном здравоохранении с методологической точки зрения выглядят следующим образом:
Описанные методологические проблемы сбора данных существенно сдерживают развитие СИИ в медицине и требуют основательного системного подхода при решении задач формирования медицинских датасетов.
План развития системы сбора медицинских данных
Учитывая представленные выше соображения, нами предлагается следующий план организации сбора и подготовки данных для развития ИИ в здравоохранении России:
Объявление Президентом России о формировании национального проекта «Экономика данных», первым пунктом которого выделена задача сбора данных, подчеркивает важность решения описанных в настоящей статье проблем. Предлагаем сосредоточить усилия специалистов в области медицинской информатики в этом направлении.
Прикрепленный файл | Размер |
---|---|
Скачать файл | 908.45 кб |