Эксперты из компании «К-Скай» (разработчик платформы Webiomed) разработали модели прогнозирования преэклампсии с использованием данных реальной клинической практики и машинного обучения. Достигнутые результаты позволили авторам сделать вывод о возможности использования созданной модели в реальной клинической практике.
Одна из ведущих причин материнской и младенческой смертности – преэклампсия (ПЭ). Это грозное и трудно прогнозируемое осложнение беременности, характеризующееся полиорганной дисфункцией, встречается с частотой 2-8% среди всех беременностей. ПЭ – чрезвычайно коварна: из-за того, что в патологический процесс вовлекаются различные системы органов и клиническая картина полиорганной дисфункции у разных пациенток широко варьирует, ПЭ трудно своевременно диагностировать. Еще труднее дать прогноз ее наступления и прогрессирования.
Таким образом, для врачей-клиницистов важным подспорьем в практике может стать многофакторная модель эффективного прогнозирования ПЭ, позволяющая своевременно принимать правильные клинические решения. Разработать модель прогнозирования общего риска ПЭ и риска ранней ПЭ с использованием технологий машинного обучения на основе данных реальной клинической практики в I триместре беременности поставил своей целью коллектив российских исследователей из проекта Webiomed.
Учеными проведено ретроспективное исследование базы данных платформы прогнозной аналитики Webiomed, содержащей обезличенные данные 11,6 млн электронных медицинских карт различных регионов России. Из этой базы данных было выделено 21 092 записи, соответствующие 12 434 уникальным беременностям 12 283 женщин (2004-2022 гг.) в возрасте от 11 до 60 лет на сроке до 16 недель включительно. Для разработке модели были использованы технологии машинного обучения, включая комплексный и многоступенчатый процесс, связанный со сбором, обработкой и анализом большого количества информации, активным взаимодействием между врачам и специалистами по искусственному интеллекту. В качестве методов и алгоритмов машинного обучения были применены логистическая регрессия (LR), методы градиентного бустинга (LightGBM, XGBoost, CatBoost) и методы, основанные на деревьях решений (RandomForest и ExtraTrees).
Наилучшие результаты решения задачи прогнозирования ПЭ показала модель ExtraTrees, которая в качестве прогностических факторов может учитывать 53 признака, автоматически извлекаемых из врачебных медицинских записей, включая анамнестические, конституциональные, клинические, инструментальные и лабораторные данные. В результате проведения независимой клинической валидации были получены следующие метрики качества работы модели: площадь под кривой (AUC) составила 0,848 (95% ДИ 0,785–0,904), точность – 0,813 (95% ДИ 0,798–0,828), чувствительность – 0,733 (95% ДИ 0,565–0,885), специфичность – 0,814 (95% ДИ 0,799–0,828). При этом результаты внешней валидации показали хорошую устойчивость модели к новым данным.
"Это наш первый опыт прогнозирования с помощью машинного обучения опасного осложнения беременности на основе данных реальной клинической практики. Качество предиктивной модели напрямую зависит от используемых данных и математических моделей, которые нам предстоит улучшить в будущих исследованиях", - отметила руководитель направления искусственного интеллекта Webiomed Анна Андрейченко.
Исследование опубликовано в 10-м номере журнала «Акушерство и Гинекология» (2023 г.) здесь: https://aig-journal.ru/