В платформу Webiomed добавлена модель машинного обучения для выявления подозрений на заболевания путем интерпретации результатов лабораторной диагностики.
Лабораторные исследования представляют собой важнейшую часть поиска постановки точного диагноза, определяют стратегию лечения заболеваний. Количество лабораторных тестов растет ежегодно, особенно показательным этой тенденции стал 2020 г. из-за пандемии COVID-19. Интерпретация больших данных медицинской лабораторной информации, оценки динамических изменений может представлять трудности для врача.
В этой задаче успешно может помочь технология машинного обучения с построением модели интерпретации лабораторных данных для выявления подозрений на различные заболевания. В рамках проекта Webiomed было решено разработать подобную модель для облегчения выявления заболеваний на основе лабораторных тестов.
Для создания модели машинного обучения был подготовлен набор данных, содержащий информацию о результатах биохимического и клинического анализов крови и сопоставленные с ними диагнозы амбулаторных случаев лечения и госпитализаций. Набор был сформирован на основании сведений из 49 медицинских организаций 9 субъектов РФ, предоставивших в рамках научно-исследовательского сотрудничества обезличенные электронные медицинские карты.
Результатом обработки собранной информации стал набор данных лабораторной диагностики, насчитывающий данные о 133 тыс. пациентов, имевших 192 тыс. случая обращения за медицинской помощью с установленным диагнозом и 5.9 млн. извлеченных лабораторных признака.
Для создания прогностической модели были применены следующие алгоритмы классификации: LogisticRegression, GaussianNB, DecisionTreeClassifier, RandomForestClassifier, xgboost, AdaBoost, LGBM, MLP. Алгоритм RandomForestClassifier позволил получить модель с максимальной точностью, равной 0.89.
Модель обучена анализировать 138 различных лабораторных признака.
Благодаря проведенной работе Webiomed теперь более точно выявляет возможные группы заболевания пациента, используя анализ имеющихся лабораторных данных. Это дает врачам возможность лучше понимать состояние пациента и прогнозировать возможное развитие заболеваний, что в свою очередь помогает улучшить профилактику и своевременное лечение болезни на ранних стадиях её развития.