Сервис Webiomed.NLP позволяет автоматически «извлекать» из медицинских текстовых записей структурированные признаки.
Почему это важно
Сегодня в электронных медицинских картах (ЭМК) до 80% врачебных записей хранится в текстовом виде. Из-за этого их невозможно обработать и использовать для машинного анализа.
Сервис Webiomed.NLP позволяет автоматически «извлекать» из медицинских текстовых записей структурированные признаки. Например: симптомы из жалоб, данные об артериальном давлении, росте и весе пациента из неструктурированных объективных данных, лабораторные показатели из выписок и многое другое.
Количество извлекаемых признаков
На данный момент система Webiomed поддерживает извлечение 1261 признаков, больше половины из которых – МНН (международное непатентованное название) лекарственных препаратов. На текущий момент это порядка 700 признаков.
Документы ЭМК
Извлечение данных доступно из четырёх типов документов: Протокол осмотра, Эпикриз по законченному случаю амбулаторный, Инструментальное исследование, Эпикриз в стационаре выписной. Каждый из типов документов поддерживает уникальное количество признаков, присущих определенному типу документа.
Помимо извлечения общих признаков из медицинских документов с помощью сервиса извлекаются признаки сердечно-сосудистых заболеваний и осложнений беременности, родов и послеродового периода (преэклампсии).
Модели NLP
В настоящий момент в Webiomed подключено 9 моделей, извлекающих признаки и симптомы ССЗ, а также 5 моделей, извлекающих признаки преэклампсии.
Команда NLP проекта Webiomed работает не только в направлении увеличения количества извлекаемых признаков, но также улучшает старые модели, добиваясь более качественных результатов извлечения признаков и повышая метрики точности до границы не менее 0.9.
В определенный момент, при разработке NLP моделей, остро встал вопрос с грамотной обработкой отрицаний признаков. Довольно часто встречающиеся отрицания признаков в явном или неявном виде не отбрасывались, а записывались в результаты извлечения как положительный результат. Но благодаря внедрению мультиклассификации в модели с бинарными признаками, модели получилось обучить таким образом, что большинство отрицаний начали корректно обрабатываться, что существенно увеличило качество моделей.
Что планируется
Мы планируем существенно увеличить количество извлекаемых симптомов из протоколов осмотров, инструментальных исследований для дальнейшего развития предиктивных способностей нашей системы, создать комплекс моделей для извлечения всех существующих МНН лекарственных препаратов.
Подробнее о сервисе Webiomed. NLP здесь: https://webiomed.ai/products/webiomednlp/
О применении NLP для извлечения информации из электронных медицинских карт в нашем материале блога: https://webiomed.ai/blog/primenenie-nlp-dlia-izvlecheniia-informatsii-iz-elektronnykh-meditsinskikh-kart/