22 августа 2023

Опыт стажировки в проекте Webiomed: применение NLP неструктурированных медицинских текстов

918

Стажировка занимает важное место в профессиональном развитии студента. Она позволяет получить ценный опыт работы в реальной профессиональной среде и применить полученные знания на практике.

Недавно в нашей компании "К-Скай" прошла стажировку Мария Казакова, магистр КНИТУ-КАИ, направление "Прикладная математика и информатика". Мария получила практический опыт в области обработки медицинских текстов с помощью NLP, о чем рассказала для блога компании К-Скай.

На последнем курсе магистратуры для меня было важно найти стажировку на стыке технологий искусственного интеллекта и медицины, так как я уже являюсь практикующим врачом, кандидатом медицинских наук и получала второе высшее образование в области науки о данных.

Работая педиатром, я всегда проявляла большой интерес к исследованиям, так как понимала важность доказательной медицины для благополучия моих пациентов. Продолжая свою карьеру, я столкнулась с многочисленными проблемами и вопросами, на которые было нелегко ответить с помощью традиционных методов исследования. Это любопытство побудило меня исследовать новые подходы к решению проблем в медицине, и именно в этот момент я наткнулась на мир науки о данных.

Полученные знания и навыки в области науки о данных в магистратуре показали мне потенциал технологий обработки естественного языка NLP (Natural Language Processing) в анализе неструктурированных медицинских текстовых данных с его возможностями применениями в области здравоохранения.

Имея двойной опыт в медицине и машинном обучении, я начала изучать способы применения технологий NLP для улучшения работы над неструктурированными медицинскими текстами в проекте WEBIOMED, специализирующейся на разработке и исследовании моделей прогнозной аналитики на основе искусственного интеллекта в медицине.

В течении прохождения стажировки, я решала ряд задач, которые охватили основные этапы разработки извлечения однозначных машиночитаемых признаков из медицинских текстов, начиная с изучения самого понятия извлекаемого признака, онтологии признака, сбора и аннотирования, первичной обработки данных, до выбора, обучения и валидации выбранной модели извлечения медицинских текстовых признаков.

В ходе решения поставленных мне задач я поняла, что интеграция NLP в здравоохранение не лишена трудностей и требует преодоления как технических, так и коммуникационных барьеров между специалистами в области здравоохранения и техническими экспертами. Так, например термин «катаральные явления», под которым медицинский работник понимает симптомы простуды: насморк, кашель, заложенность носа, головную боль и т.д., вызывает сложности в понимании техническим специалистом незнакомым с медицинской терминологией, и может быть упущен при решении задачи извлечения NER в контесте симптомов простуды.

Преодоление разрыва между медицинским сообществом и сообществом технических специалистов играет важнейшую роль в обеспечении успешного междисциплинарного сотрудничества и получения всех преимуществ применения NLP в сфере здравоохранении.

По окончании стажировки у меня осталась искренняя благодарность к проекту WEBIOMED за предоставленную мне возможность участвовать в таком уникальном проекте и за глубокое погружение в мир NLP медицинских текстов. Опыт, полученный во время моей работы в WEBIOMED, имеет бесценное значение и будет полезен мне в будущем.

Мария Казакова, магистр КНИТУ-КАИ, направление "Прикладная математика и информатика"

Пожалуйста, оцените эту статью
( 4,67 из 5,
оценили: 39)
Ваша оценка: Не ставилась

Еще по этой теме

Обратите внимание на похожие статьи

25 Апр 2023

Применение AutoML и MLflow при создании прогнозных моделей в медицине: опыт Webiomed

Стандартный жизненный цикл модели машинного обучения представляет собой последовательность нескольких базовых этапов, каждый из которых требует тщательного мониторирования и, в …

19 Ноя 2020

Словарь терминов цифрового здравоохранения

В настоящее время мы наблюдаем, возможно, один из самых впечетляющих периодов трансформации здравоохранения, которое за ближайшие 10 лет может измениться …

05 Июн 2020

Применение NLP для извлечения информации из электронных медицинских карт

Электронные медицинские карты (ЭМК) представляют основу автоматизации медицинской организации. В последнее время они повсеместно внедряются во всем мире. По некоторым …

Подпишитесь на нашу рассылку

Хотите получать интересную и полезную информацию о цифровом здравоохранении и искусственном интеллекте для медицины?
Включайтесь в нашу рассылку!

Мы рекомендуем

Стандарты для создания систем искусственного интеллекта для здравоохранения

Просмотров 1 775 3 недели, 2 дня назад

Большие языковые модели (LLM) в здравоохранении

Просмотров 479 3 недели, 3 дня назад

10 принципов FDA относительно регулирования ИИ в здравоохранении

Просмотров 346 1 месяц назад

Роль искусственного интеллекта в стратификации рисков в здравоохранении

Просмотров 799 4 месяца, 2 недели назад

Присоединяйтесь

Наши группы в соц сетях