Стажировка занимает важное место в профессиональном развитии студента. Она позволяет получить ценный опыт работы в реальной профессиональной среде и применить полученные знания на практике.
Недавно в нашей компании "К-Скай" прошла стажировку Мария Казакова, магистр КНИТУ-КАИ, направление "Прикладная математика и информатика". Мария получила практический опыт в области обработки медицинских текстов с помощью NLP, о чем рассказала для блога компании К-Скай.
На последнем курсе магистратуры для меня было важно найти стажировку на стыке технологий искусственного интеллекта и медицины, так как я уже являюсь практикующим врачом, кандидатом медицинских наук и получала второе высшее образование в области науки о данных.
Работая педиатром, я всегда проявляла большой интерес к исследованиям, так как понимала важность доказательной медицины для благополучия моих пациентов. Продолжая свою карьеру, я столкнулась с многочисленными проблемами и вопросами, на которые было нелегко ответить с помощью традиционных методов исследования. Это любопытство побудило меня исследовать новые подходы к решению проблем в медицине, и именно в этот момент я наткнулась на мир науки о данных.
Полученные знания и навыки в области науки о данных в магистратуре показали мне потенциал технологий обработки естественного языка NLP (Natural Language Processing) в анализе неструктурированных медицинских текстовых данных с его возможностями применениями в области здравоохранения.
Имея двойной опыт в медицине и машинном обучении, я начала изучать способы применения технологий NLP для улучшения работы над неструктурированными медицинскими текстами в проекте WEBIOMED, специализирующейся на разработке и исследовании моделей прогнозной аналитики на основе искусственного интеллекта в медицине.
В течении прохождения стажировки, я решала ряд задач, которые охватили основные этапы разработки извлечения однозначных машиночитаемых признаков из медицинских текстов, начиная с изучения самого понятия извлекаемого признака, онтологии признака, сбора и аннотирования, первичной обработки данных, до выбора, обучения и валидации выбранной модели извлечения медицинских текстовых признаков.
В ходе решения поставленных мне задач я поняла, что интеграция NLP в здравоохранение не лишена трудностей и требует преодоления как технических, так и коммуникационных барьеров между специалистами в области здравоохранения и техническими экспертами. Так, например термин «катаральные явления», под которым медицинский работник понимает симптомы простуды: насморк, кашель, заложенность носа, головную боль и т.д., вызывает сложности в понимании техническим специалистом незнакомым с медицинской терминологией, и может быть упущен при решении задачи извлечения NER в контесте симптомов простуды.
Преодоление разрыва между медицинским сообществом и сообществом технических специалистов играет важнейшую роль в обеспечении успешного междисциплинарного сотрудничества и получения всех преимуществ применения NLP в сфере здравоохранении.
По окончании стажировки у меня осталась искренняя благодарность к проекту WEBIOMED за предоставленную мне возможность участвовать в таком уникальном проекте и за глубокое погружение в мир NLP медицинских текстов. Опыт, полученный во время моей работы в WEBIOMED, имеет бесценное значение и будет полезен мне в будущем.
Мария Казакова, магистр КНИТУ-КАИ, направление "Прикладная математика и информатика"