Сервис Webiomed.NLP позволяет автоматически «извлекать» из медицинских текстовых записей структурированные признаки.
Почему это важно
Сегодня в электронных медицинских картах (ЭМК) до 80% врачебных записей хранится в текстовом виде. Из-за этого их невозможно обработать и использовать для машинного анализа.
Сервис Webiomed.NLP позволяет автоматически «извлекать» из медицинских текстовых записей структурированные признаки. Например: симптомы из жалоб, данные об артериальном давлении, росте и весе пациента из неструктурированных объективных данных, лабораторные показатели из выписок и многое другое.
Количество извлекаемых признаков
На данный момент система Webiomed поддерживает извлечение 1261 признаков, больше половины из которых – МНН (международное непатентованное название) лекарственных препаратов. На текущий момент это порядка 700 признаков.
Документы ЭМК
Извлечение данных доступно из четырёх типов документов: Протокол осмотра, Эпикриз по законченному случаю амбулаторный, Инструментальное исследование, Эпикриз в стационаре выписной. Каждый из типов документов поддерживает уникальное количество признаков, присущих определенному типу документа.

Помимо извлечения общих признаков из медицинских документов с помощью сервиса извлекаются признаки сердечно-сосудистых заболеваний и осложнений беременности, родов и послеродового периода (преэклампсии).
Модели NLP
В настоящий момент в Webiomed подключено 9 моделей, извлекающих признаки и симптомы ССЗ, а также 5 моделей, извлекающих признаки преэклампсии.
Команда NLP проекта Webiomed работает не только в направлении увеличения количества извлекаемых признаков, но также улучшает старые модели, добиваясь более качественных результатов извлечения признаков и повышая метрики точности до границы не менее 0.9.
В определенный момент, при разработке NLP моделей, остро встал вопрос с грамотной обработкой отрицаний признаков. Довольно часто встречающиеся отрицания признаков в явном или неявном виде не отбрасывались, а записывались в результаты извлечения как положительный результат. Но благодаря внедрению мультиклассификации в модели с бинарными признаками, модели получилось обучить таким образом, что большинство отрицаний начали корректно обрабатываться, что существенно увеличило качество моделей.
Что планируеТся
В планах существенно увеличить количество извлекаемых симптомов из протоколов осмотров, инструментальных исследований для дальнейшего развития предиктивных способностей нашей системы, создать комплекс моделей для извлечения всех существующих МНН лекарственных препаратов.
Подробнее о сервисе Webiomed. NLP здесь: https://webiomed.ai/products/webiomednlp/