Модели глубоких нейронных сетей для распознавания медицинских именованных сущностей
Вульфин А.М., Гаянова М.М., Улямаев Т.И.
Ключевые слова: именованные сущности, глубокие нейронные сети, наборы данных, модели трансформеры, интеллектуальный анализ текстовых данных.
Аннотация. В работе проанализированы подходы к построению моделей распознавания медицинских именованных сущностей для повышения эффективности анализа слабоструктурированных текстовых данных, что является актуальной задачей для совершенствования систем поддержки принятия решений в клинической практике. Выполнен сравнительный обзор и классификация моделей глубоких нейронных сетей в задачах распознавания медицинских именованных сущностей. Проведенный эксперимент на корпусе медицинских текстов заданной тематики показал, что модели общего назначения не позволяют приблизиться по качеству выделения именованных сущностей к экспертной разметке. Применение технологий переноса обучения позволяет существенно повысить эффективность моделей трансформеров.
Deep neural network models for medical named entity recognition
Vulfin A.M., Gayanova M.M., Ulyamaev T.I.
Keywords: named entities, deep neural networks, datasets, transformers models, text data mining.
Abstract. The paper analyzes approaches to constructing models for recognizing medical named entities to improve the efficiency of analyzing semi-structured text data, which is an urgent task for improving decision support systems in clinical practice. A comparative review and classification of deep neural network models in medical named entity recognition tasks has been performed. An experiment conducted on a corpus of medical texts on a given topic showed that general-purpose models do not allow the quality of identifying named entities to approach expert markup. The use of transfer learning technologies can significantly increase the efficiency of transformer models.