RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2025, том 16, выпуск 6, страницы 197–219 (Mi ps488)

Медицинская информатика

Автоматическое распознавание речевых медицинских данных с использованием LLM

Ю. Г. Сидоровa, В. Л. Малыхb, А. Н. Калининa, О. С. Елистратоваb

a Группа компаний «Интерин», Москва, Россия
b Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия

Аннотация: Одним из барьеров, препятствующих широкому распространению голосового ввода медицинских данных в МИС, являются недостаточные потребительские качества текстов, получающихся после транскрибации. Не все медицинские термины и слова общего лексикона распознаются корректно, нарушается согласование слов по роду, числу и падежам, текст недостаточно хорошо форматирован с точки зрения грамматики. Всё это требует дальнейшей доработки текста. Ещё одной сложной проблемой видится необходимость приведения текста к структуре медицинского документа в МИС. Структура документа может быть достаточно сложной, содержать много элементов, иметь требования к типу и формату данных в элементах структуры. Речевой ввод может лишь частично использоваться для формирования документа, а недостающие данные могут быть взяты из пользовательского шаблона.
Для решения указанных проблем предлагается использовать LLM в качестве корректора результатов транскрибации речи, интегратора речевых и текстовых данных из шаблона и формирователя структуры результирующих данных. В работе предлагается архитектура решения для ввода речевых медицинских данных на основе композиции системы транскрибации и LLM. Предлагается методика проведения испытаний решения, включающая подготовку набора данных и метрику расчёта качества решения. Описывается реализация решения на основе свободной и проприетарной компонент.
Результаты могут быть использованы при разработке и оценке систем ИИ, применяемых для ввода речевых данных, и не только в медицине.

Ключевые слова и фразы: медицинские информационные системы, МИС, искусственный интеллект, ИИ, речевой ввод, система транскрибации, большие языковые модели, LLM

УДК: 61:007.51:316
ББК: 51.1:32.817:32.973.202-018.2

MSC: Primary 94A05; Secondary 92C50, 93Bxx

Поступила в редакцию: 22.10.2025
Подписана в печать : 17.11.2025

DOI: 10.25209/2079-3316-2025-16-6-197-219



© МИАН, 2026