Медицинская информатика
Автоматическое распознавание речевых медицинских данных с использованием LLM
Ю. Г. Сидоровa,
В. Л. Малыхb,
А. Н. Калининa,
О. С. Елистратоваb a Группа компаний «Интерин», Москва, Россия
b Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия
Аннотация:
Одним из барьеров, препятствующих широкому распространению голосового ввода медицинских данных в МИС, являются недостаточные потребительские качества текстов, получающихся после транскрибации. Не все медицинские термины и слова общего лексикона распознаются корректно, нарушается согласование слов по роду, числу и падежам, текст недостаточно хорошо форматирован с точки зрения грамматики. Всё это требует дальнейшей доработки текста. Ещё одной сложной проблемой видится необходимость приведения текста к структуре медицинского документа в МИС. Структура документа может быть достаточно сложной, содержать много элементов, иметь требования к типу и формату данных в элементах структуры. Речевой ввод может лишь частично использоваться для формирования документа, а недостающие данные могут быть взяты из пользовательского шаблона.
Для решения указанных проблем предлагается использовать LLM в качестве корректора результатов транскрибации речи, интегратора речевых и текстовых данных из шаблона и формирователя структуры результирующих данных. В работе предлагается архитектура решения для ввода речевых медицинских данных на основе композиции системы транскрибации и LLM. Предлагается методика проведения испытаний решения, включающая подготовку набора данных и метрику расчёта качества решения. Описывается реализация решения на основе свободной и проприетарной компонент.
Результаты могут быть использованы при разработке и оценке систем ИИ, применяемых для ввода речевых данных, и не только в медицине.
Ключевые слова и фразы:
медицинские информационные системы, МИС, искусственный интеллект, ИИ, речевой ввод, система транскрибации, большие языковые модели, LLM
УДК:
61:007.51:316
ББК:
51.1:32.817:32.973.202-018.2
MSC: Primary
94A05; Secondary
92C50,
93Bxx Поступила в редакцию: 22.10.2025
Подписана в печать : 17.11.2025
DOI:
10.25209/2079-3316-2025-16-6-197-219