RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2025, том 527, страницы 94–102 (Mi danma670)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Оценка эффективности больших языковых моделей в выявлении коммуникативно значимых ошибок в письменных работах студентов, изучающих русский язык как иностранный

В. А. Шульгиновa, К. С. Клоковаa, Т. А. Юдинаa, Т. М. Обуховаbc, М. Ю. Лебедеваb

a Московский физико-технический институт, Москва, Россия
b Государственный институт русского языка имени А.С. Пушкина, Москва, Россия
c Московский государственный университет имени М. В. Ломоносова

Аннотация: Статья посвящена оценке способности современных больших языковых моделей (LLM), таких как GPT-5 и DeepSeek-R1, выявлять и классифицировать коммуникативные ошибки в письменных работах студентов, изучающих русский язык как иностранный (РКИ). В то время как существующие инструменты в основном фокусируются на формальных ошибках, данное исследование акцентирует внимание на коммуникативном аспекте, оценивая, насколько ошибка нарушает понимание (коммуникативно значимые ошибки) или лишь затрагивает языковую норму (коммуникативно незначимые ошибки). Для этого был создан и размерен экспертами корпус письменных работ студентов уровня B2 (ТРКИ-2), а также разработан многоэтапный пайплайн для тестирования LLM, включающий структурированный пролитинг и эвристические методы голосования для повышения надежности результатов. Эксперимент показал, что, хотя модели способны с определенной точностью локализовать ошибки, они испытывают значительные трудности с их правильной коммуникативной классификацией. Модели склонны систематически занижать степень влияния ошибки на понимание, пугать типы ошибок и испытывать сложности с выявлением множественных ошибок в одном фрагменте. Исследование демонстрирует как потенциал, так и текущие ограничения LLM в качестве инструмента для автоматизированной коммуникативно-ориентированной обратной связи в образовательных технологиях.

Ключевые слова: LLM, обработка естественного языка, РКИ, ТРКИ, коммуникативно значимые ошибки, коммуникативно незначимые ошибки, автоматическая оценка текстов, классификация ошибок.

УДК: 004.9

Поступило: 20.08.2025
Принято к публикации: 15.09.2025

DOI: 10.7868/S2686954325070082



Реферативные базы данных:


© МИАН, 2026