RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2025, том 527, страницы 332–345 (Mi danma691)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

JDCEmb: совмещенная дистилляция и контрастивное обучение для эмбеддингов в целеориентированных диалоговых системах

А. И. Бурыкинаa, Д. Р. Ледневаb, Д. П. Кузнецовb

a Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, Санкт-Петербург, Россия
b Московский физико-технический институт (национальный исследовательский университет), Долгопрудный, Россия

Аннотация: Мы представляем JDCEmb – новый фреймворк для обучения универсальных векторных представлений в задачах целеориентированных диалогов. Ключевую роль в таких системах играют текстовые кодировщики, от качества которых зависит эффективность диалоговых систем. Современные подходы к обучению диалоговых кодировщиков часто опираются на контрастивные методы, которые повышают различимость представлений, но чувствительны к выбору положительных и отрицательных пар. Это может приводить к потере важной смысловой информации. Методы, основанные на дистилляции знаний, наоборот, передают больше контекста, но хуже различают схожие реплики и плохо работают с тонкими смысловыми различиями. JDCEmb сочетает сильные стороны обоих подходов за счет архитектуры типа “учитель-ученик”, где модель-ученик одновременно обучается контрастивно и выравнивается с векторными представлениями модели-учителя. Такая комбинация позволяет одновременно сохранить смысловую полноту и повысить различимость векторных представлений, что критически важно для диалоговых систем. Экспериментальные результаты на ключевых диалоговых задачах подтверждают эффективность подхода: JDCEmb стабильно достигает или превосходит уровень state of the art, превосходя современные сильные базовые модели.

Ключевые слова: задача-ориентированные диалоги, векторные представления, дистилляция знаний, контрастивное обучение, диалоговые системы.

УДК: 004.8

Поступило: 21.08.2025
Принято к публикации: 29.09.2025

DOI: 10.7868/S268695432507029X



Реферативные базы данных:


© МИАН, 2026