RUS  ENG
Полная версия
ЖУРНАЛЫ // Интеллектуальные системы. Теория и приложения // Архив

Интеллектуальные системы. Теория и приложения, 2025, том 29, выпуск 3, страницы 119–145 (Mi ista567)

Часть 2. Специальные вопросы теории интеллектуальных систем

Бинаризация языковых моделей

Д. Н. Давыдова

Московский государственный университет имени М. В. Ломоносова, механико-математический факультет

Аннотация: В последние годы в сфере обработки естественного языка широкое распространение получили большие языковые модели. Но, несмотря на их востребованность, их применение становится затруднительным из-за больших затрат времени, энергии и памяти. Одним из способов решения этой проблемы является квантизация нейронных сетей - преобразование весов и активаций сети к представлению с более низкой точностью. Частным случаем квантизации является бинаризация - приведение параметров сети к разрядности $1$ бит. В работе рассмотрена структура бинарных нейронных сетей, приведен обзор текущих методов бинаризации языковых моделей, описаны полученные результаты.

Ключевые слова: обработка естественного языка, бинарные нейронные сети, бинаризация, квантизация, большие языковые модели



© МИАН, 2026