RUS  ENG
Полная версия
ЖУРНАЛЫ // Journal of Computational and Engineering Mathematics // Архив

J. Comp. Eng. Math., 2025, том 12, выпуск 1, страницы 11–22 (Mi jcem274)

Computational Mathematics

A limiting description of control in a gaussian one-armed bandit problem

[Предельное описание управления в задаче о гауссовском одноруком бандите]

A. V. Kolnogorov

Yaroslav-the-Wise Novgorod State University, Veliky Novgorod, Russian Federation

Аннотация: Рассматривается предельное описание управления в задаче о гауссовском одноруком бандите в приложении к пакетной обработке больших данных, если оценки неизвестных математического ожидания и дисперсии одношаговых доходов выполняются в процессе обработки данных внутри пакетов. Это описание дается дифференциальным уравнением в частных производных второго порядка, в котором оценка неизвестной дисперсии присутствует как постоянный параметр. Данный результат означает, что при обработке больших данных сколь угодно точная оценка неизвестной дисперсии может быть получена на относительно сколь угодно коротком начальном этапе, а затем использована для управления.

Ключевые слова: гауссовский однорукий бандит, пакетная обработка, байесовский подход, инвариантное описание.

УДК: 519.244, 519.83

MSC: 62C10, 62L05, 91A35

Поступила в редакцию: 10.01.2025

Язык публикации: английский

DOI: 10.14529/jcem250102



© МИАН, 2026