Публикации в базе данных Math-Net.Ru
-
Improved high-probability bounds for the temporal difference learning algorithm via exponential stability
Proc. Mach. Learn. Res. (PMLR), 247 (2024), 4511–4547
-
Generative flow networks as entropy-regularized RL
Proc. Mach. Learn. Res. (PMLR), 238 (2024), 4213–4221
-
О структуре множества полноцветных раскрасок случайного гиперграфа
Докл. РАН. Матем., информ., проц. упр., 512 (2023), 52–57
-
О разработке прикладных решений на основе искусственного интеллекта для обеспечения технологической безопасности
Докл. РАН. Матем., информ., проц. упр., 508 (2022), 28–32
© , 2026