Аннотация:
В докладе изложена работа по созданию алгоритма обучения системы с дискретным управлением действовать и достигать целей. Обучение происходит на основе проб и ошибок. Весь опыт системы сохраняется в Базе Данных. Оптимизация алгоритма производится по двум критериям: точность достижения поставленных целей и максимальное сокращение времени обучения. Сокращение времени обучения реализуется, главным образом, уменьшением количества пробных действий с помощью методов прогнозирования и интерполяции по опытным данным.