|
|
| СЕМИНАРЫ |
|
Семинар «Математические основы искусственного интеллекта»
|
|||
|
|
|||
|
Тензорные программы Е. А. Голиков Сколковский институт науки и технологий |
|||
|
Аннотация: Тензорные программы (ТП) — это формализм, описывающий вычисления в обучении нейронных сетей. На каждой итерации тензорная программа из вектора генерирует новый вектор с помощью линейного преобразования или покоординатного применения функции активации. С помощью таких итераций можно выразить как прямой, так и обратный проход в обучении, а также любое количество шагов градиентного спуска. Центральным результатом в теории ТП является так называемая «Главная теорема», которая утверждает, что любая скалярная величина, порождённая ТП (например, значение функции потерь или точности), имеет с вероятностью единица детерминированный предел при стремлении ширины нейронной сети (то есть количества скрытых нейронов) к бесконечности. Эта теорема имеет ряд интересных следствий, таких как устойчивость нейронного тангенциального ядра (Neural Tangent Kernel), а также некоторые другие классические результаты о спектрах случайных матриц. |
|||