Глубокий разбор обратного распространения - Интерактивное обучение визуализации

1. История и значение

В 1986 Rumelhart, Hinton и Williams систематизировали BP для многослойных сетей.

Первый автор ключевой работы по обучению многослойных сетей.

Один из главных двигателей возрождения нейросетей.

Соавтор с важным теоретическим и экспериментальным вкладом.

Ключи: правило цепочки + динамическое переиспользование. Сложность почти линейна по числу параметров.

Пусть g(x)=a*x+b, y=g(x)^2. Наблюдайте изменение dy/dx.

Параметр a: 1.20

Параметр b: 0.50

Вход x: 0.80

Forward активирует узлы, backward передает ошибку назад. Скорость обучения влияет на интенсивность.

Скорость обучения: 0.10

Ожидание действий

Смоделируйте цепное произведение локальных производных для анализа исчезания/взрыва градиента.

Глубина: 24

Средняя локальная производная: 0.90

Backpropagation = правило цепочки + распределение ответственности. Без него не было бы современного масштабного deep learning.