Backpropagation im Tiefenblick

1. Geschichte und Bedeutung

1986 systematisierten Rumelhart, Hinton und Williams BP fuer mehrschichtige Netze.

Erstautor der Schluesselarbeit zur mehrschichtigen Fehler-Rueckfuehrung.

Praegte die moderne Renaissance neuronaler Netze entscheidend.

Mitautor mit zentralen theoretischen und empirischen Beitraegen.

Stichwoerter: Kettenregel + dynamische Wiederverwendung. Aufwand nahezu linear in der Parameterzahl.

Setze g(x)=a*x+b, y=g(x)^2 und beobachte dy/dx.

Parameter a: 1.20

Parameter b: 0.50

Eingabe x: 0.80

Forward aktiviert Knoten, Backward traegt Fehler rueckwaerts. Die Lernrate steuert die Intensitaet.

Lernrate: 0.10

Warte auf Aktion

Simuliere Kettenprodukte lokaler Ableitungen fuer Vanishing/Exploding Gradients.

Tiefe: 24

Mittlere lokale Ableitung: 0.90

Backpropagation = Kettenregel + Credit Assignment. Ohne sie gaebe es kein modernes Deep Learning im grossen Massstab.