Visao Profunda de Backpropagation

1. Historia e Importancia

Em 1986, Rumelhart, Hinton e Williams sistematizaram BP para redes multicamadas.

Primeiro autor do artigo classico sobre treinamento multicamadas.

Um dos principais impulsionadores do deep learning moderno.

Coautor com contribuicoes teoricas e experimentais fundamentais.

Chaves: regra da cadeia + reaproveitamento dinamico. Custo quase linear no numero de parametros.

Defina g(x)=a*x+b, y=g(x)^2 e observe a mudanca de dy/dx.

Parametro a: 1.20

Parametro b: 0.50

Entrada x: 0.80

A fase forward ativa os nos; a fase backward propaga erros. A taxa de aprendizado controla a intensidade.

Taxa de Aprendizado: 0.10

Aguardando acao

Simule o produto encadeado para observar gradiente que desaparece/explode.

Profundidade: 24

Derivada Local Media: 0.90

Backpropagation = regra da cadeia + atribuicao de credito. Sem ela, nao existiria deep learning moderno em escala.