RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

Page 1: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

Marcondes Ricarte

Universidade Federal de Pernambuco

Centro de Informática

Aprendizagem Profunda(Deep Learning)

Page 2: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

2

Conteúdo

• Motivação.

• Conceitos gerais.

• Operações básicas

• Modelos:– Convolutional Neural Networks (CNN);

– Auto-encoders;

• Aplicações.

Page 3: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

3

Redes Neurais

• Uma rede neural padrão possui2 camadas: um camadaintermediária e uma camada desaída.

Page 4: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

4

Motivação

• Permitir aos computadores modelar nosso mundo bemosuficiente para exibir o que nós chamamos deinteligência temsido o foco de pesquisas de mais dametade de umséculo.

• Para alcançar esse objetivo, é claro que a grandequantidade de informação sobre o nosso mundo deve serde alguma forma armazenada, explicitamente ouimplicitamente, no computador.

• Já que não podemos formalizar manualmente ainformação, utilizamos algoritmos de aprendizagem.

Page 5: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

5

Motivação

• Muito esforço (e progresso!) tem sido feito em entender e melhorar algoritmos de aprendizagem, mas o desafio em IA permanece;

• Temos algoritmos capazes de entender cenas e descrevê-las em linguagem natural?

• Temos algoritmos capazes de inferir conceitos semânticos suficientes a ponto de interagir com humanos?

Page 6: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

6

Motivação

Page 7: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

7

Motivação

• Um modo plausível e comum de extrair informação útil a partir de imagens naturais envolve transformar gradualmente os pixels com valores “brutos” em representações mais abstratas;– Detecção de borda, detecção de formas locais,

identificação de categorias;

Page 8: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

8

Motivação

• Assim, uma máquina que expresse “inteligência” requer funções matemáticas altamente variáveis;– Não-lineares em termos de entradas cruas, sendo

capazes de apresentar muitas variações.

• A abstração de um objeto em uma imagem pode ser encarada como uma categoria ou feature (discreta ou contínua). – Muitos conceitos em nível mais baixo ou

intermediário poderiam ser úteis para construir um detector mais sofisticado.

Page 9: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

9

Motivação

• O foco em arquiteturas profundas é descobrir automaticamente essas abstrações: – Construir features com níveis mais baixos até

conceitos de nível mais alto;

• Utilizar algoritmos de aprendizagem que descubram essas abstrações com o mínimo esforço humano possível.

Page 10: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

10

Motivação

• Redes Neurais Artificiais feed-forward:– Maldição da

dimensionalidade.

Page 11: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

11

Motivação

• Uma das soluções encontradas para maldição de dimensionalidade é pré-processamento de dados: – Redução da dimensionalidade (às vezes por humanos).

– Desafiante e altamente dependente da tarefa.

• Se pensarmos no cérebro humano, não há indícios de que ele resolve esse problema dessa forma.

• Aprender características automaticamente em múltiplos níveis de abstração permite ao sistema mapear funções complexas sem depender de características intermediárias inteligíveis aos humanos.

Page 12: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

12

• Algoritmos de Deep Learning podemserconsiderados como processos de aprendizagemquedescobremmúltiplos níveis de abstração;

• As representações mais abstratas podemser maisúteis emextrair informações para classificadores oupreditores;

• Características intermediárias aprendidas podemsercompartilhadas entre diferentes tarefas;

Motivação

Page 13: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

13

• Por décadas, diversos pesquisadores tentaram, semsucesso, treinar redes neurais de múltiplas camadasprofundas;– Inicializadas compesos aleatórios;

– Mínimos locais.

• À medida que a profundidade aumenta torna-seainda mais difícil uma boa generalização

Motivação

Page 14: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

14

Motivação

• Múltiplas camadas constroem um espaço de características melhorado: – Primeira camada aprende as características de primeira ordem

(por exemplo, bordas em imagem);

– Segunda camada aprende características de maior ordem (por exemplo, combinação de bordas e outras características);

– As camadas são treinadas de modo não-supervisionado de modo a descobrir características gerais do espaço de entrada;

– As características finais alimentam uma camada supervisionada

– A rede inteira é então ajustada de modo supervisionado.

Page 15: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

15

Motivação

• As camadas no MLP não aprendem bem:– Difusão do gradiente;

– Treinamento muito lento;

– Camadas mais baixas tendem a fazer um mapeamento aleatório;

– Frequentemente há mais dados não rotulados do que dados rotulados;

– Mínimo locais.

Page 16: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

16

• Em 2006, Hintonet al descobriramque os resultadosde uma rede neural profunda poderiamsersensivelmente melhorados quando pré‐treinadas comum algoritmo de aprendizagemnão-supervisionado,uma camada após outra a partir da primeira camada.

Motivação

Page 17: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

17

Porque Deep Learning?

• O Teorema de Kolmogorov-Smirnov demonstraram que uma única camada oculta é suficiente para representar qualquer função ou para resolver a maioria dos problemas de generalização. Contudo a quantidade de neurônios nesta camada pode sem inviável para a solução do problema.

Page 18: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

18

Porque Deep Learning?

• Plausibilidade biológica – córtex visual

• Problemas que podem ser representados com um número polinomial de nós com k camadas podem requerer número exponencial de nós com k‐1 camadas; – Funções muito variáveis podem ser eficientemente

representadas com arquiteturas profundas;

Page 19: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

19

Modelos

- Stacked Auto-Encoders;

- Deep Belief Nets;

- Convolutional Neural Networks;

- Deep Reinforcement Networks;

- Recurrent Neural Networks;- ....

Page 20: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

20

Operações básicas

- Convolução;

- Inserção de não-linearidade;

- Sub-amostragem.

Page 21: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

21

Convolução

Page 22: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

22

• Convoluçãoé um operador linear que, a partir de duas funções dadas, resulta numa terceira que mede a área subentendida pela superposição delas em função do deslocamento existente entre elas.

• Contínua:

• Discreta:

Convolução

Page 23: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

23

Convolução

Page 24: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

24

Convolução

Page 25: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

25

Convolução 2D (Imagens)

Page 26: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

26

Convolução 2D (Imagens)

Page 27: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

27

Convolução 2D (Imagens)

Page 28: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

28

Convolução 2D (Imagens)

Page 29: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

29

Inserção de não-linearidade

• ReLU: Rectified Linear Unit

Page 30: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

30

• Pooling:

– Esse passo comprime e suaviza os dados;

– Normalmente toma a média ou o valor máximo entre trechos disjuntos;

– Dá robustez a pequenas variações espaciais dos dados.

– Espasidade.

– Max(0,x).

Convolutional Neural Networks

Page 31: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

31

• Hubel e Wiesel em 1968, estudaram o sistema visual de felinos e detectaram o papel importante das chamadas Receptive Cells que agiam sobre como filtros locais sobre o espaço de entrada e tinham dois comportamentos:– Simple Cells: respondem a padrões de bordas na

imagem;

– Complex Cells: que possuem o campo de receptividade grande e são invariantes a posição do padrão.

Convolutional Neural Networks

Page 32: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

32

Convolutional Neural Networks

Page 33: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

33

Convolutional Neural Networks

Page 34: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

34

Convolutional Neural Networks

Page 35: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

35

Convolutional Neural Networks

Page 36: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

36

Convolutional Neural Networks

Page 37: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

37

• Parâmetros:– Margens: (Ignorar/Replicar/Zerar)

– Tamanho do kernel.

– Tamanho do passo (stride).

– Quantidade de núcleos.

– Configuração dos núcleos (aprendidos).

Convolutional Neural Networks

Page 38: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

38

• Connectividade espaça: CNN exploram correlações espaciais focando em connectividade entre neurônios próximos. Os campos receptivos são contíguos. Os neurônios são invisíveis as variações fora do seu campo receptivo.

• Analogia (quando a entrada são imagens):– Pixels -> Neurônios

– Kernel -> Sinapses

– Convolução -> Operação básica de um neurônio

Convolutional Neural Networks

Page 39: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

39

• Procedimento ad-hoc para construir informação prévia no design de uma RNA:

1. Restringir a arquitetura da rede através do uso de conexões locais conhecidas como campos receptivos.

2. Limitar a escolha dos pesos sinápticos através do uso do compartilhamento de pesos.

• Essas duas técnicas, especialmente a segunda, têm um efeito colateral benéfico: o número de parâmetros livres na rede é reduzido significativamente.

Convolutional Neural Networks

Page 40: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

40

• Considere a rede feedforward parcialmente conectada. Essa rede apresenta umaarquitetura restringida por construção. Os seis nós fonte superiores constituem ocampo receptivo para o neurônio escondido 1.

Convolutional Neural Networks

Page 41: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

41

• Para satisfazer a restrição do compartilhamento de pesos, deve-se usar o mesmo conjunto de pesos sinápticos para cada um dos neurônios da camada escondida.

• Portanto, para seis conexões locais por neurônio escondido e um total de quatro neurônios escondidos (figura 4), pode-se expressar o campo local induzido do neurônio escondido j como (soma de convolução):

• Onde wi 6i= 1, constitui o mesmo conjunto de pesos

compartilhados por todos os quatro neurônios escondidos e xk é o sinal do nó fonte k=i+j.

Convolutional Neural Networks

Page 42: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

42

• Uma rede CNN é um MLP projetado para reconhecer formas bidimensionais com um alto grau de invariância para translação, mudança de escala, e outras formas de distorção.

• Esta tarefa difícil é aprendida de uma maneira supervisionada por uma rede cuja estrutura inclui as seguintes formas de restrições:– Extração de características;

– Mapeamento de características;

– Sub-amostragem.• .

Convolutional Neural Networks

Page 43: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

43

• Extração de características: Cada neurônio obtém suas entradas sinápticas de um campo receptivo local da camada anterior, forçando-o a extrair características locais. A posição relativa de uma característica extraída em relação às outras é preservada.

• Mapeamento de características: Cada camada computacional da rede é composta de múltiplos mapas de características, onde cada mapa tem a forma de um plano no qual os neurônios individuais são restringidos para compartilhar o mesmo conjunto de pesos sinápticos.

• .

Convolutional Neural Networks

Page 44: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

44

• Os filtros são aprendidos pelo algoritmo.

• A inicialização dos filtros é aleatória.

• O pesos dos filtros são os mesmo em qualquer uma das regiões do mapa.

• A convolução é linear.

• Facilita o paralelismo do processo.

Convolutional Neural Networks

Page 45: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

45

• Sub-amostragem: cada camada da CNN é seguida por uma camada computacional que realiza cálculo da média local e sub-amostragem, onde a resolução do mapa de características é reduzida. Tem o efeito de reduzir a sensibilidade da saída do mapa a deslocamentos e outras formas de distorção.

• Todos os pesos em todas as camadas de uma CNN são aprendidos através do treinamento.

• No entanto, a rede aprende a extrair suas próprias características automaticamente.

Convolutional Neural Networks

Page 46: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

46

Convolutional Neural Networks

Page 47: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

47

• A camada de entrada, com 28x28 nós sensoriais, recebe as imagens de diferentes caracteres, centralizados e normalizados. Então, a computação alterna entre convolução e sub-amostragem:

– Camada 1 escondida: convolução. 4 mapas de características com cada mapa consistindo de 24x24 neurônios. Cada neurônio tem um campo receptivo de tamanho 5x5.

– Camada 2 escondida: sub-amostragem e média local. 4 mapas de características com cada mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho 2x2, um coeficiente treinável, um bias treinável e uma função de ativação sigmoide.

– Camada 3 escondida: convolução. 12 mapas de características com cada mapa consistindo de 8x8 neurônios. Cada neurônio tem conexões sinápticas com vários mapas de características das camadas escondidas anteriores.

– Camada 4 escondida: sub-amostragem e média local. 12 mapas de características com cada mapa consistindo de 4x4 neurônios.

– A camada de saída realiza um estágio final da convolução. Consiste de 26 neurônios, atribuídos a um dos 26 caracteres possíveis. Cada neurônio tem um campo receptivo de tamanho 4x4.

Convolutional Neural Networks

Page 48: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

48

Convolutional Neural Networks

Page 49: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

49

Convolutional Layer

Page 50: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

50

Page 51: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

51

Pooling Layer

Page 52: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

52

Backpropagation Convolutional Layer

Page 53: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

53

Backpropagation Convolutional Layer

Passo 1: Inicializamos todos os filtros e parâmetros / pesos com valores aleatóriosPasso 2: A rede recebe uma imagem de treinamento como entrada, passa pela etapa de propagação direta (convolução, ReLU e operações de agrupamento junto com a propagação direta na camada totalmente conectada) e localiza as probabilidades de saída para cada classe.Vamos dizer que as probabilidades de saída para a imagem do barco acima são [0.2, 0.4, 0.1, 0.3]Como os pesos são atribuídos aleatoriamente para o primeiro exemplo de treinamento, as probabilidades de saída também são aleatórias de início.

Page 54: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

54

Backpropagation Convolutional Layer

Passo 3: Calcular o erro total na camada de saída (soma das 4 classes)Erro total = ∑ ½ (probabilidade de destino - probabilidade de

saída) ²

Page 55: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

55

Backpropagation Convolutional Layer

Passo 4: Use Backpropagation para calcular os gradientes do erro em relação a todos os pesos na rede e use o gradiente descendente para atualizar todos os valores / pesos de filtro e valores de parâmetros para minimizar o erro de saída.Os pesos são ajustados em proporção à sua contribuição para o erro total.Isso significa que a rede aprendeu a classificar corretamente essa imagem específica ajustando seus pesos / filtros de forma que o erro de saída seja reduzido.Parâmetros como número de filtros, tamanhos de filtros, arquitetura da rede, etc. foram todos corrigidos antes da Etapa 1 e não são alterados durante o processo de treinamento - somente os valores dos pesos de conexão são atualizados.

Page 56: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

56

Backpropagation Convolutional Layer

Passo 5: Repita os passos 2-4 com todas as imagens no conjunto de treino.

Page 57: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

57

Backpropagation Convolutional Layer

Page 58: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

58

Backpropagation Convolutional Layer

Page 59: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

59

Variações de Pooling

Page 60: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

60

• Os ajustes dos parâmetros livres são feitos usando uma forma estocásticas (sequencial) do aprendizado back-propagation.

• O uso do compartilhamento de pesos torna possível implementar a CNN de forma paralela: outra vantagem sobre a MLP totalmente conectada.

Convolutional Neural Networks

Page 61: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

61

Regularização - Dropout

Page 62: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

62

• http://cs.stanford.edu/people/karpathy/convnetjs/demo/cifar10.html

• http://www.cs.toronto.edu/~kriz/cifar.html

Demo

Page 63: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

63

• Transferência de aprendizagem e aprendizagem multitarefa: – Transferência em aprendizagem é a habilidade do algoritmo de

aprendizagem de extrapolar pontos em comum em diferentes tarefas e transferir conhecimento entre elas.

– Conferências como ICML (International Conference on Machine Learning) e NIPS (Neural Information Processing Systems) possuem

desafios nessa área, com arquiteturas Deep Learning vencedoras.

Aplicações

Page 64: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

64

• Android App - Prisma

Aplicações

Page 65: RN-07-deep-Learning [Modo de Compatibilidade] - cin.ufpe.braluizioa/RN/RN-07-deep-Learning.pdf · mapa consistindo de 12x12 neurônios. Cada neurônio tem um campo receptivo de tamanho

65

• Originalmente voltado para problemas de redução de dimensionalidade.

• Objetivo: criar um novo conjunto de características que captura informação essencial do conjunto original de entrada.

• As novas características são combinações lineares das características originais.

• Tentam capturar ao máximo a variância original do conjunto de entrada.