Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma...
Transcript of Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma...
![Page 1: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/1.jpg)
David Menottiwww.inf.ufpr.br/menotti/am-182
Universidade Federal do Paraná (UFPR)Especialização em Engenharia Industrial 4.0
Uma introdução à Machine Learning
![Page 2: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/2.jpg)
Hoje
• Introdução sobre AM (01-02)• Agenda
– Artificial Intelligence & Machine Learning (03-04)– Como aplicar ML na prática? (05-06)– Laboratório Weka (07-08)– Deep Learning & i4.0 (09-10)– Classificadores & Lab (11-12) – Regres. & Clustering & Lab (13-14) – Como aplicar ML na prática? (15-16)– + Classificadores (17) & Lab (19)– Avaliação (20)
2
![Page 3: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/3.jpg)
Aprendizado de Máquinas• Herbert Alexander Simon:
“Aprendizado é qualquer processo pelo qual um sistema melhora sua performance pela experiência.”
• “Machine Learning está preocupado com programas de computador que automaticamente melhoram sua performance pela experiência. “
• Economista / Matemática 1913 - 2001– Simulaçao computacional
da Cognição humana (~1954)
3
1913 - 2001
![Page 4: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/4.jpg)
Por que Machine Learning?• Desenvolver sistemas que podem automaticamente se adaptar e se
customizar para usuários individuais.– Notícias personalizadas OU Filtro de email
• Descobrir novo conhecimento a partir / usando grandes bases de dados (data mining).
– Análise de carrinho de supermer. (e.g. fraldas e cervejas)
4
![Page 5: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/5.jpg)
Por que Machine Learning?• Habilidade de imitar humanos e substituí-los em certas tarefas
monótonas - que exigem alguma inteligência.– Como o reconhecimento de caracteres manuscritos
• Desenvolver sistemas que são muito difíceis / caros para construir manualmente porque eles requerem habilidades ou conhecimento detalhados específicos ajustados para uma tarefa específica (gargalo de engenharia do conhecimento).
5
![Page 6: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/6.jpg)
Por que AGORA?• Inundação de dados disponíveis
– especialmente com o advento da internet.
• Incremento de força computacional
• Progresso crescente de:– algoritmos disponíveis– teoria desenvolvida por pesquisadores
• Aumento no suporte/apoio das indústrias
6
![Page 7: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/7.jpg)
Aplicações em ML
7
![Page 8: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/8.jpg)
O Conceito de Aprendizado• Aprendizado = Melhoria com experiência em alguma
tarefa– Melhoria sobre a tarefa T– Com respeito a medida de desempenho D– Baseado na experiência E
8
![Page 9: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/9.jpg)
Motivação - Filtro de SPAM• Example: Spam Filtering
Spam ( Sending and Posting Advertisement in Mass )– é todo email que o usuário não queria receber e não autorizou o
recebimento
T: Identificar emails SPAMD:
% de emails spam que foram filtrados% de emails non-spam (ham) que foram
incorretamente filtradosE: uma base de dados de emails que foram rotulados pelos usuários
9
![Page 10: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/10.jpg)
O Processo de Aprendizado
10
![Page 11: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/11.jpg)
O Processo de Aprendizado
11
![Page 12: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/12.jpg)
O Processo de Aprendizado
● Número de destinatários● Tamanho da Mensagem● Número de anexos● Número de “re’s” no assunto
Servidor de Emails
12
![Page 13: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/13.jpg)
A Base de Dados (Data Set)
Número de novos destinatários
Tamanho do Email (kb) País (IP) Tipo de
ClienteTipo de Email
0 2 Brasil Ouro Ok
1 4 Brasil Prata Ok
5 2 Argentina Bronze Spam
2 4 Russia Bronze Spam
3 4 Brasil Bronze Ok
0 1 EUA Prata Ok
4 2 EUA Prata Spam
Inst
ânci
as
Nominal OrdinalNuméricos
Atributos Atributo Meta
13
![Page 14: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/14.jpg)
Aprendizado do Modelo
Base de Dados
Conjunto de Aprendizado
(Treinamento)
Indutor
Algoritmo de Indução
Classificador
Modelo de Classificação
14
![Page 15: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/15.jpg)
Avaliação do Modelo
Base de Dados
Conjunto de Avaliação
(Teste)
Indutor
Algoritmo de Indução
Classificador
Modelo de Classificação
15
![Page 16: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/16.jpg)
Algoritmos de Aprendizado
16
![Page 17: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/17.jpg)
Análise da Classificação
Número de novos destinatários
OK
17
![Page 18: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/18.jpg)
Análise da Classificação
Número de novos destinatários
OK
18
![Page 19: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/19.jpg)
Análise da Classificação
Número de novos destinatários
OK
Spam
Erro
19
![Page 20: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/20.jpg)
Análise da Classificação
Número de novos destinatários
OK
20
![Page 21: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/21.jpg)
Análise da Classificação
Número de novos destinatários
OK Erro
21
![Page 22: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/22.jpg)
• Outro atributo - confusão?
Análise da Classificação
Tamanho do Email (kbytes)
22
![Page 23: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/23.jpg)
• Como você classificaria estes dados?
Classificadores Lineares
Número de novos destinatários
Tam
anho
do
Em
ail
23
![Page 24: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/24.jpg)
• Como você classificaria estes dados?
Classificadores Lineares
Número de novos destinatários
Tam
anho
do
Em
ail
24
![Page 25: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/25.jpg)
1. Coloca-se o novo email no espaço2. Classifica-o de acordo com o subespaço no qual ele “reside”
Quando um novo email é enviado
Número de novos destinatários
Tam
anho
do
Em
ail
25
![Page 26: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/26.jpg)
Classificadores Lineares
Número de novos destinatários
Tam
anho
do
Em
ail
Como você classificaria estes dados?
26
• Várias separações são possíveis
![Page 27: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/27.jpg)
Como você classificaria estes dados?
Classificadores Lineares
Número de novos destinatários
Tam
anho
do
Em
ail
• Várias separações são possíveis - Tamanho do Email?
27
![Page 28: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/28.jpg)
Como você classificaria estes dados?
Classificadores Lineares
Número de novos destinatários
Tam
anho
do
Em
ail
• Várias separações são possíveis - Número de novos dest.?
28
![Page 29: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/29.jpg)
Qualquer uma delas seria uma boa escolha …
… mas qual é a melhor?
Classificadores Lineares
Número de novos destinatários
Tam
anho
do
Em
ail
29
![Page 30: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/30.jpg)
Definir a margem de um classificador linear como a largura que o limite da margem pode ser aumentado antes de atingir/acertar um ponto
Margem Classificadora
Número de novos destinatários
Tam
anho
do
Em
ail
30
![Page 31: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/31.jpg)
A margem máxima do classificador linear é o classificador linear com a margem máxima.Este é o classificador mais simples do tipo SVM (Support Vector Machines) chamado de LSVM
Margem Máxima
Número de novos destinatários
Tam
anho
do
Em
ail
Linear SVM
31
![Page 32: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/32.jpg)
Como você classificaria estes dados?
Nenhum Classificador Linear pode cobrir todas as instâncias
Tam
anho
do
Em
ail
Número de novos destinatários
32
![Page 33: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/33.jpg)
• Idealmente, a melhor fronteira de decisão deveria ser aquela que provê um desempenho ótimo tal como ...
Nenhum Classificador Linear
33
![Page 34: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/34.jpg)
Nenhum Classificador Linear pode cobrir todas as instâncias
Tam
anho
do
Em
ail
Número de novos destinatários
34
![Page 35: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/35.jpg)
• No evento, a satisfação imediata é prematura porque o objetivo central do desenvolvimento de um classificador é o de classificar corretamente uma nova entrada
Problema de Generalização
Nenhum Classificador Linear
35
![Page 36: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/36.jpg)
Qual delas?Ta
man
ho d
o E
mai
l
# de novos destinatários
2 ErrosModelo Simples
Tam
anho
do
Em
ail
0 ErroModelo Complexo
# de novos destinatários
36
![Page 37: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/37.jpg)
Avaliando o que foi AprendidoTa
man
ho d
o E
mai
l
1. Aleatoriamente seleciona-se uma porção dos dados para ser usada para aprendizado(o conjunto de treinamento)
2. Aprende-se o modelo a partir do conjunto de treinamento3. Uma vez treinado, o modelo é executado sobre as instâncias remanescentes (o conjunto de
teste) para ver como ele se comporta
Número de novos destinatários
Azul Verm.
Azul 7 1
Verm. 1 5Rea
l(E
sper
ado)
Classificado como
Matriz de Confusão
37
![Page 38: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/38.jpg)
O Caso Não-linearmente Separável
Número de novos destinatários
Tam
anho
do
Em
ail
38
![Page 39: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/39.jpg)
O Caso Não-linearmente Separável
Número de novos destinatários
Tam
anho
do
Em
ail
39
![Page 40: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/40.jpg)
O Caso Não-linearmente Separável
Número de novos destinatários
Tam
anho
do
Em
ail
40
![Page 41: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/41.jpg)
O Caso Não-linearmente Separável
Número de novos destinatários
Tam
anho
do
Em
ail
41
![Page 42: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/42.jpg)
Aprendizado Lazy (Preguiçoso)
• A generalização além do dados de treinamento é postergada até que uma nova instância é fornecida ao sistema
42
![Page 43: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/43.jpg)
Aprendizado LazyInstance-based learning
Conjunto de Treinamento
43
![Page 44: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/44.jpg)
Aprendizado LazyK-Nearest Neighbors
Número de novos destinatários
Tam
anho
do
Em
ail
● Qual deve ser o K?● Qual medida de
distância deve ser usada?
44
![Page 45: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/45.jpg)
Árvores de Decisão- Uma estrutura de árvore do tipo fluxograma- Nós internos denotam uma avaliação em UM atributo- Cada galho representa um resultado da avaliação- Nós-folha representam uma classe/rótulo/meta
Árvores de decisão dividem o espaço de características em eixos paralelos retangulares e rotulam cada retângulo com uma classe
45
![Page 46: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/46.jpg)
Indução Top Down de Árvores de DecisãoTa
man
ho d
o E
mai
l
Número de novos destinatários
OKSPAM
Uma árvore de decisão de um único nível é também conhecida como um Cepo/Toco-Decisão (decision stump)
1 Erro 8 Erros
Tam.Email
≥ 1.8< 1.8
46
![Page 47: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/47.jpg)
Indução Top Down de Árvores de DecisãoTa
man
ho d
o E
mai
l
Número de novos destinatários
OKSPAM
1 Erro 8 Erros
Tam.Email
≥ 1.8< 1.8
OKSPAM
4 Erros 11 Erros
#Nov. Dest.
≥ 2.3< 2.3
47
![Page 48: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/48.jpg)
Indução Top Down de Árvores de DecisãoTa
man
ho d
o E
mai
l
Número de novos destinatários
OKSPAM
1 Erro 8 Erros
Tam.Email
≥ 1.8< 1.8
OKSPAM
4 Erros 11 Erros
Tam.Email
≥ 2.3< 2.3
48
![Page 49: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/49.jpg)
Indução Top Down de Árvores de DecisãoTa
man
ho d
o E
mai
l
Número de novos destinatários
SPAM
1 Erro
Tam.Email
≥ 1.8< 1.8
OK SPAM
3 Erros 1 Erro
Tam.Email
≥ 4< 4
49
![Page 50: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/50.jpg)
Indução Top Down de Árvores de DecisãoTa
man
ho d
o E
mai
l
Número de novos destinatários
SPAM
1 Erro
Tam.Email
≥ 1.8< 1.8
SPAM
1 Erro
Tam.Email
≥ 4
< 4
#Nov. Dest
OKSPAM
0 Erro 1 Erro
< 1 ≥ 1
50
![Page 51: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/51.jpg)
Qual Árvore?Ta
man
ho d
o E
mai
l
# de novos destinatários
Tam
anho
do
Em
ail
# de novos destinatários 51
![Page 52: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/52.jpg)
Overfitting & Underfitting
Overtraining: significa que ele aprendeu demais o conj. de treinamento (decorou) - ele se superajustou ao conj. de treinamento de forma que ele se desempenha mal no conj. de testeUnderfitting: significa que o modelo é muito simples, o erro no treino e no teste é muito grande
52
![Page 53: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/53.jpg)
Modelo de Rede Neuronal
Entradas
Idade
Gênero
Estágio
Variáveis independentes Pesos Camadas
Escondidas PesosVariável
dependente
Predição
“Probabilidade de estar vivo”
Saída
53
![Page 54: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/54.jpg)
“Modelos Logísticos Combinados”
Entradas
Idade
Gênero
Estágio
Variáveis independentes Pesos Camadas
Escondidas PesosVariável
dependente
Predição
“Probabilidade de estar vivo”
Saída
54
![Page 55: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/55.jpg)
“Modelos Logísticos Combinados”
Entradas
Idade
Gênero
Estágio
Variáveis independentes Pesos Camadas
Escondidas PesosVariável
dependente
Predição
“Probabilidade de estar vivo”
Saída
55
![Page 56: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/56.jpg)
“Modelos Logísticos Combinados”
Entradas
Idade
Gênero
Estágio
Variáveis independentes Pesos Camadas
Escondidas PesosVariável
dependente
Predição
“Probabilidade de estar vivo”
Saída
56
![Page 57: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/57.jpg)
“Modelos Logísticos Combinados”
Entradas
Idade
Gênero
Estágio
Variáveis independentes Pesos Camadas
Escondidas PesosVariável
dependente
Predição
Saída
“Probabilidade de estar vivo”
57
![Page 58: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/58.jpg)
Aprendizado de Ensembles
• A ideia é usar múltiplos modelos para obter melhor desempenho preditivo que se poderia obter a partir de qualquer um dos modelos constituintes
• Teoria da diversidade
58
ComitêsCombinação Fusão
![Page 59: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/59.jpg)
Aprendizado de Ensembles• Bagging (variance) envolve a construção de um ensemble (comitê) treinando cada nova instância de modelo de classificação com conjuntos de treinamento diferentes (aleatoriamente escolhidos).
• Boosting (bias) ... para enfatizar as instâncias de treinamento que foram mal classificadas por modelos anteriores.
59
![Page 60: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/60.jpg)
Exemplo de Ensemble of Weak Classifiers
60
![Page 61: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/61.jpg)
Princípios Principais
61
![Page 62: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/62.jpg)
Navalha de Occam (Século XIV)
62
• Do latim “ lex parsimoniae” – A lei da parcimônia (economia)
• A explicação de qualquer fenômeno deve fazer o menor número possível de suposições, eliminando aquelas que não fazem diferença nas predições observáveis da hipótese explicativa ou da teoria
• O Dilema de Occam: Infelizmente, em AM, acurácia e simplicidade estão em conflito.
![Page 63: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/63.jpg)
No Free Lunch Theorem em Aprendizado de Máquina
63
• “ Para quaisquer dois algoritmos de aprendizado, há tantas situações (apropriadamente ponderadas) nas quais o algoritmo 1 é superior ao algoritmo 2 e vice-versa, de acordo com qualquer uma das medidas de ‘superioridade’ “
![Page 64: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/64.jpg)
Então por que desenvolver novos algoritmos?
64
• O “desenvolvedor” (você) está preocupado em escolher o algoritmo mais apropriado para o problema em questão
• Isso requer algum conhecimento a priori - distribuição de dados, probabilidades anteriores, complexidade do problema, a física do fenômeno subjacente, etc.
![Page 65: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/65.jpg)
Então por que desenvolver novos algoritmos?
65
• O teorema do No Free Lunch nos diz que - a menos que tenhamos algum conhecimento a priori - classificadores simples (ou complexos) não são necessariamente melhores que outros. No entanto, dadas algumas informações a priori, certos classificadores podem melhorar as características de certos tipos de problemas.
• O principal desafio do “desenvolvedor” é, então, identificar a correspondência correta entre o problema e o classificador! ... o que é mais um motivo para se armar com um conjunto diversificado / arsenal de algoritmos de aprendizado!
![Page 66: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/66.jpg)
Menos é Mais
66
• A maldição da dimensionalidade(Bellman, 1961)
![Page 67: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/67.jpg)
Menos é MaisA maldição da dimensionalidade
67
• Aprender a partir de um espaço de característica de alta dimensionalidade requer uma quantidade enorme de dados de treinamento para garantir que haja várias amostras com cada combinação de valores.
• Com uma quantidade fixa de número de instâncias de treinamento, o poder de preditibilidade reduz à medida que aumenta a dimensionalidade.
![Page 68: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/68.jpg)
Menos é MaisA maldição da dimensionalidade
• Como contra-medida, muitas técnicas de redução de dimensionalidade foram propostas, e foi demonstrado que, quando feitas adequadamente, as propriedades ou estruturas dos objetos podem ser preservadas.
• No entanto, aplicar ingenuamente a redução de dimensionalidade pode levar a resultados desastrosos.
68
![Page 69: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/69.jpg)
• Como a redução de dimensionalidade é uma ferramenta importante no aprendizado de máquinas / mineração de dados / reconhecimento de padrões, deve-se estar sempre atento que ela pode distorcer os dados levando a representações enganosas.
• Acima temos uma projeção bidimensional de um mundo intrinsecamente tridimensional. 69
![Page 70: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/70.jpg)
Fotógrafo desconhecido © Eammonn Keogh & Jessica Lin● https://cs.gmu.edu/~jessica/DimReducDanger.htm
70
![Page 71: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/71.jpg)
71
• Recomenda-se usar o video original www.cs.gmu.edu/~jessica/DimReducDanger.htm
Redução da Dimensionalidade
![Page 72: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/72.jpg)
• www.cs.gmu.edu/~jessica/DimReducDanger.htm72
![Page 73: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/73.jpg)
73
Menos é Mais?• No passado (2000-2010), o conselho disseminado era
que a alta dimensionalidade era perigosa. • Mas, reduzir dimensionalidade reduz a quantidade de
informações disponíveis para previsão/aprendizado. • Hoje: tenta-se ir na direção oposta: em vez de reduzir a
dimensionalidade, aumenta-a adicionando muitas funções das variáveis preditoras.
• Quanto maior a dimensionalidade do conjunto de recursos, maior a probabilidade de ocorrer a separação (linear).
![Page 74: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/74.jpg)
74
Significado das Respostas
• Um grande risco em mineração de dados é que você “descobrirá” padrões sem sentido.
• Os estatísticos chamam isso de princípio de Bonferroni: (grosseiramente) se você procurar em mais lugares por padrões interessantes do que sua quantidade de dados suportará, você está fadado a encontrar “porcaria”.
![Page 75: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/75.jpg)
75
Exemplos do Princípio de Bonferroni
• Rastreamento de Terroristas
• O paradóxo de Rhine: um grande exemplo de como não conduzir pesquisa científica
![Page 76: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/76.jpg)
76
Por que o rastreamento de Terroristas é (Quase) Impossível?
• Suponha a crença de que certos grupos de malfeitores estão se encontrando ocasionalmente em hotéis para planejar a realização do mal.
• Deseja-se encontrar pessoas (não relacionadas) que tenham ficado pelo menos duas vezes no mesmo hotel no mesmo dia.
![Page 77: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/77.jpg)
77
Os detalhes
• 109 (um bilhão) pessoas estão sendo rastreadas• Por 1000 dias (≅3 anos)• Cada pessoa fica em um hotel 1% do tempo
(10 dias dos 1000)• Hotéis acomodam 100 pessoas (então 105 hotéis)• Se cada um comporta-se aleatoriamente (i.e., não
malfeitores) a mineração de dados vai detectar alguma coisa suspeita?
![Page 78: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/78.jpg)
78
As Contas (1)
• A probabilidade de que dado que as pessoas p & q vão estar no mesmo hotel em um dado dia d– 1/100 x 1/100 x 10-5 = 10-9.
• A probabilidade de p & q estejam no mesmo hotel nos dias d2 e d2:– 10-9 x 10-9 = 10-18
• Pares de dias (combinação de 1000 tomados 2 a 2)– ≅5.105.
![Page 79: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/79.jpg)
79
As Contas (2)
• A probabilidade de p & q estarem no mesmo hotel em “algum” par de dias:– 5.105 x 10-18 = 5.10-13
• Pares de Pessoas:– 5.1017
• Número esperado de pares de pessoas suspeitas:– 5.1017 x 5.10-13 = 250 000.
![Page 80: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/80.jpg)
80
Conclusão
• Suponha que existem 10 pares de malfeitores que definitivamente estiveram no mesmo hotel duas vezes
• Os analistas/agentes tem que vascular entre 250.010 candidatos para encontrar os 10 casos reais– Nada vai acontecer– Como podemos melhorar este esquema?
![Page 81: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/81.jpg)
81
Moral da História
• Quando estiver procurando por uma propriedade (e.g., “duas pessoas que estiveram em um mesmo hotel duas vezes”),
certifique-se de que a propriedade não permite tantas possibilidades que dados aleatórios certamente produzam fatos "de interesse".
![Page 82: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/82.jpg)
82
Paradóxo de Rhine (1)
• Joseph Rhine foi um parapsicólogo na década de 1950, que supunha que algumas pessoas tinham percepção extra-sensorial.
• Ele inventou (algo como) uma experiência em que os participantes foram solicitados a adivinhar 10 cartas escondidas - vermelho ou azul.
• Ele descobriu que quase 1 em 1000 tinha PES - eles conseguiram acertar todos os 10!
![Page 83: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/83.jpg)
83
Paradóxo de Rhine (2)
• Ele disse a essas pessoas que elas tinham PES e as chamou para outro teste do mesmo tipo.
• Infelizmente, ele descobriu que quase todos eles haviam perdido sua PES.– Nenhuma pessoa acertou novamente?
• O que ele concluiu?– Responda no próximo slide.
![Page 84: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/84.jpg)
84
Paradóxo de Rhine (3)
• Ele concluiu que você não deveria dizer às pessoas elas têm PES;– faz com que elas a percam.
![Page 85: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/85.jpg)
85
Moral da História
• Entender o princípio de Bonferroni ajudará você a se parecer um pouco menos estúpido do que um Parapsicólogo
![Page 86: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/86.jpg)
86
Instabilidade e o Efeito Rashomon
• Rashomon é um filme japonês em que quatro pessoas, de diferentes pontos de vista, testemunham um incidente criminal. Quando eles vêm para testemunhar no tribunal, todos relatam os mesmos fatos, mas suas histórias do que aconteceu são muito diferente.
• O efeito Rashomon é o efeito da subjetividade da percepção na lembrança (recollection).
![Page 87: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/87.jpg)
87
Instabilidade e o Efeito Rashomon
• O Efeito Rashomon em AM é que muitas vezes há uma multiplicidade de classificadores que dão a mesma taxa de erro mínima.
• Por exemplo, em árvores de decisão, se o conjunto de treinamento é perturbado apenas levemente, eu posso obter uma árvore bem diferente do original, mas com quase o mesmo erro do conjunto de testes.
![Page 88: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/88.jpg)
88
A Sabedoria das MultidõesPor que Muitos são mais inteligentes que Alguns e como a Inteligência Coletiva pode transformar...
• Sob certas condições controladas, a agregação de informações em grupos, resultando em decisões que são frequentemente superior aos que podem ser feitos por qualquer um - até mesmo especialistas.
• Imita nossa segunda natureza de procurar várias opiniões antes de fazer qualquer decisão crucial. Nós pesamos as opiniões individuais e as combinamos para alcançar uma decisão final.
![Page 89: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/89.jpg)
89
Comitês de Especialistas
- "... uma escola de medicina que tem como objetivo que todos alunos, dado um problema, cheguem a uma solução idêntica"
• Não há muito sentido em criar um comitê de especialistas de tal grupo - tal comitê não melhorará o julgamento de um indivíduo.
• Considerar:– É preciso haver desacordo para o comitê ter o potencial de
ser melhor que um indivíduo.
![Page 90: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/90.jpg)
90
Outras Tarefas de Aprendizado
![Page 91: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/91.jpg)
91
Aprendizado Supervisionado - MultiClass
Número de novos destinatários
Tam
anho
do
Em
ail
![Page 92: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/92.jpg)
92
Aprendizado Supervisionado - Multi-Label
Número de novos destinatários
Tam
anho
do
Em
ail
Multi-label learning refere-se ao problema de classificação onde cada exemplo pode ser atribuído a múltiplos rótulos simultaneamente
![Page 93: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/93.jpg)
93
Aprendizado Supervisionado - Regressão
Número de novos destinatários
Tam
anho
do
Em
ail
Encontrar uma relação entre uma variável dependente numérica e uma ou mais variáveis independentes
![Page 94: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/94.jpg)
94
Aprendizado Não-SupervisionadoDetecção de Anomalias
Número de novos destinatários
Tam
anho
do
Em
ail
Detectar padrões em um dado conjunto de dados que não se comportam / conformam a um comportamento padrão estabelecido.
![Page 95: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/95.jpg)
95
Aprendizado Não-Supervisionado Clustering
Número de novos destinatários
Tam
anho
do
Em
ail
Clustering é a designação de um conjunto de observações em subconjuntos (chamados clusters / aglomerados ) de forma que as observações no mesmo cluster sejam similares (em algum sentido)
![Page 96: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/96.jpg)
96
Fontes de Dados de Treinamento
• Fornecimento de exemplos aleatórios fora do controle do Algoritmo (learner).– Exemplos negativos disponíveis ou somente positivos?
• Aprendizagem Semi-Supervisionada– Desbalanceamento de classes ( atributo meta )
• O Algoritmo pode consultar um oráculo sobre a classe de um exemplo não rotulado no ambiente.– Aprendizado ativo
![Page 97: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/97.jpg)
97
Fontes de Dados de Treinamento
• O Algoritmo pode construir um exemplo arbitrário e consultar um oráculo para seu rótulo.– Interpolação de exemplo vs Desembalancemento
• O Algoritmo pode executar diretamente no ambiente sem qualquer orientação humana e obter feedback.– Aprendizagem por reforço (reinforcement learning)
• Não há conceito de classe existente– Uma forma de descoberta
• Aprendizagem não supervisionada– Clustering– Regras de Associação
![Page 98: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/98.jpg)
98
Outras Tarefas de Aprendizado
• Outras configurações de aprendizado supervisionadas– Multi-class Classification– Multi-label Classification– Semi-supervised Classification
• uso de dados rotulados e não rotulados– One Class Classification - somente instâncias de um rótulo são
fornecidas
• Aprendizagem de Ranking e Preferências– Máquinas de Busca– Máquinas de Recomendação
![Page 99: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/99.jpg)
99
Outras Tarefas de Aprendizado
• Aprendizado on-line e Aprendizado incremental – Aprende uma instância por vez.
• Concept drift
• Multi-task Learning & Transfer Learning– DeepLearning
• Classificação coletiva - quando as instâncias são dependentes!– Multiple-instance learning
![Page 100: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/100.jpg)
100
Software
![Page 101: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/101.jpg)
Quer Aprender Mais?- T. Mitchell, Machine Learning, McGraw Hill, 1997.
- http://www.cs.cmu.edu/afs/cs.cmu.edu/user/mitchell/ftp/mlbook.html
- R. Duda, P Hard and D. Stork, Pattern Classification,
Wiley-Interscience, 2000.
- C. M. Bishop, Pattern Recognition and Machine
Learning, Springer, 2006.
- Simon Rogers and Mark Girolami. A First Course in Machine Learning - second edition Chapman & Hall/CRC, 2016. 101
![Page 102: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/102.jpg)
Agenda
• Demais aulas– 10/11 - 4 aulas / 8 horas– 24/11 - 4 aulas / 8 horas– 08/12 - 2 aulas / 4 horas
102
![Page 103: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/103.jpg)
Agenda (horas 03-04)
• (03) Inteligência Artificial • (04) Aprendizado de Máquinas
103
![Page 104: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/104.jpg)
Agenda (horas 05-06-07-08)
• (05) Como aplicar Machine Learning no seu ambiente de trabalho? – Guiar “Aplicações e Estudos de casos”
• (06-07) Deep Learning & i4.0• (08) Laboratório: A ferramenta Weka
104
![Page 105: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/105.jpg)
Agenda (horas 09-10-11-12)
• (09-10) Aprendizagem Supervisionada– Árvores de Decisão – Bayesian (Naive-Bayes)– Aprendizado por Instâncias
• Janelas de Parzen• k-NN
• (11) Aplicações e Estudos de Casos• (12) Laboratório
105
![Page 106: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/106.jpg)
Agenda (horas 13-14-15-16)
• (13) Boas práticas em AM– Métricas de Avaliação / Como dividir os dados– Testes Estatísticos
• (13) Aprendizagem Não-supervisionada– Aglomeração (Clustering)
• K-means & DBScan• (14) Regressão
– Uni & Multivariada– Linear, Polinomial & Logística
• (15) Aplicações e Estudos de Casos• (16) Laboratório
106
![Page 107: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/107.jpg)
Agenda (horas 17-18-19-20)
• (17) Aprendizagem Supervisionada – Linear Perceptron– Support Vector Machines (SVM)– Multiple Layer Perceptron (MLP)
• (18) Aplicações e Estudos de Casos• (19) Laboratório• (20) Avaliação
– 40 questões– Consulta a material
107
![Page 108: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/108.jpg)
Referências
- Notas de aulas do Prof. Lior Rokach- [email protected] - http://www.ise.bgu.ac.il/faculty/liorr/
- MOOC - Massive online-courses- https://www.class-central.com- edX- Stanford University (coursera) (Andrew Ng)- Udacity
108
![Page 109: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/109.jpg)
Nota Importante- Os slides desta aula são uma tradução com adaptações das notas
de aulas do Prof. Lior Rokach- Email: [email protected] - Homepage: http://www.ise.bgu.ac.il/faculty/liorr/- Slides: https://pt.slideshare.net/liorrokach/introduction-to-machine-learning-13809045
109
![Page 110: Uma introdução à Machine ... · •Introdução sobre AM (01-02) ... postergada até que uma nova instância é fornecida ao sistema 42. Aprendizado Lazy Instance-based learning](https://reader033.fdocumentos.com/reader033/viewer/2022042809/5f9063cf148b3e7a856f8803/html5/thumbnails/110.jpg)
110