Introdução ao Machine Learning - XI Pylestras

34
Introdução ao Machine Learning

Transcript of Introdução ao Machine Learning - XI Pylestras

Page 1: Introdução ao Machine Learning - XI Pylestras

Introdução ao Machine Learning

Page 2: Introdução ao Machine Learning - XI Pylestras

Quem sou?

● Rubens Pinheiro

● Bacharel em Ciências da Computação (UECE)

● Desenvolvedor Front End

● Entusiasta Python

● Sempre aprendendo!

Page 3: Introdução ao Machine Learning - XI Pylestras

Sobre a apresentação

● Introdução

● Ideia e definição básica sobre machine learning

● Exemplo prático

● Regressão

● Classificação

● Ferramentas

● Dúvidas

Page 4: Introdução ao Machine Learning - XI Pylestras

O que é?

“Aprendizagem de máquina é um método de análise de dados que automatiza a construção de modelos analíticos.

Usando algoritmos que iterativamente aprendem a partir de dados, o aprendizado de máquina permite que os

computadores encontrem 'insights' ocultos sem ser explicitamente programados para onde olhar.” - SAS

Page 5: Introdução ao Machine Learning - XI Pylestras

Francis Galton

Vox Populi - 1907

? Kg552kG

510kG

521kG

Page 6: Introdução ao Machine Learning - XI Pylestras

Francis Galton

Vox Populi - 1907

543,4 Kg

552kG

510kG

490kG

Média de 787 tickets547,4 Kg

Menos de 1% de erro!

Paper disponível em: http://galton.org/essays/1900-1911/galton-1907-vox-populi.pdf

Page 7: Introdução ao Machine Learning - XI Pylestras

Quanto mais experiência, mais próximo do acerto

543,4 Kg552kG510kG

490kG

Dados baseado em experiência!

Page 8: Introdução ao Machine Learning - XI Pylestras

Criação de um Modelo

Page 9: Introdução ao Machine Learning - XI Pylestras

Simplificando

Dados

Page 10: Introdução ao Machine Learning - XI Pylestras

Simplificando

Dados de aprendizado

Dados de teste

Page 11: Introdução ao Machine Learning - XI Pylestras

Treinando o modelo

Dados de aprendizado

400 Kg

Todas vaquinhas tem o valor de nosso “prediction target”, que é o peso.

Importante:

Durante o treino são utilizados como referências, features dos “dados” (as vacas), como a raça da vaca, sua idade, se está prenha, além de outros aspectos que podem ser externos, como a época do ano ou o bioma local. Pode ser usado tudo que influencie no nosso target, o peso.

Page 12: Introdução ao Machine Learning - XI Pylestras

Validação do modelo

ModeloDados

de teste

? Kg

Predição501Kg

Escondemos o peso e fazemos que oModelo tente prever o valor...

Page 13: Introdução ao Machine Learning - XI Pylestras

Modelo Dados de teste

501Kg

Predição501Kg

Acerto *

Continua o processo

Validação do modelo (acerto)

* Dentro de uma margem de erro definida

Page 14: Introdução ao Machine Learning - XI Pylestras

Modelo Dados de teste

510Kg

Predição501Kg

Erro

Corrige o modelo e continua o processo

Validação do modelo (erro)

“Aprenda com seus erros!”

Page 15: Introdução ao Machine Learning - XI Pylestras

Modelo Dados de teste

510Kg

Predição501Kg

Erro

Corrige o modelo e continua o processo

Validação do modelo (erro)

“Aprenda com seus erros!”

Page 16: Introdução ao Machine Learning - XI Pylestras

Formalizando: Regressão

Page 17: Introdução ao Machine Learning - XI Pylestras

Formalizando: Regressão

Dados

yi` (Valor previsto)

yi (Valor real)

Função gerada f(x)Resíduo/Erro

Feature

Target

Page 18: Introdução ao Machine Learning - XI Pylestras

Soma do quadrado residual (RSS)

yi` (Valor previsto)

yi (Valor real)

Resíduo/ErroTarget

Feature

Page 19: Introdução ao Machine Learning - XI Pylestras

E daí?

● O que queremos?

– Minimizar o erro → Min(RSS)● Como fazermos?

– Derivando o RSS

Tendo que a derivada da soma residual dos quadrados ...

… dará a função de previsão f(x)` = ax + b

Page 20: Introdução ao Machine Learning - XI Pylestras

Outras técnicas de regressão

Polynomial RegressionKernel Regression

Page 21: Introdução ao Machine Learning - XI Pylestras

Classificação

Identificar elementos (rótular) baseado em features

?

Page 22: Introdução ao Machine Learning - XI Pylestras

Classificação

Identificar elementos (rótular) baseado em features

!Wow!

Such precision!

So fast!

Very Pythonic!

Wow!

Page 23: Introdução ao Machine Learning - XI Pylestras

Classificação de texto (Tipo)

Artigo Centífico

Romance

Textão de Face(mimimimi)

Page 24: Introdução ao Machine Learning - XI Pylestras

Classificação de texto (Análise de sentimento)

?

Page 25: Introdução ao Machine Learning - XI Pylestras

Quebrando o texto em palavras

bom incrível páia ruim

Page 26: Introdução ao Machine Learning - XI Pylestras

Treinando o modelo

bom +1

incrível+5

4 estrelas(Texto marcado como bom)(se, fora, amanhã, depois, ...)

Page 27: Introdução ao Machine Learning - XI Pylestras

Treinando o modelo

(se, fora, amanhã, depois, ...)

páia -3

ruim -2

1 estrelas(Texto marcado como ruim)

Page 28: Introdução ao Machine Learning - XI Pylestras

Testando o modelo

páia -3

bom +1

incrível+5

Esse carro é bom.É incrível como o consumo dele é baixo! Só a direção que achei páia.

Pontuação total: +1 +5 -3 = +3 (Positivo)

? estrelas

Page 29: Introdução ao Machine Learning - XI Pylestras

Testando o modelo

páia -3

bom +1

incrível+5

Esse carro é bom.É incrível como o consumo dele é baixo! Só a direção que achei páia.

Pontuação total: +1 +5 -3 = +3 (Positivo)

4 estrelas

ACERTO

Page 30: Introdução ao Machine Learning - XI Pylestras

Testando o modelo (erro)

ruim -2

Eu com esse carro? Pense em uma vida ruim...

Pontuação total: -2 (Negativo)

5 estrelas

ERRO

Corrige o modelo(Recalculo da pontuação das palavras)

Page 31: Introdução ao Machine Learning - XI Pylestras

Testando o modelo (erro)

páia -2

Eu com esse carro? Pense em uma vida ruim...

Pontuação total: -2 (Negativo)

5 estrelas

ERRO

Page 32: Introdução ao Machine Learning - XI Pylestras

Outras técnicas de classificação

● Decision Trees● Clustering● Deep learning

Page 33: Introdução ao Machine Learning - XI Pylestras

Ferramentas

Page 34: Introdução ao Machine Learning - XI Pylestras

Dúvidas

?