TDC2016SP - Machine Learning com R

Post on 20-Mar-2017

142 views 2 download

Transcript of TDC2016SP - Machine Learning com R

diogenes.justo@gmail.com

Machine Learning com R

Diógenes JustoTDC 2016

09/jul

diogenes.justo@gmail.com

Apresentação

Diogenes Justo• BM&FBOVESPA• Professor• Consultor• Empresário

Linkedin.com/in/DiogenesJusto

Mestre em Economia Aplicada (UFRGS)

MBE Economia (UFRGS).

Especialista em Banking (FGV).

Especialista em Data Science.

Bacharel em Matemática Aplicada e Computacional (UFRGS).

Cursos de especialização em Big Data, Machine Learning e Data

Mining no MIT, Washington University, University of Illinois e

Stanford

PMO Manager da BMF&Bovespa - Profissional certificado PMP.

21 anos de experiência na área de TI, tendo atuado em

desenvolvimento, infraestrutura, banco de dados e B.I., além de

projetos.

diogenes.justo@gmail.com

Experiência Acadêmica

diogenes.justo@gmail.com

diogenes.justo@gmail.com

Machine Learning e Data Science

diogenes.justo@gmail.com

Machine Learning Pipeline

diogenes.justo@gmail.com

Machine Learning Pipeline

HOJEDADOS HISTÓRICOS

(aprendizagem)

PREVISÃO(O QUE QUEREMOS ESTIMAR)

VARIÁVEIS INDEP. E DEPENDENTE (x e y)

TREINO~80%

TESTE~20%

MODELO(y=ax+b)

APLICA NOS DADOS TESTE

1

2

3 CA

LIB

RA

O

MO

DEL

O

4

APLICA NA VARIÁVEL INDEPENDENTE PARA

OBTER y

5

diogenes.justo@gmail.com

Machine Learning: train / test error

diogenes.justo@gmail.com

Machine Learning: train / test set sampling

diogenes.justo@gmail.com

Ferramentas

diogenes.justo@gmail.com

R?

diogenes.justo@gmail.com

R packages

diogenes.justo@gmail.com

Desafios em R- Gerenciamento de memória- Performance- Clustering e integration- Data Streaming- Curva de aprendizado pode não ser trivial

diogenes.justo@gmail.com

Where?

- Análise exploratória de dados

- Modeling - Baixo volume de dados

ou amostras (scale-up)- Visualização de dados

- Produção com grandes volumes

- Produção sem suporte- Front-end para

clustering

diogenes.justo@gmail.com

Obrigado

diogenes.justo@gmail.com

05/08 - Workshop DataScience

08 e 09/11 - Big Data Science

Outubro - Desafio Endeavor/FIAP

O que vem por aí...

2017/2018 - Big Data Science (o livro)