Chaordic - BigData e MapReduce - Robson Motta

56
Robson Motta | robson@chaordic.com.br Big Data e MapReduce Admirável mundo novo

description

Apresentação sobre Big Data e MapReduce feita pelo caórdico Robson Motta na abertura no evento Computer On The Beach 2014, em Floripa.

Transcript of Chaordic - BigData e MapReduce - Robson Motta

Page 1: Chaordic - BigData e MapReduce - Robson Motta

Robson Motta | [email protected]

Big Data e MapReduceAdmirável mundo novo

Page 2: Chaordic - BigData e MapReduce - Robson Motta
Page 3: Chaordic - BigData e MapReduce - Robson Motta

Mais de200 milhões

page views mensais

Page 4: Chaordic - BigData e MapReduce - Robson Motta

116 milhões de pedidos

Page 5: Chaordic - BigData e MapReduce - Robson Motta

3 bilhõesde visitas

em produtos

Page 6: Chaordic - BigData e MapReduce - Robson Motta

700 milhõesde recomendações

geradas diariamente

Page 7: Chaordic - BigData e MapReduce - Robson Motta

Como armazenar?

Page 8: Chaordic - BigData e MapReduce - Robson Motta

Como processar?

Page 9: Chaordic - BigData e MapReduce - Robson Motta

Como visualizar?

Page 10: Chaordic - BigData e MapReduce - Robson Motta

Como monitorar?

Page 11: Chaordic - BigData e MapReduce - Robson Motta

Sumário

• A Chaordic

• Chaordic + Big Data + Cloud

• Dos eventos às recomendações

• A vida não é bela: surgem os desafios

• Visualizando e monitorando

• Futuro?

Page 12: Chaordic - BigData e MapReduce - Robson Motta
Page 13: Chaordic - BigData e MapReduce - Robson Motta

+

Como tudo começou

Page 14: Chaordic - BigData e MapReduce - Robson Motta
Page 15: Chaordic - BigData e MapReduce - Robson Motta

Como fazemosComofazemos?

Page 16: Chaordic - BigData e MapReduce - Robson Motta

+

Page 17: Chaordic - BigData e MapReduce - Robson Motta

• Volume

• Velocidade

• Variedade

Page 18: Chaordic - BigData e MapReduce - Robson Motta

quantidade de dados

tempo de processamento

2010

16 M eventos 3 dias

Page 19: Chaordic - BigData e MapReduce - Robson Motta

quantidade de dados

tempo de processamento

2010 2014

16 M eventos

4500 M eventos3 dias

Page 20: Chaordic - BigData e MapReduce - Robson Motta

quantidade de dados

tempo de processamento

2010 2014

16 M eventos

4500 M eventos3 dias 7 horas

Page 21: Chaordic - BigData e MapReduce - Robson Motta

Arquitetura

Onsite

DashboardEngine

Mail

Platform

Page 22: Chaordic - BigData e MapReduce - Robson Motta

Como armazenar?

Node 1

Node 3

Node 2Node...

"Batch" Cassandra ClusterAvailability Zone - 2

Node 1

Node 3

Node 2Node...

"Online" Cassandra ClusterAvailability Zone - 1

Online Service Tier Batch Service Tier

Page 23: Chaordic - BigData e MapReduce - Robson Motta

Como processar? MapReduce

Um novo paradigmaque permite e facilitaa implementação de

algoritmos distribuídos

Page 24: Chaordic - BigData e MapReduce - Robson Motta

Data

Robson Motta Raul Seixas Ed Motta Reginaldo Rossi Nelson Mandela Valentino Rossi

Map

Motta, 1 Seixas, 1 Motta, 1 Rossi, 1 Mandela, 1 Rossi, 1

Mandela, (1) Motta, (1, 1) Rossi, (1, 1) Seixas, (1)

Reduce

Mandela, (1) Motta, (1, 1) Rossi, (1, 1) Seixas, (1)

Mandela, 1 Motta, 2 Rossi, 2 Seixas, 1

Como processar?

Page 25: Chaordic - BigData e MapReduce - Robson Motta

Data

A - B Cadeira - D Cadeira - E Cadeira - E F - A

Map

A, (B, F) B, (A) Cadeira, (D, E, E) D, (Cadeira) E, (Cadeira,Cadeira) F, (A)

Reduce

A, [B, F] B, [A] Cadeira, [E, D] D, [Cadeira] E, [Cadeira] F, [A]

Como processar?

Page 26: Chaordic - BigData e MapReduce - Robson Motta

Hadoop: HDFS e Hadoop MapReduce

• Escalável

• Custo reduzido

• Flexível

• Tolerante a falha

Como processar?

Page 27: Chaordic - BigData e MapReduce - Robson Motta

Engine

3

Como processar?

Engine Core

Platform

EC2 + EMR

S3

Uploader

5

64

2

1

Page 28: Chaordic - BigData e MapReduce - Robson Motta

recomendações

eventos

Page 29: Chaordic - BigData e MapReduce - Robson Motta

recomendações

eventos

préprocessamento

processamento

pós processamento

● produtos vistos● cliques● pedidos

etc.

Page 30: Chaordic - BigData e MapReduce - Robson Motta

• Itens muito populares• Eventos inesperados• Clientes diferentes• Sazonalidade• Ausência de eventos

Desafios

Page 31: Chaordic - BigData e MapReduce - Robson Motta

Desafios

Page 32: Chaordic - BigData e MapReduce - Robson Motta

Desafios

R$ 270,81

Usuário entrouna página paracomprar a boneca...

...e sugerimos que elelevasse junto um pneu

Page 33: Chaordic - BigData e MapReduce - Robson Motta

Compras conjuntas?

Desafios

+

Page 34: Chaordic - BigData e MapReduce - Robson Motta

Compras conjuntas?

Desafios

+

31

Page 35: Chaordic - BigData e MapReduce - Robson Motta

Dados consistentes?

Desafios

+

Page 36: Chaordic - BigData e MapReduce - Robson Motta

Dados consistentes?

Desafios

+

Page 37: Chaordic - BigData e MapReduce - Robson Motta

Bot gerando eventos?

Desafios

+

Page 38: Chaordic - BigData e MapReduce - Robson Motta

Bot gerando eventos?

Desafios

+

Page 39: Chaordic - BigData e MapReduce - Robson Motta

Kit daprópria loja?

Desafios

+

Page 40: Chaordic - BigData e MapReduce - Robson Motta

Desafios

+

Kit daprópria loja?

Page 41: Chaordic - BigData e MapReduce - Robson Motta

Destaquessimultâneos?

Desafios

+

Page 42: Chaordic - BigData e MapReduce - Robson Motta

Reduziramde preço?

Desafios

+

Page 43: Chaordic - BigData e MapReduce - Robson Motta

Reduziramde preço?

Desafios

+...só o pneu

Page 44: Chaordic - BigData e MapReduce - Robson Motta

Quandoreduziu?

Desafios

+

Page 45: Chaordic - BigData e MapReduce - Robson Motta

Quandoreduziu?

Desafios

+

Page 46: Chaordic - BigData e MapReduce - Robson Motta

Conclusão...Desafios

+

Page 47: Chaordic - BigData e MapReduce - Robson Motta

Promoção de pneu no dia das crianças

Desafios

+

Page 48: Chaordic - BigData e MapReduce - Robson Motta

Visualizandoe monitorando

Page 49: Chaordic - BigData e MapReduce - Robson Motta

Visualizare monitorar

• Consultas em bases não relacionais

• Acompanhamento de desempenho

• Visualização de logs

• Acompanhamento de custos

Page 50: Chaordic - BigData e MapReduce - Robson Motta

Visualizar

Page 51: Chaordic - BigData e MapReduce - Robson Motta
Page 52: Chaordic - BigData e MapReduce - Robson Motta
Page 53: Chaordic - BigData e MapReduce - Robson Motta

KINESIS STORM

Real Time Big Data Processing

Futuro

Page 54: Chaordic - BigData e MapReduce - Robson Motta

SHARK

In Memory Big Data Processing

Futuro

Page 55: Chaordic - BigData e MapReduce - Robson Motta

Robson [email protected]

Page 56: Chaordic - BigData e MapReduce - Robson Motta

/chaordic.com.br