Computação aplicada na boo-box

25
Computação Aplicada na boo-boox Fernando Meyer Wednesday, November 23, 11

Transcript of Computação aplicada na boo-box

Page 1: Computação aplicada na boo-box

Computação Aplicadana boo-boox

Fernando Meyer

Wednesday, November 23, 11

Page 2: Computação aplicada na boo-box

Bio - Fernando Meyer

Lead software engineer at boo-box desde set-11

12 anos de experiência em tecnologia com passagem em empresas como redhat, jboss, globo.com, locaweb.

Paixão por produtos e soluções pragmáticas

Interesse acadêmico em machine learning, data mining e nlp

@fmeyer no twitter e linkedin http://fmeyer.org

Wednesday, November 23, 11

Page 3: Computação aplicada na boo-box

Agenda - Semana Inovação

O que é a boo-box

Desafios computacionais

Desafios de arquitetura

Aplicando inovação no mundo real

Futuro

Wednesday, November 23, 11

Page 4: Computação aplicada na boo-box

A boo-box é a primeira empresa brasileira de tecnologia para publicidade e mídias sociais. Sua tecnologia classifica e categoriza o público de 225 mil sites, exibe anúncios mais interessantes para 65 milhões de pessoas no Brasil, monetiza a audiência de 28 mil produtores de conteúdo e gera melhor retorno sobre o investimento para anunciantes e agências de publicidade. Desde 2007 tem investimento da Monashees Capital e em 2010 foi a única empresa brasileira a receber investimento da Intel Capital.

65 MILHÕES DE PESSOAS IMPACTADAS

225 MIL SITES E BLOGS

3 BILHões DE anúncios Exibidos por mês

Wednesday, November 23, 11

Page 5: Computação aplicada na boo-box

Desafios da boo-box

Wednesday, November 23, 11

Page 6: Computação aplicada na boo-box

Desafios de produto - ad server

Wednesday, November 23, 11

Page 7: Computação aplicada na boo-box

Nosso sistemas vem evoluindo de forma

constante desde 2007, hoje contamos com

aproximandamente 1MM de linhas de código em

produção em todos os produtos

Desafios de produto - ad server

~ 8k requests por segundo

~ 300 GB de informação gerada por dia

~ <10 ms por request

Entregar uma propaganda que faça sentido para o internauta

Wednesday, November 23, 11

Page 8: Computação aplicada na boo-box

Desafios de produto - ad server

Wednesday, November 23, 11

Page 9: Computação aplicada na boo-box

Desafios de produto - ad server

Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real

Como por exemplo um classificador de gênero

f1

f2

f3

f4

a1

a2

a3

b1

b2

b3

M

F

Wednesday, November 23, 11

Page 10: Computação aplicada na boo-box

Desafios de produto - ad server

Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real

Como por exemplo um classificador de gênero

f1

f2

f3

f4

a1

a2

a3

b1

b2

b3

M

F

Wednesday, November 23, 11

Page 11: Computação aplicada na boo-box

Desafios de produto - ad server

Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real

Como por exemplo um classificador de gênero

f1

f2

f3

f4

a1

a2

a3

b1

b2

b3

M

F

Wednesday, November 23, 11

Page 12: Computação aplicada na boo-box

Desafios de produto - ad server

Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real

Como por exemplo um classificador de gênero

f1

f2

f3

f4

a1

a2

a3

b1

b2

b3

M

F

Wednesday, November 23, 11

Page 13: Computação aplicada na boo-box

Desafios de produto - ad server

Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real

Como por exemplo um classificador de gênero

f1

f2

f3

f4

a1

a2

a3

b1

b2

b3

M

F

Wednesday, November 23, 11

Page 14: Computação aplicada na boo-box

Desafios de produto - ad server

Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real

Como por exemplo um classificador de gênero

f1

f2

f3

f4

a1

a2

a3

b1

b2

b3

M

F

Wednesday, November 23, 11

Page 15: Computação aplicada na boo-box

Desafios de produto - ad server

Mesclar conhecimento de negócio com computação para gerar modelos de tomada de decisão

categoria do internautaWednesday, November 23, 11

Page 16: Computação aplicada na boo-box

Desafios de produto - ad server

Mesclar conhecimento de negócio com computação para gerar modelos de tomada de decisão

Analytic function for logic regression

categoria do internautaWednesday, November 23, 11

Page 17: Computação aplicada na boo-box

Desafios de produto - ad server

Mesclar conhecimento de negócio com computação para gerar modelos de tomada de decisão

Double logistic function

Analytic function for logic regression

categoria do internautaWednesday, November 23, 11

Page 18: Computação aplicada na boo-box

Desafios de produto - ad server

Com este modelo de tomada de decisão podemos saber se uma campanha ira performar melhor em uma determinada categoria de sites, otimizando o retorno

Wednesday, November 23, 11

Page 19: Computação aplicada na boo-box

Desafios de produto - seeding

O Seeding boo-box paga usuários do Twitter por divulgar mensagens comerciais em seus perfis automaticamente. O pagamento é feito de acordo com a reputação do usuário e o conteúdo publicado vem de campanhas publicitárias ou ofertas de produtos.

Wednesday, November 23, 11

Page 20: Computação aplicada na boo-box

Desafios de produto - seeding

Otimizar impacto de rede com o minimo de tweets possiveis

1

a

1

b

b

a

y = ax

y =1x

y = b x

-10 -5 5 10 15 20

0.05

0.10

0.15

Wednesday, November 23, 11

Page 21: Computação aplicada na boo-box

Desafios de produto - deteção de fraude

Utilizar modelos matemáticos para detectar fraude em clicks

Wednesday, November 23, 11

Page 22: Computação aplicada na boo-box

Desafios de arquitetura - relembrando

~ 8k requests por segundo

~ 300 GB de informação gerada por dia

~ <10 ms por request

Mais acessos do que a maioria dos sites do Brasil

Muito de dificil de escalar, pois estrategias como caching não funcionam

Otimizar quantidade de requests por maquina

Wednesday, November 23, 11

Page 23: Computação aplicada na boo-box

Desafios de arquitetura - Tecnologias

Mysql

MongoDB

Java

Ruby on Rails

Cassandra ( nosql )

Rabbitmq

Wednesday, November 23, 11

Page 24: Computação aplicada na boo-box

Futuro - venha trabalhar conosco

[email protected]

Wednesday, November 23, 11

Page 25: Computação aplicada na boo-box

facebookfacebook.com/booboxbr

twitter@booboxbr

flickrflickr.com/booboxbr

SITEboo-box.com

blogblog.boo-box.com

Av. Brigadeiro Faria Lima, 2631���DQGDU���6mR�3DXOR���63

01452 00011 3853 9598

Wednesday, November 23, 11