Computação aplicada na boo-box
-
Upload
fernando-meyer -
Category
Documents
-
view
676 -
download
2
Transcript of Computação aplicada na boo-box
Computação Aplicadana boo-boox
Fernando Meyer
Wednesday, November 23, 11
Bio - Fernando Meyer
Lead software engineer at boo-box desde set-11
12 anos de experiência em tecnologia com passagem em empresas como redhat, jboss, globo.com, locaweb.
Paixão por produtos e soluções pragmáticas
Interesse acadêmico em machine learning, data mining e nlp
@fmeyer no twitter e linkedin http://fmeyer.org
Wednesday, November 23, 11
Agenda - Semana Inovação
O que é a boo-box
Desafios computacionais
Desafios de arquitetura
Aplicando inovação no mundo real
Futuro
Wednesday, November 23, 11
A boo-box é a primeira empresa brasileira de tecnologia para publicidade e mídias sociais. Sua tecnologia classifica e categoriza o público de 225 mil sites, exibe anúncios mais interessantes para 65 milhões de pessoas no Brasil, monetiza a audiência de 28 mil produtores de conteúdo e gera melhor retorno sobre o investimento para anunciantes e agências de publicidade. Desde 2007 tem investimento da Monashees Capital e em 2010 foi a única empresa brasileira a receber investimento da Intel Capital.
65 MILHÕES DE PESSOAS IMPACTADAS
225 MIL SITES E BLOGS
3 BILHões DE anúncios Exibidos por mês
Wednesday, November 23, 11
Desafios da boo-box
Wednesday, November 23, 11
Desafios de produto - ad server
Wednesday, November 23, 11
Nosso sistemas vem evoluindo de forma
constante desde 2007, hoje contamos com
aproximandamente 1MM de linhas de código em
produção em todos os produtos
Desafios de produto - ad server
~ 8k requests por segundo
~ 300 GB de informação gerada por dia
~ <10 ms por request
Entregar uma propaganda que faça sentido para o internauta
Wednesday, November 23, 11
Desafios de produto - ad server
Wednesday, November 23, 11
Desafios de produto - ad server
Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real
Como por exemplo um classificador de gênero
f1
f2
f3
f4
a1
a2
a3
b1
b2
b3
M
F
Wednesday, November 23, 11
Desafios de produto - ad server
Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real
Como por exemplo um classificador de gênero
f1
f2
f3
f4
a1
a2
a3
b1
b2
b3
M
F
Wednesday, November 23, 11
Desafios de produto - ad server
Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real
Como por exemplo um classificador de gênero
f1
f2
f3
f4
a1
a2
a3
b1
b2
b3
M
F
Wednesday, November 23, 11
Desafios de produto - ad server
Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real
Como por exemplo um classificador de gênero
f1
f2
f3
f4
a1
a2
a3
b1
b2
b3
M
F
Wednesday, November 23, 11
Desafios de produto - ad server
Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real
Como por exemplo um classificador de gênero
f1
f2
f3
f4
a1
a2
a3
b1
b2
b3
M
F
Wednesday, November 23, 11
Desafios de produto - ad server
Usamos algoritmos avançados de aprendizado de máquina para classificar todos os dados em tempo real
Como por exemplo um classificador de gênero
f1
f2
f3
f4
a1
a2
a3
b1
b2
b3
M
F
Wednesday, November 23, 11
Desafios de produto - ad server
Mesclar conhecimento de negócio com computação para gerar modelos de tomada de decisão
categoria do internautaWednesday, November 23, 11
Desafios de produto - ad server
Mesclar conhecimento de negócio com computação para gerar modelos de tomada de decisão
Analytic function for logic regression
categoria do internautaWednesday, November 23, 11
Desafios de produto - ad server
Mesclar conhecimento de negócio com computação para gerar modelos de tomada de decisão
Double logistic function
Analytic function for logic regression
categoria do internautaWednesday, November 23, 11
Desafios de produto - ad server
Com este modelo de tomada de decisão podemos saber se uma campanha ira performar melhor em uma determinada categoria de sites, otimizando o retorno
Wednesday, November 23, 11
Desafios de produto - seeding
O Seeding boo-box paga usuários do Twitter por divulgar mensagens comerciais em seus perfis automaticamente. O pagamento é feito de acordo com a reputação do usuário e o conteúdo publicado vem de campanhas publicitárias ou ofertas de produtos.
Wednesday, November 23, 11
Desafios de produto - seeding
Otimizar impacto de rede com o minimo de tweets possiveis
1
a
1
b
b
a
y = ax
y =1x
y = b x
-10 -5 5 10 15 20
0.05
0.10
0.15
Wednesday, November 23, 11
Desafios de produto - deteção de fraude
Utilizar modelos matemáticos para detectar fraude em clicks
Wednesday, November 23, 11
Desafios de arquitetura - relembrando
~ 8k requests por segundo
~ 300 GB de informação gerada por dia
~ <10 ms por request
Mais acessos do que a maioria dos sites do Brasil
Muito de dificil de escalar, pois estrategias como caching não funcionam
Otimizar quantidade de requests por maquina
Wednesday, November 23, 11
Desafios de arquitetura - Tecnologias
Mysql
MongoDB
Java
Ruby on Rails
Cassandra ( nosql )
Rabbitmq
Wednesday, November 23, 11
Futuro - venha trabalhar conosco
Wednesday, November 23, 11
facebookfacebook.com/booboxbr
twitter@booboxbr
flickrflickr.com/booboxbr
SITEboo-box.com
blogblog.boo-box.com
Av. Brigadeiro Faria Lima, 2631���DQGDU���6mR�3DXOR���63
01452 00011 3853 9598
Wednesday, November 23, 11