SISTEMAS DE RECOMENDAÇÃO EM REDES SOCIAIS Natã Venâncio, Savyo Nóbrega
Agenda • Contextualização
– Redes Sociais – Sistemas de Recomendação (SRs)
• Técnicas de Sistemas de Recomendação • SR baseado na similaridade de perfis do Twi@er • Recomendação de tags • Sistemas de Recomendação em Redes Socais
– Google +1 – Amigos DINS
• Considerações Finais
CST 2011 – Sistemas de Recomendação em Redes Sociais
2
Redes Sociais • “Grupo de pessoas que tem algum nível de relação ou interesse mútuo.” (Dennis Altermann)
• ComparQlhamento de informações.
• Alto crescimento.
CST 2011 – Sistemas de Recomendação em Redes Sociais
3
Redes Sociais • Facebook – 590 milhões de visitantes únicos por mês – 38,5% da Internet usa o Facebook – 300 milhões de pessoas acessam diariamente – Cada usuário fica em média 25 minutos no site – 700 bilhões de minutos no total
Dados: DoubleClick ad planner
CST 2011 – Sistemas de Recomendação em Redes Sociais
4
Sistemas de Recomendação • Surgimento:
– Aumento da quanQdade de informação a que o usuário tem acesso. – Crescente mudança no paradigma da Web social baseado no usuário.
• ObjeQvo: reduzir a sobrecarga de informação da Web por meio da seleção de conteúdo baseada em preferências do usuário.
CST 2011 – Sistemas de Recomendação em Redes Sociais
5
Consumidor da informação AQvo produtor de conhecimento
Sistemas de Recomendação • Três categorias:
– Abordagem baseada em conteúdo
CST 2011 – Sistemas de Recomendação em Redes Sociais
6
Sistemas de Recomendação • Três categorias:
– Abordagem colaboraQva
– Abordagens híbridas
CST 2011 – Sistemas de Recomendação em Redes Sociais
7
Sistemas de Recomendação • Problema:
– EsQmação e forma das respostas do usuário
CST 2011 – Sistemas de Recomendação em Redes Sociais
8
Técnicas de Sistemas de Recomendação
CST 2011 – Sistemas de Recomendação em Redes Sociais 9
Filtragem baseada em conteúdo (FBC)
• Base: “Comparar conteúdo dos itens de forma a recomendar itens semelhantes aos que o usuário gostou no passado.”
• Algoritmo TF-‐IDF.
• Informações armazenadas em forma textual.
• Problema: Superespecialização e qualidade.
CST 2011 – Sistemas de Recomendação em Redes Sociais
10
Vetores formados pelos termos dos documentos
Filtragem ColaboraQva (FC) • Base: Gerar recomendações a parQr da correlação entre
usuários.
• Não apresenta restrição quanto ao Qpo dos dados.
• Vantagens: ausência do problema de superespecialização, qualidade dos itens e gosto do usuário.
• Problemas: first-‐rater, startup e sparcity.
CST 2011 – Sistemas de Recomendação em Redes Sociais
11
Mineração de dados (MD) • Descoberta de Conhecimento de Banco de Dados (DCBD).
• Descoberta de padrões num BD: – “20% dos consumidores que compram fraldas também compram cerveja”; – “80% dos consumidores que compram fraldas e cerveja em uma compra,
voltam para comprar carne e carvão na sexta-‐feira”.
CST 2011 – Sistemas de Recomendação em Redes Sociais
12
Mineração de dados (MD) • Regras associaQvas
• Nos SRs, faz-‐se uso das regras associaZvas: – Pré-‐condições que devem ser idenQficadas nos perfis dos
usuários, através dos antecedentes das regras; – Itens que devem ser recomendados, através dos consequentes
CST 2011 – Sistemas de Recomendação em Redes Sociais
13
Fraldas Cerveja
Fraldas e cerveja Carne e carvão
Raciocínio Baseado em Casos (RBC)
• Metodologia de solução de problemas que baseia-‐se em conhecimento adquirido anteriormente.
• Armazenado na forma de casos (descrição do problema + solução).
• Funcionamento de sistemas RBC é cíclico, dividido em quatro etapas principais:
• Recuperação; • ReuQlização; • Adaptação; • Retenção.
CST 2011 – Sistemas de Recomendação em Redes Sociais
14
Raciocínio Baseado em Casos (RBC)
CST 2011 – Sistemas de Recomendação em Redes Sociais
15
Problema Casos Similares
Casos Armazenados
Solução Sugerida Solução Adaptada
RECUPERAÇÃO
REUTILIZAÇÃO
ADAPTAÇÃO
RETENÇÃO
Raciocínio Baseado em Casos (RBC)
• Nos SRs, os itens a serem recomendados são tratados da mesma forma como são os problemas.
• Sistemas de Recomendação baseados em Conhecimento – Guardam informações sobre como os itens a serem recomendados se
adequam às necessidades dos usuários.
CST 2011 – Sistemas de Recomendação em Redes Sociais
16
Aplicações
Recomendação de tags SR baseado na similaridade de perfis no Twi@er
CST 2011 – Sistemas de Recomendação em Redes Sociais 17
Recomendações de tags
Propósitos: “Aumentar chances de encontrar um documento postado, relembrar ao usuário do
que se trata um documento e consolidar o vocabulário por meio dos usuários.”
BibSonomy
CST 2011 – Sistemas de Recomendação em Redes Sociais
18
Recomendações de tags
CST 2011 – Sistemas de Recomendação em Redes Sociais
19
Folksonomy
Conjunto de Usuários
Conjunto de Tags
Conjunto de Documentos
Usuário Documento Tag
Recomendações de tags • Definição do Problema: Recomendar para um dado usuário ( ) e um dado documento ( ), um conjunto de tags ( ). • Foco: Medir a relevância de tags.
CST 2011 – Sistemas de Recomendação em Redes Sociais
20
Recomendações de tags
• Usa Filtragem ColaboraQva
• Matriz usuário-‐objeto: m usuários x n objetos
CST 2011 – Sistemas de Recomendação em Redes Sociais
21
Recomendações de tags
CST 2011 – Sistemas de Recomendação em Redes Sociais
22
Conjunto dos k usuários mais similares a u
Número de vizinhos a ser retornados
Recomendações de tags
CST 2011 – Sistemas de Recomendação em Redes Sociais
23
SR baseado na similaridade de perfis no Twi@er
• ObjeQvo do trabalho: – Implementação de uma aplicação que cria um perfil para o usuário e,
a parQr dele, sugere perfis que ele pode desejar visitar.
• A recomendação faz uso da descrição de um novo usuário e recomenda um outro que possui uma descrição similar à dele.
CST 2011 – Sistemas de Recomendação em Redes Sociais
24
SR baseado na similaridade de perfis no Twi@er
CST 2011 – Sistemas de Recomendação em Redes Sociais
25
• Nearest Neighbor – Método descrito nos anos 50, mas ganhou popularidade no início dos
anos 60, quando os computadores mais potentes surgiram.
– Suponha um conjunto D de tuplas de treinamento. Cada elemento de D é uma tupla (x1, x2, ..., xn, c), onde c é a classe a qual pertence a tupla (x1, x2, ..., xn), que é considerada um ponto num espaço n-‐dimensional.
– Para saber a que classe pertence uma outra tupla Y = (y1, ..., yn), calculam-‐se as distâncias de Y a todas as tuplas de treinamento e considera aquela mais próxima de Y.
CST 2011 – Sistemas de Recomendação em Redes Sociais
26
SR baseado na similaridade de perfis no Twi@er
• Nearest Neighbor – Distância Euclidiana
– Distância de cossenos
• qi é o peso do termo i na consulta • di é o peso do termo i na consulta
– Pode haver uma normalização dos dados. CST 2011 – Sistemas de Recomendação em
Redes Sociais 27
SR baseado na similaridade de perfis no Twi@er
– Representação dos documentos é feita baseada em três modelos: booleano, probabilísQco e vetorial.
CST 2011 – Sistemas de Recomendação em Redes Sociais
28
SR baseado na similaridade de perfis no Twi@er
• Mineração de Texto – Processo de extrair padrões de textos. – Trabalha com dados não estruturados
• Etapa de pré-‐processamento: não estruturados à estruturados
• Mineração de Texto – Etapa de pré-‐processamento – Análise Léxica – Conversão entre caracteres – Stemming
CST 2011 – Sistemas de Recomendação em Redes Sociais
29
SR baseado na similaridade de perfis no Twi@er
• Mineração de Texto – Etapa de representação – Atribuição de pesos
• Peso u-‐idf: (frequência do termo) x (relevância de um termo num documento)
– Organizar os termos de acordo com o peso • Ranking
CST 2011 – Sistemas de Recomendação em Redes Sociais
30
SR baseado na similaridade de perfis no Twi@er
• Resultados obQdos – Mineração de perfis de 19.365 usuários diferentes – Pré-‐processamento à Vetor de pesos à Ranking à Dist. Euclidiana – Foram escolhidos os k perfis que mostraram menores distâncias em
relação ao perfil em questão
CST 2011 – Sistemas de Recomendação em Redes Sociais
31
SR baseado na similaridade de perfis no Twi@er
Sistemas de Recomendação
Google +1 Amigos DINS
CST 2011 – Sistemas de Recomendação em Redes Sociais 32
Sistemas de Recomendação
• Google – Recomendar conteúdo diretamente nos resultados de pesquisa ou através de botões que poderão ser adicionados em sites e blogs pela Web.
– Parecido com o do Facebook.
CST 2011 – Sistemas de Recomendação em Redes Sociais
33
Considerações Finais • Importância dos Sistemas de Recomendação associados às
Redes Sociais – Reduzir a sobrecarga de informação na Web
• Não existe uma melhor técnica para construir um SR – Depende do objeQvo da sua aplicação
• CompeQção entre as Redes Sociais existentes – Quem ganha é o usuário final
CST 2011 – Sistemas de Recomendação em Redes Sociais
34
Referências Bibliográficas • PEREIRA, D. Uma Aplicação em Sistemas de Recomendação: Sistema de
Recomendação para Pacotes GNU/Linux. • CAZELLA, S. C., NUNES, M. A. S. N., REATEGUI, E. B. A Ciência da Opinião:
Estado da Arte em Sistemas de Recomendação. • DE GEUS, P. L., FIGUEIRA FILHO, F. M., ALBUQUERQUE, J. P. Sistemas de
Recomendação e Interação na Web Social. • CORUMBA, D. M., NUNES, M. A. S. N., ARANHA, C. N. Sistema de
Recomendação baseado na similaridade de perfis do Twi@er. • h@p://www.google.com/+1/bu@on/. ÚlQmo acesso em: 31/05/2011. • Sistemas de Recuperação da Informação 2011.1, UFCG. Prof. Dr. Leandro
Balby Marinho.
CST 2011 – Sistemas de Recomendação em Redes Sociais
35
SISTEMAS DE RECOMENDAÇÃO EM REDES SOCIAIS
{natanvm,savyo}@dsc.ufcg.edu.br
Top Related