Sistemas de recomendação

59
SISTEMAS DE BUSCA SISTEMAS DE RECOMENDAÇÃO Leonardo Rosa Zanette [email protected] Julho de 2008

description

Sistemas de Busca e Sistemas de Recomendação, introdução e tendências.

Transcript of Sistemas de recomendação

Page 1: Sistemas de recomendação

SISTEMAS DE BUSCASISTEMAS DE RECOMENDAÇÃOLeonardo Rosa [email protected]

Julho de 2008

Page 2: Sistemas de recomendação

RESUMO

Introdução Sistemas de Busca Sistemas de Recomendação Coleta de Informações Estratégias de Recomendação Técnicas de Recomendação Conclusões e Tendências

Page 3: Sistemas de recomendação

INTRODUÇÃO Com a quantidade e

disponibilidade de informações no mundo de hoje, as pessoas se deparam com uma diversidade muito grande de opções.

Impossível encontrar informações relevantes em tempo hábil

Como encontrar o que interessa? Esforço próprio Sorte Recomendação de amigos

Page 4: Sistemas de recomendação

INTRODUÇÃO: SOBRECARGA DE INFORMAÇÕES

Soluções: Sistemas de busca Filtragem da informação Sistemas de recomendação

Page 5: Sistemas de recomendação

SISTEMAS DE BUSCANECESSIDADE DA INFORMAÇÃO

Procura por item conhecido Procura por um item existente Procura exploratória Procura ampla (pesquisa)

Page 6: Sistemas de recomendação

SISTEMAS DE BUSCAFUNCIONAMENTO

http://semanticstudios.com/publications/semantics/search.html

Page 7: Sistemas de recomendação

SISTEMAS DE BUSCA PROBLEMAS A busca da informação não é feita em um único

passo, a não ser a busca por um item conhecido. O usuário busca uma informação, aprende como

resultado e refina sua busca. Normalmente é difícil ao usuário encontrar tudo que

necessita numa única vez porque ele não conhece o suficiente sobre o tópico para fazer a pergunta certa.

Encontrar uma “agulha no palheiro”

Page 8: Sistemas de recomendação

SISTEMAS DE BUSCA PROBLEMAS

Page 9: Sistemas de recomendação

SISTEMAS DE BUSCAFUTURO Clusty (www.clusty.com) - Ele analisa os primeiros links (entre 200 a

500) que resultaram de uma busca do usuário e mostra os principais temas, agrupados por pastas e subpastas

Page 10: Sistemas de recomendação

SISTEMAS DE BUSCAFUTURO O SearchMash (www.searchmash.com) é uma iniciativa do Google.

Numa pesquisa típica, uma barra lateral permite estendê-la a consultas relacionadas a imagens, a blogs, a vídeos e a wikipedia, num único clique.

Page 11: Sistemas de recomendação

SISTEMAS DE BUSCAFUTURO

http://www.msdewey.com/

Page 12: Sistemas de recomendação

SISTEMAS DE RECOMENDAÇÃO

Page 13: Sistemas de recomendação

O QUE SÃO SISTEMAS DE RECOMENDAÇÃO?

Sistemas de Recomendação são definidos como sistemas que procuram auxiliar indivíduos a identificarem conteúdos de interesse em um conjunto de opções que poderiam caracterizar uma sobrecarga. São sistemas que procuram facilitar a penosa atividade de busca por conteúdo interessante.

Recomendação de produtos e serviços Recomendação de usuários é conhecida

como combinação social

Page 14: Sistemas de recomendação

EVOLUÇÃO: LINHA DO TEMPO

Sistemas de Filtragem Cooperativa - Tapestry [Goldberg et al. 1992]

1992

Sistemas de Recomendação - CACM [Resnick & Varian 1997]

1997

Eixos de Pesquisa [Terveen & Hill 2001]

2001

Sistemas deAuxílio à recomendações

Sistemas de Geração de recomendações

Sistemas de Reputação [Resnick et al. 2000]

Sist. de Combinação Social [Terveen & McDonald 2005]

1994

GroupLens [Resnick et al. 1994]

1995

Ringo/Firefly [Shardanand & Maes 1995]UsenetNews [Maltz & EHRLICH, 1995]

20002005

Page 15: Sistemas de recomendação

Taxonomia para Aplicações de Recomendação

Entradas da Comunidade

Atributo dos Itens

Itens Externos

Popularidade

Histórico de Recomendações Aceitas

Avaliações

Comentários textuais

Método de Recomendação

Recuperação da Informações brutas

Seleção Manual

Resumo Estatístico

Baseado em Atributo

Correlação Item a Item

Correlação Usuário a Usuário

Entradas do Usuário

Navegação implícita

Navegação Explícita

Palavra-chave

Atributos

Avaliações (Ratings)

Histórico do Comportamento do Usuário

Recomendação

Sistema

Entregas

Push

Pull

Passivo

Nível de Personalização

Não personalizada

Efêmera

Persistente

Feedback/respostas Feedback/respostas

Saídas

Sugestões

Previsões

Avaliações

Revisões

Schafer, Konstan e Riedl, 2000

Page 16: Sistemas de recomendação

COLETA DE INFORMAÇÕESIdentificação

Entrada dos usuários

Entrada da comunidade

Page 17: Sistemas de recomendação

COLETA DE INFORMAÇÕES:IDENTIFICAÇÃO DO USUÁRIO

No servidor: Login

No cliente: Cookie

Page 18: Sistemas de recomendação

COLETA DE INFORMAÇÕES:EXPLÍCITA

Na modalidade de coleta explícita o usuário indica espontaneamente o que lhe é importante

Dados fornecidos pela pessoa, crítica ou rating; keywords usadas, atributos escolhidos.

Page 19: Sistemas de recomendação

COLETA DE INFORMAÇÕES:EXPLÍCITA

Desvantagem

Exige paciência e atenção dos usuários

Page 20: Sistemas de recomendação

COLETA DE INFORMAÇÕESIMPLÍCITA

Interesses Implícitos

Cada interação com o usuário contribui para um sistema de coleta de interesses implícitos

Ações que indicam interesse:

Colocar uma página nos Favoritos Visualizar página por longo tempo

Page 21: Sistemas de recomendação

COLETA DE INFORMAÇÕESIMPLÍCITA

Análise de log Acessos por mês, dia, hora Páginas visualizadas Páginas mais populares Sites que remeteram ao site analisado País do visitante

Page 22: Sistemas de recomendação

COLETA DE INFORMAÇÕESIMPLÍCITA

Desvantagem

Posso comprar um presente para outra pessoa Pode acessar de vários lugares Família utiliza o mesmo acesso

Page 23: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO

• Top-N ou Lista de recomendações• Comentários em texto • Avaliação de usuários• Associação de usuários• Associação por Conteúdo• Cross-sell• E-mail

Page 24: Sistemas de recomendação

GRAU DE PERSONALIZAÇÃO Não personalizada

Quando uma aplicação oferece as mesmas recomendações para todos os usuários.

EfêmeraSistemas que utilizam as informações correntes de um usuário para personalizar a recomendação. Itens no carrinho de compras e itens “vistos” são utilizados para personalizar.

PersistenteUtilizam informações armazenadas sobre as preferências dos usuários.

Page 25: Sistemas de recomendação

APRESENTAÇÃO DA RECOMENDAÇÃORefere-se à forma como a recomendação é apresentada

Pushrecomenda itens sem que o usuário tenha que estar interagindo com o sistema ex.: e-mail de ofertas especiais

Pullusuário solicita pela recomendação. Permite que os usuários controlem quando suas recomendações serão exibidas.ex.: ”recomendações para você”

Passivarecomendações aparecem no contexto do site.ex.: itens mais vendidos

Page 26: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO:TOP-N OU LISTA DE RECOMENDAÇÕES

Esta estratégia consiste em manter listas organizadas por tipos de interesses

Itens mais vendidos, Idéias para presentes, …

Não personalizada Passiva

Page 27: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO:TOP-N OU LISTA DE RECOMENDAÇÕES

Itens mais vendidos

Page 28: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO:TOP-N OU LISTA DE RECOMENDAÇÕES

Lista de Presentes

Page 29: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO:TOP-N OU LISTA DE RECOMENDAÇÕES

VantagemA principal vantagem neste tipo de estratégia está na facilidade de implementação.

DesvantagemAs recomendações não são dirigidas a cada usuário independentemente, mas sim a todos os usuários sem distinção.

Page 30: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO: COMENTÁRIOS EM TEXTO

Comentários de outros usuários. Ajuda a criar uma imagem forte do produto junto ao usuário.

Page 31: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO:AVALIAÇÃO DE USUÁRIOS

Uma das estratégias mais utilizadas em sistemas de recomendação são as avaliações dos usuários que asseguram outros consumidores da qualidade e utilidade dos produtos.

Page 32: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO:ASSOCIAÇÃO DE USUÁRIOS

Recomenda itens baseado na correlação entre um usuário e outros que se interessam pelo mesmo item

Page 33: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO:ASSOCIAÇÃO POR CONTEÚDO (PERSISTENTE)

Page 34: Sistemas de recomendação

ESTRATÉGIAS DE RECOMENDAÇÃO:ASSOCIAÇÃO POR CONTEÚDO (EFÊMERA)

Cross-Sell Efêmera A partir de um produto que o usuário esteja

consultando, sugere-se outros produtos do mesmo autor, compositor, etc.

Page 35: Sistemas de recomendação

E-MAIL

Mala direta personalizada baseada nos itens anteriormente comprados ou áreas do site mais visitadas.

Page 36: Sistemas de recomendação

TÉCNICAS DE RECOMENDAÇÃOFiltragem Baseada em Conteúdo

Filtragem Colaborativa

Filtragem Híbrida

Redes Sociais

Page 37: Sistemas de recomendação

TÉCNICAS PARA GERAR RECOMENDAÇÕES

Filtragem Híbrida

FBC FCA Redes Sociais

Mineração de Dados/Textos

Regras de Associação

Classificação

Agrupamento(cluster)

Redes Bayesianas

Similaridade de Vetores

FolksonomyOntologias

Correlação (Pearson) RC Combinação

Page 38: Sistemas de recomendação

FILTRAGEM BASEADA EM CONTEÚDO Analisa o conteúdo dos itens e faz recomendações com

base em: Informações contidas no perfil do usuário. Interesses identificados através de ações do usuário

(seleção, aquisição de itens, avaliações)

Implementação Correlação item a item Recomendação baseada em atributo

Limitações Dificuldade para analisar conteúdos de dados pouco

estruturados (vídeo e som) Dificuldade para diferenciar sinônimos

Page 39: Sistemas de recomendação

FILTRAGEM BASEADA EM CONTEÚDOERRO FATAL

Page 40: Sistemas de recomendação

FILTRAGEM COLABORATIVA Não exige a compreensão ou reconhecimento

do conteúdo dos itens.

Complementa as limitações da FBC: Itens são filtrados com base nas avaliações feitas pelos usuários.

Cada usuário se beneficia das pontuações (experiências) apresentadas por outros usuários.

Pontuação permite identificar que itens são considerados de interesse pelo grupo e evitar itens de pouco interesse.

Page 41: Sistemas de recomendação

FILTRAGEM COLABORATIVA

Baseado na heurística de que pessoas que concordaram no passado tendem a concordar no futuro, o sistema correlaciona avaliações de itens anteriores para determinar pesos que serão associados às pessoas na hora em que forem feitas as predições.

Sistema de Sistema de RecomendaçãoRecomendação

Page 42: Sistemas de recomendação

FILTRAGEM COLABORATIVA

Recomendação tradicional

Avalie o artefato item 16

Usuário item 13 item 15 item 16 item 22 item 38 item 48u10 3 4 5 4u11 4 3 3u12 5 5 u26 3 4 u23 4 3 3

Page 43: Sistemas de recomendação

FILTRAGEM COLABORATIVA

Recomendação tradicional

ua

m

iuiuaia

ua

rrrrP

1

,,

,

Correlação entre usuáriosUsuário Alvo Pearson

u10 u11 0,38u10 u12 -u10 u23 -0,46u10 u26 0,86u11 u12 0,45u11 u23 -0,11u11 u26 0,80u12 u23 -0,76u12 u26 -u23 u26 0,56

Coeficiente de Pearson R

Page 44: Sistemas de recomendação

FILTRAGEM COLABORATIVA

Recomendação tradicional

Usuário item 13 item 15 item 16 item 22 item 38 item 48u10 3 4 5 4,12 4u11 2,57 3,53 3,3 4 3 3u12 5 5 u26 3 4 4,51 4 4,23u23 4 5 3 2

n

uua

n

uuauiu

aia

P

PrrrS

1,

1,,

,

Page 45: Sistemas de recomendação

FILTRAGEM COLABORATIVA

Limitações:

Novo item Sem avaliações não pode ser recomendado

Novo usuário Muitas avaliações para receber recomendações

Super-especialização Item muito valorizado devido a muitas

avaliações

Page 46: Sistemas de recomendação

REDES SOCIAISREDE DE CONFIANÇA Segue a idéia de que quando pedimos a um

amigo confiável uma opinião sobre algo, estamos tendo a opinião confiável para nos ajudar a formar nosso pensamento preliminar sobre essa coisa.

Recomendações feitas com base nas relações entre os usuários da comunidade

Page 47: Sistemas de recomendação

REDE DE CONFIANÇAPROPOSTA PARA LIMITAÇÕES

Recomendação tradicional

Rede de confiança

Confio em U5

Usuário ConfiaEm Área Nível

U1 U5 Filme 3

U1 U6 SQL 1

U2 U4 Redes 0

U2 U7 Filme 3

U6 U9 Filme 3

U7 U3 Filme 2

Page 48: Sistemas de recomendação

REDE DE CONFIANÇA

Recomendação tradicional

Rede de confiança

Usuário ConfiaEm Confiança

U1 U5 3

U1 U6 1

U2 U4 0

U2 U7 3

U6 U9 3

U7 U3 2

3 2

2 3

? 2

U1

U5

U6

U9

Page 49: Sistemas de recomendação

REDE DE CONFIANÇAACTIVUFRJ Subjetiva Contextualizada Assimétrica

Page 50: Sistemas de recomendação

RECOMENDAÇÕESACTIVUFRJ

Recomendações pela união da Filtragem Colaborativa com a Rede de Confiança

Persistente com ajustes Push

Page 51: Sistemas de recomendação

SISTEMAS DE RECOMENDAÇÃOTENDÊNCIAS

Page 52: Sistemas de recomendação

SISTEMAS DE RECOMENDAÇÃOTENDÊNCIAS Musicovery: http://www.musicovery.com/

Page 53: Sistemas de recomendação

SISTEMAS DE RECOMENDAÇÃOTENDÊNCIAS

LivePlasma: www.liveplasma.com – recomendações através da similaridade entre os filmes favoritos dos usuários da comunidade

Page 54: Sistemas de recomendação

SISTEMAS DE RECOMENDAÇÃOTENDÊNCIAS

Last.fm – recomendação de músicas pela combinação social dos membros da comunidade (tags, amigos, mais ouvidos, artistas parecidos)

Page 55: Sistemas de recomendação

SISTEMAS DE RECOMENDAÇÃOTENDÊNCIAS

Google maps http://maps.google.com

Page 56: Sistemas de recomendação

SISTEMAS DE RECOMENDAÇÃOTENDÊNCIAS

Outros sistemas sociais de recomendação

Page 57: Sistemas de recomendação

VÍDEO

http://www.youtube.com/watch?v=xj8ZadKgdC0

Page 58: Sistemas de recomendação

TÉCNICAS PARA IMPLEMENTAR A FCA Correlação de pearson Redes Bayesianas Modelos de Agrupamento (clustering): K-

means, C-means (lógica fuzzy) Similaridades de Vetores

BREESE, J. S., HECKERMAN, D., KADIE, C. Empirical Analysis of Predictive Algorithms for Collaborative Filtering. Technical Report, 1998.

Referência sugerida

Page 59: Sistemas de recomendação

TÉCNICAS PARA IMPLEMENTAR A FCA Novas técnicas para implementar a FCA

incluem a aplicação de medidas de reputação e confiança como peso para os vizinhos mais próximos.

Objetivo: gerar predições de recomendação mais confiáveis.

O'DONOVAN, J.; SMYTH, B. Trust in Recommender Systems. Proceedings of the 10th International Conference on Intelligent User Interfaces - IUI’05. p. 167-174, January 9–12, 2005. San Diego, California, USA.

Referência sugerida