Sistemas de Recomendação

Post on 15-Jun-2015

4.700 views 0 download

description

Apresenção sobre sistemas de recomendação: Filtragem Colaborativa e Baseada em Conteúdo

Transcript of Sistemas de Recomendação

Sistemas de RecomendaçãoFiltragem Colaborativa e

Baseada em Conteúdo

Fabiana LorenziUniversidade Luterana do Brasil

Baseada em conhecimento Banco de dados

de produtosConhecimento do

domínio

Baseada em conteúdo

Perfis de outrosusuários

Perfil do usuário

Filtragem colaborativa

Dados demográficosdos outros

Dados demográficosatuais do usuário

Conhecimentodemográfico

Filtragem de informação

• Quase todo sistema de recomendação vê a filtragem de informações ou seleção de um produto como um problema de classificação.

– F(usuário, produto) ! {gosta, não gosta}

Não gosta

)F( Usuário Conteúdo,Gosta

Filtragem Colaborativa

• Utiliza informações de outras pessoas

• Trabalha com a idéia de que se o os interesses do usuário x são similares aos interesses do usuário y, os itens preferidos pelo usuário y podem ser recomendados ao usuário x.

Filtragem Colaborativa

• Avaliação de similaridade entre pessoas– Pelo histórico (itens associados)

correlação item-a-item

– Pelo perfil (características ou atributos)correlação usuário-a-usuário

Filtragem Colaborativa

• correlação item-a-item (pessoas que compraram isto também compraram …)

• correlação usuário-a- usuário (usuários como você também compraram …)

FC: item-a-item

• Calcula-se a similaridade entre usuários.• Para cada usuário encontra-se um conjunto

de usuários “mais próximos” (maior correlação entre as avaliações passadas).

• Escores para os itens não vistos são definidos com base na combinação de escores conhecidos dos vizinhos mais próximos.

Filtragem Colaborativa

distância 5 6 6 5 4 8

Não gosta

Gosta

Não conhece

Usuário Usuários anteriores

Itens

Histórico das interações

Amazon (item-a-item)Para cada item comprado e avaliado pelo usuáriotenta encontrar itens similares e recomendá-los aousuário.

Algoritmo -Para cada item do catálogo, I1Para cada cliente C que comprou I1

Para cada item I2 comprado pelo cliente CRegistra que o cliente C comprou I1 e I2

Para cada item I2Calcula a similaridade entre I1 e I2

FC: usuário-a-usuário

• recomendar objetos relacionados a pessoas com características semelhantes ao usuário (atributos, preferências, hábitos ou comportamento).

Exemplos - Grupolens

– Sistema que auxilia pessoas a encontrar artigos que irão gostar, dentro de uma grande quantidade de artigos disponíveis.

– Relaciona as avaliações para determinar quais usuários avaliam mais semelhantemente (vizinhanças);

– Prediz quanto os usuários vão gostar de artigos novos, baseados nas avaliações dos usuários similares.

Exemplos - Ringo

• Sistema que recomenda músicas ao usuário;• O usuário avalia artistas e o conjunto destas

avaliações gera o perfil de cada usuário;• Para recomendar, o perfil do usuário é comparado aos

demais perfis dos outros usuários. O sistema prediz o quanto o usuário tende a gostar de um item/artista que ainda não tenha sido avaliado (através da média ponderada de todas avaliações dadas àquele álbum por outros usuários com perfil semelhante).

Problemas

• Problema cold start (primeiro usuário) que ocorre no inicio do sistema (sem avaliação de outros usuários).

• Se um usuário possui gostos bastante raros, a recomendação pode ser fraca, pois não existe “vizinhos próximos”. Esse problema é chamado de gray sheep(ovelha negra).

Problemas

• Problema de early-rater, quando surge um novo item, não há como ele ser recomendado a um usuário até que alguém o avalie.

• Avaliações esparsas: quando se tem poucos usuários para muitos itens as avaliações tornam-se esparsas e fica difícil de encontrar usuários similares.

Baseada em Conteúdo

• Recomendar objetos classificados no perfil do usuário

• Recomendar objetos similares aos objetos que o usuário já comprou.

Baseada em ConteúdoUso de taxonomias (classificação ou ontologia)

XClasse Classe

Identificar a classe

• Pelo perfil: características da pessoa• Pelo histórico: itens associados• Pelos atributos

• As classes devem ser compatíveis.

Baseada em conteúdo

• Exemplos:– filmes do mesmo gênero que o assistido– outros CD’s dos artistas já adquiridos– produtos complementares aos adquiridos (DVD

player " home theater)

Exemplos - InfoFinder

• O sistema aprende sobre os interesses do usuário a partir de um conjunto de mensagens ou documentos.

• Um string de consulta para cada categoria de interesse do usuário.

• Modelo do usuário = árvore de decisão.

Exemplos - Referral web

• Sistema interativo que encontra redes de pessoas envolvidas em tarefas profissionais.

• A partir do cadastro do usuário, o sistema procura por documentos com seu nome e recursivamente procura as outras citações nesses trabalhos, montando uma rede global de citações na forma de um grafo.

Usuário Saída Personalização Apresentação Modelo do usuário

InfoFinder Atributos e palavras

chave

Sugestão de documentos

Persistente Push Árvore de decisão

Referral web

Cadastro Sugestão de documentos

Persistente Pull Grafo de relações

Obs.: Aqui não temos entrada da comunidade.

Problemas

• super-especialização, pois só serão recomendados itens que o usuário avaliou no passado, não explorando novas categorias de itens.

• Falta de surpresa na recomendação (serendipity), produtos que não se relacionam com o perfil do usuário podem nunca ser recomendados.

Problemas

• O conteúdo de alguns tipos de dados ainda não pode ser analisado, como vídeo e som;

Técnicas Vantagens Desvantages

Filtragem Colaborativa A. Pode identificar nichos cross-gênero.B. Conhecimento de domínio não énecessário.C. Adaptativo: qualidade melhor com o tempo.D. Feedback implícito é suficiente.

I. Problema do novo usuário.J. Problema do novo item.K. Problema da ovelha negraL. Qualidade depende de um grande conjunto de dados histórico.M. Problema de estabilidade.

Baseada em Conteúdo B, C, D I, L, M

Baseada em Conhecimento E. Não tem problema de novo usuário e novo item.F. Sensível a mudanças de preferênciasG. Pode incluir características de H. Pode mapear produtos através das preferências do usuário.

N. Usuário deve inserir função de utilidade.O. Necessita de engenheiro de conhecimento (aquisição de conhecimento).

Sistemas Híbridos

• Combinam as duas técnicas (Filtragem Colaborativa e Baseada em Conteúdo) para resolver os problemas encontrados em cada uma delas.

FAB (http://fab.stanford.edu)

• Sistema que recomenda páginas web para usuários.

• O perfil do usuário é criado com base na análise do conteúdo dos documentos.

• Após utiliza-se a FC para descobrir os itens similares de acordo com o perfil do usuário (correlação usuário-a-usuário).

FAB

• O usuário recebe a recomendação de um item se esse item se encaixa no seu perfil ou se esse item se encaixa nos perfis de seus usuários mais similares.

Vantagens da abordagem híbrida

• Utilizando recomendações colaborativas, experiências de outros usuários são levadas em consideração;

• Utilizando recomendações baseadas em conteúdo, é possível lidar com itens não vistos por outros usuários;

• É possível recomendar bons itens a um usuário mesmo que não haja usuários semelhantes a ele.

Cuidados com a recomendação

• Solicitada ou espontânea ?• Interromper ou não ? quando (online ou

offline) ?• Recomendar tudo ou selecionar por limiar ?• Somente o que é novo ?• Explicações da escolha (trust)

Cuidados com a recomendação

• Informar origem ou recomendação anônima (reputation)

• Relevância temporal: sazonal, idade, crescimento

• Necessidades ou gostos ?• Evolução do perfil ou necessidade

– Ex: leitura de documentos ou livros básicos X avançados