Defesa de proposta de dissertacao UFCG

Post on 22-Jul-2015

117 views 3 download

Transcript of Defesa de proposta de dissertacao UFCG

Defesa de Proposta de

Dissertação Nailson Boaz Costa Leite

29/05/2014 Nailson Boaz Costa Leite (UFCG) 1

Banca examinadora: Leandro Balby Marinho (orientador)

Carlos Eduardo Batista (orientador)

Nazareno Andrade

Claudio Campelo

PPGCC/UFCG

Campina Grande – Maio, 2014

Explorando a Diversidade em Sistemas de

Recomendação baseados em Linked Open Data

Nailson Boaz Costa Leite

29/05/2014 Nailson Boaz Costa Leite (UFCG) 2

PPGCC/UFCG

Campina Grande – Maio, 2014

Sumário • Introdução

• Motivação

• Problema Abordado

• Proposta de Solução

• Objetivos

• Relevância

• Cronograma

• Referências

29/05/2014 Nailson Boaz Costa Leite (UFCG) 3

Introdução

Linked Data

• Difundir boas práticas para publicar e interligar

dados estruturados (RDF);

• Padronizar tecnologias e mecanismos que

facilitam o processamento, o compartilhamento,

a escalabilidade e o reuso de dados

29/05/2014 Nailson Boaz Costa Leite (UFCG) 4

Introdução

4 princípios do Linked Data:

• Use URIs para identificar os objetos

• Use URIs HTTP para acessar o objeto

• Cada objeto possui sua descrição

• As propriedades dos objetos podem ser referenciadas

por URIs.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 5

Exemplo RDF/XML

<rdf:RDF>

<rdf:Description rdf:about="http://dbpedia.org/resource/The_Lord_of_the_Rings">

<rdfs:label xml:lang="ja">指輪物語</rdfs:label>

<rdfs:label xml:lang="en">The Lord of the Rings</rdfs:label>

...

<dcterms:subject rdf:resource="http://.../Category:Sequel_novels" />

<dcterms:subject rdf:resource="http://...Category:High_fantasy_novels" /

...

<owl:sameAs rdf:resource="http://rdf.freebase.com/ns/m.07bz5" />

<dbpprop:author rdf:resource="http://dbpedia.org/resource/J._R._R._Tolkien" />

<dbpprop:books rdf:resource="http://.../The_Return_of_the_King" />

<dbpprop:books rdf:resource="http://.../The_Two_Towers" />

<dbpprop:books rdf:resource="http://.../The_Fellowship_of_the_Ring" />

...

</rdf:Description>

</rdf:RDF>

29/05/2014 Nailson Boaz Costa Leite (UFCG) 6

Introdução

29/05/2014 Nailson Boaz Costa Leite (UFCG) 7

(Noia, T. 2012)

Introdução

Linked Open Data

(LOD)

29/05/2014 Nailson Boaz Costa Leite (UFCG) 8

Introdução

Linked Open Data Cloud

29/05/2014 Nailson Boaz Costa Leite (UFCG) 9

(Cyganiak, A., 2011)

Introdução

Sistemas de Recomendação baseados

em LOD

Diversos trabalhos científicos tem utilizado a

estrutura e o conteúdo disponível nas bases de

dados de LOD para realizar recomendações.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 10

Introdução

As bases de dados de LOD oferecem aos SR:

• Descrições para diversos tipos de domínios;

• Taxonomia entre os objetos;

• Cruzamento entre várias bases de dados LOD;

• Facilidade na coleta dos dados;

• Facilita a exploração dos objetos e suas relações;

• Adiciona semântica aos dados.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 11

Motivação

“O real valor de uma recomendação está em

sugerir objetos que os usuários não descobririam

por si mesmos” (Herlocker, 2004)

• Recomendações óbvias

• Recomendações redundantes

• Recomendações populares

29/05/2014 Nailson Boaz Costa Leite (UFCG) 12

Motivação

29/05/2014 Nailson Boaz Costa Leite (UFCG) 13

(Sandoval, S., 2012)

Motivação

Novas dimensões para avaliação de SR:

• Novidade

• Diversidade

• Seredipidade

29/05/2014 Nailson Boaz Costa Leite (UFCG) 14

Motivação

Diversidade em SR:

A diversidade de uma lista de itens

recomendados refere-se ao quão diferente

cada item é dos demais, de acordo com uma

ou mais propriedades.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 15

Diversidade e acurácia

29/05/2014 Nailson Boaz Costa Leite (UFCG) 16

(Ziegler, 2005)

Problema de Negócio

Os usuários estão recebendo muitas

recomendações óbvias e redundantes em

relação ao que já foi visto anteriormente.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 17

Problema Técnico

Gerar listas ranqueadas de recomendações

que apresentem diversidade e relevância

entre os seus itens.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 18

Proposta de Solução

Utilizar as informações semânticas, as

propriedades e a taxonomia das bases de

dados LOD para solucionar o trade-off entre

diversidade e acurácia.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 19

Proposta de Solução

• Topic Diversification (Ziegler, 2005)

Algoritmo “guloso” de re-rankeamento que

computa a similaridade entre os itens através de

sua taxonomia e controla o fator diversidade com

uma variável ΘF.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 20

Proposta de Solução

29/05/2014 Nailson Boaz Costa Leite (UFCG) 21

(Ziegler, 2005)

Proposta de Solução

• Topic Diversification

29/05/2014 Nailson Boaz Costa Leite (UFCG) 22

(Sandoval, S., 2012)

Proposta de Solução

Podemos utilizar as complexas taxonomias entre

as propriedades dos objetos para reordenar as

listas de recomendações através do topic

diversification e tentar inferir o valor de ΘF.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 23

Objetivos Gerais

Desenvolvimento e avaliação de um SR que utiliza

as bases de dados de LOD para realizar

recomendações diversas e acuradas.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 24

Objetivos Específicos

1. Analisar o conjunto de dados semânticos de LOD em

contextos de recomendação (livros, filmes, músicas).

2. Desenvolver um modelo de SR que utilize métodos que

exploram o conteúdo extraído das bases de LOD

3. Realizar um estudo comparativo entre a diversidade e

acurácia dos modelos propostos

29/05/2014 Nailson Boaz Costa Leite (UFCG) 25

Relevância

(Ziegler, 2005) - Intra-List, Topic diversification

(Vargas, S., 2011) - Diversity and Novelty metrics

(Noia, T., 2012) - LOD to suport content based RS

(Ostuni, V., 2013) – Top-N recommendation leveraging

LOD

29/05/2014 Nailson Boaz Costa Leite (UFCG) 26

Relevância

ESWC 2014 Challenge:

Task 3: Diversity

A tarefa 3 do ESWC foi o desenvolvimento de um SR

baseado em conteúdo que leve em consideração a

acurácia (F-measure) e a diversidade (intra-list) das

recomendações utilizando o conteúdo disponível nas

bases de dados de LOD. .

29/05/2014 Nailson Boaz Costa Leite (UFCG) 27

Metodologia

• Revisão Sistemática

o Algoritmos e Métricas de Diversidade

• Estudo das Bases de LOD

• Desenvolvimento de SR baseado em LOD

• Escrita de Artigos

29/05/2014 Nailson Boaz Costa Leite (UFCG) 28

Cronograma

Meses

Fase 06/14 07/14 08/14 09/14 10/14 11/14 12/14 01/15 02/15 03/15 04/15

1 X X X

2 X X X

3 X

4 X X X

5 X X

6 X X X X X X X

29/05/2014 Nailson Boaz Costa Leite (UFCG) 29

Obrigado

29/05/2014 Nailson Boaz Costa Leite (UFCG) 30

Referências

(Noia, T. 2012) Tommaso Di Noia, Roberto Mirizzi, Vito Claudio Ostuni, and Davide Romito. Exploiting the web of data in model-based recommender systems.In Proceedings of the sixth ACM conference on Recommender systems, pages 253–256. ACM, 2012.

(Sandoval, S., 2012) Novelty and Diversity Enhancement and Evaluation in Recommender Systems.

(Ziegler, 2005) Cai-Nicolas Ziegler, Sean M McNee, Joseph A Konstan, and Georg Lausen. Improving recommendation lists through topic diversification. In Proceedings of the 14th international conference on World Wide Web, pages 22–32. ACM, 2005.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 31

Referências

(Vargas, S., 2011) Saúl Vargas and Pablo Castells. Rank and

relevance in novelty and diversity metrics for recommender

systems. In Proceedings of the fifth ACM conference on

Recommender systems, pages 109–116. ACM, 2011.

(Cyganiak, A., 2011) Anja Jentzsch Richard Cyganiak. Linking

open data cloud diagram, 2011.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 32

Defesa da Proposta de

Dissertação de Mestrado

Nailson Boaz Costa Leite

29/05/2014 Nailson Boaz Costa Leite (UFCG) 33

Banca examinadora: Leandro Balby Marinho (orientador)

Carlos Eduardo Batista (orientador)

Nazareno Andrade

Claudio Campelo