Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

15
Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa

description

Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE. Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa. Roteiro. Introdução Objetivo Motivação Coleção de Documentos Aplicação Trabalhos Futuros. Introdução. - PowerPoint PPT Presentation

Transcript of Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Page 1: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Bruno Florencio Pinheiro

Orientador: Renato Fernandes Corrêa

Page 2: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Introdução Objetivo Motivação Coleção de Documentos Aplicação Trabalhos Futuros

Page 3: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Sistemas de Recuperação da Informação (SRI) são aplicações com o objetivo de satisfazer a necessidade de informação do usuário através de consultas.

Mapas de documentos são redes neurais artificiais do tipo Mapas Auto-organizáveis treinados com vetores documentos.

Page 4: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Agregar um mapa de documento ao SRI com o intuito de auxiliar o usuário em suas buscas.

Disponibilizar a consulta tanto através de palavras-chaves, como através da navegação pelo mapa.

Page 5: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Crescente número de documentos (teses e dissertações) em meio digital.

Tornar universal o acesso a esses documentos.

Dificuldade do usuário em expressar a sua necessidade da informação através de palavras-chaves.

Page 6: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Biblioteca Digital de Teses e Dissertações da UFPE (BDTD-UFPE) Acervo do material produzido nos programas

de pós-graduação da universidade. Cerca de 6 mil documentos. Vinculada a BDTD nacional e ao NDLTD

(Networked Digital Library of Theses and Dissertations)

Page 7: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Arquitetura

Page 8: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Aquisição dos documentos

Através do protocolo OAI-PMH

Colheita de arquivos XMLs contendo metadados dos documentos

Extração dos dados através da biblioteca JColtrane

Page 9: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Indexação Uso da biblioteca em Java, Lucene.

Operações de Stemming, eliminação de pontuação, dígitos e stopwords.

Geração do índice invertido através do modelo espaço vetorial.

Page 10: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Construção do Mapa Representação dos documentos como vetores

compondo uma matriz esparsa.

Treinamento do mapa auto-organizável com essa matriz.

Rotinas de treinamento realizadas em MATLAB, resultado do trabalho de (CORRÊA, 2008).

Page 11: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Construção da Interface Terminado o treinamento, rotula-se os

neurônios com as palavras-chaves mais significativas.

Geração de uma imagem representando o mapa no formato 10 x 12

Relação das áreas da imagem com a lista de documentos pertencentes a mesma.

Page 12: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE
Page 13: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Comparar e analisar o desempenho de variantes do SOM, além de outros modelos aplicados ao sistema.

Page 14: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

CARDOSO JUNIOR, M. J. M. Clio-i: Interoperabilidade entre repositórios digitais utilizando o protocolo OAI-PMH. 2007. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife.

JCOLTRANE. Portal de informações e tutoriais da ferramenta JColtrane. Disponível em: <http://jcoltrane.sourceforge.net/>

WIKI LUCENE. Enciclopédia digital da ferramenta Lucene. Disponível em:<http://wiki.apache.org/jakarta-lucene/>.

CORRÊA, R. F. Sistemas Baseados em Mapas Auto-organizáveis para Organização Automática de Documentos Texto. Tese de Doutorado. Centro de Informática da UFPE, Recife, 2008.

Page 15: Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

À FACEPE pelo fomento através da bolsa PIBIC e o apoio financeiro ao projeto “Mapeador de Teses e Dissertações da UFPE (MTD-UFPE)”.

À atenção de todos.

OBRIGADO!