Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Post on 22-Apr-2015

109 views 0 download

Transcript of Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Matching de Esquemas: 10 anos depois

Nicolle Chaves Cysneiros

Roteiro1. O Matching de Esquemas

i. Definição

ii. Aplicações

2. Principais técnicas de Matching

3. Novas técnicas desenvolvidas

4. Ferramentasi. COMA++

ii. SemMatcher: um Matcher Semântico

5. Tendências Futuras

O Matching de Esquemas

É uma operação de manipulação de esquemas, onde dois esquemas S1 e S2

são passados como parâmetro, e o mapeamento entre os elementos dos dois

esquemas é gerado.

Aplicações

Integração de Esquemas

Data Warehouse

E-commerceProcessamento de Consultas

Principais Técnicas de Matching

Tipo de Informações – Baseados em Esquema

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

Principais Técnicas de Matching

Granularidade – Nível Elementos

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• Nível atômico:

Livro.titulo ≅ Obra.nome_livro

• Níveis maiores:

Livro ≅ Obra

Principais Técnicas de Matching

Granularidade – Nível Estrutura

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• Matching Parcial:

Livro ≅ Obra

• Padrões de Equivalência:

Livro.editora ≅ Editora

Principais Técnicas de Matching

Cardinalidade

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• 1:1

Obra.nome_livro ≅ Livro.titulo

• n:1

Obra.valor, Obra.desconto ≅ Livro.valorFinal

• 1:n

Obra.nome_autor ≅ Autor.nome, Autor.sobrenome

• n:m

Obra.nome_autor, Obra.espec_autor ≅ Autor.nome, Autor.sobrenome,

Autor.especialidade

Principais Técnicas de Matching

Abordagem Linguística

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• Uso de dicionários

Obra.espec_autor ≅ Autor.especialidade

Principais Técnicas de Matching

Abordagem de Restrições

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• Chave Primária

Obra.no ≅ Livro.id

Principais Técnicas de Matching

Tipo de Informações – Baseado em Instâncias

Útil para o tratamento de dados semi-estruturados

Utilizado para consertar ambiguidades e erros de

interpretação

Faz uso de abordagens inteligentes, como:

Regras Lógicas

Redes Neurais

Aprendizagem de Máquina

Principais Técnicas de Matching

Combinação de Matchers

Matchers Híbridos

Matchers Compostos

Principais Técnicas de Matching

Novas TécnicasTipo de Informações

Matching de GrafosHistórico de Uso

Combinação de MatchersPruning do Espaço de BuscaMatching em Paralelo

Interação com UsuárioValidação InterativaColaboração entre Usuários

Novas TécnicasExtensão da Semântica

Adicionar uma “tag” à correspondência indicando:EquivalênciaAgregaçãoGeneralizaçãoEspecializaçãoProximidade

Ferramentas

COMA++

COMA++

SemMatcher

SemMatcher

SemMatcher

SemMatcher

SemMatcher

Tendências Futuras

Reutilização de Mapeamentos

Manter o reuso das expressões semânticas

Análise coletiva de esquemas conhecidos

Mais facilidade na interação do usuário

Combinação do matching de metadado e matching de instâncias

Referências Madhavan, J., & Bernstein, P. A. (2001). Generic Schema

Matching with Cupid.

Bernstein, P. a, Madhavan, J., & Rahm, E. (2011). Generic Schema Matching , Ten Years Later. Pvldb, 4(11), 695–701.

Rahm, E., & Bernstein, P. a. (2001). A survey of approaches to automatic schema matching. VLDB Journal, 10(4), 334–350.

Aumueller, D., Do, H. H., Massmann, S., & Rahm, E. (2005, June). Schema and ontology matching with COMA++. In Proceedings of the 2005 ACM SIGMOD international conference on Management of data (pp. 906-908). ACM.

Pereira, T. (2008). Mapeamento Semântico de Ontologias no SPEED. Recife.

Dúvidas?