Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

26
Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros

Transcript of Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Page 1: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Matching de Esquemas: 10 anos depois

Nicolle Chaves Cysneiros

Page 2: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Roteiro1. O Matching de Esquemas

i. Definição

ii. Aplicações

2. Principais técnicas de Matching

3. Novas técnicas desenvolvidas

4. Ferramentasi. COMA++

ii. SemMatcher: um Matcher Semântico

5. Tendências Futuras

Page 3: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

O Matching de Esquemas

É uma operação de manipulação de esquemas, onde dois esquemas S1 e S2

são passados como parâmetro, e o mapeamento entre os elementos dos dois

esquemas é gerado.

Page 4: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Aplicações

Integração de Esquemas

Data Warehouse

E-commerceProcessamento de Consultas

Page 5: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Principais Técnicas de Matching

Tipo de Informações – Baseados em Esquema

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

Page 6: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Principais Técnicas de Matching

Granularidade – Nível Elementos

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• Nível atômico:

Livro.titulo ≅ Obra.nome_livro

• Níveis maiores:

Livro ≅ Obra

Page 7: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Principais Técnicas de Matching

Granularidade – Nível Estrutura

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• Matching Parcial:

Livro ≅ Obra

• Padrões de Equivalência:

Livro.editora ≅ Editora

Page 8: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Principais Técnicas de Matching

Cardinalidade

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• 1:1

Obra.nome_livro ≅ Livro.titulo

• n:1

Obra.valor, Obra.desconto ≅ Livro.valorFinal

• 1:n

Obra.nome_autor ≅ Autor.nome, Autor.sobrenome

• n:m

Obra.nome_autor, Obra.espec_autor ≅ Autor.nome, Autor.sobrenome,

Autor.especialidade

Page 9: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Principais Técnicas de Matching

Abordagem Linguística

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• Uso de dicionários

Obra.espec_autor ≅ Autor.especialidade

Page 10: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Principais Técnicas de Matching

Abordagem de Restrições

Livro

id primaryKey

titulo varchar

editora varchar

valorFinal double

idAutor foreignKey

Autor

id primaryKey

nome varchar

sobrenome varchar

especialidade

varchar

Obra

no primaryKey

nome_livro varchar

nome_autor

varchar

espec_autor

varchar

valor double

desconto double

no_editora foreignKeyEditora

no primaryKey

nome varchar

• Chave Primária

Obra.no ≅ Livro.id

Page 11: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Principais Técnicas de Matching

Tipo de Informações – Baseado em Instâncias

Útil para o tratamento de dados semi-estruturados

Utilizado para consertar ambiguidades e erros de

interpretação

Faz uso de abordagens inteligentes, como:

Regras Lógicas

Redes Neurais

Aprendizagem de Máquina

Page 12: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Principais Técnicas de Matching

Combinação de Matchers

Matchers Híbridos

Matchers Compostos

Page 13: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Principais Técnicas de Matching

Page 14: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Novas TécnicasTipo de Informações

Matching de GrafosHistórico de Uso

Combinação de MatchersPruning do Espaço de BuscaMatching em Paralelo

Interação com UsuárioValidação InterativaColaboração entre Usuários

Page 15: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Novas TécnicasExtensão da Semântica

Adicionar uma “tag” à correspondência indicando:EquivalênciaAgregaçãoGeneralizaçãoEspecializaçãoProximidade

Page 16: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Ferramentas

Page 17: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

COMA++

Page 18: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

COMA++

Page 19: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

SemMatcher

Page 20: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

SemMatcher

Page 21: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

SemMatcher

Page 22: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

SemMatcher

Page 23: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

SemMatcher

Page 24: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Tendências Futuras

Reutilização de Mapeamentos

Manter o reuso das expressões semânticas

Análise coletiva de esquemas conhecidos

Mais facilidade na interação do usuário

Combinação do matching de metadado e matching de instâncias

Page 25: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Referências Madhavan, J., & Bernstein, P. A. (2001). Generic Schema

Matching with Cupid.

Bernstein, P. a, Madhavan, J., & Rahm, E. (2011). Generic Schema Matching , Ten Years Later. Pvldb, 4(11), 695–701.

Rahm, E., & Bernstein, P. a. (2001). A survey of approaches to automatic schema matching. VLDB Journal, 10(4), 334–350.

Aumueller, D., Do, H. H., Massmann, S., & Rahm, E. (2005, June). Schema and ontology matching with COMA++. In Proceedings of the 2005 ACM SIGMOD international conference on Management of data (pp. 906-908). ACM.

Pereira, T. (2008). Mapeamento Semântico de Ontologias no SPEED. Recife.

Page 26: Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.

Dúvidas?