Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML Tese de Doutorado por Ronaldo...
-
Upload
maria-julia-barreiro-de-sequeira -
Category
Documents
-
view
217 -
download
0
Transcript of Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML Tese de Doutorado por Ronaldo...
Uma Abordagem Uma Abordagem Bottom-UpBottom-Up para a Integração Semântica para a Integração Semântica
de Esquemas XMLde Esquemas XML
Tese de Doutoradopor
Ronaldo dos Santos Mello
Prof. Carlos Alberto HeuserOrientador
UFRGS/II - PPGC
Roteiro• Introdução• Abordagem de Integração Proposta• Modelo Canônico e Mapeamentos• Etapa de Conversão da DTD• Etapa de Integração Semântica• Considerações Finais
Roteiro1. Introdução2. Abordagem de Integração Proposta3. Modelo Canônico e Mapeamentos4. Etapa de Conversão da DTD5. Etapa de Integração Semântica6. Considerações Finais
Motivação• Contexto do problema
– consultas a fontes de dados heterogêneas e semi-estruturadas na Web
– foco em dados XML• Áreas de pesquisa
– integração de esquemas– tradução e otimização de consultas globais– integração de resultados de consultas
Motivação• Contexto do problema
– consultas a fontes de dados heterogêneas e semi-estruturadas na Web
– foco em dados XML• Áreas de pesquisa
– integração de esquemas– tradução e otimização de consultas globais– integração de resultados de consultas
Objetivo da Tese• Uma abordagem de integração semântica
de esquemas XML – semi-automático
• mínima intervenção do usuário– processo bottom-up
• esquema global que representa de forma garantida todas as informações dos esquemas das fontes
– modelo canônico conceitual• alto nível de abstração
Trabalhos RelacionadosTrabalho Integração Processo Modelo Canônico
TSIMMIS manual bottom-up grafoGarlic manual bottom-up ODMGMIX manual bottom-up DTDDIXSE manual bottom-up conceitualJensen manual bottom-up UMLYAT manual - árvoreMcBrien manual - grafoVdovjak manual top-down conceitualXyleme semi-automático top-down DTDLSD semi-automático top-down DTDLim semi-automático bottom-up grafoCUPID semi-automático bottom-up conceitualMOMIS semi-automático bottom-up conceitual
Trabalhos RelacionadosTrabalho Integração Processo Modelo Canônico
TSIMMIS manual bottom-up grafoGarlic manual bottom-up ODMGMIX manual bottom-up DTDDIXSE manual bottom-up conceitualJensen manual bottom-up UMLYAT manual - árvoreMcBrien manual - grafoVdovjak manual top-down conceitualXyleme semi-automático top-down DTDLSD semi-automático top-down DTDLim semi-automático bottom-up grafoCUPID semi-automático bottom-up conceitualMOMIS semi-automático bottom-up conceitual
Características
• não tratam a integração de representações alternativas de elementos• não tratam de forma completa a integração de elementos textuais com estruturados
Limitações na integração de esquemas XML
MOMIS
CUPID
Trabalho
CaracterísticasTrabalho Limitações da Modelagem Conceitual
CUPID • não modela representações alternativas de elementos• não filtra elementos irrelevantes para o domínio
MOMIS • esquema conceitual definido manualmente
Vdokjak • esquema conceitual definido manualmente
DIXSE • não modela relacionamentos de herança• não filtra elementos irrelevantes para o domínio
Proposta da Tese• Processo de integração semântica de
esquemas XML– tratamento dos casos de unificação de
elementos heterogêneos– modelagem canônica conceitual de um
esquema XML• análise do esquema XML• inferências semânticas (heurísticas)
• análise de documentos XML
Roteiro1. Introdução2. Abordagem de Integração Proposta3. Modelo Canônico e Mapeamentos4. Etapa de Conversão da DTD5. Etapa de Integração Semântica6. Considerações Finais
Arquitetura de Mediação
Sites Web Documentos
XML
Sites Web
Camada de Wrappers
Wrapper 1 Wrapper nDTD 1
DTD n
Sites Web
...
Documentos XML
Sites Web
• disponibiliza um esquema local para uma ou mais fontes• executa consultas nestas fontes
Mediador
Wrapper 1 Wrapper nDTD 1
DTD n
Consulta local textual
Usuário Especialista
Mediador
DTDs Documentos XML Locais
Sites Web
...
Documentos XML
Sites Web
EsquemaGlobal
• integra esquemas locais• gerencia consultas globais a um conjunto de fontes
Documento XML globalConsulta global textual
Interface de Consulta
Wrapper 1 Wrapper nDTD 1
DTD n
Consultas locais textuais
Documento XML global
EsquemaGlobal
Usuário Especialista
Mediador
Interface de Consulta
DTDs
Consulta global Resultados
Documentos XML Locais
Sites Web
Consulta global textual
...
Documentos XML
Sites Web
• define consultas sobre o esquema global• apresenta os resultados
Processo de Integração
DTD 1DTD n
Esquema Global
Usuário Especialista
Integração Semântica
Camada de Mediação
. . .Esquema Conceitual 1 Esquema Conceitual n
. . .
Conversão da DTD
ARTEMIS
Documentos XML
Documentos XML
Conversão da DTD. . .
Processo de Integração
DTD 1DTD n
Esquema Global
Usuário Especialista
Integração Semântica
Camada de Mediação
. . .Esquema Conceitual 1 Esquema Conceitual n
. . .
Conversão da DTD
ARTEMIS
Documentos XML
Documentos XML
Conversão da DTD. . .
Processo de Integração
DTD 1DTD n
Esquema Global
Usuário Especialista
Integração SemânticaCamada de Mediação
. . .Esquema Conceitual 1 Esquema Conceitual n
. . .
Conversão da DTD
ARTEMIS
Documentos XML
Documentos XML
Conversão da DTD. . .
Roteiro1. Introdução2. Abordagem de Integração Proposta3. Modelo Canônico e Mapeamentos4. Etapa de Conversão da DTD5. Etapa de Integração Semântica6. Considerações Finais
Roteiro1. Introdução2. Abordagem de Integração Proposta3. Modelo Canônico e Mapeamentos
3.1 Modelo Conceitual Canônico (MCC)3.2 Mapeamento MCC-DTD
4. Etapa de Conversão da DTD5. Etapa de Integração Semântica6. Considerações Finais
Modelo Conceitual Canônico (MCC)
• Variante do ORM (Object with Roles Model)
Halphin, T. Object-Role Modeling (ORM/NIAM), Handbook on Architectures of Information Systems. Springer-Verlag, 1998.
– notação gráfica do modelo ER
Exemplo de Esquema MCC
Publication
Proceedings
Title
Business
University
AddressConference
Publisher
Book(1,N)
(1,N)
homeAddress(0,1)
(1,N)
(1,N)
(1,1)
(1,N)
(1,N)
(1,N)
(1,N)
(1,N)
(1,1)(1,1)
(1,N)
(1,1)
(1,1)
{technical, fiction}
Category
Author
Name(1,1)
(1,N)
workAddress(1,1)
(1,N)
StreetCity
(1,N)(1,N)(1,1) (1,1)
Number
(1,N)(1,1)
string
string
string
string
string
string
string
integer
string integer
Exemplo de Esquema MCC
Publication
Proceedings
Title
Business
University
AddressConference
Publisher
Book(1,N)
homeAddress(0,1)
(1,N)
(1,N)
(1,1)
(1,N)
(1,N)
(1,N)
(1,N)
(1,N)
(1,1)(1,1)
(1,N)
(1,1)
(1,1)
{technical, fiction}
Category
Author
Name(1,1)
(1,N)
workAddress(1,1)
(1,N)
StreetCity
(1,N)(1,N)(1,1) (1,1)
Number
(1,N)(1,1)
string
string
string
string
string
string
string
integer
string integer
conceito NL
(1,N)
Exemplo de Esquema MCC
Publication
Proceedings
Title
Business
University
AddressConference
Publisher
Book(1,N)
homeAddress(0,1)
(1,N)
(1,N)
(1,1)
(1,N)
(1,N)
(1,N)
(1,N)
(1,N)
(1,1)(1,1)
(1,N)
(1,1)
(1,1)
{technical, fiction}
Category
Author
Name(1,1)
(1,N)
workAddress(1,1)
(1,N)
StreetCity
(1,N)(1,N)(1,1) (1,1)
Number
(1,N)(1,1)
string
string
stringstring
string
string
string
integer
string integer
conceito L
(1,N)
Exemplo de Esquema MCC
Publication
Proceedings
Title
Business
University
AddressConference
Publisher
Book(1,N)
homeAddress(0,1)
(1,N)
(1,N)
(1,1)
(1,N)
(1,N)
(1,N)
(1,N)
(1,N)
(1,1)(1,1)
(1,N)
(1,1)
(1,1)
{technical, fiction}
Category
Author
Name(1,1)
(1,N)
workAddress(1,1)
(1,N)
StreetCity
(1,N)(1,N)(1,1) (1,1)
Number
(1,N)(1,1)
string
string
string
string
string
string
string
integer
string integer
relacionamento de associação
(1,N)
Exemplo de Esquema MCC
Publication
Proceedings
Title
Business
University
AddressConference
Publisher
Book(1,N)
homeAddress(0,1)
(1,N)
(1,N)
(1,1)
(1,N)
(1,N)
(1,N)
(1,N)
(1,N)
(1,1)(1,1)
(1,N)
(1,1)
(1,1)
{technical, fiction}
Category
Author
Name(1,1)
(1,N)
workAddress(1,1)
(1,N)
StreetCity
(1,N)(1,N)(1,1) (1,1)
Number
(1,N)(1,1)
string
string
string
string
string
string
string
integer
string integer
relacionamento de herança
(1,N)
Exemplo de Esquema MCCdisjunção
Publication
Proceedings
Title
Business
University
AddressConference
Publisher
Book(1,N)
homeAddress(0,1)
(1,N)
(1,N)
(1,1)
(1,N)
(1,N)
(1,N)
(1,N)
(1,N)
(1,1)(1,1)
(1,N)
(1,1)
(1,1)
{technical, fiction}
Category
Author
Name(1,1)
(1,N)
workAddress(1,1)
(1,N)
StreetCity
(1,N)(1,N)(1,1) (1,1)
Number
(1,N)(1,1)
string
string
string
string
string
string
string
integer
string integer
(1,N)
Roteiro1. Introdução2. Abordagem de Integração Proposta3. Modelo Canônico e Mapeamentos
3.1 Modelo Conceitual Canônico (MCC)3.2 Mapeamento MCC-DTD
4. Etapa de Conversão da DTD5. Etapa de Integração Semântica6. Considerações Finais
Mapeamento MCC - DTD• Informação de mapeamento
– correspondência entre o esquema global e os esquemas locais
– finalidade: tradução de consultas globais
• Abordagens para definição de mapeamentos– catálogos de mapeamento– visões
Mapeamento MCC - DTD• Informação de mapeamento
– correspondência entre o esquema global e os esquemas locais
– finalidade: tradução de consultas globais
• Abordagens para definição de mapeamentos– catálogos de mapeamento– visões
Mapeamento MCC - DTD• Estratégia de mapeamento
– expressões de caminho XPath associadas a conceitos e relacionamentos do esquema global
– por quê XPath?• XPath é um padrão para consulta a dados XML• visão XPath: expressão direta de busca para um
elemento ou atributo em uma fonte XML
Mapeamento de Conceitos• Expressão de caminho absoluto XPath
Book(1,N)
Author
(1,N)
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
Mapeamento de Conceitos• Expressão de caminho absoluto XPath
Book(1,N)
Author
(1,N)
DTD X : /Book/
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
Mapeamento de Conceitos• Expressão de caminho absoluto XPath
Book(1,N)
Author
(1,N)
DTD X : /Book/AuthorList
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
Mapeamento de Conceitos• Expressão de caminho absoluto XPath
Book(1,N)
Author
(1,N)
DTD X : /Book/AuthorList/Author
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
Mapeamento de Relacionamentos
• Expressão de caminho relativo XPath
Book(1,N)
Author
(1,N)
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
Mapeamento de Relacionamentos
• Expressão de caminho relativo XPath
Book(1,N)
Author
(1,N)
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
DTD X:
BookAuthor:
Mapeamento de Relacionamentos
• Expressão de caminho relativo XPath
Book(1,N)
Author
(1,N)
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
DTD X:
BookAuthor: AuthorList
Mapeamento de Relacionamentos
• Expressão de caminho relativo XPath
Book(1,N)
Author
(1,N)
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
DTD X:
BookAuthor: AuthorList/Author
Mapeamento de Relacionamentos
• Expressão de caminho relativo XPath
Book(1,N)
Author
(1,N)
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
DTD X:
Author Book:
Mapeamento de Relacionamentos
• Expressão de caminho relativo XPath
Book(1,N)
Author
(1,N)
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
DTD X:
Author Book: ..
Mapeamento de Relacionamentos
• Expressão de caminho relativo XPath
Book(1,N)
Author
(1,N)
DTD X<!ELEMENT Book (AuthorList, ...)><!ELEMENT AuthorList (Author+)><!ELEMENT Author (...)>
DTD X:
Author Book: ../..
Roteiro1. Introdução2. Abordagem de Integração Proposta3. Modelo Canônico e Mapeamentos4. Etapa de Conversão da DTD5. Etapa de Integração Semântica6. Considerações Finais
Etapa de Conversão da DTD• Contribuição principal da abordagem
– diferencial em relação a outros trabalhos• define um esquema semântico para uma DTD • resulta de uma análise detalhada do esquema +
dados de documentos XML + inferências semânticas
– modelagem canônica +adequada ao domínio
esquema global +preciso
Processo de Conversão
Documentos XML
Usuário Especialista
Pré-Processamento
DTD
DTDPré-Processada
Conversão
Esquema Conceitual Preliminar
Reestruturação
Esquema Conceitual
Definitivo
Fonte XML
Processo de Conversão
Documentos XML
Usuário Especialista
Pré-Processamento
DTD
DTDPré-Processada
Conversão
Esquema Conceitual Preliminar
Reestruturação
Esquema Conceitual
Definitivo
Fonte XML
modifica detalhes de estruturação da DTD:• remoção de informação irrelevante para o domínio• tratamento de elementos com aninhamento• renomeação de informação
Remoção de Elementos
<!ELEMENT Book(AuthorList, Publisher)>
...
<!ELEMENT AuthorList(Author)+>
Remoção de Elementos
<!ELEMENT Book(AuthorList, Publisher)>
...
<!ELEMENT AuthorList(Author)+>
<!ELEMENT Book((Author)+, Publisher)>
Tratamento de Aninhamentos
<!ELEMENT Address((Street, Number)?, City)>
Tratamento de Aninhamentos
<!ELEMENT Address((Street, Number)?, City)>
<!ELEMENT Address(AddressGroup1?, City)>
<!ELEMENT AddressGroup1(Street, Number)>
Processo de Conversão
Documentos XML
Usuário Especialista
Pré-Processamento
DTD
DTDPré-Processada
Conversão
Esquema Conceitual Preliminar
Reestruturação
Esquema Conceitual
Definitivo
Fonte XML
gera os conceitos e relacionamentos de um esquema MCC com base:• nas definições de elementos e atributos da DTD• nos documentos XML
Regras de Conversão<!ELEMENT Publication (Year,...,Author+,...,Book?)>
Conversão de Elemento Composto<!ELEMENT Publication (Year,...,Author+,...,Book?)>
Publication
Conversão de Elemento Simples<!ELEMENT Publication (Year,...,Author+,...,Book?)><!ELEMENT Year (#PCDATA)>
Yearinteger
Publicationanálise de docs XML
default: string
Análise de Documentos XML• Análise de tipo de dado
...<Year>2002</Year> ...<Year>1999</Year>...<Year>1995</Year> ...
Tipo de dado de Year: integer
Conversão de Componentes<!ELEMENT Publication (Year,...,Author+,...,Book?)><!ELEMENT Year (#PCDATA)>
Yearinteger
Publication
(1,1)
(1,N)default: (1,N)
regras decardinalidade
Análise de Documentos XML• Análise de cardinalidade inversa
...<Publication Title = “XML”> ... <Year>2002</Year> ... </Publication>...<Publication Title = “XPath”> ... <Year>2002</Year> ...</Publication>...
CardinalidadeYearPublication: (1,N)
Conversão de Componentes<!ELEMENT Publication (Year,...,Author+,...,Book?)><!ELEMENT Year (#PCDATA)><!ELEMENT Author(..., University+ | Business)>
Yearinteger
Publication
(1,1)
(1,N)
Author
Universitystring
(1,N)(1,N)
Businessstring
(1,N)(1,1)
Heurística de Herança<!ELEMENT Publication (Year,...,Author+,...,Book?)><!ELEMENT Year (#PCDATA)><!ELEMENT Author(..., University+ | Business)>
Yearinteger
Publication
(1,1)
(1,N)
Author
Universitystring
(1,N)(1,N)
Businessstring
(1,N)(1,1)
Book
consulta à Thesaurus (Wordnet)
<Publication BT Book>
Conversão de Atributos<!ELEMENT Publication (Year,...,Author+,...,Book?)><!ATTLIST Publication Title CDATA #REQUIRED><!ELEMENT Year (#PCDATA)><!ELEMENT Author(..., University+ | Business)>
Yearinteger
Publication
(1,1)
(1,N)
Author
Universitystring
(1,N)(1,N)
Businessstring
(1,N)(1,1)
Book
Titlestring
(1,1)(1,1)
Processo de Conversão
Documentos XML
Usuário Especialista
Pré-Processamento
DTD
DTDPré-Processada
Conversão
Esquema Conceitual Preliminar
Reestruturação
Esquema Conceitual
Definitivo
Fonte XML
realiza validações manuais e automáticas para uma melhor adequação do esquema ao domínio
Validações Manuais
Publication
Proceedings(1,1)(1,1)(1,1)(1,1)
Publication
Proceedings
Validações Automáticas
Publication
Proceedings Book
Title(1,1)(1,1)(1,N)(1,N)
(1,1)(1,1)(1,N)(1,N)
Title (1,1)(1,1)(1,N)(1,N)
Book
Proceedings
Publication
Processo de Conversão
Documentos XML
Usuário Especialista
Pré-Processamento
DTD
DTDPré-Processada
Conversão
Esquema Conceitual Preliminar
Reestruturação
Esquema Conceitual
Definitivo
Fonte XML
Roteiro1. Introdução2. Abordagem de Integração Proposta3. Modelo Canônico e Mapeamentos4. Etapa de Conversão da DTD5. Etapa de Integração Semântica6. Considerações Finais
Etapa de Integração Semântica• Baseada em regras e algoritmos de
unificação• Diferencial em relação a outros trabalhos
– trata as particularidades de integração de esquemas XML
• representações textuais e/ou estruturadas• representações alternativas
Processo de Integração Semântica
Usuário Especialista
Clusterização de SinônimosClusters deAfinidade
Esquema Conceitual 1
Reestruturação
Esquema Global
Definitivo
Esquema Conceitual n
Unificação
Inclusão de Relações de HerançaEsquema Global
Preliminar
ARTEMIS
...
Processo de Integração Semântica
Usuário Especialista
Clusterização de SinônimosClusters deAfinidade
Esquema Conceitual 1
Reestruturação
Esquema Global
Definitivo
determinação de equivalências entre conceitos:• graus de afinidade• agrupamento em clusters
Esquema Conceitual n
Unificação
Inclusão de Relações de HerançaEsquema Global
Preliminar
ARTEMIS
...
Processo de Integração Semântica
Usuário Especialista
Clusterização de SinônimosClusters deAfinidade
Esquema Conceitual 1
Reestruturação
Esquema Global
Definitivo
Esquema Conceitual n
Unificação
Inclusão de Relações de HerançaEsquema Global
Preliminar
ARTEMIS
...
integração semântica de conceitos presentes em um mesmo cluster
Unificação• Regras e algoritmos aplicadas a três casos
de unificação– Unificação L x L (cluster léxico)– Unificação NL x NL (cluster não-léxico)– Unificação NL x L (cluster misto)
Unificação L x L
Numberinteger
Nrinteger
Numberfloat
Numberfloat
string
Businessstring
Enterprisestring
(1) (2)Enterprise
(3)(1) (2)
Unificação NL x NL
WriterName(1,1) (1,N)
(1,1)(1,N)
Author
AuthorName(1,1) (1,N)
(2)(1)
University
Business
Name(1,1) (1,1)
(1,N)
(1,N)
(1,1)
(1,N)
University
(1,1)
(1,N)
E-mail(1,1)(0,N)
University
Business(1,N) (0,1)
(1,N)(1,N)
Unificação NL x L
City
Publishing-House
Manual
(1,N)
(1,1)
Namestring
(1,N)
(1,1)
string
(1,1)
(0,N)
(2)
Publisher
string
(1)
Publisher (2) Publishing-House/Name (1)(mapeamento 1:1)
City
Publishing-House
Manual
(1,N)
(1,1)
Namestring
(1,N)
(1,1)
string
(1,1)
(0,N)
DTD 2: Publisher
Unificação NL x LAddress
StreetCity
(1,N)
(1,1)(1,1)
Number
(1,1)
stringstringinteger
(1,N)
(1,N)(1)
Address
string
(2)
Address (2) Address/Street Address/Number Address/City (1) (mapeamento 1:N)
Address
DetailedAddress TextualAddressTextualAddress
Text
string
(1,N) (1,1)Street(1,N)(1,1)
City
(1,N)(1,1)
string
Number
(1,1)
integer
(1,N)
string
DTD 1: Address DTD 2: Address
Processo de Integração Semântica
Usuário Especialista
Clusterização de SinônimosClusters deAfinidade
Esquema Conceitual 1
Reestruturação
Esquema Global
Definitivo
Esquema Conceitual n
Unificação
Inclusão de Relações de HerançaEsquema Global
Preliminar
ARTEMIS
...
consideração de novos relacionamentos de herança relevantes para o domínio
Inclusão de Relações de Herança
PublicationTitle (1,1)string
(1,N)
Manual
(1,1)
(1,N)
e
<Publication BT Manual>
PublicationTitle (1,1)string
(1,N)
Manual
(1,1)
(1,N)
relacionamento relevante?
Processo de Integração Semântica
Usuário Especialista
Clusterização de SinônimosClusters deAfinidade
Esquema Conceitual 1
Reestruturação
Esquema Global
Definitivo
Esquema Conceitual n
Unificação
Inclusão de Relações de HerançaEsquema Global
Preliminar
ARTEMIS
...
validações manuais e automáticos para uma melhor adequação do esquema global ao domínio
Ajuste de Disjunções
Publication
Proceedings BookManual
Publication
Proceedings BookManual
+
Publication
Proceedings BookManual
Publication
Proceedings BookManual
Simplificação do Esquema
PublicationTitle (1,1)string
(1,N)
Manual
(1,1)
(1,N)
PublicationTitle (1,1)string
(1,N)
Manual
Processo de Integração Semântica
Usuário Especialista
Clusterização de SinônimosClusters deAfinidade
Esquema Conceitual 1
Reestruturação
Esquema Global
Definitivo
Esquema Conceitual n
Unificação
Inclusão de Relações de HerançaEsquema Global
Preliminar
ARTEMIS
...
Roteiro1. Introdução2. Abordagem de Integração Proposta3. Modelo Canônico e Mapeamentos4. Etapa de Conversão da DTD5. Etapa de Integração Semântica6. Considerações Finais
Contribuições• Um processo de conversão de uma DTD
para um esquema conceitual• Um processo de integração semântica de
esquemas XML• Uma estratégia de mapeamento baseado
no padrão XPath
Trabalhos RelacionadosTrabalho Integração Processo Modelo
CanônicoTSIMMIS manual bottom-up grafoGarlic manual bottom-up ODMGMIX manual bottom-up DTDDIXSE manual bottom-up conceitualJensen manual bottom-up UMLYAT manual - árvoreMcBrien manual - grafoVdovjak manual top-down conceitualXyleme semi-automático top-down DTDLSD semi-automático top-down DTDLim semi-automático bottom-up grafoTESE semi-automático bottom-up conceitual
Trabalhos RelacionadosTrabalho Técnicas de Integração Integração de esquemas XMLCUPID • análise de informação do
esquema• análise de nomenclatura• análise de estrutura
• não tratam a integração de representações alternativas de elementos (disjunções)• não tratam de forma completa a integração de elementos textuais com estruturados
MOMIS
TESE • análise de informação do esquema• análise de nomenclatura• análise de estrutura• análise de informação análise de informação de instânciasde instâncias
• tratam a integração de tratam a integração de disjunçõesdisjunções• consideram várias consideram várias alternativas para a alternativas para a integração NL x Lintegração NL x L
Trabalhos RelacionadosTrabalho Limitações de Modelagem Conceitual TESE
CUPID • não modela representações alternativas de elementos• não filtra elementos irrelevantes para o domínio
MOMIS • esquema conceitual definido manualmente
Vdokjak • esquema conceitual definido manualmente
DIXSE • não modela relacionamentos de herança• não filtra elementos irrelevantes para o domínio
Trabalhos Futuros• Comparação de esquemas
– técnicas de integração baseada em instâncias• aprendizado de máquina, PLN
• Mapeamento– desenvolvimento do módulo processador de
consultas do Mediador• validação da estratégia de mapeamento
– consideração de restrições de integridade• Fonte X: Sigmod Record Journal
– Journal — Title (Fonte X: [Title = “Sigmod Record”])
Trabalhos Futuros• Processo de integração
– abstração de esquemas em XML-Schema– consulta a vários Thesauri
• comparação de termos em diversas línguas– análise de performance dos algoritmos
• otimização de processamento– realização de mais estudos de caso
• validação da aplicabilidade das regras e algoritmos– desenvolvimento de um protótipo completo
Publicações• Abordagem de integração
– “A Method for the Unification of XML Schemata”• Mello, R.; Castano, S.; Heuser, C. Information & Software
Technology, v.44, n.4, Mar 2002.
– “A Rule-Based Conversion of a DTD to a Conceptual Schema”
• Mello, R.; Heuser, C. Proceedings of the XX International Conference on Conceptual Modeling (ER’2001), Yokohama, Japan, Springer-Verlag, Nov 2001.
– “A Bottom-Up Approach for Integration of XML Sources”
• Mello, R.; Heuser, C. Proceedings of the International Workshop on Information Integration on the Web (WIIW’2001), Rio de Janeiro, Brazil, Apr 2001.
Publicações• Estado da arte
– “Dados Semi-Estruturados”• Mello R. et. al. Anais do XV Simpósio Brasileiro de Banco
de Dados (SBBD’2000) / XIV Simpósio Brasileiro de Engenharia de Software – Mini-cursos e Tutoriais, João Pessoa, Brasil, Out. 2000.
– “Aplicação de Ontologias a Dados Semi-Estruturados”
• Mello R., Heuser, C. Anais da XXVI Conferencia Latinoamericana de Informática (CLEI’2000), Cidade do México, México, Set, 2000 (ed. eletrônica)
Uma Abordagem Uma Abordagem Bottom-UpBottom-Up para a Integração Semântica para a Integração Semântica
de Esquemas XMLde Esquemas XML
Tese de Doutoradopor
Ronaldo dos Santos Mello
Prof. Carlos Alberto HeuserOrientador
UFRGS/II - PPGC
ORM x ER• ER
– dicotomia Entidade-Atributo
Author University
<!ELEMENT Author (University)><!ELEMENT University (#PCDATA)> DTD
University
Author
affiliation
ER:name
ORM x ER• ORM
– somente um construtor de modelagem para representação de informação léxica
ORM: Author University
<!ELEMENT Author (University)><!ELEMENT University (#PCDATA)> DTD
ORM x ER• ER
– elementos léxicos compartilhados não podem ser modelados como atributos
<!ELEMENT Author (Name)><!ELEMENT Company (Name)><!ELEMENT Name (#PCDATA)>
DTD
AuthorName
CompanyName
ER:
ORM x ER• ORM
– não há restrição de modelagem para conceitos léxicos compartilhados
ORM: Author Name
<!ELEMENT Author (Name)><!ELEMENT Company (Name)><!ELEMENT Name (#PCDATA)>
DTD
Company