Apresentação Artigo Mestrado

Post on 05-Jun-2015

324 views 0 download

description

O presente artigo escrito pela Natalya Noy e Mark Musen, visa demonstrar uma ferramenta de fusão e alinhamento de ontologia

Transcript of Apresentação Artigo Mestrado

Fábio Vieira

Orientadora: Profª Drª. Rosario Girardi

PROMPT: Algorithm and Tool for Automated Ontology Merging and Alignment

Natalya Fridman Noy and Mark A. Musen

Recuperação e Filtragem de Informação

Roteiro

• Conceitos e motivação• Algoritmo de fusão de ontologia PROMPT

– Algoritmo incremental (PROMPT)– Algoritmo estatístico (Anchor-PROMPT)

• As ferramentas• Avaliação• Trabalhos futuros

Fábio Vieira- UFMA12 de abril de 2023 2

O que estavamos tentando descobrir

• O benefício que a ferramenta oferece–Benefício da produtividade–Melhoria da qualidade nos resultados da ontologia

–Satisfação do usuário• Precisão e recall de sugestões das

ferramentasFábio Vieira- UFMA12 de abril de 2023 3

Perguntas que fizemos

• Quão boas são as sugestões e estratégias de resolução de conflitos do PROMPT?

• O PROMPT fornece algum benefício quando comparado a uma ferramenta de edição de ontologia genérica (Protégé-2000)?

Fábio Vieira- UFMA12 de abril de 2023 4

Ontologias

O = (C, H, I, R, P, A)– C = CC U CI é

– H = {tipo_de (c1,c2) | c1 CC c2 CC }

– I = {é_um (c1,c2) | c1 CI c2 CC }

– R = {relk (c1,c2,..., cn) | i, ci C}

– P = {propC (ck, tipo) | ck ∈ CC} {propI (ck, valor) | ck ∈ CI}

– A = {condiçãox conclusãoy (c1, c2,..., cn) | j, cj CC}

Fábio Vieira- UFMA12 de abril de 2023 5

Por que nós Precisamos de Ontologias

• Fornece um vocabulário compartilhado para diferentes aplicações em um domínio

• Permite interoperação entre aplicações utilizando fontes de dados diferentes do mesmo domínio

Fábio Vieira- UFMA12 de abril de 2023 6

Ontologias estão em toda Parte

• Ontologias têm sido utilizados em projetos acadêmicos por um longo tempo– Compartilhamento de conhecimento e

reutilização– Reutilização de métodos de resolução de

problemas

• Ontologias estão se tornando amplamente utilizada fora da academia– Categorização de sites Web (Yahoo!, por

exemplo)– Catálogos de produtos

Fábio Vieira- UFMA12 de abril de 2023 7

Necessidade de Fusão das Ontologias

• Existe uma sobreposição significativa em ontologias existentes– Yahoo! e DMOZ Open Directory– Catálogos de produtos para domínios similares

Necessidade de Fusão e Integração das Ontologias

• Workshop sobre "Ontologias e Compartilhamento de Informações" no IJCAI'2001–6 dos 18 trabalhos (1/3) abordaram a fusão e integração das ontologia 

Fábio Vieira- UFMA12 de abril de 2023 9

O que é fusão da Ontologia

Fábio Vieira- UFMA12 de abril de 2023 10

Abordagens Existentes

• Design e integração de ontolgia– Correspondência de termos (Stanford SKC, ISI)– Gráficos com base em análises (Stanford SKC)– Operadores de transformação (Ontomorph at

ISI)– Ferramentas de fusão (Chimaera at Stanford

KSL)

Fábio Vieira- UFMA12 de abril de 2023 11

Abordagens Existentes (II)

• Base de Dados– Desenvolver mediadores e providenciar

wrappers– Definir um modelo de dados comum e

mapeamentos– Definir regras de correspondências para

traduzir diretamente

Fábio Vieira- UFMA12 de abril de 2023 12

Roteiro

• Conceitos e motivação• Algoritmo de fusão de ontologia PROMPT

– Algoritmo incremental (PROMPT)– Algoritmo estatístico (Anchor-PROMPT)

• As ferramentas• Avaliação• Trabalhos futuros

Fábio Vieira- UFMA12 de abril de 2023 13

PROMPT

• Nossa abordagem é:– Automação parcial– Algoritmos baseados em

• Conceitos de representação de estrutura• Relações entre conceitos• Ações dos usuários

• Nossa abordagem não é:– Automação completa– Algoritmo para correspondência de nomes

de conceito

Fábio Vieira- UFMA12 de abril de 2023 14

Modelo de Conhecimento

• Um modelo de conhecimento genérico - OKBC (Open Knowledge-Base Connectivity Protocol)– Classes

• Coleções de objetos com propriedades semelhantes• Organizadas em subclasses - uma hierarquia de

superclasses– Instâncias

• É um ser único de uma classe– Slots

• São as relações entre indivíduos ou as propriedades– Facetas

• Restrições sobre os valores slot (cardinalidade, min, max)

Fábio Vieira- UFMA12 de abril de 2023 15

Faça sugestões iniciais

Selecione a próxima operação

Realize atualizações automáticas

Encontre conflitos

Dê sugestões

O Algoritmo PROMPT

Fábio Vieira- UFMA12 de abril de 2023 16

Example: merge-classes

Fábio Vieira- UFMA

Agencyemployee

Agent

Customer

subclass of

agent for

Agent

Employee

Traveler

subclass of

has client

Agencyemployee

Agent

Employee

Customer Traveler

subclass of subclass of

agent for has client

12 de abril de 2023 17

Analisando Propriedades Globais de Localização

• Propriedades globais– Classes que têm os mesmos conjuntos de slots– Classes que se referem ao mesmo conjunto de

classes– Slots que estão ligados à mesma classe

• Contexto local– Análise incremental– Considerar apenas os conceitos que foram

afetados pela última operação

Fábio Vieira- UFMA12 de abril de 2023 18

O Conjunto de Operações do PROMPT

• Extensão das operações do OKBC com as operaçõs de fusões das ontologias– Fusão de classes– Fusão de slots– Fusão de instâncias– Cópia de uma classe

• Profunda ou superficial• Com ou sem subclasses• Com ou sem instâncias

Fábio Vieira- UFMA12 de abril de 2023 19

Depois que um Usuário Realiza uma Operação

• Para cada operação– Executa a operação– Considera possíveis conflitos

•Identifica conflitos•Propõe soluções

– Analiza o contexto local– Cria novas sugestões – Reforça ou menciona sugestões

existentes

Fábio Vieira- UFMA12 de abril de 2023 20

Conflitos

• Conflitos identificados no PROMPT– Conflitos de nomes– Redudância em uma hierarquia de

classes– Valores de slots com restrições que

violam a herança de classes

Fábio Vieira- UFMA12 de abril de 2023 21

Agent Agent

Agent

Exemplo: merge-classes

Fábio Vieira- UFMA12 de abril de 2023 22

Operação para: fusão de classes

• Verificar os slots de uma classe• Modelos de slots• Subclasses e superclasses• Conflitos• Sugestões

Fábio Vieira- UFMA12 de abril de 2023 23

Agent Agent

Agent

agent for

Modelo de Slots

Cópia de modelo de slots que não existe na fusão da ontologia

Fábio Vieira- UFMA

agent for

12 de abril de 2023 24

Agent Agent

Agent

has client

clientclient

Modelo de Slots

Anexar os slots que já foram mapeados

Fábio Vieira- UFMA12 de abril de 2023 25

Employee

Subclasses e Superclasses

Se uma superclasse (subclass) existe, reestabeleça as ligações

Fábio Vieira- UFMA

Agent Agent

Agent

Agencyemployee

superclass

superclass

12 de abril de 2023 26

Agentclient

has client

Sugestões Adicionais: Fusão de Slots

Se os nomes dos slots numa fusão de classes são similares, ele sugere uma fusão de slots

Fábio Vieira- UFMA12 de abril de 2023 27

Agent

Sugestões Adicionais: Fusão de Classes

Se o conjunto de classes referenciadas pela classe fundida é o mesmo que o conjunto de classes referenciada por outra classe, sugere-se uma fusão

Fábio Vieira- UFMA

ReservationClient

hasclients

handlesreservations

Agency employee

12 de abril de 2023 28

Employee Agencyemployee

Agent

Sugestões Adicionais: Fusão de Classes

Se os nomes das superclasses (subclasses) são similares a classe fundida, sugere-se a fusão das classes

Fábio Vieira- UFMA

superclasssuperclass

12 de abril de 2023 29

Resumo• Realizar a operação atual• Para os conceitos (classes, slots, e

instâncias) diretamente ligado à operações de argumentos– Realizar uma análise global para

novas sugestões– Realizar uma análise global para

novos conflitos

Fábio Vieira- UFMA12 de abril de 2023 30

Roteiro

• Conceitos e motivação• Algoritmo de fusão de ontologia PROMPT

– Algoritmo incremental (PROMPT)– Algoritmo estatístico (Anchor-PROMPT)

• As ferramentas• Avaliação• Trabalhos futuros

Fábio Vieira- UFMA12 de abril de 2023 31

Protégé-2000

• Um ambiente para– Desenvolvimento de Ontolgoia– Aquisição de Conhecimento

• Interface de manipulação• Extensibilidade

– Capacidade de conectar novos componentes

32Fábio Vieira- UFMA12 de abril de 2023

Ontologias no Protégé-2000

33Fábio Vieira- UFMA12 de abril de 2023

Ferramenta PROMPT baseado no Protégé

• Protégé-2000– Tem um modelo de conhecimento

compatível com OKBC– Permite a construção de extensões

através de um mecanismo de plugin•Pode funcionar como um servidor de base de conhecimento para os plugins

34Fábio Vieira- UFMA12 de abril de 2023

The PROMPT tool

35Fábio Vieira- UFMA12 de abril de 2023

Características da ferramenta PROMPT

• Definição de uma ontologia preferida• Mantém o foco do usuário• Fornece feedback para o usuário• Preserva as relações originais

– Relações superclasse-subclasse– Adição de slot– Valores facetas

• Ligação direta para manipular o editor da ontologia

• Operações de Logging

36Fábio Vieira- UFMA12 de abril de 2023

Roteiro

• Conceitos e motivação• Algoritmo de fusão de ontologia PROMPT

– Algoritmo incremental (PROMPT)– Algoritmo estatístico (Anchor-PROMPT)

• As ferramentas• Avaliação• Trabalhos futuros

37Fábio Vieira- UFMA12 de abril de 2023

Avaliação

• Sistemas baseado em conhecimento são raramente avaliados

• Podemos usar as abordagens de engenharia de software para avaliar empiricamente as ferramentas

• Precisamos desenvolver medições adicionais para base de conhecimento

38Fábio Vieira- UFMA12 de abril de 2023

Fonte de ontologia para os experimentos

• Duas ontologias de resolução de problemas– Ontologia para linguagem unificada

para o desenvolvimento de métodos de resolução de problemas (UPML)

– Ontologia para linguagem de descrição de métodos (MDL)

39Fábio Vieira- UFMA12 de abril de 2023

Experimento 1: Avaliar a qualidade das sugestões do

PROMPT’s• Métricas

– Precisão– Recall

• Método– Registro

automático– Relatório de

dados automático

Fábio Vieira- UFMA

40

Sugestões que a

ferramenta produziu

Operações que o

usuário realiza

Sugestão que o usuário

seguiu

12 de abril de 2023

Resultados: a qualidade das sugestões do PROMPT’s

41

Fábio Vieira- UFMA

Sugestões que os usuários seguiram

Estratégias de resolução de conflitos que os usuários seguiram

Base de conhecimento gerada automaticamente

90% 75%

74%

12 de abril de 2023

Trabalhos futuros

• Ampliar o conjunto de heurísticas que o PROMPT usa para guiar os especialistas

• Estender as técnicas para o alinhamento das ontologias

• Desenvolver protocolos e métricas para uma avaliação mais detalhada das ferramentas

42

Fábio Vieira- UFMA12 de abril de 2023

http://protege.stanford.edu

http://www.isi.edu/info-agents/courses/iiweb/kushmerick-ijcai97.pdf

http://www.google.com.br/url?sa=t&rct=j&q=prompt

%20algorithm&source=web&cd=1&ved=0CB0QFjAA&url=http%3A%2F%2Finfolab.stanford.edu

%2Finfoseminar.Archive%2FSpringY2001%2Fspeakers%2Fnfridmannoy%2Fslides.ppt&ei=UAy4TsW2MpPUgQfdgsSRBA&usg=AFQjCNG1PEtMGlr4ppxXBcFlDC11F04gHw

&sig2=Ob9zttxkSStigW9KBLCbZw

Referências