INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de...

24
INQUER INQUER Interacção Pessoa-Máquina em Interacção Pessoa-Máquina em Linguagem Natural Linguagem Natural MÓDULO II MÓDULO II Inferência e Extracção de Inferência e Extracção de Informação Informação Ricardo Santos, 2003

Transcript of INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de...

Page 1: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

INQUERINQUERInteracção Pessoa-Máquina em Linguagem NaturalInteracção Pessoa-Máquina em Linguagem Natural

MÓDULO IIMÓDULO II

Inferência e Extracção de InformaçãoInferência e Extracção de Informação

Ricardo Santos, 2003

Page 2: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

TópicosTópicos

INQUER

WordNet.PT

Módulo II - Inferência e Extracção de Informação Extracção e Tratamento da Base de Dados

Alg. de Consulta e Extracção de Informação

Inferência e Extraccão de Informação

Interface (site do INQUER)

Page 3: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Arquitectura Geral do INQUERArquitectura Geral do INQUER

Base de DadosLéxico-Conceptual

(WordNet.PT)

MÓDULO IIMotor de Inferência

MÓDULO IIIGerador

MÓDULO I

Analisador

Pergunta (Português)

Resposta (Português)

Base de DadosLexical

Forma Lógica

Resposta

Forma Lógica

INQUER

Page 4: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

WordNet.PTWordNet.PT

Base de Dados do Conhecimento Linguístico

Rede Léxico-Conceptual

Capta padrões da organização do léxico mental

Page 5: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Relações entre conceitos lexicalizadosRelações entre conceitos lexicalizados

Relações estruturantes Sinonímia Hiperonímia / Hiponímia

{animal}

{mamífero}

{cão} {gato}...

hiperonímia/generalização

hiponímia/especialização

Cada conceito tem uma glosa associada

ex. borrego-cordeiro; rabanada-fatia dourada

ex. gato-mamífero; mamífero-animal

Page 6: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Relações de Todo-ParteRelações de Todo-Parte

Holonímia / Meronímia

Holo-parte / Mero-parte

Holo-membro / Mero-membro

Holo-porção / Mero-porção

Holo-matéria / Mero-matéria

Holo-localização / Mero-localização

ex. árvore-tronco; leão-juba

ex. enxame-abelha; pinhal-pinheiro

ex. bolo-fatia; melão-talhada

ex. carne de porco-fiambre

ex. cidade-baixa

ex. açorda-pão; sangria-açúcar

Page 7: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Relações internas à estrutura do eventoRelações internas à estrutura do evento

Role / Involved

Agente / Envolve Agente

Paciente (Objecto) / Envolve Paciente (Objecto)

Resulta / Tem Resultado

ex. gordura-fritar

ex. cão-ladrar; gato-miar

ex. vaca-ordenhar; almoço-almoçar

ex. bolo-cozer; fumado-fumar

Page 8: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Arquitectura Geral - Módulo IIArquitectura Geral - Módulo II

Base de DadosLéxico-Conceptual

(WordNet.PT)

Alg. Satisf. da FL

Processamento da FL

Representação Semântica(Forma Lógica - LPO)

Resposta (em linguagem artificial)

INFERÊNCIA e EXTRACÇÃO de INFO.

Alg. de Consulta

Alg. Segm. da FL

Alg. de Extracção

INFERÊNCIA

PERG.SOBRE ARG.

PERG.POLARES

Page 9: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Extracção e Tratamento da BDExtracção e Tratamento da BD

Construção de ficheiros consultáveis pelo Prolog

Ficheiros de Texto

Ficheiros Prolog

Extracção de Dados

Polaris

Geração de Ficheiros

Prolog

Detonador

Ordenação e Remoção de redundâncias

WordNet.PT

Base de DadosINQUER

Page 10: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Algoritmos de Consulta e Algoritmos de Consulta e Extracção de InformaçãoExtracção de Informação

Correspondência entre Termos/Expressões em LN e relações da WN.PT

Termos/Exps em LNTermos/Exps em LN WN.PTWN.PT Ex. PerguntasEx. Perguntas

sinónimo; “o mesmo”; variante

Sinonímia- Quais são os sinónimos de fatia dourada?- “Borrego” é o mesmo que carneiro?

hipónimo; tipo; subtipo; raça; espécie

Hiponímia- Quantos (sub)tipos de felino há?- Quais são as raças de gatos que existem?

hiperónimo; supertipo Hiperonímia - “Carnívoro” é hiperónimo/supertipo de cão?

glosa; definição; significado/significar

Glosa- Qual é a definição/glosa de gato siamês?- O que significa fritar?

Page 11: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Correspondências LN-WN.PT (cont.)Correspondências LN-WN.PT (cont.)

LNLN Relações da WN.PTRelações da WN.PT Ex. PerguntasEx. Perguntas

serHiper/Hiponímia; Sinonímia; Glosa

- Os cães são carnívoros?- Um borrego é um cordeiro?- O que é um gato?

terMeronímia; Mero-parte;

Mero-porção

- A açorda tem pão?- Os gatos têm patas?- O pão tem migalhas?

“feito de”; levar Mero-matéria- O fiambre é feito de carne de porco?- Um enchido leva carne?

“feito com”; levar Holonímia/Meronímia- Os doces são feitos com açúcar?- Quais são os pratos que levam bacalhau?

Verbos da WN.PT(miar,ladrar,comer,...)

Role/Involved - Os gatos miam?

Page 12: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Algoritmos de Consulta e Algoritmos de Consulta e Extracção de InformaçãoExtracção de Informação

Implementação dos algoritmos usando predicados que representam relações da WN.PT

has_hyponym/2

has_meronym/2

gloss/2

etc.

Predicados:

Page 13: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Inferência & Extracção de Inferência & Extracção de Info.Info.

Dois tipos de pergunta Polares Sobre argumentos

Inferência (Porquê?) A Base de Dados não contém todo o conhecimento

de forma explícita

Necessário mecanismo capaz de inferir informação implícita

(consulta)

(consulta e extracção)

Page 14: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

InferênciaInferência

has_hyponym(gato,'gato siamês').

has_hyponym(felino,gato).

has_mero_part(felino,pata).

x (gato_siamês(x) gato(x))

x (gato(x) felino(x))

x (felino(x) (y (pata(y) ter(x,y)))

Factos Prolog Forma Lógica

felino

gato

gato siamês

pata

Page 15: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Perguntas PolaresPerguntas Polares

Uma Forma Lógica é verdadeira ou falsa num determinado modelo (WN.PT)Pressuposto de Mundo Fechado

Satisfação da Forma Lógica

R(t1,..,tn) sse t1 a tn são conceitos lexic. da WN e R/n um pred. exec.

P Q sse P é satisfazível e Q é satisfazível em WN.PT

P sse P não é satisfazível em WN.PT

x P(x) sse Existe pelo menos um x tq P(x) é sat. em WN.PT

x P(x) sse Não existe um x tq P(x) não seja sat. em WN.PT

-Todos os felinos miam? - Não | -Alguns felinos miam? - Sim

A sse B - A é satisfazível em WN.PT se e só se a condição B se verifica

Page 16: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Perguntas sobre ArgumentosPerguntas sobre Argumentos

1- Segmenta a FL devolvendo uma lista com os predicados executáveis que a compõem

2- Executa os predicados extraindo conjuntos de conceitos

3- Faz a intersecção desses conjuntos

4- Devolve resultado

Algoritmo:

Page 17: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

ExemploExemplo

Quais são os carnívoros que têm focinho?

1- [ter(D,focinho), ser_v(E,carnívoro)]

2- conj1 (ter_focinho) [canídeo, marsupial, coelho, lebre, doninha, felino, equídeo, urso, roedor, ruminante, toupeira, ...]

conj2 (ser_carnívoro) [canídeo, ave de rapina, fuínha, furão, marta, orca, felino, crocodilo, jacaré, tubarão branco, ...]

[qual(A)*>d(o,plu,B,carnívoro(B)&d(exi,sing,C,felino(C) &ter(B,C))>ser_v(A,B)))]

Page 18: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Exemplo (cont.)Exemplo (cont.)

3- [canídeo, diabo da Tasmânia, felino, fuínha, furão hiena, marta, ouriço-cacheiro]

4- canídeo, diabo da Tasmânia, felino, fuínha, furão hiena, marta, ouriço-cacheiro

Quais são os carnívoros que têm focinho?

Resposta à pergunta:

Page 19: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Processamento da Forma LógicaProcessamento da Forma Lógica

Integração dos Módulos (Perg. Polares e Perg. Sobre Argumentos) Análise da FL e reencaminhamento para o respectivo

Módulo

Perguntas Ambíguas Uma resposta para cada interpretação

Coordenações (ex. Os gatos e os cães são animais?)

Aplicação do processo de inferência e extracção de informação a cada componente da coordenação

Page 20: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

InterfaceInterface

Site do INQUER - Arquitectura

Web Browser

Servidor CLUL

Prolog-CGIScript

Form HTML

Página HTML

Pedido HTTP

Página HTML

Pergunta

Resposta

Page 21: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Demonstração do Demonstração do sitesite

http://www.clul.ul.pt/clg/inquer

Page 22: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Em sínteseEm síntese

Estudo da WordNet.PT

Extracção e Tratamento da Base de Dados

Implementação dos Algoritmos de Consulta e Extracção

Implementação dos mecanismos de obtenção de resposta para os dois tipos de pergunta

Construção do site do INQUER

Page 23: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Trabalho Futuro – Módulo IITrabalho Futuro – Módulo II

Melhorar a rapidez dos algoritmos de busca e extracção de info.

Cobrir todas as relações semânticas utilizadas pela WN.PT

Considerar:

Interrogativas de Alternativa

Interrogativas sobre Adjuntos Causais

Interrogativas que envolvem comparação

- ex. os gatos são felinos ou canídeos?

- ex. por que é que os peixes têm guelras?

- ex. o que têm em comum um gato e um cão?

Page 24: INQUER Interacção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003.

Trabalho Futuro - INQUERTrabalho Futuro - INQUER

Desenvolvimento do Módulo III – Geração em LN

Rumo ao HAL9000...

Módulo de Fala (Reconhecimento e Síntese)