COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes...

170
SANDRA CRISTINA DOS SANTOS ANTUNES COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Dissertação de Mestrado em Linguística (Área de Especialização: Processamento e Tecnologia das Línguas Naturais) Apresentada à Faculdade de Letras da Universidade de Lisboa Orientador: Professora Doutora Palmira Marrafa 2002

Transcript of COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes...

Page 1: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

SANDRA CRISTINA DOS SANTOS ANTUNES

COMPUTAÇÃO DA POLISSEMIA REGULAR EM

PORTUGUÊS

Dissertação de Mestrado em Linguística

(Área de Especialização: Processamento e Tecnologia das Línguas Naturais)

Apresentada à Faculdade de Letras da Universidade de Lisboa

Orientador: Professora Doutora Palmira Marrafa

2002

Page 2: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

SANDRA CRISTINA DOS SANTOS ANTUNES

COMPUTAÇÃO DA POLISSEMIA REGULAR EM

PORTUGUÊS

Dissertação de Mestrado em Linguística

(Área de Especialização: Processamento e Tecnologia das Línguas Naturais)

Apresentada à Faculdade de Letras da Universidade de Lisboa

Orientador: Professora Doutora Palmira Marrafa

2002

Page 3: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

AGRADECIMENTOS

Terminado este trabalho, não posso deixar de tornar presentes todos aqueles

que, de uma forma ou de outra, contribuíram para a sua realização, manifestando aqui

o meu reconhecimento.

À Professora Doutora Palmira Marrafa, minha orientadora, agradeço o

encorajamento e todas as sugestões e correcções que ajudaram a estruturar este

trabalho. Agradeço também o cuidado com que leu as sucessivas versões deste

trabalho e a sua crítica constante.

À Doutora Fernanda Bacelar agradeço o incentivo e a sensibilidade que sempre

demonstrou, permitindo que interrompesse a minha actividade no CLUL na fase final

de elaboração deste trabalho.

Aos meus colegas e companheiros de mestrado e do CLUL, nomeadamente à

Amália Mendes, à Florbela Barreto, à Rita Veloso e à Sara Mendes, agradeço a

motivação, a compreensão e o carinho sempre demonstrados, bem como todas as

sugestões sempre pertinentes e oportunas. À Raquel Amaro deixo um agradecimento

muito especial pela leitura sempre atenta de algumas partes deste trabalho, bem como

todo o apoio e ajuda essenciais na sua fase final. Ao Rui Chaves, pela sua inestimável

amizade, compreensão e motivação, bem como todos os “safanões” que nos momentos

mais críticos me ajudaram a ir para a frente. Agradeço também todas as leituras que fez

deste trabalho e todas as sugestões que em muito o beneficiaram.

À Ana Rosa e à Manuela Gonzaga agradeço o apoio e todas as sugestões feitas

após a leitura deste trabalho, sempre com o seu espírito crítico de linguistas.

Aos meus pais, pelo apoio, incentivo e carinho absolutos, de quem só quer o

melhor para mim.

Ao Jorge, uma inesgotável fonte de apoio, pelo carinho, compreensão,

preocupação e dedicação constantes e por ter feito sempre tudo o que esteve ao seu

alcance para que eu pudesse levar este barco a bom porto.

Page 4: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

“When I use a word,” Humpty Dumpty said, in rather a scornful tone, “it

means just what I choose it to mean, neither more nor less”.

“The question is” said Alice, “whether you can make a word mean so many

different things”.

“The question is” said Humpty Dumpty, “which is to be master – that’s all”.

Lewis Carrol, Alice’s Adventures in Wonderland

Page 5: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

ix

ÍNDICE

1. INTRODUÇÃO.............................................................................................................................. 1

1.1. Objecto de Estudo .......................................................................................................... 3

1.2. Metodologia e Selecção dos Dados ............................................................................. 9

1.3. Organização ................................................................................................................... 10

2. PROBLEMÁTICA ........................................................................................................................ 13

2.1. A Questão da Polissemia ............................................................................................. 14

2.2. Polissemia e Vaguidade ............................................................................................... 15

2.3. Polissemia e Homonímia ............................................................................................. 19

2.4. Polissemia e Contexto .................................................................................................. 22

2.5. Polissemia nas Categorias Sintácticas ....................................................................... 27

2.5.1. Polissemia Nominal ........................................................................................ 27

2.5.2. Polissemia Verbal ............................................................................................ 34

2.5.3. Polissemia Adjectival ...................................................................................... 37

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO ............................................................... 47

3.1. Léxico Enumerativo de Sentidos ................................................................................ 48

3.2. Regras Lexicais .............................................................................................................. 53

3.3. Léxico Generativo ......................................................................................................... 58

3.3.1. Níveis de Representação ................................................................................. 59

3.3.1.1. Estrutura Argumental ..................................................................... 61

3.3.1.2. Estrutura Eventiva ........................................................................... 64

3.3.1.3. Estrutura Qualia ................................................................................ 69

3.3.2. Sistema de Tipos Semânticos e Herança Lexical ........................................ 72

3.3.3. Paradigma Léxico-Conceptual (PLC) ........................................................... 74

3.3.4. Mecanismos Generativos ............................................................................... 76

3.3.4.1. Coerção de Tipo ................................................................................ 76

Page 6: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

x

3.3.4.2. Coerção de Subtipo ........................................................................ 80

3.3.4.3. Coerção de Complemento .............................................................. 82

3.3.4.4. Co-composição ................................................................................. 85

3.3.4.5. Ligação Selectiva .............................................................................. 91

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO .................................................................... 95

4.1. Tipos Nominais Complexos ...................................................................................... 95

4.1.1. Selecção Semântica e Interpretação de Tipos Complexos ....................... 99

4.1.2. O Papel Constitutivo ..................................................................................... 101

4.2. Adjectivos Relativos e Modificadores de Propriedade ......................................... 104

4.2.1. Transcrição de Tipo ....................................................................................... 106

4.2.2. Posição do Adjectivo ..................................................................................... 108

4.2.2.1. Nomes com o Tipo Simples ‘Indivíduo’ ..................................... 108

4.2.2.2. Nomes com o Tipo Simples ‘Estado’ ........................................... 110

4.2.2.3. Nomes que Denotam Pares ‘Indivíduo’ – ‘Estado’ ................... 111

4.3. Causativos Aspectuais ............................................................................................... 113

4.3.1. Algumas Questões sobre a Coerção ........................................................... 114

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS ......................................... 121

5.1. Tipos Complexos e Co-predicação .......................................................................... 122

5.2. Polissemia Construcional (Modulação de Significados) ...................................... 127

5.2.1. Polissemia Construcional Adjectival .......................................................... 127

5.2.2. Polissemia Construcional Verbal ................................................................. 129

5.2.3. Polissemia Construcional Nominal ............................................................. 130

5.3. Extensão de Significados (Alteração de Significados) ........................................... 131

5.3.1. Extensão de Significados Nominais ............................................................ 133

5.3.2. Metáforas ........................................................................................................ 135

5.4. O Teste de Co-Predicação ......................................................................................... 136

5.5. A Problemática de Itens como Jornal ....................................................................... 141

6. CONCLUSÃO .............................................................................................................................. 149

REFERÊNCIAS ................................................................................................................................ 155

Page 7: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

11.. INTRODUÇÃO

Psychologically, the remarkable fact about polysemy is how little trouble it

causes.

(Miller, 1978: 97)

A Semântica Lexical é a área da Linguística que se dedica essencialmente ao

estudo da estrutura semântica dos itens lexicais e ao modo como esta deve ser

representada no léxico.

O léxico tem sido predominantemente encarado como um repositório que contém

toda a informação pertinente, de natureza fonológica, morfológica, sintáctica e semântica,

sobre cada item lexical representado. Nesta perspectiva, essa informação não é derivável a

partir de quaisquer mecanismos gramaticais. As propriedades representadas nas entradas

lexicais poderão ser de natureza mais geral (especificando a categoria sintáctica, o quadro

de subcategorização e a classe semântica do item lexical, o que permite integrar os itens

em classes) ou de natureza mais idiossincrática, caracterizando apenas um ou um

pequeno número de itens. Neste quadro, a cada significado diferente de um item

corresponderá uma entrada lexical distinta.

O estudo do léxico ganhou vigor a partir da década de sessenta e, em particular, a

partir da década de oitenta, quando começaram a surgir vários trabalhos que tinham

como objecto de investigação a descrição e a classificação das categorias gramaticais de

acordo com o(s) seu(s) possível(is) significado(s). Até então, a sintaxe tinha sido

considerada a componente mais proeminente da gramática e, consequentemente, o

principal objecto de estudo dos linguistas.

Page 8: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

2

Foi nos últimos anos que o estudo da pluralidade de sentidos que um item lexical

pode ter despertou o interesse dos investigadores na área da semântica lexical.

“Polysemy has been the subject of remarkable little research. Linguists have found it insufficiently regular to succumb to their theoretical accounts, lexicographers have been concerned with instances rather than theory, and NLP has, until recently, overlooked the homonymy/polysemy distinction and ignored the relations between polysemous senses.” (Kilgarriff, 1995a: 3)

Robins (1967) foi dos primeiros trabalhos a ter em conta as relações complexas

existentes entre as palavras e os seus significados, a partir da observação de que um

conceito simples podia ser expresso por diferentes palavras - sinonímia - e que,

contrariamente, uma palavra podia comportar diferentes significados - polissemia ou

homonímia.

A distinção entre polissemia e homonímia tem sido largamente discutida na

literatura. Neste trabalho assume-se que se está perante uma caso de homonímia quando

dois, ou mais, significados distintos e não relacionados partilham acidentalmente a

mesma forma lexical (por exemplo, banco - peça de mobiliário - e banco - instituição

financeira). Por outro lado, está-se perante um caso de polissemia quando a mesma

unidade lexical comporta dois ou mais significados semanticamente relacionados (por

exemplo, janela - abertura na parede e objecto físico que tapa essa mesma abertura)1.

A polissemia é um fenómeno comum em todas as línguas, mas raramente constitui

um problema na comunicação. Seleccionamos fácil e inconscientemente o significado

apropriado, ainda que as palavras mais usadas tendam a ser as mais polissémicas.

Embora não constitua problema no uso da língua, excepto em casos de trocadilhos e jogos

de palavras, a polissemia coloca problemas a nível da representação semântica, estando

longe de haver consenso quanto ao número de significados que uma palavra pode ter ou

quanto ao modo como esses significados se relacionam entre si ou como devem ser

representados nos dicionários e no léxico.

Em termos de aplicações computacionais, o problema da desambiguação também

constitui uma questão crucial. A identificação automática dos vários sentidos relacionados

que se podem associar a um dado item lexical não é uma questão trivial em termos

1 A distinção entre homonímia e polissemia será debatida mais pormenorizadamente no capítulo 2.

Page 9: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

1. INTRODUÇÃO

3

computacionais, uma vez que, na maioria dos casos, esses sentidos estão associados ao

mesmo contexto sintáctico ou a contextos sintácticos muito próximos.

Foram as categorias predicativas, verbos e adjectivos, que mais atenção mereceram

por parte dos estudiosos, como mostram, entre outros, trabalhos como Levin (1993), para

os verbos, Bouillon (1996, 1997, 1999) e Saint-Dizier (1998a, 1998b, 1999), para os

adjectivos. No seguimento destes trabalhos, bem como Pinto (2001) e Berkeley Coter

(2002), para o Português, o presente trabalho tem como principal objectivo o estudo da

polissemia regular nas classes nominal, verbal e adjectival, no Português, e sua

representação no quadro de um modelo computacionalmente executável.

Há que captar a sistematicidade da relação existente entre os significados

relevantes para a interpretação de um mesmo item lexical e dar conta da criação de novos

significados em contexto.

Trabalhos como os de Copestake & Briscoe (1992, 1995), Pustejovsky (1995a) e

Kilgarriff (1992), que assentam na criação de um formalismo que dê conta do fenómeno

de polissemia regular, servem de base para a elaboração do presente estudo.

Pustejovsky (1995a) propõe a criação de entradas lexicais suficientemente ricas

para modelizarem a semântica “intrínseca” das unidades lexicais e suficientemente

subespecificadas para permitirem a derivação, através de mecanismos generativos

apropriados, do sentido adquirido em contexto.

Copestake & Briscoe (1992, 1995) propõem um modelo que combina entradas

lexicais, semelhantes às propostas no âmbito do Léxico Generativo (Pustejovsky 1995a),

com regras lexicais, de forma a explicar a derivação de diferentes tipos de significados de

um item polissémico.

Ambos os modelos têm como objectivo prever o comportamento dos itens

polissémicos e obter a interpretação adequada no contexto apropriado.

1.1. OBJECTO DE ESTUDO

Quando surgiram os primeiros sistemas de Gramáticas Independentes do

Contexto (Context-Free Grammars - CFG) e de Gramáticas Transformacionais, a principal

Page 10: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

4

motivação para a sua criação residia na aparente inadequação dos sistemas de estados

finitos existentes na altura para descrever todos os aspectos linguísticos associados à

natureza criativa das línguas naturais. Ainda que não se apreciasse a ideia de que os

sistemas de estados finitos não eram suficientes para analisar uma dada construção,

tornava-se cada vez mais necessária a criação de uma gramática com um maior poder

expressivo. Hoje, a semântica das línguas naturais encontra-se numa situação análoga.

Atingiu-se um estado em que se descobrem inúmeros fenómenos da língua que se

encontram além do poder explanatório dos nossos sistemas de semântica lexical.

Um dos fenómenos mais difíceis de tratar é o da ambiguidade lexical. De entre o

fenómeno de ambiguidade lexical destaca-se a distinção entre POLISSEMIA e HOMONÍMIA.

Atente-se nos seguintes exemplos:

(1) a. Este livro é muito deprimente.

b. A Rita deixou o livro em cima da mesa.

(2) a. A Clara foi buscar o banco ao sótão.

b. Este é o banco onde deposito o meu dinheiro.

Como se analisará mais detalhadamente no capítulo 2, é notória a existência de

uma relação semântica entre os significados de livro em (1), contrariamente aos

significados de banco, em (2), que não parecem apresentar qualquer relação semântica

entre si. Ou seja, pode estabelecer-se uma relação entre os significados de livro -

informação - e livro - objecto físico - em (1a) e (1b), respectivamente. A intuição de que

estes dois significados são inerentemente relacionáveis é reforçada pela possibilidade de

ocorrência de frases onde ambos os significados estão disponíveis ao mesmo tempo.

(3) O livro que a Rita deixou em cima da mesa é muito deprimente.

Em contrapartida, não é possível estabelecer-se qualquer relação semântica entre

os significados de banco - peça de mobília/assento - e banco - instituição financeira -

presentes em (2a) e (2b), respectivamente, nem ter ambos os significados disponíveis na

mesma frase.

Page 11: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

1. INTRODUÇÃO

5

(4) *A Clara foi buscar ao sótão o banco onde deposito o meu dinheiro.

O estudo dos itens polissémicos levou à constatação de que a polissemia podia ser

regular, i.e., que certas alternâncias de significados ocorriam de forma previsível e

sistemática dentro de uma determinada classe de palavras (Apresjan, 1973).

(5) a. O livro/artigo/revista/quadro/fotografia está em cima da mesa.

b. O livro/artigo/revista/quadro/fotografia é muito deprimente.

Um dos principais problemas da semântica lexical reside na criação de modelos

que consigam captar todos os significados que um determinado item lexical pode

adquirir. Na perspectiva clássica do léxico, os itens lexicais têm significados fixos. A

aquisição de um novo significado por parte de um item lexical corresponde à criação de

uma nova entrada lexical, no léxico, de modo a permitir dar conta desse novo significado.

Um sistema com estas características é denominado LINGUAGEM MONOMÓRFICA, e

caracteriza-se essencialmente por atribuir um único significado a um item lexical. A

ambiguidade lexical é expressa através de múltiplas listas de entradas lexicais para um

dado item. Os Léxicos Enumerativos de Sentidos são um exemplo desta abordagem

monomórfica.

“Monomorphic Languages: A language where lexical items and complex phrases are provided a single type and denotation. In all these views, every word has a literal meaning. Lexical ambiguity is treated by multiple listing of words, both for contrastive ambiguity and logical polysemy.” (Pustejovsky, 1995a: 56)

Para os exemplos (1) e (2) supra, os itens livro e banco teriam ambos duas entradas

lexicais, correspondendo a livro1 [informação], livro2 [objecto físico], banco1 [peça de

mobiliário], e banco2 [instituição financeira]. Note-se que, neste sistema, não é possível

captar a relação existente entre livro1 e livro2, tornando-o um fenómeno de ambiguidade

semelhante a banco1 e banco2, o que não é o caso.

A par da categoria nominal, as categorias verbal e adjectival também apresentam

comportamentos polissémicos. Os exemplos em (6) e (7) ilustram alguns casos de

polissemia verbal.

Page 12: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

6

(6) a. A Rita ferveu o leite.

b. O leite ferveu.

(7) a. A Maria começou o livro.

b. A Maria começou a ler o livro.

c. A Maria começou a escrever o livro.

As estruturas em (6) correspondem à alternância causativa/incoativa, em que, do

ponto de vista sintáctico, o mesmo verbo se comporta quer como transitivo - (6a) - quer

como ergativo - (6b). Esta alternância encontra-se relacionada por um traço de

causalidade, sendo considerada um caso de polissemia regular.

No que respeita às estruturas em (7), o mesmo verbo pode, sintacticamente,

seleccionar diferentes tipos de complementos. No entanto, apesar das diferentes

estruturas sintácticas, existe uma relação semântica entre o significado dos diversos

complementos. Num modelo monomórfico existiriam vários verbos ferver e começar, cada

um com várias entradas lexicais, correspondendo, cada uma, a uma estrutura sintáctica

possível, o que não permitiria captar qualquer tipo de relação entre as diferentes

estruturas.

No que respeita aos adjectivos, esta categoria também apresenta um

comportamento polissémico. Do ponto de vista semântico, os adjectivos apresentam um

comportamento polimórfico, cuja origem pode dever-se, fundamentalmente, a três

factores: (i) semântica do próprio adjectivo - alternando entre interpretações de

experienciador e de causalidade, podendo seleccionar nomes que denotem indivíduos,

objectos ou eventos - como ilustram os exemplos em (8); (ii) semântica do nome que

modifica - adquirindo significados distintos de acordo com o item nominal que modifica -

como se pode observar pelos exemplos em (9); (iii) posição do adjectivo relativamente ao

nome que modifica – “activando” aspectos distintos da semântica do mesmo item

nominal - como mostram as estruturas em (10).

(8) a. O rapaz está triste.

b. Este livro é triste.

c. Hoje foi um dia triste.

Page 13: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

1. INTRODUÇÃO

7

(9) a. um bom livro (que está bem concebido)

b. um bom investimento (que traz vantagens)

c. uma boa caldeirada (que é agradável ao paladar ou ao olfacto)

d. uma boa pessoa (que apresenta qualidades morais)

e. um bom médico (que desempenha bem as suas funções)

f. uma boa faca (que funciona bem)

(10) a. um velho marinheiro (de longa data)

b. um marinheiro velho (de idade avançada)

Como se pode observar pelos exemplos apresentados, torna-se difícil a um Léxico

Enumerativo de Sentidos conseguir captar e enumerar todos os significados possíveis de

um dado item.

O inverso de uma abordagem monomórfica consiste numa abordagem que negue

a existência de um significado literal, como é o caso de uma LINGUAGEM POLIMÓRFICA

NÃO RESTRINGIDA. O significado é determinado exclusivamente pelo contexto e não por

quaisquer propriedades inerentes da língua.

“Unrestricted Polymorphic Languages: No restriction on the type that a lexical item may assume. No operational distinction between subclasses of polymorphic transformations. (...). The contribution of “background knowledge” acts as the trigger to shift the meaning of an expression in different pragmatically determined contexts, and there is nothing inherent in the language that constrains the meaning of the words in context.” (Pustejovsky, 1995a: 56)

No entanto, o que se deseja é um modelo de semântica lexical que consiga captar e

prever o comportamento polissémico dos itens lexicais, sem sobregerar ou produzir

expressões semanticamente mal formadas. O significado deve ser em parte lexicalmente

determinado e não totalmente definido através da pragmática. Trata-se de uma

LINGUAGEM POLIMÓRFICA FRACA.

“Weakly Polymorphic Languages: All lexical items are semantically active, and have a richer typed semantic representation than conventionally assumed; semantic operations of lexically-determined type changing (e.g., type coercions) operate under well-defined constraints. Different subclasses of polymorphic operations are defined, each with independent properties and conditions on their application.” (Pustejovsky, 1995a: 57)

Page 14: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

8

Pustejovsky (1995a), propõe, assim, o modelo do Léxico Generativo (LG), que

assenta na criação de entradas lexicais subespecificadas e de mecanismos generativos que,

ao interagirem com a informação codificada nas várias estruturas que compõem as

entradas lexicais, permitem a interpretação adequada do item em contexto.

“Instead of enumerating the different senses of the words as in a monomorphic approach, the theory adopts a generative (or semi-polymorphic) point of view (…). The word has a lexical sense that can be manipulated by a set of generative devices which derive an infinite number of senses in context.” (Bouillon, 1999: 4)

Uma outra proposta é a de Copestake & Briscoe (1992, 1995) que se fixa em testes

de co-predicação2 a partir dos quais distingue dois modos distintos de representação dos

itens polissémicos: entrada lexicais subespecificadas segundo o modelo generativo, por

um lado, e regras lexicais por outro.

Considerem-se os seguintes exemplos:

(11) a. O livro que a Rita deixou em cima da mesa é muito deprimente.

b. O banco onde deposito o meu dinheiro tem uma fachada renascentista.

(12) a. *O Jornal despediu o editor e está sujo de café.

b. *O João amamenta e come cabrito.

Nos exemplos em (11) o item livro é ambíguo entre a interpretação de ‘objecto

físico’ e ‘informação’ - em (11a) - e o item banco é ambíguo entre a interpretação de

‘instituição financeira’ e ‘edifício’ - em (11b). Ambos os itens podem entrar em estruturas

de co-predicação.

No que respeita aos exemplos em (12), os itens jornal e cabrito, ambíguos entre as

interpretações de ‘instituição’ e ‘objecto físico’ - em (12a) - e ‘animal’ e ‘comida’ - em (12b)

- não permitem a co-predicação, resultando em estruturas zeugmáticas.

2 A co-predicação consiste essencialmente na aplicação, numa mesma estrutura, de diferentes predicados sobre um item lexical polissémico, fazendo emergir os seus diferentes significados.

Page 15: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

1. INTRODUÇÃO

9

Com base na não aceitação das estruturas em (12), em contraste com a aceitação

das estruturas em (11), Copestake & Briscoe (1992, 1995) propõem dois tipos de

polissemia regular e, consequentemente, dois modos distintos de representação lexical.

A nível computacional, ambas as propostas são executáveis. No âmbito do LG

existem algumas implementações de pequena escala em alguns trabalhos da área, a maior

parte deles sob a forma de Matrizes Atributo-Valor - MAV - (cf. capítulo 3, nota 3). A

proposta de Copestake & Briscoe (1992, 1995), desenvolvida no âmbito do projecto

ACQUILEX3, faz uso do LG, por um lado, e de regras lexicais, por outro, e é

implementada em LRL (Lexical Representation Language), com recurso a estruturas de

traços tipificadas.

Contrariando o que foi durante largos anos a perspectiva dominante, estas

abordagens sustentam que o léxico não é um componente estático e independente da

gramática, constituído por listas exaustivas de entradas lexicais providas de informação

intralinguística.

1.2. METODOLOGIA E SELECÇÃO DOS DADOS

“For an understanding of the lexicon, the contributing disciplines are lexicography, psycholinguistics and theoretical, computational and corpus linguistics.” (Kilgarriff, 1992: 4)

No seguimento de Pustejovsky (1995a), o presente estudo baseou-se

primeiramente no estabelecimento prévio de um conjunto de classes de alternâncias

nominais, verbais e adjectivais, nas quais os itens lexicais são sistematicamente ambíguos

entre dois ou mais significados.

3 ACQUILEX (The Acquisition of Lexical Knowledge for Natural Language Processing Systems) é um projecto que tem como objectivo o desenvolvimento de técnicas e metodologias para a utilização de dicionários informatizados (Machine-Readable Dictionaries – MRD) na construção de bases de conhecimento lexical, no âmbito do processamento das línguas naturais.

Page 16: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

10

O recurso à base de dados da WordNet do Português4 ajudou consideravelmente ao

alargamento desse conjunto de alternâncias, nomeadamente no que respeita aos itens

polissémicos da categoria nominal.

A consulta de um corpus de uso real da língua revelou-se útil na medida em que

permitiu captar a regularidade de alguns dados5.

Este trabalho reuniu, assim, um conjunto de exemplos que representam casos

relevantes de polissemia, os quais vão constituir objecto de um estudo sistematizado e tão

exaustivo quanto possível.

1.3. ORGANIZAÇÃO

No próximo capítulo procede-se a uma definição mais detalhada do conceito de

polissemia, em geral, e de polissemia regular, em particular, distinguindo estes conceitos

dos restantes fenómenos de ambiguidade semântica, nomeadamente da vaguidade e da

homonímia. Analisam-se alguns casos de polissemia regular no Português nas categorias

nominal, verbal e adjectival.

No capítulo 3 analisam-se as abordagens existentes com o objectivo de representar

os itens lexicais polissémicos, de modo a permitir o acesso a todas as suas possíveis

interpretações. Destacam-se as Técnicas Enumerativas de Sentidos, as Regras Lexicais e o

Léxico Generativo (LG), que pretende explicar o comportamento polimórfico das línguas

naturais e captar a criação de novos sentidos em contexto, desenvolvendo uma

representação semântica complexa com base na noção de co-composicionalidade6.

No capítulo 4 são analisadas algumas expressões polissémicas à luz do modelo do

LG, quadro teórico em que este estudo se insere.

4 Também designada WordNet.PT ou WN.PT. Trata-se de um projecto em curso no CLG – Grupo de Computação do Conhecimento Léxico-Gramatical - do Centro de Linguística da Universidade de Lisboa. Segundo os pressupostos da WordNet de Princeton, desenvolvida para o inglês americano pelo Laboratório de Ciências da Universidade de Princeton, este projecto consiste numa base de dados do conhecimento linguístico, em que a informação relativamente a cada item lexical é representada de forma estruturada, sendo o significado de cada unidade deduzido das suas relações com outras unidades (Marrafa, 2001). 5 Foi consultado o corpus construído no âmbito do projecto Léxico Multifuncional do Português Contemporâneo, coordenado pelo Centro de Linguística da Universidade de Lisboa. 6 Que respeita, em particular, à interacção entre o significado de um dado item lexical e o significado dos seus argumentos.

Page 17: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

1. INTRODUÇÃO

11

No capítulo 5 distinguem-se dois tipos de polissemia regular - polissemia

construcional e extensão de significados - a que correspondem representações distintas

(Copestake & Briscoe, 1995). É introduzido o conceito de co-predicação e analisam-se

alguns exemplos.

Finalmente, e a título de conclusão, o capítulo 6 encerra esta dissertação, focando

os aspectos mais importantes analisados ao longo deste trabalho.

Page 18: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

12

Page 19: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

The fundamental problem posed by polysemy for computation is that

particular words can take on an almost indefinite number of subtle

meaning variations.

(Verspoor, 1997a: 214)

As palavras relacionam-se com outras palavras de diversas maneiras, tornando-se

necessário seleccionar e isolar cada uma dessas relações para que sejam apropriadamente

analisadas. A sinonímia e a polissemia são, provavelmente, as relações mais produtivas de

qualquer língua e resultam em certa medida de uma das propriedades de todas as línguas

naturais: a sua criatividade. Para além de produzirem enunciados até então nunca antes

produzidos, os falantes também fazem novos usos das palavras, principalmente através

de processos metafóricos e metonímicos. No entanto, esses novos usos não são criados

arbitrariamente. No seu uso criativo de novos significados os falantes observam as regras

e as relações utilizadas na geração de significados conhecidos, gerando, por sua vez,

significados desconhecidos mas, contudo, possíveis. Deste modo, o uso criativo que os

falantes fazem da linguagem não produz qualquer impedimento à compreensão de novos

significados.

No entanto, no que respeita aos sistemas de Processamento das Línguas Naturais

(PLN), torna-se complicado identificar, de entre os vários sentidos relacionados que se

podem associar a uma dada palavra, aquele que é requerido num contexto particular.

Como reage um sistema de PLN quando, na sua busca através do léxico para encontrar o

Page 20: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

14

significado de uma palavra, encontra vários? E, consequentemente, qual será o melhor

método de representação lexical dos vários significados que uma palavra pode adquirir?

Debruçando-se sobre o estudo da relação de polissemia regular, este capítulo

apresenta uma distinção entre os restantes fenómenos de ambiguidade lexical no

Português e uma descrição do modo como os vários significados dos itens lexicais se

relacionam entre si.

2.1. A QUESTÃO DA POLISSEMIA

O conceito de polissemia coloca dois problemas centrais na área da Semântica

Lexical: um diz respeito à definição e outro diz respeito à estrutura da polissemia.

No que respeita à definição, torna-se necessário, primeiramente, distinguir a

polissemia de dois outros fenómenos de ambiguidade lexical: a vaguidade1 e a

homonímia.

No respeitante à vaguidade, e de um modo sucinto, este fenómeno refere uma

falta de conteúdo informacional relativamente a diferentes especificações não dadas e

neutralizadas no contexto. De um modo mais simples, ao contrário da polissemia, que

respeita a uma variação de significados, a vaguidade respeita a uma variação dentro do

mesmo significado. Por exemplo, estudante ou criança não são palavras polissémicas, mas

vagas relativamente à informação sobre o sexo. Quando se opõe a polissemia à

vaguidade, coloca-se a questão de precisar se um determinado valor semântico - ou uso -

de uma palavra faz parte do conjunto de significados dessa palavra, ou se é o resultado de

uma especificação contextual de um desses significados. Do ponto de vista metodológico,

na determinação e delimitação dos vários significados de uma palavra, quais são os

critérios que se devem utilizar na distinção entre diferentes significados e meras

especificações contextuais?

Relativamente à homonímia, esta distingue-se da polissemia por envolver

diferentes significados com a mesma forma. Por outro lado, a polissemia envolve uma

1 Dada a diferente terminologia encontrada no que respeita a este tipo de ambiguidade, nomeadamente VAGUIDADE, VAGUEZA e INDETERMINAÇÃO, adoptou-se, neste trabalho, e no seguimento de Silva (1997) e Mendes (2001), o termo VAGUIDADE.

Page 21: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

15

mesma palavra com vários significados relacionados. Uma vez que o que caracteriza a

polissemia, e a distingue da homonímia, é a relação existente entre os vários significados,

a questão que se coloca, neste caso, é a de definir a natureza dessa relação. Será ela

intuitivamente reconhecida pelos falantes?

No que respeita à questão da estrutura do item polissémico, duas questões se

afiguram importantes. Por um lado é necessário definir que tipos de relações unem os

diferentes significados de um item lexical: apenas as relações baseadas em processos

metafóricos e metonímicos, ou também fazem parte desse grupo outro tipo de relações,

como as relações hierárquicas? Por outro lado, importa estabelecer como é que se

distingue o significado-base e o significado derivado de um item polissémico.

2.2. POLISSEMIA E VAGUIDADE

Têm sido propostos vários testes para a distinção entre polissemia e vaguidade, ou

seja, para a distinção entre significados distintos e especificações - ou variações -

contextuais de um mesmo significado. Geeraerts (1993) classifica estes testes em três tipos:

lógicos, linguísticos e da definição2. No entanto, todos estes testes parecem apresentar

alguns problemas.

O primeiro grupo diz respeito aos testes lógicos, primeiramente definidos por

Quine (1960). Segundo o critério lógico dos valores de verdade, se uma asserção envolver

uma palavra que pode ser simultaneamente verdadeira e falsa em relação a um mesmo

referente, então essa palavra é polissémica. Um exemplo apresentado em Silva (1997: 613)

diz respeito ao item café, que pode ter como significados ‘fruto do cafezeiro’ e

‘estabelecimento comercial onde se toma a respectiva bebida’. A estrutura apresentada em

(1) ilustra como, segundo o teste lógico, o item café é polissémico por denotar valores de

verdade simultaneamente verdadeiros e falsos.

2 Não se consideram aqui os critérios de sinonímia, antonímia ou derivação morfológica, entre outros, a partir dos quais se considera que a existência de diferentes sinónimos, antónimos ou derivados morfológicos, em relação a um mesmo item lexical, são argumentos a favor da polissemia desse item. Trata-se de testes “ indirectos” , na terminologia de Cruse (1986), que são insuficientes no que respeita à distinção entre polissemia e vaguidade e que levantam, muitas vezes, alguns problemas de aplicação e de interpretação. Estes critérios também podem levar ao tratamento homonímico de um item, mesmo quando é notória a relação entre os significados.

Page 22: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

16

(1) Delta é um café, e não um café.

A frase é possível uma vez que café está a ser usado como ‘fruto do cafezeiro’, no

primeiro caso, e como ‘estabelecimento comercial’, no segundo.

Cruse (1986) acrescenta uma variação a este teste construindo asserções nas quais

ambos os significados de uma palavra podem ser verdadeiros, mas não redundantes.

(2) O João mudou a sua posição.

A frase pode ser verdadeira no que respeita à mudança da localização física do

sujeito no espaço ou à mudança do seu ponto de vista em relação a um determinado

assunto.

O segundo grupo de testes é de natureza linguística e consiste na existência de

restrições semânticas no que respeita ao uso de diferentes significados de um item

polissémico numa mesma estrutura. Este teste, também designado “teste da identidade”,

foi primeiramente introduzido por Lakoff (1970) e baseia-se na assunção de que a

coordenação de significados distintos produz frases zeugmáticas. Atente-se no seguinte

exemplo:

(3) a. *O João bebeu o café e o Manuel também entrou num.

b. O João deixou o café e o Manuel também.

A frase em (3a) ilustra como a coordenação dos significados distintos de café é

inaceitável. Em (3b) só pode haver uma interpretação para o item café, ou seja, só são

admissíveis as leituras em que tanto o João como o Manuel abandonaram ambos ou a

bebida ou o estabelecimento comercial. A leitura cruzada em que o João abandona a

bebida e o Manuel o estabelecimento, ou vice-versa, não é aceitável, o que mostra que esta

é uma palavra polissémica, pois não admite coordenação de significados distintos. Os

itens com o significado vago não produzem estruturas zeugmáticas em contextos de

coordenação. Considerem-se os seguintes exemplos apresentados em Mendes (2001: 229).

Page 23: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

17

(4) a. A minha blusa era azul pastel, e a dela era azul forte.

b. A minha blusa era azul e a dela também.

A palavra azul, em (4b), constitui um caso de vaguidade e não de polissemia, uma

vez que é permitida a coordenação deste item, mesmo que este apresente variações de

significado (as blusas podem ser ambas azul pastel, azul forte, ou cada uma de um tom de

azul diferente).

No entanto, como se analisará pormenorizadamente no capítulo 5, este teste falha

quando se verifica a aceitabilidade de estruturas com coordenação de diferentes

significados de um item polissémico.

Finalmente, o terceiro grupo de testes, informalmente apresentado por Aristóteles,

contempla as definições. Segundo este teste, uma palavra é polissémica se mais do que

uma definição for necessária para dar conta dos seus significados. Por exemplo, ‘azul

pastel’ e ‘azul forte’ não representam duas definições, nem, consequentemente, dois

significados de azul, uma vez que esses valores podem ser abrangidos por uma única

definição: ’uma das cores do espectro solar que pode apresentar diversas gradações’. No

entanto, não existe uma definição maximamente genérica, i.e., que consiga abranger todo

o conjunto de significados do item café: ‘fruto do cafezeiro’, ‘bebida feita a partir do fruto

do cafezeiro’ e ‘estabelecimento comercial’. Este teste também comprova que café é

polissémico.

Todavia, Geeraerts (1993) constata alguns casos em que a aplicação destes

diferentes testes pode fazer previsões conflituosas. Se, por um lado, os três critérios

convergem relativamente à polissemia do item café, pode acontecer que um item seja

considerado polissémico segundo determinado(s) teste(s) e vago segundo outro(s). Os

casos mais visíveis ocorrem com palavras como cão e jornal. No que respeita ao item cão -

com os usos de canídeo e macho da cadela - este é polissémico de acordo com o teste

lógico, como se pode ver em (5).

(5) Layka é um cão, mas não é um cão.

Contudo, segundo os critérios linguístico e da definição, os dois usos de cão

representam um caso de vaguidade. Relativamente ao critério linguístico, são aceites

Page 24: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

18

frases como a apresentada em (6), em que se exige uma identidade entre a semântica do

item cão - com o significado de canídeo - e do elemento anafórico o.

(6) O Pluto é um cão e a Layka também (o é).

No que respeita ao critério da definição, é possível formular uma definição que

cubra todos os significados do item cão: ‘canídeo doméstico tanto macho como fêmea’.

Tal como acontece com cão, também com itens como jornal é possível obter

resultados diferentes consoante os testes utilizados. Atente-se no seguinte exemplo:

(7) O jornal decidiu reduzir o seu tamanho.

Neste caso, o item jornal designa ‘o conjunto de pessoas que encabeçam a

organização’, enquanto o elemento anafórico seu designa ‘o objecto físico’. De acordo com

o teste linguístico, a aceitabilidade de (7) é um argumento a favor da interpretação de

jornal como vago (relativamente a estes dois valores) e não polissémico. No entanto o item

é polissémico de acordo com o teste da definição - uma vez que uma única definição não

chega para cobrir todos os seus significados - e de acordo com o teste lógico, tendo em

conta a não aceitabilidade de (8).

(8) Os redactores são o jornal mas não são o jornal.

A existência de resultados contraditórios dependendo do tipo de teste que se

aplica mostra, segundo Geeraerts (1993), que a distinção entre polissemia e vaguidade,

sendo uma distinção legítima e necessária, é instável e de limites não definidos. O que

nalguns contextos pode apresentar-se como um caso de significados distintos pode,

noutros contextos, tornar-se um caso de vaguidade e vice-versa.

“a oposição entre polissemia e vaguidade não constitui uma dicotomia estrita, mas antes um “continuum”. (...) Se de facto é difícil determinar os significados de uma palavra, então é porque os significados não são como as coisas, isto é, não são entidades que se possam delimitar, individualizar, contar, registar, encontrar, etc. (...) em vez de entendermos os significados como coisas, devemos entender a significação como um processo de criação de sentido. Metaforicamente falando, as palavras não são pacotes de informação

Page 25: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

19

(...); as palavras são antes, (...), holofotes que se movem e que, em cada aplicação efectiva, iluminam uma porção particular de todo o seu domínio de aplicação.” (Silva, 1997: 620-621)

2.3. POLISSEMIA E HOMONÍMIA

O conceito de polissemia está estreitamente relacionado com o de homonímia,

uma vez que ambos os conceitos denotam “vários sentidos”3 que os itens lexical podem

comportar. Tradicionalmente, a distinção entre polissemia e homonímia é baseada num

critério diacrónico a partir do qual são consideradas palavras homónimas aquelas cujos

significados resultem de étimos diferentes, tornados homógrafos e homófonos através da

aplicação de vários processos linguísticos ao longo dos anos. Segundo esta distinção,

temos como exemplos de itens homónimos os apresentados em (9) e (10)4:

(9) camelo1 - com o sentido de “mamífero da fam. dos Camelídeos, de origem

asiática, de grande porte, ruminante, com duas corcovas dorsais,

muito utilizado como animal de carga nas regiões áridas”,

proveniente etimologicamente do grego kámelos, pelo latim came�lu-.

camelo2 - com o sentido de “corda grossa”, proveniente etimologicamente do

grego kámilos.

(10) pena1 - com os sentidos de “castigo; punição; desgosto; tristeza; dor; aflição”,

proveniente etimologicamente do latim poena-.

pena2 - com os sentidos de “cada um dos órgãos cutâneos que revestem o

corpo das aves (...)”, proveniente etimologicamente do latim penna-.

pena3 - com o sentido de “rocha, fraga, fraguedo”, proveniente do latim

pinna- ou penna-.

3 No seguimento de Mendes (2001) também neste trabalho se adopta o termo sentido quando não é referido um tipo específico de pluralidade de sentidos, uma vez que este termo pode abranger tanto variações de um mesmo significado, como variações que correspondem a diferentes significados. 4 Exemplos retirados do Dicionário da Língua Portuguesa, Porto Editora, 8ª Edição.

Page 26: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

20

No entanto, para além da dificuldade por vezes encontrada em precisar com

segurança a etimologia de um item lexical, tem vindo a impor-se como um problema

proeminente a determinação das semelhanças e das diferenças existentes entre os

significados que um determinado item pode assumir. Em consequência, polissemia e

homonímia distinguem-se usualmente com base em critérios semânticos sincrónicos,

nomeadamente na existência ou não de uma relação entre os vários significados do item

em questão.

“It came to be understood that systematic polysemy – senses that are systematically related and therefore predictable over classes of lexical items – is fundamentally different from homonymy – senses that are unrelated, non-systematic and therefore not predictable.” (Buitelaar, 1998:2)

Mais concretamente, um item lexical é considerado polissémico se os diferentes

significados que comporta estiverem semanticamente relacionados. Por outro lado, a

homonímia ocorre quando a uma mesma forma estão associados acidentalmente

significados distintos e não relacionados5.

Para ilustrar a distinção entre estes dois conceitos, considerem-se os exemplos de

homonímia apresentados em (11) e (12), em contraste com os casos de polissemia

apresentados em (13) e (14):

(11) a. O Carlos sentou-se num banco.

b. Nenhum de nós tem conta no banco.

(12) a. O tribunal decretou uma pena de 10 anos de prisão.

b. O piriquito arrancou uma pena da asa.

(13) a. Este banco foi fundado em 1910.

b. A loja que procuras fica ao lado do banco que construíram há pouco tempo.

5 Apresentando uma terminologia diferente, Weinreich (1964) defende que a ambiguidade pode ser de natureza contrastiva ou complementar. Os significados contrastivos são desprovidos de qualquer relação (o mesmo que homonímia), enquanto os significados complementares se encontram relacionados de modo sistemático (o mesmo que polissemia regular, definida mais adiante).

Page 27: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

21

(14) a. O João entrou pela janela.

b. O João pintou a janela.

De facto, parece consensual que não existe qualquer relação entre os significados

de banco - ‘peça de mobiliário’ e ‘instituição financeira’, em (11a) e (11b), respectivamente.

O mesmo acontece com os significados de pena - ‘castigo’ e ‘órgão que reveste o corpo das

aves’, em (12a) e (12b), respectivamente. Em contrapartida, os significados de banco -

‘instituição financeira’, em (13a), e ‘edifício onde a instituição financeira se localiza’, em

(13b), encontram-se sistematicamente relacionados. Do mesmo modo, também é possível

estabelecer uma relação entre os significados de janela, em que o significado de ‘abertura

na parede’, em (14a), se encontra sistematicamente relacionado com o significado de

‘objecto que serve para tapar a abertura na parede’, em (14b).

Um outro aspecto importante a realçar é o facto de a relação existente entre os

significados dos nomes polissémicos ser sistemática, ou seja, parece existirem classes de

nomes que partilham a capacidade de exprimir conceitos da mesma ordem. Deste modo,

podemos encontrar o mesmo tipo de relação entre os significados presentes em banco em

nomes como escola, bem como podemos encontrar o mesmo tipo de relação entre os

significados presentes em janela em nomes como porta.

(15) a. Esta escola foi fundada em 1910.

b. A loja que procuras fica ao lado da escola que construíram há pouco tempo.

(16) a. O João entrou pela porta.

b. O João pintou a porta.

Uma definição interessante do conceito de polissemia denominada regular

(Apresjan, 1973) ou sistemática (Ostler & Atkins, 1992, Copestake & Briscoe, 1992, 1995) ou,

ainda, lógica (Pustejovsky, 1995a)6, pode ser encontrada em Apresjan (1973), e é aqui

reproduzida7:

6 O autor utiliza o termo Polissemia Lógica definindo-o como um tipo de ambiguidade complementar (no seguimento de Weinreich, 1964), onde não ocorre qualquer alteração da categoria sintáctica do item lexical, contrapondo-a aos casos em que existe tal alteração.

(i) a. John crawled through the window. b. The window is closed.

Page 28: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

22

“Polysemy of the word A with the meanings ai and aj is called regular if, in the given language, there exists at least one other word B with the meanings bi bj, which are semantically distinguished from each other in exactly the same way as ai and aj and if ai and bi, aj and bj are nonsynonymous. Polysemy is called irregular if the semantic distinction between ai and aj is not exemplified in any other word of the given language.”

Em suma, segundo o autor, a polissemia é irregular se a relação semântica

existente entre os significados de um item lexical for exclusiva desse item (tornando-o um

caso isolado dentro da sua classe), sendo a referência a vários significados distintos

considerada acidental. Por outro lado, a polissemia é regular (termo adoptado neste

trabalho) se o tipo de distribuição existente entre os significados de um item lexical for

comum a outros itens da mesma classe, tornando o fenómeno regular e previsível. O autor

observa ainda que a polissemia regular se baseia na maior parte das vezes na relação de

metonímia existente entre os itens lexicais.

2.4. POLISSEMIA E CONTEXTO

“One of the central problems of lexical semantics is the sensitivity of word meaning to context.” (Cruse, 2000: 30)

Dada a sensibilidade do significado dos itens lexicais relativamente ao contexto

importa questionar como é que, num plano linguístico, os diversos significados podem ser

captados.

“We do not think that it is possible to define a real theory of sense delimitation, but it is certainly possible to define a few principles or a strategy.” (Saint-Dizier, 1998a: 122)

(ii) a. If the store is open, check the price of the coffee.

b. Zac tried to open his mouth for the dentist.

No presente trabalho também só serão tratados casos de polissemia como os apresentados em (i), i.e., sem alteração de categoria sintáctica. 7 Apud Buitelaar (1998: 16).

Page 29: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

23

É prática corrente definir o significado básico dos itens lexicais

independentemente do contexto, estabelecendo posteriormente princípios de acordo com

os quais, num contexto particular, os significados dos vários itens interagem entre si. A

questão central consiste em encontrar os aspectos do significado de um item que são pré-

definidos e invariantes através dos contextos e os aspectos que só se realizam em

determinado contexto. As abordagens existentes são divergentes no que respeita a esta

questão.

Wierzbicka (1996) e Goddard (2000), entre outros, consideram que os itens lexicais

têm o máximo de conteúdo semântico. Os autores propõem um método de definição

lexical denominado Natural Semantic Metalanguage – NSM – através do qual todo o

significado de uma expressão semântica (seja um item lexical ou uma expressão

gramatical) é captado através de uma paráfrase (ou explicação), construída numa

metalinguagem baseada em primitivos semânticos8. A NSM assenta em duas premissas

fundamentais: (i) toda a análise semântica deve ser definida numa língua natural e não

em formalismos técnicos ou símbolos lógicos, uma vez que estes não são suficientemente

explícitos até serem explicados numa língua natural; (ii) todo o significado de uma

expressão semântica deve poder ser captado em termos de uma paráfrase ou expressão

equivalente. A possibilidade de substituir qualquer expressão semântica por uma

paráfrase em todas as suas ocorrências contextuais permite sustentar que o significado de

um item está devidamente lexicalizado.

“... every language must have an irreducible semantic core consisting of a ‘mini-lexicon’ of indefinable words (a.k.a. ‘semantic primes’) and a ‘mini-syntax’ governing how they can be combined. (…) In the NSM system, the meaning of a semantically complex expression (be it a word or a grammatical construction) is described by means of an explanatory reductive paraphrase (an ‘explication’) framed entirely within the semantic metalanguage.” (Goddard, 2000: 129-130)

8 A proposta de Goddard (2000) surge no seguimento de trabalhos inseridos no âmbito de uma perspectiva tradicional, como Wierzbicka (1996). Segundo a autora, os significados das palavras podem ser decompostos num número finito de primitivos semânticos universais, chamados primes. Após cerca de trinta anos de investigação em vários domínios semânticos foram identificados cerca de sessenta primes. No entanto, a hipótese de que o significado lexical pode ser reduzido a um número finito de primitivos é fortemente contestada.

Page 30: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

24

Numa outra perspectiva, Schütze (2000) defende que os itens lexicais não têm

conteúdo semântico, mas apenas semelhanças semânticas com outros itens lexicais. O

autor propõe um algoritmo de desambiguação de palavras que agrupa contextos

semanticamente semelhantes com base em contagens de palavras semelhantes que co-

ocorrem com determinadas palavras num corpus.

“The more neighbours two words have in common, the more similar they are. The more similar words appear in two contexts, the more similar the two words are.” (Schütze, 2000: 208)

De acordo com o autor, o significado de um item lexical não está lexicalizado. O

significado é simplesmente um conjunto de ocorrências com contextos semelhantes.

“A contextual representation of a word is knowledge of how that word is used. (…) Two occurrences of an ambiguous word belong to the same sense to the extent that their contextual representations are similar.” (Schütze, 2000: 216)

Alguns modelos computacionais apresentam sistemas de delimitação de sentidos

tão extremos como os anteriores. Alguns léxicos estruturados distinguem cada sentido

consoante o uso - ou contexto - do item lexical, o que resulta numa proliferação de

sentidos. Uma abordagem deste tipo é bastante útil na medida em que fornece uma

descrição detalhada sobre o uso de várias palavras de uma língua. No entanto, esta

abordagem não permite dar conta de certas generalizações da língua, que são de extrema

utilidade em sistemas de PLN.

No outro extremo, alguns sistemas de Inteligência Artificial postulam a existência

de um único significado para um item lexical. Processos complexos de derivação

produzem os diferentes significados. As abordagens deste tipo têm como motivação

principal o modo de representação de um determinado item lexical, relegando para

segundo plano o uso da língua.

Outra proposta interessante é a de Cruse (1986: 50-54) que defende que o contexto

pode afectar a semântica de um item lexical de duas maneiras. O autor distingue entre o

que designa por MODULAÇÃO CONTEXTUAL de um único significado, por um lado, e

SELECÇÃO CONTEXTUAL de significados, por outro. O primeiro caso é entendido como a

variação induzida pelo contexto de modo a dar mais ou menos ênfase a determinados

traços semânticos do significado de uma palavra, enquanto o segundo refere a selecção de

um significado particular de entre outros que um item lexical possui.

Page 31: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

25

“... a single sense can be modified in an unlimited number of ways by different contexts, each context emphasising certain semantic traits, and obscuring or suppressing others (…). This effect of a context on an included lexical unit will be termed modulation (…). The second manner of semantic variation concerns the activation by different contexts of different senses associated with ambiguous word forms. This will be termed contextual selection (of senses) (…).” (Cruse ,1986: 52)

Atente-se nos seguintes exemplos:

(17) a. O carro precisa de ir à revisão. (mecânica)

b. O carro precisa de ser lavado. (carroçaria)

(18) a. O quarto está pintado com uma cor leve. (clara)

b. O João fez uma refeição leve. (ligeira)

Segundo o autor, frases como as de (17) são consideradas casos de modulação

contextual, uma vez que são referidos diferentes aspectos de carro, ou seja, diferentes

traços semânticos do significado de carro: a mecânica e a carroçaria. Não se assume que

carro refere diferentes entidades em ambas as frases. Os diferentes aspectos do item

podem ser activados simultaneamente.

(19) O carro precisa de ser lavado e de ir à revisão.

A estrutura em (19) é semanticamente aceitável, ainda que diferentes aspectos de

carro estejam a ser referidos por cada um dos verbos.

Por outro lado, as frases em (18) apresentam casos de selecção contextual, uma vez

que só um significado de leve é seleccionado em cada caso. Os diferentes significados não

podem ser activados em simultâneo.

(20) *O João fez uma refeição leve e tem o quarto pintado da mesma maneira.

No entanto, a distinção de Cruse entre selecção e modulação contextuais vai ao

encontro da distinção entre polissemia e vaguidade, apresentada anteriormente,

Page 32: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

26

pressupondo uma separação estável entre estes dois tipos de ambiguidade. Segundo o

autor, o contexto ou selecciona um significado particular de um dado item, ou modula um

significado particular de um item. No entanto, como já se referiu anteriormente, o que

num determinado contexto pode ser considerado uma variação de um determinado

significado, noutro contexto pode passar a constituir significados distintos. Se nos

exemplos (17) e (19) as variações do significado de carro - mecânica e carroçaria - são

compatíveis, encontrando-nos, de facto, perante um caso de modulação contextual de um

mesmo significado, contextos há em que esses dois aspectos podem tornar-se

incompatíveis. Considerando um carro velho (na sucata), sem componentes mecânicas,

bancos e algumas rodas, este pode ser considerado um carro no que respeita à sua forma e

alguma constituição, mas já não é um carro no que respeita à sua função. De acordo com o

teste lógico, o exemplo em (21) ilustra que o item carro pode ser, neste contexto particular,

polissémico por permitir denotar valores de verdade simultaneamente verdadeiros e

falsos.

(21) Isto é um carro mas já não é um carro.

O que esta reflexão ilustra é que o contexto pode seleccionar um significado de

entre outros que a palavra tenha e modular um mesmo significado, ou seja, realçar

determinados traços semânticos de um único significado. No entanto, o contexto também

pode tornar incompatíveis variações de um mesmo significado, passando a constituir

significados diferentes e vice-versa. Um exemplo extremo é a compatibilização de

significados de palavras homónimas que se podem transformar em variações de um

mesmo significado.

“Daddy, what exactly do you call a bank: the place where we moor the boat or the place where I bring my savings? - Well, son, the place where we moor the boat is a bank, but so is the place where you bring your savings.” (Geeraerts, 1993: 245)

O contexto influencia a interpretação do significado de um item lexical,

funcionando quer como elemento selectivo quer como elemento criador da sua

semanticidade, constituindo, consequentemente, um componente importante na sua

desambiguação.

Page 33: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

27

A polissemia é um fenómeno contextual na medida em que o contexto pode

conduzir à interpretação particular de um dado valor semântico do item lexical. No

entanto, e apesar das várias influências contextuais, nem todos os valores semânticos de

um item lexical são o resultado exclusivo do contexto, ou seja, defende-se a existência de

propriedades semânticas independentes do contexto.

“... although in principle word meaning may be regarded as infinitely variable and context sensitive, there are nonetheless regions of higher semantic ‘density’ (…), forming, as it were, more or less well-defined ‘lumps’ of meaning with greater or lesser stability under contextual change.” (Cruse, 2000: 30)

2.5. POLISSEMIA NAS CATEGORIAS SINTÁCTICAS

Centrando-nos no fenómeno particular de polissemia regular - que pressupõe uma

determinada relação semântica entre os significados de um item lexical, tornando-se, essa

relação, sistemática e previsível na medida em que abrange toda uma classe de palavras –

as próximas três secções focarão os tipos de relações existentes nas três principais

categorias sintácticas em que se pode observar itens com comportamento polissémico –

nominal, verbal e adjectival.

2.5.1. POLISSEMIA NOMINAL

No seguimento das alternâncias nominais consideradas em Pustejovsky (1995a),

analisemos agora, para o português, alguns casos de polissemia regular nominal, em que

os significados se encontram relacionados entre si de forma sistemática e previsível.

Page 34: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

28

INSTITUIÇÃO – EDIFÍCIO – CONJUNTO DE PESSOAS

Retomemos as alternâncias apresentadas em (13), aqui renumeradas como (22):

(22) a. Este banco foi fundado em 1910.

b. A loja que procuras fica ao lado do banco que construíram há pouco tempo.

Como se verificou anteriormente, a alternância entre o significado de banco -

‘instituição financeira’ - e o de banco - ‘edifício’ - patentes em (22a) e (22b),

respectivamente, é extensível a todos os nomes que, a par de banco, denotem uma

entidade abstracta com carácter organizativo, por um lado, e uma edificação, por outro.

Apresentam esta alternância nomes como escola, faculdade, fábrica, empresa, editora, clínica,

jornal9, escritório, secretaria, entre outros. Note-se, ainda, uma terceira acepção destes itens

que consiste na capacidade que estes nomes têm em denotar uma ou mais entidades com

carácter [+volitivo], pertencentes a essa instituição, como ilustram os seguintes exemplos:

(23) a. A fábrica manifestou-se contra o reduzido aumento salarial.

b. A escola secundária de Sacavém saiu para a rua em protesto contra a

abolição do ensino nocturno.

c. A empresa aplaudiu a decisão da direcção.

ABERTURA – OBJECTO FÍSICO

Recordem-se, agora, os exemplos apresentados em (14), aqui renumerados como

(24):

(24) a. O João entrou pela janela.

b. O João pintou a janela.

9 O item jornal apresenta dois tipos de alternância: (i) instituição/edifício/conjunto de pessoas; (ii) informação/objecto físico (caracterizada mais adiante). A sua complexidade vai ser objecto de estudo mais detalhado no capítulo 5.

Page 35: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

29

Neste caso, é expressa uma alternância de significado entre ‘abertura’ e ‘objecto

físico’ - (24a) e (24b), respectivamente - que se pode encontrar em nomes que partilhem as

mesmas propriedades semânticas que janela, como porta, portada, escotilha, entre outros.

CONTINENTE – CONTEÚDO

Atente-se nos seguintes exemplos:

(25) a. A Joana partiu o copo.

b. Vamos beber um copo com os amigos.

A alternância entre ‘continente’ e ‘conteúdo’, presente em (25a) e (25b),

respectivamente, exprime a propriedade que todos os nomes que denotam receptáculos

têm de denotarem quer o continente, quer, metonimicamente, o conteúdo desse

continente.

OBJECTO FÍSICO – INFORMAÇÃO

Relativamente à alternância de significados existente em nomes como livro, que

tanto podem ser interpretados como ‘objecto físico’ - (26a) - ou ‘informação contida no

objecto físico’ - (26b) - esta é extensível a nomes como revista, jornal, carta, artigo, relatório,

resumo, tese, exame, dissertação, cassete.

(26) a. O Duarte pousou o livro.

b. Este livro é muito divertido.

Page 36: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

30

ANIMAL – COMIDA

A alternância entre as interpretações contável (entidade) e massiva (substância) em

que participam nomes que denotam animais encontra-se representada nos exemplos em

(27).

(27) a. O cabrito foi amamentado por biberão.

b. A Maria comeu cabrito ao jantar.

Sendo um caso de polissemia regular, todos os nomes que denotam animais

deveriam permitir esta alternância de significados10. No entanto, é aceitável a existência

de um subconjunto de animais que são mais facilmente vistos como fontes de alimento. O

uso ou não de certos nomes de animais com o significado de massivo parece depender de

critérios sociais e pragmáticos.

(28) a. A Catarina foi à Coreia e comeu cão.

b. A semana passada provei escaravelho.

São, igualmente, critérios pragmáticos que estão na base da estranheza, ou mesmo

da não aceitação de frases como as apresentadas em (29). O significado massivo está

normalmente associado ao masculino, com algumas excepções, como é o caso de vaca,

ainda que, em algumas regiões, boi apresente também uma lexicalização para o

significado de ‘comida’ - (29e)11.

10 Línguas como o Inglês e o Francês apresentam algumas lexicalizações específicas para o significado de ‘comida’ que, normalmente, não são utilizadas com o significado de ‘animal’ , ainda que tal possa acontecer em registos dialectais ou familiares.

(1) a. John has a cow/ox/bull. (animal) b. We had a join of roast beef for lunch on Sunday. (comida)

(2) a. Pigs are often kept in a farm. (animal) b. Mary doesn’ t eat pork. (comida)

(3) a. La guerre consist uniquement à voler des poules et des cochons aux villains. (animal) b. Les musulmans et les israelites ne mangent pas de porc. (comida)

11 Contrariamente ao Português em que ocorre a lexicalização de vaca (feminino) para o significado de ‘comida’ , o Francês apresenta, para o mesmo significado, a lexicalização do masculino – boeuf.

(1) a. C’est une vache normande. (animal) b. Les boeufs attelés aux pesantes charrettes. (animal)

Page 37: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

31

(29) a. *A minha vizinha come porca todos os dias.

b. ??*O jantar vai ser ovelha estufada.

c. ??*A cabrita estava saborosa.

d. ??*Ontem comi touro/boi ao jantar.

e. O ano passado fui a um restaurante no Porto e comi boi com ervilhas.

ÁRVORE - MADEIRA

Outra alternância entre as interpretações contável e massiva diz respeito aos

nomes de árvores, que podem ser sistematicamente interpretados quer como a própria

planta, por um lado, quer como a sua madeira, por outro, como se pode ver pelos

exemplos em (30).

(30) a. A minha avó tem uma cerejeira no quintal.

b. Comprei um móvel em cerejeira.

Uma excepção ocorre com a lexicalização de pinho para a substância proveniente

da entidade pinheiro.

PEDRA PRECIOSA – MINERAL

É também sistemática a relação existente entre o significado de ‘pedra preciosa’

(contável) e o de ‘mineral’ (massivo). É o caso de diamante, rubi, safira, esmeralda, jade,

topázio, ametista, ágata, entre outros.

(31) a. O anel de noivado da Lurdes tem um diamante.

b. Muitas ferramentas industriais são construídas a partir de diamante.

(2) a. *Je ne mange pas de vache. (comida)

b. Je ne mange pas de boeuf. (comida)

Page 38: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

32

METAL – ELEMENTO

Existe, igualmente, uma relação sistemática entre o significado de ‘metal’ e o de

‘elemento’, presente em nomes como ferro, cobre, prata, ouro, platina, estanho, chumbo,

alumínio, níquel e zinco.

(32) a. As janelas eram gradeadas com um ferro ao meio.

b. O ferro pode ser encontrado sob quatro formas cristalizadas.

LOCAIS – CONJUNTO DE PESSOAS

Os nomes que denotam locais também podem alternar entre o significado locativo

e o significado que denota a população desse lugar, como se verifica em (33).

(33) a. A cidade é mais bonita à noite.

b. A cidade manifestou-se contra o presidente da Câmara.

OBJECTO - EVENTO

Nomes como almoço, jantar, banquete, refeição são sistematicamente ambíguos entre

a interpretação de ‘alimento’ e o evento que lhe está associado, como se pode observar a

partir dos exemplos em (34).

(34) a. O almoço estava saboroso.

b. O almoço foi divertido.

Page 39: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

33

PROCESSO – RESULTADO

Um último exemplo de alternâncias diz respeito a nomes deverbais que podem

manifestar tanto uma interpretação de processo, como o estado resultante desse processo.

Nomes como construção, destruição, tradução, análise, demonstração, entre outros, permitem

esta alternância, como se pode ver pelos exemplos em (35) e (36), apresentados em Lopes

(1996: 18-19).

(35) a. A construção da barragem pela EDP demorou mais tempo do que o

previsto.

b. A construção da barragem alterou irremediavelmente a paisagem.

(36) a. A tradução das Minas de Salomão por Eça de Queirós demorou mais de um

ano.

b. A tradução das Minas de Salomão de Eça de Queirós continua a ser lida

com agrado.

Note-se que, enquanto resultado, nomes como tradução, análise ou demonstração

apresentam ainda a alternância entre as interpretações de ‘informação’ e ‘objecto físico’, já

referida anteriormente para nomes como livro.

(37) a. A tradução das Minas de Salomão por Eça de Queirós está bem feita.

b. Ontem comprei a tradução das Minas de Salomão de Eça de Queirós.

(38) a. A análise de Hernâni Cidade dos Lusíadas é muito interessante.

b. A análise de Hernâni Cidade dos Lusíadas está em cima da mesa.

As alternâncias nominais apresentadas em (35) e (36) ocorrem somente com nomes

deverbais, que, por se encontrarem relacionados com os verbos dos quais derivam,

deixam transparecer as suas propriedades sintácticas e semânticas. Nos casos em questão

os nomes pressupõem o mesmo tipo de evento denotado pelo predicado verbal ao qual

estão associados.

Page 40: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

34

2.5.2. POLISSEMIA VERBAL

Os itens verbais também podem apresentar comportamentos polissémicos. Nesta

secção descrevem-se dois tipos de comportamento que os verbos polissémicos podem

apresentar: (i) a alternância causativa/incoativa; (ii) a possibilidade de selecção de

diferentes tipos de complemento.

(i) ALTERNÂNCIA CAUSATIVA/INCOATIVA

No que respeita ao estudo das alternâncias verbais, destaca-se aqui o trabalho de

Levin (1993), para o Inglês, que agrupa estes itens em classes semânticas de acordo com o

seu comportamento sintáctico, i.e., de acordo com os argumentos que seleccionam12. Das

alternâncias verbais consideradas, importa aqui salientar a alternância

causativa/incoativa. Os predicados designados causativos caracterizam-se por poderem

ocorrer tanto em estruturas transitivas como em estruturas ergativas. No entanto, em

ambas as estruturas, os significados encontram-se relacionados através de um traço de

causalidade, podendo considerar-se os verbos em causa como polissémicos.

Considerem-se os seguintes exemplos:

(39) a. A Maria ferveu a sopa.

b. A sopa ferveu.

(40) a. O João partiu o copo.

b. O copo partiu-se.

c. O copo partiu.

12 Acerca das comummente denominadas alternâncias gramaticais (i.e. contextos sintácticos distintos), Pustejovsky (1995a) argumenta que a participação de um verbo numa determinada alternância gramatical não é suficiente para determinar a sua classe semântica. Só se pode explicar o comportamento de uma determinada classe semântica se se assumir que os diferentes padrões sintácticos de uma dada alternância não são independentes da informação contida nos argumentos envolvidos nessa alternância. De um modo mais simples, a diversidade relativamente ao tipo de complementos que um verbo - ou outra categoria sintáctica - pode seleccionar é em grande parte determinada pela semântica dos próprios complementos.

Page 41: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

35

(41) a. O submarino afundou o barco.

b. O barco afundou-se.

c. O barco afundou.

Do ponto de vista sintáctico, nos exemplos em (39a), (40a) e (41a) os verbos ferver,

partir e afundar são transitivos, seleccionando um complemento com a função sintáctica de

objecto directo. No entanto, como se pode observar a partir dos exemplos em (39b), (40b,

c) e (41b, c), o mesmo verbo pode ocorrer numa construção ergativa.

Esta alternância pode ser vista como um caso de polissemia lógica, na medida em

que se considera a existência de uma relação de causalidade entre as duas construções. De

facto, parece consensual que os significados presentes em (39a), (40a) e (41a) pressupõem

os significados presentes em (39b), (40b, c) e (41b, c).

Importa salientar que as construções ergativas em (40) e (41) diferem de (39), na

medida em que, em termos sintácticos, verbos como partir e afundar apresentam

preferencialmente o clítico denominado ‘se ergativo’13 (muitos falantes atribuem um maior

grau de aceitabilidade a estruturas com o clítico do que a estruturas sem o clítico). A

questão do significado, ou ausência de significado, do clítico ‘se ergativo’ apresenta um

elevado grau de complexidade e não constitui objecto de estudo deste trabalho. Contudo,

Berkeley Cotter (2002) apresenta algumas hipóteses sobre esta questão:

“Em Português existe a possibilidade de um verbo pertencente ao PCD [Paradigma Causativo por Defeito] ser [+se] ou [-se]. A distinção passa pela possibilidade de o argumento interno poder ser, ou não, co-indexado com a causa, visto o clítico [+se] implicar agentividade.” (Berkeley Cotter, 2002: 87)14

(ii) POSSIBILIDADE DE SELECÇÃO DE DIFERENTES TIPOS DE COMPLEMENTO

Ainda dentro da classe dos verbos causativos, os predicados aspectuais começar e

acabar apresentam um comportamento polissémico, na medida em que, do ponto de vista

sintáctico, permitem a selecção de diferentes tipos de complementos. Considerem-se os

seguintes exemplos, apresentados em Berkeley Cotter (2002: 58):

13 Mateus et alii (1989: 213-217) 14 Para uma abordagem mais aprofundada sobre este assunto veja-se Berkeley Cotter (op. cit.: 63-87).

Page 42: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

36

(42) a. A Sónia começou o livro.

b. A Sónia começou a ler o livro.

c. A Sónia começou a escrever o livro.

(43) a. O Pedro acabou a cerveja.

b. O Pedro acabou de beber a cerveja.

No entanto, outros predicados que não os causativos podem ocorrer em diversos

quadros sintácticos. É o caso de querer, como se pode observar pelos exemplos em (44) e

(45).

um bolo. um cigarro. (44) O João quer uma cerveja. um livro. um filme.

comer um bolo. fumar um cigarro. (45) O João quer beber uma cerveja. ler/escrever um livro. ver um filme.

Como se verá pormenorizadamente no próximo capítulo, para explicar o

comportamento polissémico deste tipo de verbos, Pustejovsky (1995a) propõe a existência

de mecanismos generativos que permitem uma interacção entre o verbo e o seu

argumento interno.

Page 43: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

37

2.5.3. POLISSEMIA ADJECTIVAL

No que respeita à função do adjectivo, este é caracterizado por denotar um

determinado estado relativamente ao nome que modifica. No seguimento da terminologia

adoptada por Casteleiro (1981), do ponto de vista sintáctico os adjectivos são classificados

como predicativos e não predicativos. Relativamente aos adjectivos predicativos - como

alegre, bonito, calmo, alto - estes caracterizam-se essencialmente, segundo o autor, por

poderem ocorrer em frases com as propriedades contextuais ou distribucionais que se

podem observar a partir dos exemplos em (46)15.

(46) a. Adoro as paisagens calmas. (propriedade pós-nominal)

b. Adoro as calmas paisagens. (propriedade pré-nominal)

c. Adoro as paisagens muito calmas. (propriedade de grau)

d. Adoro as paisagens que são calmas. (propriedade predicativa)

Por outro lado, os adjectivos não predicativos – como campestre, citadino,

municipal, rural - não podem ocorrer em estruturas com as propriedades distribucionais

supra referidas, como se pode verificar pelos exemplos em (47)16.

(47) a. Adoro as casas rurais.

b. *Adoro as rurais casas.

c. *Adoro as casas muito rurais.

d. ?*Adoro as casas que são rurais.

15 Exemplos retirados de Casteleiro (op. cit.:53). 16 Na gramática tradicional a terminologia adoptada pode variar. Contrariamente a Casteleiro (1981), alguns autores classificam os adjectivos que se encontram na posição predicativa como atributivos, uma vez que exprimem um atributo do sujeito, enquanto os adjectivos em posição adnominal são designados epítetos. Outros estudiosos, como Demonte (1999), classificam os adjectivos como atributivos na posição adnominal e predicativos na posição predicativa. A designação de adjectivo atributivo torna-se assim ambígua, uma vez que, enquanto para alguns autores corresponde à posição predicativa, para outros corresponde à posição adnominal. Note-se, porém, que alguns adjectivos podem ocorrer tanto em posição adnominal como em posição predicativa “ ... casi todos los adjetivos que funcionan como predicados en oraciones copulativas caracterizadoras pueden ser también modificadores. No todos los adjetivos modificadores, empero, concurren en posiciones predicativas...” (Demonte (1999: 133)).

Page 44: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

38

Em Português, muitos adjectivos predicativos estão associados a significados

diferentes, conforme ocupam a posição pré-nominal ou pós-nominal.

(48) a. Ele encontrou o seu amigo rico.

b. Ele encontrou o seu rico amigo.

(49) a. A Maria é uma rapariga pobre.

b. A Maria é uma pobre rapariga.

Na posição pós-nominal - (48a) e (49a) – os adjectivos têm um valor objectivo,

também designado sentido próprio, e podem ser introduzidos por uma frase relativa, sem

qualquer alteração do seu significado.

(50) a. Ele encontrou o seu amigo que é rico.

b. A Maria é uma rapariga que é pobre.

Na posição pré-nominal – (48b) e (49b) – os adjectivos têm um valor subjectivo,

avaliativo, e o seu valor semântico não pode ser obtido a partir de frases relativas.

Crisma (1990) designa os adjectivos em posição pré-nominal como apositivos. A

sequência [Adj N] é considerada uma sequência enfática que permite expressar a opinião

do locutor e a sua atitude relativamente ao objecto designado pelo nome ao qual o

adjectivo está associado. Em contrapartida, os adjectivos em posição pós-nominal são

denominados restritivos, pois restringem o universo denotado pelo nome que modificam.

A sequência [N Adj] é considerada a ordem canónica.

No entanto, a alteração de sentido mencionada não ocorre com todos os adjectivos

predicativos, sendo indiferente, do ponto de vista do seu valor semântico, que se

encontrem em posição pré-nominal ou em posição pós-nominal.

(51) a. um livro bom

b. um bom livro

(52) a. uma bonita rapariga

b. uma rapariga bonita

Page 45: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

39

A relação entre os adjectivos apositivos e restritivos e/ou predicativos e não

predicativos constitui um problema extremamente complexo e não faz parte do objecto de

estudo deste trabalho17. O que se pretende realçar nesta secção é o facto de algumas

classes de adjectivos predicativos poderem apresentar comportamentos polissémicos

dependendo do nome que modificam e da posição que ocupam na estrutura frásica.

Trabalhos que se debruçam sobre o estudo dos adjectivos, como Bouillon (1996,

1997, 1999), observam que esta categoria, a par das já analisadas, também apresenta um

comportamento polimórfico, exprimindo significados diferentes em função dos contextos

nos quais ocorre. A autora defende que o carácter polimórfico dos adjectivos pode ter

uma origem semântica ou sintáctica. No que respeita à origem semântica esta pode estar

relacionada com a semântica do próprio adjectivo, com a semântica do nome com o qual

co-ocorre ou com a semântica resultante da composição destas duas categorias.

(53) Polimorfismo Adjectival

Semântico Sintáctico

Semântica do Adj Semântica do N Composição N-Adj

1. POLIMORFISMO SEMÂNTICO

(i) SEMÂNTICA LEXICAL DO ADJECTIVO

Bouillon (1997) defende que alguns adjectivos apresentam alternâncias

sistemáticas, como se ilustra em (54) e (55).

(54) a. Eu estou triste.

b. Este livro é triste.

c. Hoje foi um dia triste.

17 Para uma abordagem aprofundada sobre este assunto veja-se Casteleiro (op. cit.: 52-66).

Page 46: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

40

(55) a. Ele é inteligente.

b. A sua argumentação é inteligente.

O adjectivo psicológico em (54), tal como alegre ou divertido, entre outros, pode

alternar entre a interpretação de experienciador – como em (54a), em que o sujeito

expressa um estado de tristeza – e a interpretação causativa, em que se faz referência à

causa de certo estado – como em (54b, c), em que o livro/dia causa tristeza.

No que respeita ao adjectivo em (55), ou ainda hábil ou ingénuo, entre outros, este

pode denotar quer uma qualidade de um indivíduo – (55a) - quer a manifestação dessa

qualidade - (55b).

(ii) SEMÂNTICA LEXICAL DO NOME

Há contextos em que o adjectivo pode apresentar um número infinito de

significados, dependendo do nome que modifica. Considere-se, primeiramente, o

adjectivo bom, analisado em Saint-Dizier (1999) como sendo um dos adjectivos mais

polissémicos no Francês. No caso do Português, este é igualmente um dos adjectivos mais

polissémicos. Os seguintes exemplos são retirados do DLPC18.

(56) a. A fruta já não está boa. (que está são ou em perfeito estado)

b. Um bom livro. (que está bem concebido)

c. Um bom investimento. (que traz vantagens)

d. É bom passear pela cidade. (que dá prazer)

e. Uma boa caldeirada. (que é agradável ao paladar ou ao olfacto)

f. Um remédio bom para as dores de dentes. (que tem as qualidades necessárias a

um determinado fim)

g. Um problema bom de resolver. (que se faz com facilidade)

h. Uma pessoa boa. (que apresenta qualidades morais)

i. Um bom médico. (que desempenha bem as suas funções)

18 Dicionário da Língua Portuguesa Contemporânea, Academia das Ciências de Lisboa/Editorial Verbo, 2001.

Page 47: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

41

j. Esperou uma boa hora e ninguém apareceu. (que indica uma quantidade)

k. Uma boa bofetada. (que é forte, intenso, violento)

l. “se o virem chegar com bom fato, bom chapéu, boa corrente de ouro, não o

tomarão por qualquer peneira, (...)” (que se distingue pela qualidade)

m. Precisa-se de uma boa faca. (que tem as qualidades que se esperam, de

acordo com a sua natureza ou função)

O mesmo fenómeno de “proliferação” de significados está presente em adjectivos

como rápido ou difícil, como se pode verificar pelos exemplos em (57) e (58).

(57) a. um desporto rápido (que envolve movimentos rápidos)

b. um carro rápido (que permite que seja conduzido rapidamente)

c. uma dactilógrafa rápida (que dactilografa rapidamente)

d. um livro rápido (que se lê rapidamente)

(58) a. Este é um texto difícil. (de compreender)

b. O Pedro é uma criança difícil. (de educar)

c. Esta é uma vida difícil. (de viver)

Os adjectivos pertencentes a uma mesma classe semântica19 podem apresentar

algumas semelhanças no que respeita ao comportamento polissémico. Podem encontrar-

19 Para além das classes determinadas a partir do comportamento sintáctico dos adjectivos, estes também podem ser distinguidos tendo em conta o seu significado. Dixon (1991) propõe o estabelecimento das seguintes classes:

DIMENSÃO (grande, pequeno, largo, comprido, curto); PROPRIEDADE FÍSICA (duro, macio, pesado, leve); COR (vermelho, verde, amarelo); PROPRIEDADE HUMANA (ciumento, feliz, orgulhoso, cruel); IDADE (jovem, velho, novo); VALOR (bom, mau, excelente, delicioso); VELOCIDADE (rápido, lento); DIFICULDADE (difícil, fácil); SEMELHANÇA (parecido, semelhante); QUALIFICAÇÃO (possível, provável).

A par da classificação anterior, Demonte (1999) propõe uma divisão dos adjectivos qualificativos (segundo a classificação da autora, os adjectivos qualificativos expressam uma propriedade que se refere à constituição do nome que modificam - cor, forma, idade, etc.), estabelecendo sete classes: DIMENSÃO, VELOCIDADE, PROPRIEDADE FÍSICA, COR, IDADE, PREDISPOSIÇÃO HUMANA E ATITUDE e AVALIATIVOS.

O agrupamento dos adjectivos em classes semânticas varia consoante os autores. No entanto, realça-se o facto de algumas classes se manterem relativamente constantes.

Page 48: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

42

se os significados patentes em bom noutros adjectivos avaliativos, como, por exemplo,

excelente ou mau – de acordo com a classificação de Dixon (1991) - como se pode ver a

partir dos exemplos em (59). Do mesmo modo, podem encontrar-se os mesmos

significados patentes em rápido noutros adjectivos de velocidade, como lento ou veloz,

como se observa a partir dos exemplos em (60). No entanto, pode acontecer que nem

todos os significados resultantes da co-ocorrência de um determinado adjectivo com um

determinado item nominal sejam partilhados por todos os adjectivos da sua classe,

quando associados ao mesmo item nominal, como é o caso de (59e) e (60d).

(59) a. um mau/excelente livro

b. um mau/excelente investimento

c. uma pessoa má/excelente

d. um mau/excelente médico

e. *Esperou uma má/excelente hora e ninguém apareceu.

(60) a. um desporto lento/veloz

b. um carro lento/veloz

c. uma dactilógrafa lenta/veloz

d. ??*um livro lento/veloz

Os exemplos de (56) a (60) ilustram que os diferentes significados adquiridos

pelos adjectivos dependem da semântica do nome que modificam20.

Pustejovsky (1995a) argumenta que o agrupamento dos adjectivos em classes deste tipo pode ser bastante

útil para fins descritivos, mas não revela muito acerca das suas propriedades semânticas e sintácticas, podendo agrupar itens com comportamentos sintácticos distintos. 20 Num estudo baseado em corpora, Saint-Dizier (1998b) sustenta que os adjectivos pertencentes às classes semânticas AVALIATIVA (bom, grande, caro), LOCATIVA (central, exterior) e FORMA (redondo, rectangular) são os mais polissémicos. Em contrapartida, os adjectivos pertencentes às classes TÉCNICA (químico), ASPECTUAL (final) e de NACIONALIDADE (internacional) são os menos polissémicos. As classes semânticas de adjectivos são definidas pelo autor e não correspondem às apresentadas por Dixon (1991).

Page 49: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

43

(iii) COMPOSIÇÃO NOME - ADJECTIVO

Como já foi referido anteriormente, o mesmo adjectivo pode ter significados

diferentes conforme se encontra em posição pré-nominal - apositivos - ou pós-nominal -

restritivos. Ao analisar para o Francês o adjectivo velho (‘vieux’), Bouillon (1999) distingue

entre o que designa de adjectivo RELATIVO e adjectivo MODIFICADOR DE PROPRIEDADE. Nas

estruturas em que o adjectivo se encontra em posição pós-nominal - N Adj - o adjectivo é

considerado relativo, implicando que a entidade modificada seja um N e um Adj, como

ilustram os exemplos em (61).

(61) a. A Ana é a minha amiga velha. (de idade avançada)

→ A Ana é amiga.

→ A Ana é velha.

b. O João é um arquitecto falso. (que é velhaco)

→ O João é arquitecto.

→ O João é falso.

No entanto, o mesmo não acontece em estruturas em que o adjectivo se encontra

em posição pré-nominal - Adj N - ou seja, quando ele é modificador de propriedade.

Como se pode observar pelo exemplo (62a) não é necessariamente verdade que a entidade

denotada pelo N tenha a propriedade denotada pelo Adj, ainda que essa interpretação

seja igualmente possível. De facto, pode mesmo acontecer que a entidade modificada pelo

adjectivo não seja nem a entidade denotada pelo N nem tenha a propriedade denotada

pelo Adj, como se verifica em (62b).

(62) a. A Ana é a minha velha amiga. (de longa data)

→ A Ana é amiga.

→ (#)A Ana é velha.

b. O João é um falso arquitecto. (que não tem as aptidões que finge ter)

→ #O João é arquitecto.

→ #O João é falso.

Page 50: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

44

Como se pode verificar, neste caso, a alteração de significado resulta da posição

do adjectivo relativamente ao mesmo nome, realçando diferentes aspectos da semântica

do nome.

2. POLIMORFISMO SINTÁCTICO

Tal como os verbos, também os adjectivos podem ocorrer em contextos

sintácticos distintos, como ilustram os exemplos (63). Neste caso, os diferentes contextos

sintácticos não implicam necessariamente uma alteração de significado do adjectivo,

ainda que tenhamos, nos exemplos contemplados, uma interpretação de experienciador -

(63a), (63b), (63c) e (63d) - e uma interpretação causativa - (63e) e (63f).

(63) a. Este homem está triste.

b. Este homem está triste por tu partires.

c. Este homem está triste por partir.

d. Ele é um homem triste.

e. Partir é triste.

f. É triste que tu partas.

A partir da análise efectuada pode observar-se que, de um ponto de vista

sintáctico, os adjectivos podem ocorrer como modificadores de um nome (um livro triste)

ou em estruturas predicativas com verbos copulativos, como ser (este livro é triste). De um

ponto de vista semântico, os adjectivos apresentam um comportamento polimórfico

notório, cuja origem pode dever-se, fundamentalmente, à semântica do próprio adjectivo

(alternando entre interpretações de experienciador e causativas, podendo modificar

nomes que denotem indivíduos, objectos ou eventos), à semântica do nome que modifica

(adquirindo significados distintos de acordo com o item nominal que modifica) ou à

posição do adjectivo relativamente ao nome que modifica (realçando aspectos distintos da

semântica do mesmo item nominal).

Page 51: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

2. PROBLEMÁTICA

45

Como podem as relações existentes entre os vários significados dos itens

polissémicos aqui descritos ser representadas no léxico, de modo a permitir o acesso a

todas as suas interpretações? É o que se discutirá no próximo capítulo.

Page 52: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

46

Page 53: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO

GENERATIVO

... the form that a lexicon takes influences the overall design and structure

of the grammar.

(Pustejovsky, 1995a: 33)

Uma das preocupações centrais da investigação no âmbito da Semântica Lexical

Computacional reside na concepção de um modelo que permita representar a

ambiguidade lexical descrita no capítulo anterior. Em termos gerais, três abordagens

merecem particular atenção: (i) a enumeração de sentidos, que lista exaustivamente, tanto

quanto possível, todos os sentidos de uma palavra, em entradas lexicais distintas; (ii) as

regras lexicais, que geram significados derivados a partir de um significado-base; (iii) o

modelo do Léxico Generativo, que permite captar todos os significados de um item

através da interacção de mecanismos generativos com a informação especificada na sua

entrada lexical.

Page 54: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

48

3.1. LÉXICO ENUMERATIVO DE SENTIDOS

“Treating the lexicon as an enumerative listing of word senses has been the predominate view...” (Pustejovsky, 1995b: 74)

A forma mais directa, e tradicionalmente utilizada, de representar um item lexical

consiste na enumeração exaustiva de todos os seus significados. Cada sentido distinto

corresponde a uma entrada lexical distinta. Este modo de listar os significados das

palavras é normalmente referido como Léxico Enumerativo de Sentidos (LES), e é

utilizado, no âmbito de uma abordagem lexicográfica tradicional, por alguns modelos

teóricos e computacionais. No seguimento de Pustejovsky (1995a), um LES é caracterizado

da seguinte forma:

(1) Um léxico L é um Léxico Enumerativo sse para cada palavra w em L, com

múltiplos sentidos s1, ... , sn, existir uma entrada lexical distinta para cada

sentido: ws1, ... ,wsn.1

Um exemplo clássico da utilização de técnicas enumerativas de sentidos diz

respeito aos artigos de dicionário. Analisem-se os exemplos apresentados em (2), bem

como a figura 1, que representa o verbete abreviado do item banco, de acordo com o

DLPC2.

(2) a. A Maria foi buscar um banco para se sentar.

b. Este é o banco no qual deposito o meu dinheiro.

c. O banco fica ao lado do supermercado.

1 Traduzido de Pustejovsky (1995a: 34). 2 Dada a extensão dos verbetes, optou-se por omitir algumas abonações e registar apenas a definição das acepções sem os agrupamentos composicionais (colocações, combinatórias e expressões idiomáticas).

Page 55: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

49

banco [bα��ku]. s.m. (Do ger. bank). 1. Assento estreito e comprido, de material variável, com ou sem encosto, para várias pessoas. No jardim havia bancos pintados de verde, onde os mais velhos se sentavam a ler o jornal. (...). 2. Assento para uma pessoa , sem encosto, de tampo redondo ou quadrado, sustentado por três ou quatro pés. � MOCHO. Comprou na feira dois bancos para a cozinha e um banco baixinho para descansar os pés. (...). 3. Assento comprido e largo, com encosto alto, de tampo amovível, que

pode servir também de tampa de uma arca. � ARQUIBANCO, ESCABELO, ESCANO. 4. Prancha comprida, sustentada por quatro pés, ou mesa de trabalho onde se fixam as peças em que se trabalha, especialmente em

marcenaria, carpintaria e serralharia � BANCADA. (...). 5. Elevação do fundo do mar ou dum rio por acumulação de areias, de rochas, de

detritos e que pode aflorar à superfície durante a maré baixa. � BAIXIO, BAIXO. Naquela zona havia vários bancos de areia que dificultavam a entrada e a saída das embarcações. (...). 6. Massa de gelo de grande altura, flutuando à superfície do mar. 7. Geol. camada ou estrato de aglomeração de detritos de rocha, de conchas fósseis ou de matérias sólidas. 8. Pesc. Grande quantidade de peixes que se encontram perto da costa, especialmente na época da desova. � CARDUME. Um banco de sardinha. 9. estabelecimento particular ou estatal, cuja actividade se centra no depósito e empréstimo de valores, transacções de fundos... «Houve [...] muitas pessoas que retiraram do banco as suas pequenas poupanças. » (PF, 971). (...) 10. edifício onde funciona esse estabelecimento. Pararam a conversar em frente do banco. (...). 11. Estabelecimento clínico onde se recolhem órgãos ou substâncias do organismo humano, para posterior utilização. (...).

Fig. 1. Verbete banco do DLPC

O verbete da figura 1 ilustra como, numa abordagem enumerativa, os diferentes

sentidos do item banco são exaustivamente listados. Fazendo corresponder os diferentes

significados de banco apresentados em (2) à entrada correspondente no verbete, o DLPC

regista na acepção número 2 o significado correspondente a (2a), na acepção número 9 o

significado correspondente a (2b) e na acepção número 10 o significado correspondente a

(2c).

No entanto, e para além da dificuldade muitas vezes encontrada em listar todos os

diferentes significados de uma palavra – uma vez que é sempre possível que esta adquira

novos significados em novos contextos - outro dos principais problemas das técnicas

enumerativas de sentidos reside no facto de estas não captarem as relações semânticas

sistemáticas existentes entre os significados dos itens polissémicos.

“it [polysemy] demands the impossible task of enumerating in advance all the senses which might be associated with a lexical form.” (Verspoor, 1997a: 219)

Page 56: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

50

De facto, a partir da observação do verbete de banco, pode constatar-se que não há

qualquer forma de distinguir a relação polissémica existente entre as acepções 9 e 10, da

relação de homonímia existente relativamente às restantes acepções.

Dada a discriminação de todos os significados, uma abordagem enumerativa não

permite, deste modo, captar os significados de estruturas como as apresentadas em (3),

em que banco denota simultaneamente os significados de ‘instituição’ e de ‘edifício’.

(3) O banco no qual deposito o meu dinheiro fica ao lado do supermercado.

Pustejovsky (1995a) apresenta exemplos da abordagem enumerativa sob a forma

de estruturas de traços3. As estruturas em (4), (5) e (6) ilustram, do mesmo modo, como os

três significados da palavra banco, apresentados em (2), são representados através de

entradas distintas.

(4)

���

���

==

assento

contável nome

banco

GENUS

CAT

1

(5)

���

���

==

financeira oinstituiçã

contável nome

banco

GENUS

CAT

2

3 A informação acerca dos itens lexicais pode ser codificada em estruturas de traços organizadas em matrizes atributo-valor (MAV), como as utilizadas em formalismos como a HPSG (Pollard & Sag, 1994). Cada MAV é composta por pares atributo: valor, onde o atributo (ou traço) é expresso em maiúsculas e o seu valor em minúsculas. Este último pode ser atómico ou constituído por outras estruturas de traços.

(i)

���

���

��

���

�=

=

=

=

dd

ccb

aa

valor ATRIBUTO

valor ATRIBUTOATRIBUTO

valorATRIBUTO

Page 57: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

51

(6)

���

���

==

edifício

contável nome

banco

GENUS

CAT

3

Em que o traço CAT designa a categoria gramatical da palavra e o traço GENUS designa, basicamente, o significado da palavra.

Este tipo de representação pode ser aplicada a expressões homónimas (banco1 vs

banco2 e banco3). No entanto, não parece ser a mais adequada no que respeita à

representação de expressões polissémicas em que, contrariamente à homonímia, os

diferentes significados se encontram estreitamente relacionados, como é o caso de banco2

e banco3.

Do mesmo modo que se verificou com a enumeração de sentidos exposta no

verbete da figura 1, as representações apresentadas em (4), (5) e (6) parecem, igualmente,

indicar que a relação entre os significados de banco2 e banco3 são comparáveis à relação

(ou ausência dela) existente entre estes e os significados de banco1, o que não é o caso. Ou

seja, também não parece ser possível representar, através deste tipo de entrada, a relação

semântica sistemática existente entre os diferentes significados das expressões

polissémicas.

Uma alteração possível à abordagem dos Léxicos Enumerativos, que permite

distinguir os casos de homonímia dos de polissemia, consiste na representação dos vários

significados numa única entrada lexical para os itens polissémicos, evitando-se, deste

modo, a proliferação de entradas lexicais.

(7)

���

���

==

assento

contável nome

banco

GENUS

CAT

1

Page 58: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

52

(8)

��������

��������

��

���

��

���

=

==

=

==

edifício

contável nome

oinstituiçã

contáve nome

banco

GENUS

CAT OSIGNIFICAD

GENUS

l CAT OSIGNIFICAD

2

1

2

Deste modo, no seguimento de (Pustejovsky, 1995a), haverá que proceder a uma

reformulação da definição de Léxico Enumerativo apresentada em (1) supra, de modo a

dar conta desta distinção respeitante ao armazenamento dos diferentes significados.

(9) Um léxico L é um Léxico Enumerativo sse a cada palavra w em L, com

múltiplos sentidos s1, ... , sn:

(i) s1, ... , sn corresponderem a significados de palavras homónimas, não

apresentando qualquer relação semântica, e houver uma entrada lexical

distinta para cada significado, representada como ws1, ... ,wsn;

(ii) s1, ... , sn corresponderem a significados de palavras polissémicas,

apresentando uma relação semântica, e houver uma única entrada lexical que

lista todos os significados possíveis, representada como w{s1, ..., sn}.4

Esta é uma abordagem comum, que visa o estabelecimento de um conjunto finito

de significados e, em cada contexto, a selecção do mais apropriado. No entanto, não só

essa selecção envolve níveis de complexidade computacionalmente insatisfatórios, como a

própria enumeração de sentidos nem sempre é uma questão trivial:

“... there are three basic arguments showing the inadequacies of SELs [Sense Enumerative Lexicons] for the semantic description of language. (1) THE CREATIVE USE OF WORDS: Words may assume new senses

in novel contexts. (2) THE PERMEABILITY OF WORD SENSES: Word senses are not

atomic definitions but overlap and make reference to other senses of the word.

(3) THE EXPRESSION OF MULTIPLE SYNTACTIC FORMS: A single word sense can have multiple syntactic realization.” (Pustejovsky, 1995a: 39)

4 Traduzido de Pustejovsky (1995a: 38).

Page 59: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

53

Um léxico fixo dificilmente dá conta de fenómenos de metonímia, metáfora ou

transferência de significados (Nunberg, 1995), cuja referência se encontra dependente do

contexto.

“Given the fact that reference transfer is an entirely context-dependent phenomenon, it is difficult to see how it could plausible be accounted for in terms of a fixed lexicon” (Verspoor, 1997a: 220)

A produtividade e dinamismo das línguas tornam as abordagens enumerativas

inadequadas tanto a nível estritamente linguístico, como a nível computacional. A

enumeração de significados trata o léxico como um repositório estático de informação, ao

qual se pode aceder, mas que, por ser um componente independente da gramática, não

interage com quaisquer processos gramaticais ou pragmáticos.

Outra desvantagem importante reside na falta de economia. Esta enumeração tem

como resultado uma lista exaustiva de significados que, em termos computacionais,

requer muito espaço - memória, com custos importantes a nível de eficiência do sistema.

3.2. REGRAS LEXICAIS

Em oposição à abordagem enumerativa apresentada anteriormente, os diferentes

significados podem ser derivados através de regras lexicais aplicadas a entradas lexicais

específicas. Permitindo gerar significados a partir de um significado-base, as regras

lexicais têm um papel central numa concepção dinâmica do léxico.

Se um sistema computacional captar uma regra que determine que ‘um nome

contável que denota um animal pode ser usado como um nome massivo que denota a

carne desse animal’, então terá uma base que lhe vai permitir distinguir significados como

os apresentados em (10).

(10) a. O João costuma passear o cão aos fins-de-semana.

b. Ontem comemos cão ao jantar.

Page 60: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

54

De modo a dar conta do fenómeno de polissemia regular, as instanciações desta

regra [animal → comida] irão permitir processar correctamente estruturas como as

representadas em (11).

(11) a. Ontem provei lagarto.

b. O coala estava delicioso.

Copestake & Briscoe (1992, 1995) propõem um conjunto de operações lexicais

baseadas em estruturas de traços, com a seguinte representação esquemática:

(12)

���

���

==

calsigno_lexi 0

calsigno_lexi 1

lexical_regra

Todas as regras lexicais têm de ter os traços 1 e 0 aos quais vão corresponder

valores do tipo signo_lexical. Estas regras vão ter como input a estrutura de traços presente

em 1 e como output a estrutura de traços presente em 0, que vai corresponder ao novo

significado gerado.

Retomando a alternância ANIMAL - COMIDA, a regra em (13) ilustra como a

estrutura de traços que tem como input o significado de ‘animal’ vai ter como output o

significado de ‘comida’. A operação lexical também dá conta da alteração de nome

contável para nome massivo.

(13) animal_comida � regra_lexical

���������������

���������������

���

���

⊃===

������

������

��

���

+=⊃

=

==

substância stânciacomida_sub

vonome_massi

0

dividualobjecto_in animal

velnome_contá

1

idaanimal_com

RQS

1ORTH

COMESTÍVELRQS

1ORTH

Page 61: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

55

Em que ORTH significa orthography e RQS significa Relativised Qualia Structure (Calzolari, 1991).

O efeito desta regra consiste na transformação de um nome contável que denota

um animal num nome massivo que denota uma substância. A componente principal desta

regra consiste numa operação sintáctica, na medida em que afecta a realização sintáctica

do item possibilitando a sua ocorrência sem determinante, co-relacionada com uma

operação semântica subespecificada.

O uso de regras lexicais está dependente de um léxico estruturado.

“... it depends on a lexicon in which various generalisations are captured about the semantic classes which words in the lexicon belong to (e.g. animal nouns). (...) It is difficult to imagine a semantic motivated way of defining the appropriate input to a rule in the absence of represented semantic relationships between words. Lexical rules would be extremely difficult to formulate under a unstructured multiple lexical entry view of the lexicon, in which entries are not grouped into classes.” (Verspoor, 1997a: 221)

Uma das grandes questões relativamente ao uso de regras lexicais diz respeito à

necessidade de evitar ambiguidades desnecessárias que possam ser geradas por estas

regras. É necessário, assim, bloquear a geração de algumas regras lexicais. A aplicação de

uma regra é bloqueada se já existir no léxico uma palavra que possa estar no lugar do

suposto output. Existem dois tipos de bloqueio: pre-emption5 semântico - que ocorre

quando o significado que vai ser gerado já está lexicalizado noutra palavra (a lexicalização

de vaca para o significado de ‘comida’ bloqueia a geração de boi para o mesmo significado)

- e pre-emption lexical - que ocorre quando a palavra que vai ser gerada já existe no léxico

com outro significado.

Ostler & Atkins (1992) propõe que as regras devem ter uma direccionalidade

definida e que o fenómeno de bloqueio pode ser formulado através de restrições na

aplicação das regras.

Uma das questões centrais que resulta da assunção da direccionalidade das regras

lexicais consiste em determinar qual é o significado-base e qual é o significado derivado.

5 Dada a dificuldade em encontrar termos equivalentes em Português, adoptou-se a terminologia da versão original.

Page 62: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

56

Saint-Dizier (1998b) defende que o significado base é aquele que é mais usado e,

provavelmente, historicamente o mais antigo.

“... it is often the most usual usage which is the most primitive, probably the most concrete one, often one of the most widely used and also possibly historically and ontogenetically the oldest (...).” (Saint-Dizier, 1998b: 125)

Kilgarriff (1992) defende que há casos em que, numa relação sistemática, alguns

itens são mais proeminentes em certas instanciações do que outros. No caso da alternância

ÁRVORE-MADEIRA, os itens cerejeira e nogueira, por exemplo, têm como significado mais

saliente o de ‘árvore’, enquanto itens como faia e mogno têm como significado mais

saliente o de ‘madeira’. O mesmo acontece com a alternância ANIMAL-COMIDA, em que

para peru o significado de ‘comida’ é mais saliente, ao contrário de cão, em que o

significado mais saliente é o de ‘animal’. Na sua ontologia, Kilgarriff dá conta deste

fenómeno exprimindo as alternâncias em ambos os nós (relaciona o nó árvore com o nó

madeira e vice-versa), o que se torna desnecessariamente redundante.

Por outro lado, Copestake & Briscoe (1992, 1995) propõem adicionar às regras

lexicais uma condição probabilística, baseando-se na frequência dos significados de cada

item, e que vai reflectir o modo como esse item é usado num determinado contexto6.

Uma vez que as regras lexicais geram significados derivados a partir de

significados-base, estes significados vão estar associados a frequências diferentes,

podendo mesmo acontecer que, para algumas palavras, o significado derivado tenha uma

frequência mais alta que o significado-base. É o caso de peru, já referido anteriormente, em

que o significado derivado (‘comida’) ocorre com mais frequência que o significado-base

(‘animal’).

A informação sobre a frequência de ocorrência dos significados dos itens parece,

desta forma, não ser um critério para a definição do significado-base e do significado

derivado (uma vez que pode acontecer que os significados derivados tenham uma

frequência mais alta que os significados-base), mas apresenta alguma utilidade, na

medida em que reflecte o uso desses significados num determinado contexto.

A nível computacional, os parsers podem beneficiar desta informação estatística

para melhorar o seu processamento. Os itens polissémicos podem ser inicialmente 6 Kilgarriff (1997b) refere que alguns dicionários de língua inglesa, nomeadamente o Longman Dictionary of Contemporary English (3rd Edition, 1995) e o Collins Cobuild English Dictionary (New Edition, 1995), também incorporam informação acerca da frequência de um item a partir de corpora.

Page 63: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

57

processados com base na frequência mais alta dos seus significados. A frequência mais

baixa será posteriormente escolhida no caso de conflitos sintácticos ou de subsequentes

processos pragmáticos, que determinarão que esse é o significado adequado.

Uma outra proposta é a de Ostler & Atkins (1992) que estabelece um conjunto de

cerca de 130 tipos de alteração sistemática de significado, denominados REGRAS DE

IMPLICAÇÃO LEXICAL (RIL), e que podem definir-se esquematicamente como se segue:

(14) CL1 [...α...]: [CS1 [...σ...] → CL1/CL2 [...α...]: [CS2 [...t...]

De acordo com este esquema, um item lexical é composto por uma componente

lexical (CL) - que contém informação fonológica, ortográfica, morfológica e sintáctica (α) -

e por uma componente semântica (CS) - que expressa as propriedades semânticas e o

significado do item lexical (σ/t). A aplicação das RIL pode ou não alterar a componente

lexical, mas altera sempre a componente semântica. De (15) a (19) encontram-se alguns

exemplos destas regras. Note-se que em (15) e (19) só se verifica alteração a nível

semântico. No entanto, de (16) a (18) existe alteração a nível sintáctico. Em (16) e (17)

verifica-se uma transição de nome contável (NC) para nome massivo (NM). Em (18)

verifica-se uma transição de verbo transitivo para verbo ergativo.

(15) NC: continente → NC: conteúdo

a. O João partiu a garrafa.

b. Não bebas a garrafa toda.

(16) NC: animal → NM: carne desse animal

a. O cabrito corre pelo prado.

b. A Maria não come cabrito.

(17) NC: árvore → NM: madeira

a. O João está escondido atrás do carvalho.

b. Esta mesa é de carvalho.

Page 64: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

58

(18) V Transitivo: causativo → V Ergativo: incoativo

a. A Rita ferveu o leite.

b. O leite ferveu.

(19) Adj: experienciador → Adj: causa

a. O João está triste.

b. Foi um dia triste.

A aplicação das RIL também pode ser bloqueada, através de pre-emption, a nível da

CS, quando o output resultante já estiver lexicalizado noutro item. É o caso da já

mencionada alternância ANIMAL – COMIDA, em que o significado de ‘comida’ para boi, já

está lexicalizado em vaca.

Uma das propriedades das RIL reside no facto de poderem ser específicas de uma

determinada língua ou dialecto, uma vez que a alternância de significados de uma classe

de palavras pode ser específica de uma língua e não universal.

3.3. LÉXICO GENERATIVO

O Léxico Generativo (LG) consiste num modelo de Semântica Lexical que permite

situar os casos de polissemia regular e fenómenos associados (metonímia, metáfora,

extensão de significados) na interface entre o significado lexical e o significado

composicional.

As entradas lexicais contêm idealmente toda a informação (sintáctica e semântica)

considerada necessária para a caracterização das unidades lexicais. Esta informação

encontra-se especificada em vários níveis de representação, que se relacionam de algum

modo, mas que não são dependentes uns dos outros. Interagindo com estes componentes

existe ainda um conjunto de mecanismos generativos que permitem captar a variação de

significado em função do contexto.

“What we hope to achieve is a model of meaning in language that captures the means by which words can assume a potentially

Page 65: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

59

infinite number of senses in context, while limiting the number of senses actually stored in the lexicon”.(Pustejovsky, 1995a: 105)

Dadas as virtualidades deste modelo, o LG é pormenorizadamente apresentado

nas secções seguintes.

3.3.1. NÍVEIS DE REPRESENTAÇÃO

Tendo como objectivo fornecer uma descrição formal da língua que seja expressiva

e flexível o suficiente para captar a natureza generativa da criatividade lexical e os

fenómenos de extensão de significado, o LG envolve quatro níveis de representação:

1. ESTRUTURA ARGUMENTAL (A)

Especifica o número e o tipo de argumentos de um predicado, bem como o

modo como eles se realizam sintacticamente.

2. ESTRUTURA EVENTIVA (E)

Especifica o tipo do evento (estado, processo ou transição) associado a uma

expressão lexical ou sintáctica.

3. ESTRUTURA QUALIA (Q)

Codifica os aspectos essenciais da semântica das unidades lexicais,

estabelecendo a relação entre as duas primeiras estruturas (A e E), através dos

papéis constitutivo, formal, télico e agentivo.

4. ESTRUTURA DE HERANÇA LEXICAL (H)

Estabelece a relação entre uma estrutura lexical e outras estruturas lexicais

num dado reticulado.

A interagir com estes quatro níveis de representação, existe um conjunto de

mecanismos generativos que permite a interpretação composicional das unidades lexicais

em contexto:

Page 66: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

60

(i) COERÇÃO DE TIPO

Um item lexical, ou um sintagma, é “coagido” a uma determinada

interpretação semântica através de um item regente (functor), sem qualquer

alteração do seu tipo sintáctico.

(ii) CO-COMPOSIÇÃO

Múltiplos elementos de um sintagma comportam-se como functores,

gerando novos significados não-lexicalizados para as palavras que fazem

parte da composição.

(iii) LIGAÇÃO SELECTIVA

Um item lexical ou sintagma operam especificamente na subestrutura de

outro sintagma, sem qualquer alteração do tipo da estrutura.

Estes mecanismos de composição semântica, explicados mais

pormenorizadamente na secção 3.3.4, são fundamentais para captar a relação semântica

existente entre expressões sintacticamente distintas.

Ao definir o comportamento funcional dos itens lexicais em diferentes níveis de

representação, espera-se chegar a uma caracterização do léxico como um componente

activo na composição dos significados em contexto. Os mecanismos generativos

envolvidos, que permitem obter o significado atribuído a uma dada expressão num dado

contexto, contribuem para que esta abordagem reúna toda a informação relativa a um

item lexical numa meta-entrada (que permite prever todas as regularidades de

comportamento desse item quando contextualizado) e, como resultado, reduza o número

de entradas no léxico. Essas meta-entradas denominam-se PARADIGMAS LÉXICO-

CONCEPTUAIS (PLC).

Page 67: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

61

3.3.1.1. ESTRUTURA ARGUMENTAL

A estrutura argumental, definida como uma especificação dos argumentos de um

predicado (número de argumentos, tipo sintáctico e semântico, realização sintáctica), foi

objecto de investigação importante no âmbito da semântica lexical, particularmente dos

estudos sobre a interface sintaxe-semântica. O que originalmente começou por ser uma

lista simples dos argumentos associados a um predicado desenvolveu-se numa visão

sofisticada do modo como os argumentos são projectados na estrutura sintáctica.

No quadro do modelo de Princípios e Parâmetros (Chomsky, 1981), por exemplo,

o Princípio de Projecção requer que os argumentos sejam expressos como constituintes

sintácticos em todos os níveis de representação sintáctica7.

Uma das mais recentes e importantes contribuições para a teoria da gramática

consiste na assunção de que a estrutura argumental é altamente estruturada e

independente da sintaxe. Trabalhos como Grimshaw (1990) sustentam que a estrutura

argumental é hierarquicamente estruturada, estabelecendo e definindo relações de

proeminência entre os argumentos de um predicado.

Pustejosvky (1995a) propõe um nível de representação independente para a

estrutura argumental dos itens lexicais e distingue quatro tipos de argumentos:

(i) ARGUMENTOS VERDADEIROS

Os argumentos verdadeiros satisfazem os requisitos do Princípio de Projecção e do

Critério Temático da Teoria de Princípios e Parâmetros (Chomsky 1981, 1986a), sendo que

a sua realização sintáctica é obrigatória. A sua não realização induz normalmente

agramaticalidade, como se exemplifica em (20a) e (20b).

(20) a. *O João pôs.

b. *O João pôs o livro.

c. O João pôs o livro na prateleira.

7 “Representations at each syntactic level (i.e. LF and D- and S-structure) are projected from the lexicon, in that they observe the subcategorization properties of lexical items.” Chomsky (1981: 29).

Page 68: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

62

(ii) ARGUMENTOS POR DEFEITO

Os argumentos por defeito são considerados implícitos por estarem já expressos

nos qualia do item lexical. Só têm realização sintáctica em função de factores contextuais

ou discursivos, sendo, por isso, opcionais.

(21) a. O João construiu uma casa com tijolos/de madeira.

b. O João construiu uma casa.

(iii) ARGUMENTOS-SOMBRA

Os argumentos-sombra estão semanticamente incorporados no item lexical e só

são expressos em determinadas condições, nomeadamente em casos especificação do

discurso.

(22) a. O João pintou o quarto.

b. *O João pintou o quarto com tinta.

c. O João pintou o quarto com tinta lavável.

Denotando pintar “cobrir com tinta”, a realização de com tinta em (22b) é

redundante, tornando a expressão agramatical. No entanto, num caso de introdução de

uma maior especificação, como em (22c), a realização do argumento em causa já é

aceitável.

(iv) ADJUNTOS VERDADEIROS

Os adjuntos são modificadores - de que são exemplo os temporais e os locativos -

que fazem parte da interpretação situacional de uma expressão, mas que não estão ligados

à representação específica de um item lexical. Como tal, a sua realização é opcional.

Page 69: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

63

(23) a. A Maria dormiu até tarde no domingo.

b. O Rui falou com o João no comboio.

A codificação da informação sobre os argumentos é feita através de uma estrutura

de traços como a apresentada em (24). Os traços ARG1 e ARG2 representam os tipos dos

argumentos verdadeiros. ARG-D vale por argumento por defeito e ARG-S por

argumento-sombra.

(24)

��������

��������

����

����

==

==

=

...

...

...

...

...

S -ARG

D-ARG

ARG

ARG

ESTR_ARG2

1

Deste modo, para os verbos mencionados anteriormente teremos as representações

informais apresentadas de (25) a (27)8.

(25)

������

������

���

���

===

=

...

local

sicoobjecto_fí

animadoindivíduo_

pôr

3

2

1

ARG

ARG

ARG

ESTR_ARG

(26)

������

������

���

���

===

=

...

matéria

artefacto

animadoindivíduo_

construir

D-ARG

ARG

ARG

ESTR_ARG 2

1

8 Por motivos de economia, em cada representação apresentada optou-se por incluir apenas os atributos relevantes para a análise do fenómeno em questão.

Page 70: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

64

(27)

������

������

���

���

===

=

...

tinta

sicoobjecto_fí

animadoindivíduo_

pintar

S-ARG

ARG

ARG

ESTR_ARG 2

1

3.3.1.2. ESTRUTURA EVENTIVA

Um predicado denota um determinado tipo de evento, entendido como uma

situação ou acontecimento, em que participam os seus argumentos. No seguimento de

Vendler (1967), Dowty (1979), Moens & Steedman (1988), Pustejovsky (1991) e Marrafa

(1993), entre outros, consideram-se aqui três tipos de eventos primitivos: ESTADOS (E),

PROCESSOS (P) e TRANSIÇÕES (T).

Um ESTADO pode ser informalmente definido como um evento atómico, alargado

no tempo, não se fazendo referência ao seu início nem ao seu fim, e não avaliado em

relação a qualquer outro.

Um PROCESSO consiste numa sequência de eventos idênticos (iteração), que pode

apresentar uma culminação ou não, em relação, geralmente, com a presença ou ausência

de operadores temporais ou quantificacionais.

Uma TRANSIÇÃO é descrita como um evento complexo, constituído por dois

subeventos, um processo e um estado, que representam, respectivamente, o período

inicial e final do evento, resultando numa mudança de estado.

Em termos estruturais, um ESTADO é representado como uma estrutura atómica,

não ramificada, um PROCESSO como uma estrutura com ramificações múltiplas e uma

TRANSIÇÃO como uma estrutura binária, como abaixo se ilustra.

Page 71: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

65

(28) ESTADO: [e]

E

e

Exs: saber, amar, acreditar, conhecer, possuir

(29) PROCESSO: [e1... en]

P

e1 ... en

Exs: correr, nadar, conduzir, andar

(30) TRANSIÇÃO [P, E]

T

P E

Exs: construir, pintar, ler, escrever

Dado que os eventos apresentam uma estrutura interna, é necessário assumir um

nível específico para a sua representação que indique os tipos de eventos que estão

associados a um item lexical (E1 e E2), bem como as restrições que os regem (RESTR),

como se ilustra em (31).

Page 72: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

66

(31)

��������

��������

���

���

===

=

...

...

...

...

...

RESTR

E

E

ESTR_EVENT 2

1

No que respeita às restrições que regem os eventos, e no seguimento de

Pustejovsky (1995a), estas relacionam-se com a ordenação temporal dos eventos. Deste

modo podemos ter três tipos de relações:

(i) PRECEDÊNCIA (<α)

A restrição de precedência está associada a predicados que denotam uma

transição, como construir. Um evento complexo (e3) é constituído por dois subeventos (e1 e

e2) em que e1 e e2 estão temporalmente ordenados, de modo que o primeiro precede o

segundo (<α ({e1, e2}, e3)). Ou seja, para que algo esteja no estado construído é necessário,

em primeiro lugar, o processo de construção. A representação estrutural abreviada do

verbo construir será a apresentada em (32).

(32)

��������

��������

���

���

<===

=

...

estado:e

processo:e

...

construir

RESTR

E

E

ESTR_EVENT 22

11

Page 73: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

67

(ii) SOBREPOSIÇÃO (o α)

A restrição de sobreposição está associada a predicados como acompanhar, em que

um evento complexo (e3) é constituído por dois subeventos (e1 e e2), que ocorrem

simultaneamente (o α ({e1, e2}, e3)).

(33)

��������

��������

���

���

===

=

...

o

processo:e

processo:e

...

acompanhar

22

11

RESTR

E

E

ESTR_EVENT

(iii) PRECEDÊNCIA COM SOBREPOSIÇÃO (<o α)

A restrição de precedência com sobreposição está associada a predicados como

andar, em que um evento complexo (e3) é constituído por dois subeventos simultâneos (e1

e e2), em que e1 começa primeiro que e2 (<o α ({e1, e2}, e3)). No caso de andar ocorre primeiro

o movimento das pernas, resultando no movimento final do corpo.

(34)

��������

��������

���

���

<===

=

...

o

processo:e

processo:e

...

andar

22

11

RESTR

E

E

ESTR_EVENT

Para além das restrições que regem os subeventos, Pustejovsky (1995a) propõe

também uma subespecificação das estruturas eventivas relativamente ao núcleo. Numa

Page 74: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

68

estrutura eventiva bipartida, um dos subeventos pode ser mais proeminente em relação

ao outro, ocupando a posição de núcleo. O subevento que ocupa a posição de núcleo é

representado como e*1 ou e*2, quer seja o subevento inicial ou final, respectivamente. Em

(35) é apresentada a matriz por defeito da estrutura eventiva de um dado predicado α.

(35)

���������

���������

����

����

==

==

=

...

...

...

...

...

...

NÚCLEO

RESTR

E

E

ESTR_EVENT2

1

Relativamente à marcação das estruturas eventivas em relação ao núcleo,

considerando que o subevento mais proeminente pode ser o inicial, o final, ambos ou

nenhum, existem quatro hipóteses distintas de marcação, de acordo com Pustejovsky

(1995a: 73):

(i) ESTRUTURAS ENDOCÊNTRICAS À ESQUERDA

Exs: Construir [e*1 <α e2]

Comprar [e*1 oα e2]

Caminhar [e*1 <oα e2]

(ii) ESTRUTURAS ENDONCÊNTRICAS À DIREITA

Exs: Chegar [e1 <α e*2]

Vender [e1 oα e*2]

Caminhar para casa [e1 <oα e*2]

Page 75: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

69

(iii) ESTRUTURAS ENDOCÊNTRICAS À ESQUERDA E À DIREITA

Exs: Dar [e*1 <α e*2]

Casar [e*1 oα e*2]

(iv) ESTRUTURAS NÃO ENDOCÊNTRICAS

Exs: Ferver [e1 <α e2]

Alugar [e1 oα e2]

Começar [e1 <oα e2]

As estruturas em (iv), que não são especificadas relativamente ao núcleo,

representam os casos de predicados polissémicos. Em termos de estrutura eventiva, a

polissemia ocorre quando uma expressão não é especificada relativamente ao núcleo,

admitindo duas interpretações. Encontram-se neste agrupamento, entre outros, os

predicados que alternam entre uma estrutura causativa/incoativa, como ferver, e certos

predicados causativos aspectuais, como começar.

De um modo sucinto, os predicados não endocêntricos podem ter como núcleo

qualquer um dos subeventos que constituem a estrutura eventiva. Uma vez que os

subeventos estão associados a papéis qualia distintos – o papel agentivo encontra-se

associado a e1 (processo), ao passo que o papel formal se encontra associado a e2 (estado) –

a proeminência de um ou de outro resulta em interpretações diferentes.

No caso da alternância causativa/incoativa, a interpretação causativa ocorre

quando o subevento inicial é o núcleo, projectando informação relativa ao papel agentivo

(A Maria ferveu o leite). Por outro lado, a interpretação incoativa ocorre quando o

subevento final é o núcleo, projectando informação relativa ao papel formal (O leite

ferveu).

3.3.1.3. ESTRUTURA QUALIA

A designação de qualia baseia-se na noção aristotélica de “ modos de explanação” ,

através da qual o sujeito processa a compreensão de um objecto ou relação no mundo.

Page 76: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

70

Esta estrutura codifica a informação semântica necessária para a interpretação de um item

nominal, e é constituída por quatro componentes, ou papéis qualia, distintos:

(i) CONSTITUTIVO

Especifica a relação entre o objecto semântico e as partes que o constituem,

codificando características como o material, o peso, os componentes.

(ii) FORMAL

Especifica aquilo que distingue o objecto semântico num dado domínio,

como a orientação, a magnitude, a forma, a dimensionalidade, a cor.

(iii) TÉLICO

Indica a função do objecto semântico.

(iv) AGENTIVO

Especifica os factores que estão envolvidos na origem do objecto semântico,

como o criador, tipo natural ou nexo de causalidade.

A estrutura qualia pode ser entendida como um conjunto de propriedades ou

eventos associados a um item lexical nominal, e, consequentemente, ao sintagma

nominal no qual está inserido. A informação contida nos papéis qualia vai ser associada

aos argumentos de um predicado e aos seus subeventos.

Esta estrutura inclui os diferentes tipos de relações que os objectos semânticos

podem estabelecer entre si: meronímia/holonímia9, através do papel constitutivo,

hiponímia/hiperonímia10, através do papel formal, propósito ou função, através do papel

télico e origem ou causalidade, através do papel agentivo. Enquanto os papéis

9 Corresponde à relação parte/todo. Em termos informais, a relação meronímia/holonímia pode ser definida do seguinte modo: A é merónimo de B sse A é necessariamente parte de B e B inclui necessariamente A; B é holónimo de A sse A é merónimo de B. Exemplificando, pétala é merónimo de corola e corola holónimo de pétala, uma vez que pétala é necessariamente parte de corola e corola inclui necessariamente pétala (Marrafa 2001: 38). 10 Segundo Fellbaum (1998), a hiperonímia e a hiponímia são relações inversas e dizem basicamente respeito à noção de inclusão em classes: se Y é um tipo de X, então X é hiperónimo de Y e Y é hipónimo de X. Exemplificando, o hiperónimo de cão será canídeo, e os hipónimos serão as várias raças de cães (dálmata, pastor alemão, etc.). A relação de hiponímia requer que o hiperónimo possa substituir o hipónimo num contexto referencial (este dálmatahipónimo é bonito / este cãohiperónimo é bonito).

Page 77: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

71

constitutivo e formal estabelecem uma relação com outros objectos semânticos, os papéis

télico e agentivo fazem referência a eventos.

Todos os itens lexicais têm uma estrutura qualia associada, mas não existe

obrigatoriedade de atribuir valores a todos os papéis que a compõem. Em (36) é

apresentada a matriz por defeito da estrutura qualia de um dado predicado α.

(36)

���������

���������

����

����

==

==

=

�origem_de_

�função_de_

ção_de_�identifica

ão_de_�constituiç

...

AGENTIVO

TÉLICO

FORMAL

CONST

AESTR_QUALI

É fácil verificar através da estrutura qualia que, por exemplo, romance se distingue

de dicionário relativamente ao seu papel constitutivo (o primeiro é uma narrativa,

enquanto o segundo consiste numa lista de palavras), ao seu papel télico (o primeiro é

para ler enquanto o segundo é para consultar), e ao seu papel agentivo (o primeiro é

escrito enquanto o segundo é compilado), sendo somente semelhantes no seu papel

formal (ambos são livros). Em termos informais, teríamos as seguintes representações

para os referidos itens:

(37)

���������

���������

����

����

==

==

=

escrever

ler

livro

narrativa

...

romance

AGENTIVO

TÉLICO

FORMAL

CONST

AESTR_QUALI

Page 78: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

72

(38)

���������

���������

����

����

==

==

=

compilar

consultar

livro

palavras de lista

...

dicionário

AGENTIVO

TÉLICO

FORMAL

CONST

AESTR_QUALI

É também neste nível de representação que se processa toda a informação

semântica pertinente para a caracterização de itens com comportamento polissémico.

3.3.2. SISTEMA DE TIPOS SEMÂNTICOS E HERANÇA LEXICAL

Os itens lexicais são definidos no léxico por um conjunto de tipos semânticos que

reflectem distinções ontológicas como humano, artefacto, objecto_físico, evento, entre outros.

Os tipos podem ser simples ou complexos. Os tipos simples caracterizam as

expressões não polissémicas, ou seja, que só têm uma interpretação. É o caso de homem (x:

humano), faca (x:artefacto) ou pedra (x:objecto_físico). Ao contrário das expressões não

polissémicas, as expressões polissémicas, por terem mais do que uma interpretação,

denotam tipos complexos (dotted types, segundo Pustejovsky (1995a)). É o caso de livro

(x:objecto físico, y:informação), janela (x:objecto_físico, y:abertura) ou banco (x:instituição,

y:edifício).

Os tipos complexos são representados pelo operador cartesiano “ •” . Deste modo,

por exemplo, livro denota o tipo complexo objecto_físico•informação, enquanto janela

denota o tipo complexo objecto_físico•abertura.

A todas as expressões de uma língua pode ser atribuído um tipo semântico.

Pustejovsky (1995a) defende que, para se obter a representação semântica de um item

lexical, é necessário que este aceda a um tipo semântico, presente numa rede de tipos

Page 79: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

73

hierarquicamente organizada, de modo a permitir a herança de traços dos seus

supertipos.

No LG, um item lexical herda informação a partir da sua estrutura qualia. De facto,

os quatro papéis qualia introduzem quatro redes de herança lexical separadas. A herança

de traços processa-se, assim, através de quatro “ canais” diferentes e independentes.

Retomem-se os exemplos de romance e dicionário que, como se verificou a partir das

estruturas (37) e (38), apresentam uma estrutura qualia distinta, sendo o papel formal –

livro - o único que têm em comum. De um modo sucinto, estes itens terão as relações de

herança apresentadas em (39).

(39) a. dicionário É_FORMAL livro

b. dicionário É_TÉLICO consulta

c. dicionário É_AGENTIVO matéria_compilada

d. romance É_FORMAL livro

e. romance É_TÉLICO leitura

f. romance É_AGENTIVO escrita

g. livro É_FORMAL objecto_físico•informação

h. livro É_TÉLICO leitura

i. livro É_AGENTIVO escrita

De um modo mais simples, o diagrama em (40) representa as relações de herança

apresentadas em (39).

(40) objecto_físico•informação

escrita F

consulta leitura

matéria_compilada T A

T A livro

F F T A

dicionário romance

Page 80: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

74

O diagrama em (40) ilustra como dicionário e romance são um subtipo de livro - uma

vez que ambos partilham o valor do papel formal (F). No entanto, estes objectos

semânticos distinguem-se relativamente aos traços que herdam do seu supertipo,

apresentando, consequentemente, valores distintos para os restantes papéis qualia.

Relativamente a dicionário, este só herda o valor do papel formal de livro -

objecto_físico•informação - distinguindo-se no que respeita aos papéis télico (T) – consulta

- e agentivo (A) – matéria_compilada. No que respeita a romance, este herda de livro os

valores dos papéis formal, télico – leitura - e agentivo – escrita.

3.3.3. PARADIGMA LÉXICO-CONCEPTUAL (PLC)

Um dos objectivos centrais do modelo do LG consiste em construir uma única

entrada lexical que englobe todos os significados das expressões polissémicas, reduzindo,

assim, o número de entradas armazenadas no léxico.

Considerem-se, os seguintes exemplos com o item livro, que é um nome

polissémico que denota o tipo complexo objecto_físico•informação.

(41) a. Este livro é muito divertido.

b. Este livro está mal estimado.

c. Este livro está mal estimado mas é muito divertido.

Nos exemplos acima, o nome livro apresenta três significados: ‘informação’ (41a),

‘objecto físico’ (41b) e ‘informação’ e ‘objecto físico’ em (41c). Pustejovsky & Anick (1988)

denominam PARADIGMA LÉXICO-CONCEPTUAL (PLC) a representação, numa mesma

entrada, dos vários sentidos de um mesmo item. Estas meta-entradas permitem que seja

projectado qualquer um dos três significados em contextos semânticos e sintácticos

distintos.

O PLC representa, assim, um tipo complexo para um item polissémico α que tem

os significados σ1 e σ2.

Page 81: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

75

(42) ( ) 2 1

21��:�PLC

�:� �:�

O que (42) indica é que dois tipos simples (σ1 e σ2) podem juntar-se e formar um

tipo complexo (σ1•σ2). O PLC contém todas as combinações de tipos possíveis, ou seja, os

dois tipos simples e o tipo complexo resultante da sua combinação, como se pode ver em

(43).

(43) PLC = {σ1 • σ2, σ1, σ2}

Concretizando, o PLC do nome livro será o apresentado em (44) e terá a entrada

lexical apresentada abreviadamente em (45).

(44) objecto_físico•informação_PLC = {objecto_físico•informação, objecto_físico,

informação}

(45)

�����������

�����������

����

����

==

==

��

���

==

=

y)xv,,escrever(e

y)xw,,ler(e

x)conter(y,

físico_ objectoinformação

físico objecto :y

informação : x

livro

2

1

AGENTIVO

TÉLICO

FORMAL

PLC

AESTR_QUALI

ARG2

ARG1ESTR_ARG

Na próxima secção analisar-se-á de que modo é que a interacção entre a semântica

do predicado e dos seus complementos resulta na interpretação adequada do item

polissémico.

Page 82: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

76

3.3.4. MECANISMOS GENERATIVOS

Existe um conjunto de mecanismos generativos que se combinam com os

diferentes níveis de representação semântica descritos anteriormente (estrutura

argumental, estrutura eventiva e estrutura qualia) e que permitem dar conta da

interpretação composicional das palavras em contexto. Esses mecanismos são:

(i) COERÇÃO DE TIPO;

(ii) COERÇÃO DE SUB-TIPO;

(iii) COERÇÃO DE COMPLEMENTO;

(iv) CO-COMPOSIÇÃO;

(v) LIGAÇÃO SELECTIVA.

Nas secções seguintes será analisado cada um destes mecanismos, que permite

captar os meios através dos quais as palavras podem assumir um número potencialmente

infinito de significados em contexto, ao mesmo tempo que se limita o número de

significados armazenados no léxico.

3.3.4.1. COERÇÃO DE TIPO

Como já se referiu anteriormente, os tipos semânticos encontram-se ordenados

numa hierarquia de tipos, como a apresentada em (46), de acordo com Copestake &

Briscoe (1992) e Pustejovsky (1995a).

Page 83: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

77

(46) nomrqs11

indivíduo proposição evento

abstracto objecto_físico informação

... ... ...

Cada tipo está associado a uma forma sintáctica canónica. Deste modo, o tipo

indivíduo está associado a um Sintagma Nominal (SN), o tipo proposição a uma Frase (F)

e o tipo evento a um Sintagma Verbal (SV).

A coerção de tipo consiste numa operação semântica que converte, no contexto de

uma dada função, um argumento no tipo esperado pela função. De outro modo resultará

um erro de tipo e a estrutura será anómala.

Existem alguns casos de verbos que foram comummente tratados como ambíguos,

mas cuja aparente ambiguidade pode ser explicada através do fenómeno de coerção.

Alguns casos discutidos por Dowty (1985) dizem respeito aos tipos de complementos do

verbo querer, como é ilustrado em (47) e (48).

(47) a. O João quer uma cerveja. (beber)

b. O João quer um livro. (ler)

c. O João quer um cigarro. (fumar)

(48) a. A Maria quer [comer um bolo]. [F]

b. A Maria quer [um bolo]. [SN]

Dowty (1985) defende uma abordagem enumerativa para explicar estas diferenças

de interpretação. Mas uma estratégia diferente é adoptada no Léxico Generativo.

Assumindo que o tipo do verbo se mantém inalterável, o que muda é o tipo do

complemento do verbo, que sofre uma operação de mudança de tipo em virtude de se

encontrar sob regência lexical do verbo. Esta operação é chamada de coerção de tipo, por

ser uma mudança de tipo lexicalmente regida.

11 Em que nomrqs refere o elemento supremo do subconjunto de tipos considerado, ou seja, o tipo imediatamente acima relativamente aos tipos ‘ indivíduo’ , ‘preposição’ e ‘evento’ .

Page 84: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

78

“ TYPE COERCION: a semantic operation that converts an argument to the type which is expected by a function, where it would otherwise result in a type error.” (Pustejovsky, 1995a: 111)

Pustejovsky (1993) sugere que cada expressão α pode ter disponível um conjunto

de operadores de mudança, Σα, que pode operar sobre uma expressão, mudando o seu

tipo e denotação. Em (49) é apresentada uma formulação da regra de APLICAÇÃO DA

FUNÇÃO COM COERÇÃO (AFC):

(49) APLICAÇÃO DA FUNÇÃO COM COERÇÃO: se α é do tipo c e β é do tipo <a, b>,

então:

(i) se o tipo c = a, então β(α) é do tipo b;

(ii) se existir um σ ∈ Σα, tal que σ(α) resulte numa expressão do tipo a, então

β(σ (α)) é do tipo b;

(iii) de outro modo ocorrerá um erro de tipo.12

Para ilustrar os efeitos desta regra, tomem-se como exemplo as estruturas

apresentadas em (47) e (48). É necessário ter em conta: (i) os diferentes contextos

sintácticos que o verbo querer pode seleccionar, em (48); (ii) as diferentes interpretações

emergentes dos complementos SN em (47), que parecem requerer uma enumeração de

significados. No entanto, e como já foi referido, em vez de propor diferentes tipos

semânticos para o verbo - o que resultaria em diferentes entradas lexicais - propõe-se uma

única entrada, em que o tipo do verbo se mantém constante. Por sua vez o argumento

interno é uniformemente identificado com um determinado tipo, neste caso uma

proposição. A estrutura apresentada em (50) ilustra a relação existente entre o tipo

semântico requerido e as realizações sintácticas possíveis dos complementos.

12 Traduzido de Pustejovsky (1995a: 111).

Page 85: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

79

(50) [prop]

coerção coerção

SN F SV

Segundo esta proposta, três hipóteses afiguram-se possíveis:

(i) se a forma sintáctica que ocorre na posição de complemento coincidir com

o tipo proposição, requerido pelo verbo, então a estrutura é bem formada;

(ii) se, pelo contrário, não houver essa correspondência, então o tipo do

complemento sofre um processo de coerção de forma a transformar-se no

tipo esperado, i.e., numa proposição, e a estrutura passa a ser bem

formada;

(iii) se não houver correspondência entre o tipo do complemento e o tipo

requerido pelo verbo, e não houver coerção, haverá um erro de tipo e a

estrutura é mal formada.

Constata-se, assim, que um mesmo tipo semântico pode ter realizações sintácticas

diferentes, e que uma dada estrutura sintáctica pode assumir um tipo semântico

particular dependendo do contexto em que se encontra.

No que respeita aos exemplos em (47), é importante salientar, em primeiro lugar,

as propriedades de selecção do predicado querer que, semanticamente, selecciona um

complemento com uma interpretação eventiva. Uma vez que, sintacticamente, este verbo

selecciona um SN com o tipo indivíduo, não satisfazendo, deste modo, a condição de

selecção de um complemento eventivo, o verbo executa um processo de coerção que

resulta na mudança de tipo do complemento, possível devido à informação contida na

estrutura qualia da expressão nominal. É a informação contida na estrutura qualia do

complemento, neste caso no papel télico, que permite interpretar correctamente o

significado de querer. O facto de o papel télico de cerveja, livro e cigarro ser ‘beber’, ‘ler’ e

‘fumar’, respectivamente (i.e. eventos) permite que, em (47), o complemento de querer seja

interpretado adequadamente como ‘beber uma cerveja’, ‘ler um livro’ e ‘fumar um

Page 86: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

80

cigarro’, nos contextos apropriados. Note-se, contudo, que, no que respeita à estrutura

querer um livro, para além do papel télico, o papel agentivo também denota um evento -

neste caso ‘escrever’. Deste modo a estrutura torna-se ambígua entre as interpretações de

querer ler um livro e querer escrever um livro, sendo a primeira preferencial, decorrente de

razões pragmáticas.

3.3.4.2. COERÇÃO DE SUBTIPO

A coerção de subtipo baseia-se essencialmente na existência de uma hierarquia de

tipos que pode, de certa maneira, assemelhar-se à hierarquia lexical existente nas relações

de hiperonímia/hiponímia. Atente-se nos seguintes exemplos:

(51) a. O Pedro conduziu um Ferrari no sábado.

b. A Joana leu “ Os Maias” nas férias.

É necessário, neste caso, estabelecer uma relação entre o tipo semântico denotado

por cada SN na posição de complemento e o tipo que é formalmente seleccionado pelos

verbos conduzir e ler. Essa relação é convencionalmente denominada coerção de subtipo.

Nos casos acima listados o verbo conduzir selecciona um complemento do tipo veículo, que

tem como subtipos Ferrari, Honda, etc., enquanto o verbo ler selecciona um complemento

do tipo texto, que tem como subtipos Os Maias, Os Lusíadas, etc.. Assume-se então que se

uma função selecciona um tipo τ1 e ocorre um complemento do tipo τ2, em que τ2 é um

subtipo de τ1, (τ2 ≤ τ1), este deve ser aceite pela função como um argumento legítimo.

Assumindo que a representação lexical para o nome veículo é a apresentada em (52), e,

assumindo que Ferrari é um subtipo de carro, que, por sua vez, é um subtipo de veículo,

estabelece-se a seguinte relação: Ferrari ≤ carro ≤ veículo.

Page 87: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

81

(52) [ ]

��������

��������

���

���

===

=

==

x)z,,econstruir(

x)y,,mover(e

x

sicoobjecto_fí : x

veículo

2

1

1

AGENTIVO

TÉLICO

FORMAL

AESTR_QUALI

ARGESTR_ARG

(53) [ ]

��������

��������

���

���

===

=

==

x)z,,econstruir(

x)y,,conduzir(e

x

veículo: x

carro

2

1

1

AGENTIVO

TÉLICO

FORMAL

AESTR_QUALI

ARGESTR_ARG

(54) [ ]

��������

��������

���

���

===

=

==

x)Co,-Ferrari,econstruir(

x)y,,conduzir(e

x

carro : x

Ferrari

2

1

1

AGENTIVO

TÉLICO

FORMAL

AESTR_QUALI

ARGESTR_ARG

Note-se que os valores dos qualia formal e télico de Ferrari são herdados da entrada

de carro, enquanto a especificidade do tipo do valor do quale agentivo é localmente

definida (especifica-se o produtor).

A relação de coerção de subtipo, formalmente representada pelo símbolo Θ, pode

ser definida de seguinte forma:

(55) [ ]

[ ]( ) 221

21211�:� � ��

��:� �� ,�:�

≤→≤

Page 88: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

82

O que a representação em (55) indica é que, tendo um antecedente com uma dada

expressão α do tipo σ1, que é um subtipo de σ2, existe um mecanismo de coerção entre σ1 e

σ2 que tem como consequência alterar o tipo de α para σ2.

Concretizando, para o exemplo (51b) é estabelecida a relação Os Maias ≤ livro ≤

texto entre o tipo seleccionado pelo verbo ler e o tipo do complemento que neste caso

ocorre.

3.3.4.3. COERÇÃO DE COMPLEMENTO

Enquanto a coerção de subtipo envolve mecanismos de inferência disponíveis

numa estrutura de tipos, a coerção de complemento tem fundamentalmente como base a

informação disponível nos qualia dos complementos. Por outro lado, a coerção de

complemento é licenciada por regência lexical. Tomem-se como exemplos as estruturas

abaixo apresentadas:

(56) a. O João começou o livro.

b. O João começou a ler o livro.

c. O João começou a escrever o livro.

A regra de Aplicação da Função com Coerção (AFC), apresentada em (49),

assegura que o tipo semântico seleccionado pelo verbo é satisfeito nos três casos,

independentemente da estrutura sintáctica dos complementos.

Ao analisar a estrutura por defeito do verbo começar, apresentada em (57), verifica-

se que o segundo argumento (ARG2) é, explicitamente, um evento.

Page 89: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

83

(57)

�����������

�����������

��

���

���

���

<=

��

���

==

=

=

==

=

=

=

)ex,,meçar(eacto_de_co

x),P(e

estado:e

processo:e

e

humano: x

começar

21

2

22

11

22

1

AGENTIVO

FORMAL A ESTR_QUALI

RESTR

E

E

ESTR_EVENT

ARG

ARGESTR_ARG

A coerção aplicada ao complemento de modo a satisfazer o tipo semântico

requerido pelo verbo (neste caso um evento) só é aplicada com sucesso se o complemento

tiver acessível, na sua estrutura, o tipo apropriado. No caso de (56), o complemento livro

tem disponível na sua estrutura qualia dois tipos de evento, patentes no valor dos seus

papéis télico e agentivo.

(58)

�����������

�����������

����

����

==

==

��

���

==

=

y)xv,,escrever(e

y)xw,,ler(e

x)conter(y,

sico_objecto_fíinformação

sicoobjecto_fí:y

informação: x

livro

2

1

2

1

AGENTIVO

TÉLICO

FORMAL

PLC

AESTR_QUALI

ARG

ARGESTR_ARG

Deste modo, e através do processo de coerção de complemento, o complemento

adquire o tipo semântico requerido pelo verbo e as interpretações presentes em (56b) e

(56c) são possíveis, sem qualquer alteração da estrutura sintáctica.

Considerem-se agora os seguintes exemplos:

Page 90: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

84

(59) a. A Maria acredita no livro. (informação)

b. A Maria rasgou o livro. (objecto físico)

Contrariamente às estruturas em (56), nas frases em (59) os verbos acreditar e rasgar

não seleccionam um complemento com o tipo evento.

Ao observar a estrutura lexical de livro em (58), verifica-se que este item consiste

num dot object que denota dois tipos semânticos diferentes: ‘informação’ e ‘objecto físico’.

Como se referiu anteriormente, um dot object consiste num par lógico de significados

compostos por tipos individuais, formando um tipo complexo. Torna-se, assim, necessário

definir, a partir do tipo complexo, as operações de extracção do tipo que contém o

significado apropriado. Essas operações de coerção, que, a partir do tipo complexo (dot

object), extraem um tipo particular, são definidas através dos operadores Σ1 e Σ2, como se

evidencia em (60).

(60) PLC = {σ1 • σ2, Σ1[σ1 • σ2]:σ1, Σ2[σ1 • σ2]:σ2}

Informalmente, Σn é uma função que entra no dot object e extrai um dos tipos

disponíveis, fazendo emergir o tipo certo no contexto apropriado.

(61) a. Σ1[inf•objecto_físico]:inf

b. Σ2[inf•objecto_físico]:objecto_físico

c. inf•objecto_físico_PLC = {inf•objecto_físico, inf, objecto_físico}

Deste modo, através da aplicação das operações de coerção (AFC), subtipificação

(Θ) e do operador Σ, é possível extrair os dois significados de livro, como se pode observar

a partir de (62), permitindo interpretar adequadamente as estruturas em (59).

(62) a. livro ≤ informação ≤ proposição

b. livro ≤ objecto_físico ≤ indivíduo

Page 91: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

85

3.3.4.4. CO-COMPOSIÇÃO

A co-composição está directamente relacionada com a polissemia verbal e permite

a derivação de novos sentidos em contexto, na medida em que consiste num mecanismo

que opera na semântica do verbo e na semântica do nome que lhe serve de complemento,

alterando o significado do primeiro.

Considere-se, para o Inglês, o verbo bake, apresentado em Pustejovsky (1995a: 122),

que, dependendo da natureza do complemento com que co-ocorre, pode ser interpretado

como uma “ mudança de estado” ou um “ processo de criação” , conforme ilustram os

exemplos (63a) e (63b), respectivamente.

(63) a. John baked the potato.

b. John baked the cake.

De modo a captar os diferentes significados sem postular a existência de entradas

lexicais distintas, Pustejovsky (1995a) propõe que os complementos contêm determinada

informação que vai “ actuar” sobre a semântica do verbo. Só existe uma entrada lexical

para bake e qualquer outro significado é derivado através do mecanismo generativo de co-

composição.

Considere-se a entrada lexical de bake, em (64)13:

(64)

�������������

�������������

���

���

==

�����

�����

��

���

===

��

���

==

=

��

���

==

=

=

)2,1AGENTIVEQUALIA

FORMAL2ARG

FORMAL 1ARG

ARGSTR

HEAD

EEVENTSTR

,bake_act(e

ge_lcpstate_chan

physobj

mass

physobj

danimate_in

e

process:e

bake

1

2

1

1

11

13 Por respeitar a um item em inglês optou-se por reproduzir a entrada lexical original, a partir de Pustejovsky (1995a: 123).

Page 92: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

86

Pertencente ao paradigma dos verbos de mudança de estado quando ocorre com

nomes como potato, o verbo bake passa a pertencer ao paradigma dos verbos de criação

quando ocorre com nomes como cake, bread ou cookie. A explicação para a alteração de

significado do verbo reside no facto de, enquanto complementos como potato denotam um

objecto natural, pelo que só podem sofrer uma mudança de estado, complementos como

cake não existem na natureza, tendo, por isso, de sofrer um processo de criação. A

distinção entre estes dois sentidos faz-se com base nas representações lexicais dos

complementos, nomeadamente através do seu papel agentivo.

Considere-se a entrada lexical de cake, em (65):

(65)

�����������

�����������

����

����

==

==

=

��

���

==

=

y)w,1,bake_act(e

x)z,eat(e2,

x

y

mass:y

food_ind: x

cake

AGENTIVE

TELIC

FORMAL

CONST

QUALIA

ARG-D

ARGARGSTR

1

1

A partir das estruturas lexicais em (64) e (65) pode verificar-se que ambas

partilham o valor do papel agentivo. A semântica do SV bake a cake resulta de duas

operações básicas: (i) aplicação de uma função que liga o objecto à estrutura argumental

do verbo bake (ARG2); (ii) unificação do traço do quale agentivo: QA(bake) = QA(the cake).

Em (66) encontra-se representada a estrutura lexical do SV bake a cake.

Page 93: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

87

(66)

������������������������

������������������������

����

����

=

==

����������

����������

��

���

===

���

���

====

��

���

==

=

����

����

=<=

==

=

=

)3,1AGENTIVE

)2FORMALQUALIA

FORMAL3ARG

FORMAL

3CONST2ARG

FORMAL 1ARG

ARGSTR

HEAD

RESTR

E

E

EVENTSTR

,bake_act(e

,exist(e

create_lcp

mass

material

physobj

artifact

physobj

danimate_in

e

state:e2

process:e

cake a bake

1

2

3

2

1

1

2

11

O resultado do mecanismo de co-composição consiste, assim, numa representação

semântica a nível do SV.

Para o português, este tipo de operação é normalmente ilustrado com o verbo

cozer. Atente-se nos exemplos (67), apresentados em Berkeley Cotter (2002: 44):

(67) a. O Manuel cozeu a carne.

b. O Manuel cozeu o pão.

Neste caso, o verbo cozer também pode denotar uma mudança de estado - (67a) -

ou um processo de criação - (67b) - comportando-se do mesmo modo que bake. No

entanto, como a autora refere, a distinção entre estes sentidos para o verbo cozer pode não

ser tão linear em Português como o é em Inglês.

Observem-se os seguintes exemplos (Berkeley Cotter, op. cit.: 46):

Page 94: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

88

(68) a. Vou pôr o pão a cozer.

b. O pão já está a começar a ficar cozido.

Em ambas as estruturas em (68) o item pão é interpretado como um artefacto já

confeccionado, que ainda não está no estado cozido, ou seja, não há nenhum processo de

criação, verificando-se somente a leitura de mudança de estado.

“ De facto, parece que o verbo cozer não implica uma criação, mas apenas uma mudança de estado, independentemente do complemento que o acompanha. (...) talvez os falantes considerem o artefacto pão enquanto tal, assim que dão a sua confecção por terminada e não apenas após a sua cozedura.” (Berkeley Cotter, op. cit.: 46)

Vai ser, igualmente, através do mecanismo de co-composição, ou seja, através da

interacção entre o significado de um item lexical e os significados dos seus argumentos,

que é possível interpretar adequadamente estruturas como as apresentadas em (69).

(69) a. A Maria abriu a carta.

b. A Maria abriu a porta.

Ao analisarmos as entradas lexicais de carta e porta, em (70) e (71), podemos

observar que o papel télico destes nomes é ‘ler’ e ‘atravessar’, respectivamente.

(70)

���������

���������

���

���

===

��

���

==

=

y)xz,,ler(e

y)conter(x,

_PLCinformaçãosicoobjecto_fí

informação:y

sicoobjecto_fí: x

carta

1

2

1

TÉLICO

FORMALAESTR_QUALI

ARG

ARGESTR_ARG

Page 95: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

89

(71)

��������

��������

��

���

==

��

���

==

=

y)z,,(eatravessar

LCabertura_Psicoobjecto_fí

abertura:y

sicoobjecto_fí: x

porta

1

2

1

TÉLICOAESTR_QUALI

ARG

ARGESTR_ARG

O valor dos papéis télico dos complementos carta e porta é partilhado pelo valor do

papel formal do predicado abrir, procedendo-se, deste modo, a uma unificação qualia

entre o predicado e o complemento. Em (72) apresenta-se a representação lexical por

defeito de abrir.

(72)

[ ]��������������������

��������������������

����

����

=

�==

�����

�����

��

���

==

��

���

==

=

���

���

<===

=

) , ,rir(eacto_de_ab

) ) ( ,P(e

o_PLCpor_defeitcausativo_

sicoobjecto_fí

entidade

indivíduo

entidade

estado:e

processo:e

abrir

21 AGENTIVO

2 TÉLICOFORMALAESTR_QUALI

FORMAL2ARG

FORMAL1ARG

ESTR_ARG

RESTR

E

E

ESTR_EVENT

1

2

2

1

22

11

Em que � representa o operador modal que exprime possibilidade.

A partir da estrutura em (72) pode verificar-se que o argumento mais proeminente

é ARG2, ou seja, o argumento interno. É sobre o papel télico da estrutura deste argumento

que o verbo abrir vai operar, procedendo-se a uma unificação de papéis qualia.

Page 96: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

90

Estruturas como abrir a carta e abrir a porta possibilitam a “ actualização” do papel

télico dos complementos, i.e., ‘ler’ e ‘atravessar’. Deste modo, através do mecanismo

generativo de co-composição, a unificação qualia é possível, permitindo captar um

determinado significado verbal em contexto. Em (73) e (74) representam-se as estruturas

resultantes da co-composição dos SV’s abrir a carta e abrir a porta.

(73)

[ ]�����������������������������

�����������������������������

����

����

=

�==

�������������

�������������

����������

����������

���

���

==

==

��

���

==

==

��

���

==

=

���

���

<===

=

)2 , ,rir(eacto_de_ab

) ,P(e

o_PLCpor_defeitcausativo_

y)xz,ler(e,

y)conter(x,

_PLCinformaçãosicoobjecto_fí

informação:y

sicoobjecto_fí: x

carta

2

indivíduo

entidade

estado:e

processo:e

carta aabrir

1 AGENTIVO

3FORMALAESTR_QUALI

3 TÉLICO

FORMALAESTR_QUALI

ARG

ARGESTR_ARG

ARG

FORMAL1ARG

ESTR_ARG

RESTR

E

E

ESTR_EVENT

1

2

2

1

2

1

22

11

Page 97: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

91

(74)

[ ]���������������������������

���������������������������

����

����

=

�==

������������

������������

��������

��������

���

���

===

��

���

==

==

��

���

==

=

���

���

<===

=

) 2 , ,rir(eacto_de_ab

) ,P(e

o_PLCpor_defeitcausativo_

y)z,(e,atravessar

LCabertura_Psicoobjecto_fí

abertura:y

sicoobjecto_fí: x

porta

indivíduo

entidade

estado:e

processo:e

porta aabrir

1 AGENTIVO

3FORMALAESTR_QUALI

3 TÉLICOAESTR_QUALI

ARG

ARGESTR_ARG2ARG

FORMAL1ARG

ESTR_ARG

RESTR

E

E

ESTR_EVENT

1

2

2

1

2

1

22

11

O mecanismo de co-composição permite, desta forma, fazer uso da informação

semântica presente nos qualia, tanto do functor como dos seus argumentos.

3.3.4.5. LIGAÇÃO SELECTIVA

A ligação selectiva está relacionada com a polissemia adjectival e opera dentro de

estruturas nome-adjectivo. Considerem-se os seguintes exemplos:

Page 98: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

92

(75) a. O Carlos é um dactilógrafo rápido.

b. Precisamos de um carro rápido para chegar a tempo.

c. Há que tomar decisões rápidas.

O adjectivo rápido tem significados diferentes em (75) em consequência da relação

semântica que estabelece com o nome que modifica. Ou seja, o significado do adjectivo é

parcialmente determinado pela semântica do nome com o qual co-ocorre.

Através da operação de ligação selectiva o adjectivo selecciona uma determinada

interpretação contida na estrutura qualia do nome que modifica. Neste caso, é o adjectivo

que tem o papel de functor que é aplicado a um determinado papel quale do nome com o

qual co-ocorre. Nos casos de dactilógrafo e carro é o papel télico (que denota actividade ou

função) que é referido pelo adjectivo. No caso de decisões é o papel agentivo que é

seleccionado. Em suma, a diferença de significados em frases como as apresentadas em

(75) é explicada através de um dos papéis qualia do nome, sobre o qual o adjectivo opera.

Observem-se as seguintes representações para dactilógrafo rápido, em (76), e decisões

rápidas, em (77).

(76)

[ ]

[ ] �������������

�������������

==

��������

��������

��������

��������

��

���

==

=

��

���

==

===

==

)e,rápido(e

y)x,,far(edactilogra

x

texto:y

humano: x

fodactilógra

estado:e

rápido fodactilógra

21

2

2

1

1

11

FORMALAESTR_QUALI

TÉLICO

FORMALAESTR_QUALI

ARG

ARGESTR_ARGARGESTR_ARG

EESTR_EVENT

Page 99: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO

93

(77)

[ ]

[ ] �������������

�������������

==

��������

��������

��������

��������

��

���

==

=

��

���

==

===

==

)e,rápido(e

x)y,, tomar(e

x

abstracto:x

humano:y

decisões

estado:e

rápidas decisões

21

2

2

1

1

11

FORMALAESTR_QUALI

AGENTIVO

FORMALAESTR_QUALI

ARG

ARGESTR_ARGARGESTR_ARG

EESTR_EVENT

Enquanto adjectivos como rápido seleccionam eventos, denotados pelos valores

dos papéis télico ou agentivo dos nomes com os quais se combinam, adjectivos como

bonito seleccionam objectos, denotados pelo valor do papel formal. Uma estrutura como

dactilógrafo bonito teria a seguinte representação:

(78)

[ ]

[ ] �������������

�������������

==

��������

��������

��������

��������

��

���

==

=

��

���

==

===

==

x),bonito(e

y)x,,far(edactilogra

x

texto:y

humano: x

fodactilógra

estado:e

bonito fodactilógra

1

2

2

1

1

11

FORMALAESTR_QUALI

TÉLICO

FORMALAESTR_QUALI

ARG

ARGESTR_ARGARGESTR_ARG

EESTR_EVENT

A diferença entre (76) e (77), por um lado, e (78), por outro, reside no facto de os

adjectivos se aplicarem a distintos papéis qualia de dactilógrafo: rápido aplica-se ao papel

télico, enquanto bonito se aplica ao papel formal.

Contrariamente a abordagens como os Léxicos Enumerativos de Sentidos, o

modelo do Léxico Generativo propõe uma única entrada lexical complexa, na qual está

Page 100: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

94

codificada toda a informação pertinente para a interpretação do item lexical. Esta

informação encontra-se distribuída por vários níveis de representação, que, por sua vez,

se relacionam com vários mecanismos generativos, permitindo obter a interpretação

adequada do item polissémico no contexto apropriado.

Page 101: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

95

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

... generative lexicon theory (GL) has succeeded in describing and

explaining many cases of systematic polysemy.

(Buitelaar, 1998: 29)

Após a apresentação de várias abordagens utilizadas na representação dos itens

lexicais, este capítulo centra-se no modelo do Léxico Generativo, quadro teórico em que

este estudo se insere.

Caracterizados os níveis de representação, que codificam toda a informação

pertinente associada aos itens lexicais, bem como os mecanismos generativos, que,

interagindo com essa informação, captam a variação de sentidos em contexto, cabe agora

reflectir sobre alguns casos de polissemia em particular.

Em termos gerais, neste capítulo procede-se a uma caracterização de algumas

expressões polissémicas, do modo como são representadas no quadro do LG, salientando

as virtualidades e dificuldades encontradas, bem como algumas questões sobre a

aplicação dos mecanismos de coerção.

4.1. TIPOS NOMINAIS COMPLEXOS

Considere-se novamente o item livro, polissémico entre as interpretações de

‘objecto físico’ e ‘informação’, cuja entrada lexical se apresenta em (1), de acordo com o

modelo do LG.

Page 102: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

96

(1)

�����������

�����������

����

����

==

==

��

���

==

=

y)xv,,escrever(e

y)xw,,ler(e

x)conter(y,

sico_objecto_fíinformação

sicoobjecto_fí:y

informação: x

livro

2

1

2

1

AGENTIVO

TÉLICO

FORMAL

PLC

AESTR_QUALI

ARG

ARGESTR_ARG

O PLC1 de livro representa o tipo complexo (x•y), que é composto pelos tipos

simples (x:informação) e (y:objecto_físico). Como já foi referido, o PLC contém todas as

combinações possíveis entre os tipos, ou seja, os dois tipos simples e o tipo complexo

resultante da sua combinação. Quando o PLC surge em contexto torna-se necessário

extrair, a partir do tipo complexo, o tipo que contém o significado apropriado. Essa

extracção é feita através do operador Σ, que, do dot object, extrai um dos três tipos

disponíveis – cada um dos tipos individuais e o próprio tipo complexo - como se pode ver

a partir da função apresentada em (2) e contextualizada em (3).

(2) PLC = {σ1 • σ2, Σ1[σ1 • σ2]:σ1, Σ2[σ1 • σ2]:σ2}

(3) a. Σ1[inf•objecto_físico]:inf

b. Σ2[inf•objecto_físico]:objecto_físico

c. inf•objecto_físico_PLC = {inf•objecto_físico, inf, objecto_físico}

Analisem-se, agora, os seguintes exemplos:

(4) a. O João leu o livro.

b. O João escreveu o livro.

c. O João acredita no livro.

1 Para uma definição de PLC cf. 3.3.3.

Page 103: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

97

(5) a. O João rasgou o livro.

b. O João estragou o livro.

c. O João sujou o livro.

(6) O cão estragou o livro mais divertido que eu tinha.

Nas frases em (4) os predicados ler, escrever e acreditar seleccionam o tipo simples

que denota ‘informação’. Nas frases em (5), os predicados rasgar, estragar e sujar

seleccionam o tipo simples ‘objecto físico’. Finalmente, em (6), a ocorrência dos predicados

estragar e divertido na mesma estrutura seleccionam o tipo complexo

informação•objecto_físico, na medida em que cada um dos predicados é aplicado sobre

um tipo simples distinto, fazendo emergir ambos os tipos na mesma estrutura.

Formalmente, na selecção dos tipos semânticos são aplicados os mecanismos de

coerção de subtipo -Θ - e de coerção de complemento - Σ. Em (7) e (8) encontram-se

representados os mecanismos aplicados na extracção do tipo ‘informação’.

(7) a. Θ [livro ≤ informação] : livro → informação

b. Θ [informação ≤ proposição] : informação → proposição

(8) [ ]

[ ] proposição:sico))objecto_fí(inf( proposiçãoinf

proposiçãoinf:proposiçãoinf , inf:sico)objecto_fí(inf

1

1

Σ≤Θ→≤ΘΣ

A estrutura em (7) mostra como o operador Θ permite derivar um supertipo,

através da hierarquia de tipos (livro ≤ informação ≤ proposição). No que respeita à

estrutura em (8), esta ilustra como o operador Σ permite extrair o tipo ‘informação’ (inf)

que pode, por sua vez, ser usado por Θ para obter o supertipo ‘proposição’.

Em (9) é apresentada a interpretação semântica associada à representação em (8).

Em (9b) é aplicado o mecanismo de coerção de complemento que extrai o tipo semântico

adequado (inf). Em (9c) é aplicado o mecanismo de coerção de subtipo que permite

interpretar adequadamente livro como uma proposição, tornando possível interpretar

correctamente a estrutura O João acredita no livro como ‘o João acredita na informação que

está no livro’.

Page 104: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

98

(9) a. O João acredita no livro.

b. acreditar( Θ (Σ1(livro))) (João) �

c. acreditar( Θ (livro:inf)) (João) �

d. acreditar(livro:proposição) (João)

No que respeita à extracção do tipo ‘objecto físico’, em (10) e (11) encontram-se

representados os mecanismos aplicados.

(10) a. Θ [livro ≤ obj_físico] : livro → obj_físico

b. Θ [obj_físico ≤ indivíduo] : obj_físico → indivíduo

(11) [ ]

[ ] indivíduo:sico))objecto_fí(inf( indivíduoobj_físico

indivíduoobj_físico:indivíduoobj_físico , obj_físico:)obj_físico(inf

1

1

Σ≤Θ→≤ΘΣ

À semelhança do que se observou anteriormente, em (12) é apresentada a

interpretação semântica associada à representação em (11), a partir da qual é possível

interpretar adequadamente o João sujou o livro como ‘o João sujou o objecto físico que livro

representa’.

(12) a. O João sujou o livro.

b. sujar(Θ (Σ1(livro))) (João) �

c. sujar(Θ (livro:obj_físico)) (João) �

d. sujar(livro:indivíduo) (João)

Nos exemplos analisados, os mecanismos de coerção, nomeadamente de coerção

de subtipo (Θ ) e de coerção de complemento (Σ), permitem, desta forma, seleccionar o

tipo semântico requerido pelo verbo, obtendo-se a interpretação adequada no contexto

apropriado.

Page 105: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

99

4.1.1. SELECÇÃO SEMÂNTICA E INTERPRETAÇÃO DE TIPOS COMPLEXOS

Como se pode verificar, alguns predicados são semanticamente especificados na

medida em que seleccionam directamente um tipo semântico particular. É o caso de ler,

escrever, acreditar ou divertido, entre outros, que seleccionam o tipo ‘informação’, ou de

rasgar, sujar, riscar ou cair, entre outros, que seleccionam o tipo ‘objecto físico’.

No entanto, existem alguns predicados que podem ser vagos no que respeita ao

tipo semântico que seleccionam.

Observem-se os exemplos apresentados em (13)

(13) a. O João gostou do livro porque tem uma capa bonita.

b. O João gostou do livro porque a história é divertida.

c. O João gostou do livro.

É importante salientar, nestes casos, as propriedades de selecção do predicado

gostar que, semanticamente, selecciona um complemento com uma interpretação eventiva.

A presença das orações subordinadas causais em (13a) e (13b) remetem para a

interpretação de livro como ‘objecto físico’ e ‘informação’, respectivamente. No entanto,

em (13c), não há nenhuma informação que especifique quais são os aspectos de livro de

que o João gosta. Tanto pode ser denotado o ‘objecto físico’ (capa, tamanho, qualidade do

papel), como a ‘informação’ (história, estilo de escrita), como, ainda, o ‘objecto físico’ e a

‘informação’ simultaneamente.

Note-se ainda que o nome livro tem acessível, como parte da sua especificação

lexical, um papel agentivo e um papel télico, relativos ao seu processo típico de criação e

uso, respectivamente. Deste modo, se se aludir ao significado de ‘informação’ - (13b) -, a

frase tem ainda como interpretações possíveis O João gostou de ler/escrever o livro.

Para a estrutura em (13c) são possíveis os vários contextos presentes em (14), que

forçam uma dada interpretação. Nos exemplos em (15) representa-se a forma lógica de

cada interpretação.

Page 106: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

100

(14) a. O João gostou do livro. É de fácil leitura.

b. O João gostou do livro. Divertiu-se muito a escrevê-lo.

c. O João gostou do livro. A capa é bonita e o papel é de boa qualidade.

d. O João gostou do livro. A capa é bonita e a história é muito divertida.

(15) a. ∃x•y ∃e ∃e’[gostar(e, João, e’) ∧ ler(e’, João, y) ∧ livro(x:obj • y:inf)]

b. ∃x•y ∃e ∃e’[gostar(e, João, e’) ∧ escrever(e’, João, y) ∧ livro(x:obj • y:inf)]

c. ∃x•y ∃e[gostar(e, João, x) ∧ livro(x:obj • y:inf)]

d. ∃x•y ∃e[gostar(e, João, x•y) ∧ livro(x:obj • y:inf)]

No entanto, a leitura preferencial e imediatamente reconhecida pelos falantes é a

de ‘informação’, mais particularmente aquela que alude ao papel télico de livro, ou seja,

‘ler’. Contudo, a interpretação que se refere ao papel agentivo, i.e. ‘escrever’, também é

aceite, principalmente se a estrutura envolver aspectos relativos ao conhecimento do

mundo, como se pode observar em (16).

(16) “O Ensaio Sobre a Cegueira” é o livro de que Saramago gostou mais.

Finalmente, a interpretação de ‘objecto físico’ (14c) parece ser mais forçada do que

as anteriores, mas também é aceite pelos falantes e prevista pelo modelo.

Note-se que os predicados que se encontram numa relação de sinonímia,

antonímia ou hiponímia com gostar apresentam um comportamento semântico

semelhante.

(17) a. O João apreciou/adorou o livro.

b. O João detestou/odiou o livro.

A par de predicados como gostar, predicados como vender ou comprar, quando

seleccionam complementos como livro, também admitem ambiguidade relativamente ao

tipo semântico que seleccionam.

(18) O Pedro vendeu o livro.

Page 107: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

101

Neste caso, o complemento livro pode ser interpretado quer como ‘objecto físico’ –

leitura mais imediata – quer como ‘informação’, na medida em que vender o livro pode ser

entendido como vender o conteúdo informacional.

4.1.2. O PAPEL CONSTITUTIVO

Quando os itens lexicais denotam tipos complexos, uma das questões que se

coloca no modelo do LG diz respeito à atribuição do valor respeitante ao seu papel

constitutivo. Pustejovsky (1995a) não apresenta nenhuma especificação relativamente a

este quale. Na verdade, o autor defende a não obrigatoriedade de atribuir valores a todos

os papéis da estrutura qualia.

“There are two general points that should be made concerning qualia roles: (1) Every category expresses a qualia structure; (2) Not all lexical items carry a value for each qualia role.” (Pustejovsky, 1995a: 76)

No caso das expressões polissémicas, verifica-se que os dois tipos simples que

compõem o tipo complexo apresentam constituições diferentes. Relativamente a livro, se,

por um lado, enquanto ‘objecto físico’ livro é composto por capa, folhas e páginas, enquanto

‘informação’ livro é, por sua vez, composto por capítulos, parágrafos, frases, palavras, entre

outros.

Deste modo, o valor do papel constitutivo de livro teria uma representação como a

apresentada em (19).

Page 108: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

102

(19)

[]

��������������

��������������

��������

��������

==

∧∧∧∧∧∧∧∧=

=

=

��

���

==

=

y)xv,,escrever(e

y)xw,,ler(e

...x),parte_de(dfrase(d)x),parte_de(cpalavra(c)

y),parte_de(bfolha(b)y),parte_de(aapa(a)c

x)conter(y,

físico_ objectoinformação

sicoobjecto_fí:y

informação: x

livro

2

1

2

1

AGENTIVO

TÉLICO

CONST

FORMAL

PLC

AESTR_QUALI

ARG

ARGESTR_ARG

No entanto, esta enumeração exaustiva não é a opção mais económica. Como se

referiu no capítulo 3.3.2, para se obter a representação semântica de um item lexical é

necessário que este aceda a um tipo semântico, presente numa rede de tipos

hierarquicamente organizada, de modo a permitir a herança de traços dos seus

supertipos. Assim, também a informação respeitante à estrutura qualia é herdada através

da estrutura de tipos.

Deste modo, pode deduzir-se que livro herda o valor do papel constitutivo dos

seus supertipos - respeitantes ao objecto físico e à informação – não sendo necessário listar

esse valor na sua entrada lexical. O mesmo processo de herança de valores dos papéis

qualia parece ser válido para outros itens polissémicos como banco ou cerejeira, por

exemplo. Cerejeira herdará constituintes como folhas, ramos, tronco, ou raiz, a partir do

supertipo ‘árvore’. Por outro lado, herdará constituintes como veios ou nódulos, a partir do

supertipo ‘madeira’. Relativamente a banco, este herdará constituintes como paredes, tecto

ou janelas, a partir do supertipo ‘edifício’, bem como os constituintes trabalhadores ou

directores, a partir do supertipo ‘instituição’.

Um dos aspectos que merece particular atenção acerca dos elementos constituintes

– ou partes - de livro tem a ver com o facto de estes poderem representar, ou não, casos

análogos de polissemia regular.

Considerem-se, primeiramente, os constituintes relativos ao tipo ‘objecto físico’,

como capa, folhas e páginas.

Page 109: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

103

Relativamente a capa, importa realçar a relação de metonímia existente entre as

interpretações de ‘cobertura – dura ou mole – que protege as folhas que constituem o

livro’, por um lado, e ‘face oposta à contracapa’, por outro. No primeiro caso, capa é, por

sua vez, constituída pela lombada, pela contracapa e pela parte da frente, ou capa. Os

exemplos em (20) ilustram as duas acepções mencionadas.

(20) a. Os livros de capa mole são mais baratos. (cobertura)

b. Comprei o livro que tem o Stephen Hawking na capa. (oposto à contracapa)

Considerem-se agora os exemplos de (21) e (22):

(21) a. Esta capa está riscada/suja/mal impressa.

b. Esta folha está riscada/suja/mal impressa.

c. Esta página está riscada/suja/mal impressa.

(22) a. Esta capa é deprimente/falaciosa/confusa.

b. ??Esta folha é deprimente/falaciosa/confusa.

c. Esta página é deprimente/falaciosa/confusa.

Enquanto nas estruturas em (21) os itens capa, folha e página são interpretados

como ‘objecto físico’, em (22) os mesmos itens denotam a informação contida no

respectivo objecto físico.

A gramaticalidade de (22a) e (22c) mostra que os constituintes de livro - capa e

página - apresentam o mesmo tipo de polissemia que o seu holónimo, ou seja, permitem a

alternância entre as interpretações de ‘objecto físico’ e ‘informação’.

No que respeita a folha, a interpretação de ‘objecto físico’ parece ser mais

proeminente. De facto, quando se refere o tipo ‘informação’ página parece ser a expressão

mais aceite.

Atente-se agora nos constituintes relativos ao tipo ‘informação’, como frases,

parágrafos e desenho.

Page 110: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

104

(23) a. Esta frase é deprimente/falaciosa/confusa.

b. Este parágrafo é deprimente/falacioso/confuso.

c. Este desenho é deprimente/falacioso/confuso.

(24) a. Esta frase está riscada/suja/mal impressa.

b. Este parágrafo está riscado/sujo/mal impresso.

c. Este desenho está riscado/sujo/mal impresso.

Como se pode ver a partir dos exemplos em (23) e (24) os itens frase, parágrafo e

desenho, a par de livro, também apresentam um comportamento polissémico, podendo

entrar em construções que seleccionam quer o tipo ‘informação’ quer o tipo ‘objecto

físico’. Este último pode ser explicado tendo em consideração que estes elementos

ocupam um determinado espaço físico num dado objecto físico.

Tendo já em consideração que os elementos que se encontram numa relação de

subtipificação com livro - como romance ou dicionário - por herdarem certos traços do seu

supertipo são expressões que apresentam igualmente a alternância entre as interpretações

de ‘objecto físico’ e ‘informação’, esta secção tinha como objectivo principal questionar se

os seus constituintes, ou merónimos, também apresentavam esta alternância de

significados. A partir da análise dos exemplos de (21) a (24) pode verificar-se que os

diferentes constituintes referentes aos dois tipos denotados por livro também apresentam

comportamento polissémico.

4.2. ADJECTIVOS RELATIVOS E MODIFICADORES DE PROPRIEDADE

Como se referiu anteriormente no capítulo 2, o mesmo adjectivo pode ter

significados diferentes conforme se encontra em posição pré-nominal ou pós-nominal.

(25) O António é um marinheiro velho.

→ #O António é marinheiro há muito tempo.

→ O António é um marinheiro de idade avançada.

Page 111: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

105

(26) O António é um velho marinheiro.

→ O António é marinheiro há muito tempo.

→ O António é um marinheiro de idade avançada.

Na terminologia de Bouillon (1999), cuja proposta se explora nesta secção2,

enquanto em (25) o adjectivo velho é RELATIVO e a frase tem como única interpretação ‘o

António é um marinheiro de idade avançada’, em (26) o adjectivo é MODIFICADOR DE

PROPRIEDADE3 e a frase pode ser interpretada tanto como ‘o António é marinheiro há

muito tempo‘, como ‘o António é um marinheiro de idade avançada’4.

O comportamento de adjectivos como velho origina, assim, o levantamento de

algumas questões:

(i) Como é que se podem derivar os significados de relativo e de modificador de

propriedade a partir das representações do nome e do adjectivo?

(ii) Como é que o adjectivo velho pode ser ambíguo entre os significados de

relativo e de modificador de propriedade quando se encontra em posição

pré-nominal (Adj N), como se pode observar a partir de (26)?

(iii) Por que é que nem todas as construções Adj N apresentam essa alternância

de significados (por exemplo, porque é que se pode interpretar um velho

amigo como ‘alguém que é amigo há muito tempo’, mas estruturas como um

velho homem ou uma velha tia não podem ser interpretadas como ‘alguém que

é homem/tio há muito tempo’)?

(iv) Por que é que o adjectivo tem de preceder o nome para que a interpretação

de modificador de propriedade seja possível (um marinheiro velho dificilmente

é interpretado como ‘alguém que é marinheiro há muito tempo’)?

2 As representações aqui propostas seguem no essencial a análise de Bouillon (1999) para o Francês. 3 Como se referiu em 2.5.3, na terminologia de Bouillon (1997, 1999), o adjectivo é RELATIVO quando se encontra em posição pós-nominal e MODIFICADOR DE PROPRIEDADE quando se encontra em posição pré-nominal. 4 Os juízos de valor podem variar relativamente à interpretação de frases como O António é um velho marinheiro. Ainda que a interpretação preferencial seja ‘o António é marinheiro há muito tempo’ , em que o adjectivo adquire o valor de modificador de propriedade, não se exclui, neste trabalho, a interpretação de ‘ idoso’ . Note-se, contudo, que esta última não é decorrente da primeira, ou seja, não é necessariamente verdade que, sendo marinheiro há muito tempo, o António seja um indivíduo idoso.

Page 112: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

106

Nas próximas secções tentar-se-á responder a estas questões no quadro do modelo

do LG. As representações subespecificadas permitem derivar os diferentes significados de

adjectivos como velho, tendo em atenção a semântica do próprio adjectivo, a semântica do

nome e o modo como ambos se combinam.

4.2.1. TRANSCRIÇÃO DE TIPO

No que respeita à semântica de adjectivos como velho, estes podem modificar tanto

nomes que denotem indivíduos como nomes que denotem estados, como se pode

observar a partir dos exemplos (27) e (28), respectivamente.

(27) a. um velho homem

b. um velho cão

(28) a. uma velha amizade

b. um velho amor

Bouillon (1999) defende que existe uma relação entre os tipos ‘indivíduo’ e

‘estado’, uma vez que quando adjectivos como velho se combinam com um nome que

denota um indivíduo está implícito que este se encontra num determinado estado. A

partir das estruturas em (27) pode observar-se que homem e cão, ainda que denotando

indíviduos, é o estado de ‘existir’ que é modificado: ‘existem há bastante tempo’.

Os adjectivos como velho podem combinar-se com nomes que denotem

argumentos de tipos diferentes. No caso de marinheiro, por exemplo, que, por poder ser

definido como ‘alguém que tem aptidão para navegar’, pode ser caracterizado como

tendo argumentos de três tipos: humano, estado (ter aptidão) e processo (navegar).

De acordo com o modelo do LG, o adjectivo tem acesso à estrutura qualia do nome

com o qual se combina (Ligação Selectiva)5. Note-se que os adjectivos como velho podem

modificar dois tipos semânticos diferentes (‘indivíduo’ e ‘estado’). Deste modo, estes

5 Cf. capítulo 3.3.4.5.

Page 113: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

107

adjectivos podem predicar sobre ambos os tipos contidos na estrutura qualia do nome,

dando origem à ambiguidade presente nas construções Adj N.

Estruturas como um velho marinheiro podem ser interpretadas do seguinte modo:

(i) o adjectivo é aplicado ao argumento do tipo ‘humano’ denotado por marinheiro,

obtendo-se a interpretação de ‘um indivíduo velho que tem aptidão para navegar’; (ii) o

adjectivo é aplicado ao argumento do tipo ‘estado’ (ter aptidão), obtendo-se a

interpretação de ‘alguém que tem aptidão para navegar há bastante tempo’.

Em (29) encontra-se representada a entrada lexical para o adjectivo velho, adaptada

de Bouillon (1999: 7).

(29)

[ ][ ]

������

������

��

���

∧==

====

)velho(e)e x,existir(e

estado_

estado:e

estado:eindivíduo: x

velho

121

11

21

FORMAL

PLCAESTR_QUALI

EESTR_EVENT

ARGESTR_ARG

A estrutura em (29) representa um estado - existir(e1,x•e2) - que é ‘velho’ -

velho(e1). Bouillon (1999) propõe que o adjectivo toma como argumento o tipo complexo

indivíduo•estado. Esta proposta é inovadora na medida em que, ao considerar que o

adjectivo apresenta um argumento do tipo complexo, o adjectivo tem, necessariamente,

acesso aos tipos que compõem esse tipo complexo, podendo predicar sobre nomes que

denotem apenas um desses tipos. No entanto, no caso de o adjectivo modificar um nome

que denote somente o tipo ‘indivíduo’, por exemplo, este vai ser “coagido” de modo a

denotar igualmente um estado através de um processo de TRANSCRIÇÃO DE TIPO: o

indivíduo encontra-se num estado de existência e esse estado é “velho”.

A TRANSCRIÇÃO DE TIPO é uma variante à COERÇÃO DE TIPO. Em vez de alterar o

tipo semântico do argumento para o tipo requerido pelo predicado, a transcrição de tipo

adiciona à semântica do argumento a informação presente na semântica do predicado. A

sua aplicação depende de dois factores: (i) o adjectivo seleccionar um tipo complexo

indivíduo•estado; (ii) o argumento denotar um tipo contido no tipo complexo do

adjectivo. Deste modo, o argumento não sofre alteração de tipo, apenas lhe é acrescentada

Page 114: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

108

informação relativa ao outro tipo simples que faz parte do tipo complexo do adjectivo,

que ele não possui.

4.2.2. POSIÇÃO DO ADJECTIVO

De acordo com a classificação apresentada em 2.5.3, velho é um adjectivo

predicativo que pode ocorrer tanto em posição adnominal (um homem velho/um velho

homem), como em posição predicativa (este homem é velho). Tendo em consideração esta

propriedade distribucional, esta secção tem como objectivo analisar o modo como o

adjectivo se combina com diferentes tipos de nomes no LG, quer em posição adnominal

quer em posição predicativa. Distinguir-se-ão três tipos de nomes: (i) nomes com o tipo

simples ‘indivíduo’; (ii) nomes com o tipo simples ‘estado’; (iii) nomes que contêm na sua

estrutura semântica elementos com o tipo ‘indivíduo’ e com o tipo ‘estado’.

4.2.2.1. NOMES COM O TIPO SIMPLES ‘INDIVÍDUO’

Considere-se em (30) a representação do nome homem, que denota o tipo simples

‘indivíduo’.

(30) [ ]

������

������

��

���

==

==

x

indivíduo_

indivíduo: x

homem

FORMAL

PLCAESTR_QUALI

ARGESTR_ARG 1

Page 115: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

109

Quando se combina com nomes como homem, os adjectivos como velho só podem

ser aplicados ao tipo semântico ‘indivíduo’, adicionando, através do mecanismo de

transcrição de tipo, o tipo ‘estado’, constituinte do tipo complexo indivíduo•estado

exigido pelo adjectivo.

Em posição predicativa, o conteúdo semântico do nome é inserido no papel formal

da estrutura qualia do adjectivo, como se pode ver em (31).

(31)

[ ][ ]

������

������

��

���

∧∧==

====

indivíduo:homem(x))velho(e)ex,existir(e

estado_

estado:e

estado:eindivíduo: x

velhoé homem este

121

11

21

FORMAL

PLCAESTR_QUALI

EESTR_EVENT

ARGESTR_ARG

Em posição adnominal, é o conteúdo semântico do adjectivo que é inserido no

papel formal da estrutura qualia do nome, como se pode ver em (32).

(32) [ ]

������

������

��

���

∧∧==

==

• )velho(e)ex,existir(e:)velho(e x

indivíduo_

indivíduo: x

homem velhoum / velhohomem um

1211

1

FORMAL

PLCAESTR_QUALI

ARGESTR_ARG

Uma vez que o nome denota apenas um dos tipos simples - ‘indivíduo’ - que

constituem o tipo complexo denotado pelo adjectivo, este só pode modificar o estado

existir (que surge no conteúdo semântico do nome através do mecanismo de transcrição

de tipo) aplicado ao indivíduo denotado pelo nome. Em (33) verifica-se que só existe uma

interpretação possível, independentemente da posição ocupada pelo adjectivo.

Page 116: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

110

(33) a. um homem velho

b. um velho homem

c. Este homem é velho.

→ Um indivíduo que existe há bastante tempo.

4.2.2.2. NOMES COM O TIPO SIMPLES ‘ESTADO’

Considere-se em (34) a representação do nome amizade, que denota o tipo simples

‘estado’.

(34) [ ]

��������

��������

��

���

==

==

��

���

==

=

y) x,,amizade(e

estado_

estado:e

indivíduo:y

indivíduo: x

amizade

1

11

2

1

FORMAL

PLCAESTR_QUALI

EESTR_EVENT

D-ARG

D-ARGESTR_ARG

Do mesmo modo que se verificou anteriormente com o nome homem, que denota

somente o tipo simples ‘indivíduo’, o nome amizade denota somente o tipo simples

‘estado’. Quando nomes como amizade se combinam com adjectivos como velho, estes só

podem modificar o estado existir aplicado a esse tipo. A junção do conteúdo semântico do

adjectivo ao conteúdo semântico do nome processa-se do mesmo modo que se verificou

com homem.

Quando o nome denota um tipo simples - ‘estado’ ou ‘indivíduo’ - o adjectivo

modifica unicamente esse tipo e é sempre interpretado como relativo, não gerando

qualquer ambiguidade dependente da sua posição.

Page 117: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

111

4.2.2.3. NOMES QUE DENOTAM PARES ‘INDIVÍDUO’ - ‘ESTADO’

Considere-se a representação do nome alcoólico, que denota argumentos tanto do

tipo ‘indivíduo’ como do tipo ‘estado’.

(35)

[ ]

�����������

�����������

����

����

==

==

��

���

==

=

==

)ex,,o_de(e ter_hábit

x),beber(e

x

agentivo_

processo:e

estado:e

indivíduo: x

alcoólico

21

2

2-2

1-1

1

AGENTIVO

TÉLICO

FORMAL

PLC

AESTR_QUALI

DE

DEESTR_EVENT

ARGESTR_ARG

Bouillon (1999) distingue o que considera o NÚCLEO, ou seja, os argumentos e os

eventos verdadeiros denotados pelo item lexical, em contraste com os argumentos e os

eventos por defeito. No caso de alcoólico o núcleo é ARG1, enquanto os eventos por defeito

são E1-D e E2-D.

Dependendo do tipo de argumento sobre o qual o adjectivo vai ser aplicado, este

relaciona-se com o nome de modos diferentes: (i) se o adjectivo se aplicar ao núcleo do

nome é interpretado como relativo; (ii) se o adjectivo não se aplicar ao núcleo do nome é

interpretado como modificador de propriedade.

Por seleccionar o tipo complexo indivíduo•estado, os adjectivos como velho,

quando se combinam com nomes cujos argumentos denotam igualmente estes dois tipos,

vão adquirir uma interpretação relativa e de modificadores de propriedade. Observem-se

as representações em (36) e (37):

Page 118: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

112

(36)

[ ]

�����������

�����������

����

����

==

∧∧==

��

���

==

=

==

)ex,,o_de(e ter_hábit

x),beber(e

)velho(e)e x,existir(e:)velho(e x

agentivo_

processo:e

estado:e

indivíduo: x

velhoalcoólico um / alcoólico velhoum

21

2

3233

2-2

1-1

1

AGENTIVO

TÉLICO

FORMAL

PLC

AESTR_QUALI

DE

DEESTR_EVENT

ARGESTR_ARG

(37)

[ ]

�����������

�����������

����

����

∧∧==

==

��

���

==

=

==

• )velho(e)e xexistir(e:)velho(e)ex,,o_de(e ter_hábit

x),beber(e

x

agentivo_

processo:e

estado:e

indivíduo: x

alcoólico velhoum

323,321

2

2-2

1-1

1

AGENTIVO

TÉLICO

FORMAL

PLC

AESTR_QUALI

DE

DEESTR_EVENT

ARGESTR_ARG

Em (36) o adjectivo modifica o tipo ‘indivíduo’, ou seja, o núcleo da estrutura de

alcoólico, adquirindo uma interpretação relativa, independentemente de se encontrar em

posição pré ou pós-nominal – ambas as estruturas um alcoólico velho e um velho alcoólico

têm a interpretação de ‘idade avançada’, ou seja, ‘um indivíduo que existe há bastante

tempo e que é alcoólico’. A informação semântica do adjectivo é inserida no papel formal

da estrutura qualia, ou seja, o papel que denota o tipo ‘indivíduo’.

A outra interpretação possível para o adjectivo em posição pré-nominal – ‘um

indivíduo que é alcoólico há bastante tempo’ - encontra-se representada em (37). O

adjectivo modifica o tipo ‘estado’ e o seu conteúdo semântico é inserido no papel

agentivo, ou seja, o papel que denota ‘o hábito de beber’.

Quando o adjectivo se encontra em posição predicativa – este alcoólico é velho – é a

informação semântica do nome que é inserida no papel formal da estrutura qualia do

Page 119: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

113

adjectivo. A construção predicativa só tem como interpretação ‘um indivíduo que existe

há bastante tempo e que é alcoólico’. Nas construções predicativas, independentemente

de os nomes que se combinam com o adjectivo denotarem argumentos com apenas um

dos tipos ou ambos os tipos que constituem o tipo complexo denotado pelo adjectivo, este

só modifica o tipo ‘indivíduo’. A representação de este alcoólico é velho, em (38), é, deste

modo, semelhante à de este homem é velho, apresentada em (31).

(38)

[ ][ ]

������

������

��

���

∧∧==

====

indivíduo:x)alcoólico()velho(e)ex,existir(e

estado_

estado:e

estado:eindivíduo: x

velhoé alcoólico este

121

11

21

FORMAL

PLCAESTR_QUALI

EESTR_EVENT

ARGESTR_ARG

Através do modelo do LG é possível, deste modo, representar os diferentes

significados que os adjectivos como velho podem adquirir, dependendo da posição que

ocupam relativamente ao nome com o qual se combinam. As diferentes interpretações de

‘idade avançada’, por um lado, e ‘existência num determinado estado há bastante tempo’,

por outro, são representadas através da modificação de valores de papéis qualia distintos

da semântica do nome. Enquanto no primeiro caso o adjectivo modifica o valor do papel

formal, no segundo caso o adjectivo modifica o valor do papel agentivo.

4.3. CAUSATIVOS ASPECTUAIS

Os predicados causativos aspectuais, como começar, apresentam um

comportamento polissémico na medida em que, do ponto de vista sintáctico, permitem a

selecção de diferentes tipos de complementos, como se pode observar a partir das

estruturas em (39).

Page 120: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

114

(39) a. O João começou o livro

b. O João começou a ler o livro.

c. O João começou a escrever o livro.

Como foi referido no capítulo anterior, os diferentes contextos sintácticos são

explicados através de um mecanismo de coerção que “coage” os complementos que não

apresentam o tipo sintáctico-semântico requerido pelo verbo a adquirir esse tipo

sintáctico-semântico6.

O facto de a estrutura em (39a) poder ser ambígua entre as estruturas (39b) e (39c)

prende-se com o facto de o verbo começar seleccionar um evento que pode ser denotado

pelos valores dos papéis télico e agentivo do nome que lhe serve de complemento, neste

caso, livro.

No entanto, alguns autores têm contestado a aplicação do mecanismo generativo

de coerção de tipo como uma estratégia eficaz no que respeita à interpretação adequada

de algumas estruturas da língua. Na próxima secção analisar-se-ão algumas estruturas

que parecem apresentar-se como contra-exemplos à aplicação dos mecanismos de

coerção, mas que, como se verá, também podem ser analisadas através destes

mecanismos.

4.3.1. ALGUMAS QUESTÕES SOBRE A COERÇÃO

Algumas estruturas com começar parecem revelar que alguns complementos

nominais não permitem a aplicação dos processos de coerção, tornando-se necessário

restringir a acção dos mecanismos de coerção por forma a não haver sobregeração de

interpretações. Atente-se nos seguintes exemplos:

(40) a. *O João começou o dicionário. (... começou a consultar...)

b. *O João começou a auto-estrada. (... começou a conduzir...)

6 Cf. capítulo 3.3.4.1.

Page 121: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

115

O que as estruturas em (40) evidenciam é que, para as interpretações em questão, o

mecanismo de coerção falha, gerando agramaticalidade, por não encontrar no papel télico

do complemento nominal - ‘consultar’ no caso de dicionário e ‘conduzir’ no caso de auto-

estrada - o tipo esperado pelo verbo começar. Em Pustejovsky & Bouillon (1996)

argumenta-se que os verbos causativos como começar seleccionam um evento do tipo

transição, excluindo, consequentemente, as interpretações de consultar o dicionário e

conduzir a auto-estrada, visto tratar-se de processos. Deste modo, as estruturas em (40)

terão uma interpretação adequada se o mecanismo de coerção se aplicar ao papel agentivo

dos complementos, que denota o acto de criação, ou seja, um evento de transição do tipo

esperado (cf. 41).

(41) a. O João começou o dicionário. (... começou a compilar...)

b. O João começou a auto-estrada. (... começou a construir...)

A mesma explicação sobre a selecção de complementos que denotem transições

está na base da agramaticalidade das estruturas em (43).

(42) a. O João começou o livro. (... começou a ler/escrever...)

b. O João começou o queijo. (...começou a comer...)

(43) a. *O João começou livros. (... começou a ler/escrever...)

b. *O João começou queijos. (... começou a comer...)

Enquanto em (42) a estrutura eventiva denota uma transição, sendo a aplicação do

mecanismo de coerção bem sucedida, em (43), a indefinitude do SN complemento altera o

tipo de evento de transição para processo, falhando a aplicação do mecanismo de coerção.

Deste modo, conclui-se que os complementos seleccionados pelos verbos

causativos aspectuais têm de ter associada uma estrutura eventiva do tipo transição,

disponível directamente ou através do mecanismo de coerção.

Outra restrição à aplicação do mecanismo de coerção está relacionada com as

estruturas de controlo e de elevação em que alguns verbos causativos aspectuais podem

entrar. Atente-se nos seguintes exemplos:

Page 122: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

116

(44) a. A festa começou.

b. O jantar começou.

Para além das estruturas de controlo como as apresentadas em (39), o verbo

começar pode, também, entrar em construções de elevação como as apresentadas em (44).

A relação sintáctica existente entre as construções de controlo e de elevação é, de

alguma forma, semelhante à relação existente entre as construções causativas e incoativas,

como se pode observar a partir de (45) e (46).

(45) a. O avião afundou o barco.

b. O barco afundou.

(46) a. A Maria começou o filme.

b. O filme começou.

Pustejovsky (1995a) propõe que se aplique o conceito de causalidade à alternância

entre as construções de controlo e de elevação.

“... both raising and control constructions exist for the same aspectual predicate, given that causative and unaccusative forms exist for the same predicate, as with sink. That is, we can view the relation between these two constructions as one involving causation in much the same way as the default causative paradigm.” (Pustejovsky, 1995a: 201)

Apesar de os significados associados às estruturas de controlo e de elevação

estarem estreitamente relacionados, em Pustejovsky & Bouillon (1996) defende-se que só

as estruturas de controlo permitem a coerção.

Atente-se nos seguintes exemplos:

(47) a. O Rui começou a escrever a tese.

b. O Miguel começou a beber a cerveja.

c. O ácido começou a corroer o mármore.

d. O João começou a ficar enjoado.

Page 123: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

117

Um dos testes-diagnóstico que permite distinguir os predicados de controlo dos

predicados de elevação consiste em construir estruturas com o verbo forçar, denominadas

CONSTRUÇÕES COMPLEMENTO DE FORÇAR (force-complement constructions). Apenas o sentido

de controlo satisfaz as restrições de selecção impostas pelo verbo forçar.

(48) a. O João forçou o Rui a escrever a tese.

b. A Ana forçou o Miguel a beber a cerveja.

c. *O Luís forçou o ácido a corroer o mármore.

d. *A Sofia forçou o João a ficar enjoado.

Conforme se pode observar a partir das estruturas com o verbo forçar em (48), de

acordo com este teste-diagnóstico, a gramaticalidade de (48a) e (48b) permite concluir que

o verbo começar em (47a) e (47b) é um predicado de controlo, que selecciona uma

transição, e que permite a aplicação dos mecanismos de coerção.

(49) a. O Rui começou a tese. (... começou a escrever...)

b. O Miguel começou a cerveja. (... começou a beber...)

Pelo contrário, a agramaticalidade de (48c) e (48d) permite admitir que o verbo

começar em (47c) e (47d) é um predicado de elevação, que selecciona, nos exemplos

mencionados, um processo e um estado, respectivamente, mas que não coloca restrições

quanto à estrutura eventiva do seu complemento7. Estes predicados não permitem a

aplicação dos mecanismos de coerção.

(50) a. *O ácido começou o mármore (... começou a corroer...)

b. *O João começou o enjoo. (... começou a ficar...)

Deste modo, ainda que possa ocorrer em construções de controlo e de elevação, a

natureza da estrutura eventiva do complemento com que co-ocorre em cada um dos casos

é diversa: enquanto predicado de controlo selecciona apenas transições ao passo que

7 Para mais argumentação sobre esta análise cf. Pustejovsky & Bouillon (1996).

Page 124: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

118

enquanto predicado de elevação não impõe restrições quanto à estrutura eventiva do seu

complemento.

No âmbito do LG, a entrada lexical de começar, apresentada em (51) possibilita

ambos os sentidos, o de controlo e o de elevação.

(51)

�����������

�����������

��

���

���

���

<=

��

���

==

=

=

==

=

=

=

)ex,,meçar(eacto_de_co

x),P(e

estado:e

processo:e

e

humano: x

começar

21

2

22

11

22

1

AGENTIVO

FORMAL A ESTR_QUALI

RESTR

E

E

ESTR_EVENT

ARG

ARGESTR_ARG

Como se referiu no capítulo 3, a par dos predicados que exibem a alternância

causativo/incoativo, predicados como começar também são caracterizados pela natureza

não endocêntrica da sua estrutura eventiva, ou seja, não são especificados relativamente

ao núcleo. Deste modo, uma estrutura não endocêntrica como (51) pode ter como

proeminente, ou núcleo, qualquer um dos subeventos que compõem a estrutura eventiva.

Por sua vez, estes subeventos vão estar associados a um papel qualia específico.

“A proeminência de um subevento relativamente aos restantes dá conta da não projecção na sintaxe dos argumentos associados a todos os eventos não nucleares, licenciando apenas a projecção de argumentos associados ao subevento que constitui o NÚCLEO da estrutura.” (Berkeley Cotter, 2002: 69)

Como se pode observar a partir de (51), os papéis qualia estão associados a

subeventos diferentes. Vai ser com base no mecanismo de especificação do núcleo que se

determina o subevento e, consequentemente, o papel qualia mais proeminentes numa

determinada estrutura, desencadeando, assim, as construções de controlo ou de elevação.

Deste modo, se o subevento inicial (e1:processo) for o núcleo, projectando informação

relativa ao papel agentivo (acto_de_começar), está-se perante uma construção de controlo

(A Maria começou o filme). Por outro lado, se o subevento final (e2:estado) for o mais

Page 125: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO

119

proeminente, projectando informação relativa ao papel formal (P(e2,x)), está-se perante

uma construção de elevação (O filme começou).

Ao longo desta secção pretendeu-se ilustrar que existem restrições ao nível da

aplicação dos mecanismos de coerção, evitando-se, deste modo, a sobregeração de

interpretações.

“Without a proper notion of constraints on coercion, however, there can indeed be overgeneration of interpretations in the semantics, and in fact, the notion of conditions on coercion has always been integral to the basic spirit of generative lexicons.” (Pustejovsky & Bouillon, 1996: 133)

No próximo capítulo analisar-se-ão diferentes casos de polissemia regular com

base num conjunto de fenómenos de referência, nomeadamente a co-predicação. No

seguimento de Copestake & Briscoe (1995), esta distinção tem como principal

consequência a existência de diferentes modos de representação dos itens lexicais:

descrições complexas segundo o modelo generativo de Pustejovsky (1995a), por um lado,

e significados relacionados através de regras lexicais, por outro.

Page 126: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

120

Page 127: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

121

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE

SIGNIFICADOS

... there exist various types of polysemy, and, following from that, various

types of identifying and representing lexical senses.

(Verspoor, 1997: 225)

No seguimento da necessidade de representar computacionalmente os vários

significados dos itens polissémicos, no âmbito do projecto ACQUILEX, Copestake & Briscoe

(1995) distingue dois tipos de polissemia regular: a polissemia construcional, por um lado, e a

extensão de significados, por outro.

A polissemia construcional prevê um único significado atribuído numa entrada

lexical, contextualmente especificado através de processos de co-composição sintagmática. A

extensão de significados relaciona previsivelmente dois ou mais significados.

Do ponto de vista da formalização e da implementação, a polissemia construcional é

tratada como uma instanciação de uma entrada lexical subespecificada, enquanto a extensão

de significados recorre ao uso de regras lexicais (já referidas no capítulo 3), que podem ser

usadas tanto para relacionar significados completamente convencionados, como para serem

aplicadas produtivamente para reconhecer novos usos.

Um dos fundamentos para a distinção entre estes dois tipos de polissemia e,

consequentemente, a criação de dois modos distintos de representação, baseia-se no modo

Page 128: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

122

como os diferentes significados de um item polissémico se relacionam entre si. Enquanto com

alguns itens é possível aceder aos seus diferentes significados na mesma estrutura, com

outros apenas é possível aceder a um dos significados em cada estrutura. O teste utilizado

para aceder aos diferentes significados de um item polissémico numa mesma estrutura

denomina-se CO-PREDICAÇÃO.

5.1. TIPOS COMPLEXOS E CO-PREDICAÇÃO

Como se referiu anteriormente, ao contrário dos nomes não polissémicos, que

denotam um tipo semântico simples - faca (x:artefacto), homem (x:indivíduo) -, os itens

polissémicos denotam tipos semânticos complexos - livro (x:objecto_físico, y:informação),

banco (x:instituição, y:edifício). No que respeita aos tipos complexos, é importante definir de

que modo é que eles se relacionam, i.e., se ambos os tipos podem ou não estar acessíveis

simultaneamente num dado contexto.

No âmbito do LG, Buitelaar (1998) propõe a existência de dois tipos complexos

distintos, ligados por diferentes operadores:

‘•’ - liga tipos relacionados sistematicamente que são sempre interpretados

simultaneamente.

‘°’ - liga tipos relacionados sistematicamente que nunca podem ser interpretados

simultaneamente.

Segundo o autor, o tipo complexo (x•y) denota um objecto complexo cujos tipos são

sempre interpretados em simultâneo, como, por exemplo, livro ou cassete (x:informação,

y:objecto físico). Por outro lado, o tipo complexo (x°y) denota um objecto complexo cujos

Page 129: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

123

tipos nunca são interpretados em simultâneo, como, por exemplo, janela ou porta (x:abertura,

y:objecto físico).

No entanto, como se sustenta em Pinto (2001), se, por um lado, no Português, os tipos

denotados por cassete podem não ser interpretados simultaneamente, por outro, os tipos

denotados por porta podem ser interpretados simultaneamente, como se pode verificar em (1)

e (2) respectivamente1.

(1) A cassete está partida.

(2) A Ana entrou pela porta que o João pintou de amarelo.

Enquanto em (1) só se alude ao objecto físico, em (2) tanto a interpretação de

‘abertura’ como a de ‘objecto’ estão disponíveis.

Demonstrando a inadequação da proposta de Buitelaar (1998) para os casos acima

descritos, Pinto (2001: 85) procede a uma redefinição das relações existentes entre os tipos

complexos:

‘•’ - liga tipos relacionados sistematicamente que são interpretados

simultaneamente.

‘°’ - liga tipos relacionados sistematicamente que podem não ser interpretados

simultaneamente.

De acordo com esta nova proposta, o tipo complexo (x•y) denota um objecto

constituído por tipos que são geralmente interpretados em simultâneo, como, por exemplo,

cassete ou livro (x:informação, y:objecto físico). Por outro lado, o tipo complexo (x°y) denota

um objecto constituído por tipos que podem ou não ser interpretados em simultâneo, como,

por exemplo, banco (x:instituição, y:edifício).

1 Exemplos retirados de Pinto (2001: 85).

Page 130: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

124

No entanto, de acordo com esta nova proposta, ambos os tipos complexos (x•y) e (x°y)

permitem que os significados de um item polissémico possam ou não ser interpretados

simultaneamente, tornando-se, por isso, um pouco redundante.

Considerem-se os exemplos (3) e (4), apresentados em Pinto (2001: 63-64, 76).

(3) a. O João pediu um empréstimo ao banco.

b. O banco foi reconstruído por um arquitecto japonês.

c. O João pediu um empréstimo ao banco que foi reconstruído por um arquitecto

japonês.

(4) a. A cassete está partida.

b. A cassete ficou mal gravada.

c. A cassete está partida e ficou mal gravada.2

De acordo com a autora, banco seria representado pelo tipo complexo

instituição°edifício e cassete pelo tipo complexo informação•objecto físico. Os exemplos

apresentados em (3) e (4) ilustram que ambos os tipos complexos podem apresentar uma

estrutura em que cada um dos tipos simples está disponível (3a, 3b, 4a, 4b), bem como uma

estrutura em que ambos os tipos ocorrem simultaneamente (3c, 4c), não parecendo, assim,

existir nenhuma diferença relativamente ao modo como os tipos se combinam.

O que parece ser importante distinguir é se, por um lado, existe algum caso em que os

tipos que constituem o tipo complexo possam ser interpretados simultaneamente (não sendo,

contudo, necessário que tal aconteça sempre) e, por outro, verificar se existe algum caso em

que os tipos que constituem o tipo complexo nunca possam ser interpretados

simultaneamente (caso representado pelo operador ‘°’ proposto por Buitelaar (1998), mas

que, em Português, parece não ser adequado ao exemplo que o autor apresenta).

2 Ainda que Pinto (op. ci.:76) apresente a estrutura em (4c) por forma a ilustrar que o item cassete pode ser interpretado simultaneamente como ‘ objecto físico’ e ‘ informação’, na verdade, a expressão ficou mal gravada pode denotar também o objecto físico, não havendo, nesse caso, selecção de tipos diferentes. Um exemplo que ilustra melhor a interpretação simultânea de ambos os tipos será a cassete é “ pimba” e está partida.

Page 131: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

125

Um dos testes utilizados para aceder aos tipos simples que compõem um tipo

complexo na mesma estrutura sintáctica consiste na co-predicação. Em concreto, dois

predicados distintos seleccionam o mesmo argumento sintáctico (que incluirá o item

polissémico), mas, a nível semântico, seleccionam tipos diferentes, como se pode verificar

pelos exemplos de (5) a (7).

(5) O livro está rasgado mas é muito divertido.

(6) O ladrão entrou pela janela amarela.

(7) Este banco dá facilidades de empréstimo e fica ao lado da minha casa.

Enquanto em (5) o predicado rasgado só pode remeter para o tipo ‘objecto físico’, o

adjectivo divertido envolve, necessariamente, o tipo ‘informação’. Do mesmo modo, em (6), o

verbo entrar selecciona o tipo que denota a abertura, enquanto o adjectivo amarela requer o

tipo que denota o objecto físico. Finalmente, em (7), a estrutura dá facilidades de empréstimo

remete para o tipo ‘instituição’, ao passo que fica ao lado da minha casa recupera o tipo

‘edifício’.

Propõe-se, deste modo, uma nova reformulação no que respeita à relação existente

entre os tipos complexos de um dado item.

‘•’ - liga tipos relacionados sistematicamente que podem ser interpretados

simultaneamente.

‘°’ - liga tipos relacionados sistematicamente que não podem ser interpretados

simultaneamente.

Deste modo, e seguindo o modelo do LG, janela, cujos tipos podem ser interpretados

simultaneamente, e cabrito, cujos tipos não podem ser interpretados simultaneamente, como

se analisará na secção 5.3.1, são representados da seguinte forma:

Page 132: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

126

(8)

�����������

�����������

����

����

=∧=

==

��

���

==

=

y)xw,,econstruir(

y)x,,tapar(ey),luz(eentrar_ar_

x)conter(y,

abertura_sicoobjecto_fí

abertura :y

sicoobjecto_fí : x

janela

3

21

2

1

AGENTIVO

TÉLICO

FORMAL

PLC

QUALIA_ESTR

ARG

ARGESTR_ARG

(9)

�����������

�����������

����

����

=∧=

==

��

���

==

=

y)w,,cozinhar(e

y)z,,comer(ex),arne(efornecer_c

y)conter(x,

comida_animal

comida :y

animal : x

cabrito

3

21

2

1

AGENTIVO

TÉLICO

FORMAL

PLC

QUALIA_ESTR

ARG

ARGESTR_ARG

Diferente da proposta de Buitelaar (1998) é a de Copestake & Briscoe (1995). Com base

na assunção de que a impossibilidade de co-predicação entre os vários significados de um

item implica que esses mesmos significados não podem estar disponíveis na mesma

estrutura, os autores distinguem os dois tipos de polissemia e de representações já

mencionados, e sobre os quais vão incidir as próximas secções deste capítulo.

Page 133: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

127

5.2. POLISSEMIA CONSTRUCIONAL (MODULAÇÃO DE SIGNIFICADOS)

Na polissemia construcional, o item lexical polissémico é representado através de

entradas lexicais complexas, seguindo o modelo do LG. Este tipo de polissemia assenta na

assunção de que a um dado item lexical é atribuído um significado básico e de que a

alternância entre o(s) outros(s) significado(s) em contexto é consequência da herança de

valores dos seus papéis qualia e da aplicação de processos de co-composição sintagmática (cf.

capítulo 3.3.4).

Os itens polissémicos pertencentes a esta classe podem ser co-predicados. Existe uma

única entrada lexical que, aliada a mecanismos de coerção, permite que se aceda a ambos os

significados do item, disponibilizando-os simultaneamente no mesmo contexto sintáctico.

Os itens polissémicos de categoria verbal e adjectival são sempre tratados como

fenómenos de polissemia construcional. São, igualmente, tratadas no âmbito da polissemia

construcional algumas alternâncias nominais.

5.2.1. POLISSEMIA CONSTRUCIONAL ADJECTIVAL

Um dos casos de polissemia construcional diz respeito à modificação adjectival.

(10) a. O squash é um jogo rápido.

b. O Ferrari é um carro rápido.

c. O João é um condutor rápido.

d. A Maria é uma dactilógrafa rápida.

e. Esta partida de ténis foi rápida.

f. Há que tomar decisões rápidas.

Como já foi referido, os adjectivos adquirem diferentes significados seleccionando

uma determinada interpretação, contida na estrutura qualia dos nomes que modificam,

Page 134: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

128

através do mecanismo generativo de ligação selectiva (cf. capítulo 3.3.4.5). Nos exemplos em

(10), o adjectivo predica sobre os papéis agentivo ou télico dos nomes com os quais co-ocorre,

adquirindo os significados de ‘movimento rápido’ (a, b), ‘execução de uma acção

rapidamente’ (c, d, e) e ‘execução de uma acção que requer um tempo reduzido’ (f).

É possível coordenar adjectivos do mesmo tipo ou de tipos diferentes, ainda que

sejam impostas algumas restrições à produtividade deste processo, principalmente quando os

adjectivos seleccionam papéis qualia distintos (cf. (11a)). No entanto, em (11b), a coordenação

é gramatical, uma vez que as propriedades coordenadas se encontram relacionadas. Por

razões pragmáticas é mais esperado que um bom dactilógrafo seja ‘rápido e inteligente’ do que

‘rápido e bem vestido’.

(11) a. ?Uma dactilógrafa rápida e bem-vestida.

b. Uma dactilógrafa rápida e inteligente.

No que respeita à coordenação de nomes modificados pelo mesmo adjectivo, é

possível coordenar nomes que denotem o mesmo tipo ou que se encontrem numa relação de

subtipificação. A coordenação também é aceite se o adjectivo seleccionar o mesmo papel

qualia dos nomes coordenados.

(12) a. Alain Prost só se entusiasma com pistas e carros rápidos. (que se percorrem /

conduzem rapidamente)

b. A televisão e a serra eléctrica são boas. (funcionam bem)

c. O administrador quer para a sua empresa dactilógrafos e computadores

rápidos. (que trabalham rapidamente)

d. *Este livro e esta criança são difíceis. (de ler/de educar)

Page 135: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

129

5.2.2. POLISSEMIA CONSTRUCIONAL VERBAL

Considerem-se agora os seguintes exemplos:

(13) a. O João quer uma cerveja

a’ O João quer beber uma cerveja.

b. O João quer um livro.

b’ O João quer ler um livro.

c. O João quer um cigarro.

c’ O João quer fumar um cigarro.

Nos exemplos em (13) o verbo querer, do ponto de vista sintáctico, subcategoriza um

SN ou uma frase infinitiva. Semanticamente, requer um complemento com uma interpretação

eventiva. As frases (13a), (13b) e (13c) são interpretadas como (13a’), (13b’) e (13c’),

respectivamente, devido à aplicação do mecanismo generativo de coerção de tipo. O verbo

querer, que selecciona um determinado tipo semântico, “coage” o seu argumento a adquirir o

tipo requerido. Este mecanismo evita que as diferentes interpretações que querer pode

assumir sejam listadas em entradas lexicais distintas, contrariamente ao que acontece com as

abordagens enumerativas (cf. capítulo 3.1).

A existência de uma única entrada lexical subespecificada que interage com o

mecanismo generativo de coerção de tipo permite que, em contexto, qualquer interpretação

do predicado verbal possa emergir. Essa acessibilidade de significados a partir da entrada

lexical licencia o fenómeno de co-predicação, somente possível nos casos de polissemia

construcional.

(14) a. O João quer uma cerveja e um cigarro.

a’. O João quer beber uma cerveja e fumar um cigarro.

b. A minha avó só quer renda e telenovelas.

b’. A minha avó só quer fazer renda e ver telenovelas.

Page 136: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

130

Realça-se aqui que, para se obter a interpretação adequada do verbo querer nas

estruturas (14a) e (14b), não é necessário que o mecanismo de coerção seja aplicado aos

mesmos papéis qualia dos complementos nominais coordenados. De facto, enquanto em (14a,

a’) o mecanismo de coerção é aplicado ao papel télico de cerveja e cigarro, em (14b, b’) o

mecanismo de coerção é aplicado ao papel agentivo de renda e ao papel télico de telenovelas.

5.2.3. POLISSEMIA CONSTRUCIONAL NOMINAL

Existem algumas alternâncias nominais em que os diferentes significados podem ser

co-predicados. Neste caso, o item nominal é representado através de uma única entrada

lexical em que a interacção entre as diferentes estruturas que a compõem - nomeadamente a

argumental e a qualia - e os vários mecanismos generativos permitem seleccionar os

diferentes significados nos contextos apropriados.

Os exemplos de (15) a (18) ilustram como nas alternâncias OBJECTO FÍSICO-

INFORMAÇÃO, OBJECTO FÍSICO-ABERTURA, CONTINENTE-CONTEÚDO e INSTITUIÇÃO-EDIFÍCIO,

através do PLC (que contém todas as combinações de tipos possíveis, ou seja, os dois tipos

simples e o tipo complexo resultante da sua combinação), é possível dar conta da

interpretação de cada um dos tipos isoladamente - alíneas (a) e (b) - ou em simultâneo - alínea

(c).

(15) a. Este livro é muito divertido.

b. O Duarte rasgou o livro.

c. O Duarte rasgou o livro mais divertido que tinha.

(16) a. Os bombeiros entraram pela janela.

b. O João tem uma janela de vidro fumado.

c. Os bombeiros entraram pela janela de vidro fumado.

Page 137: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

131

(17) a. A Ana pegou no copo.

b. Vamos beber um copo com os amigos.

c. A Ana bebeu o copo que tinham posto à sua frente.

(18) a. Este banco tem o melhor crédito bonificado.

b. O banco fica ao lado do supermercado.

c. Este banco tem o melhor crédito bonificado e fica ao lado do supermercado.

5.3. EXTENSÃO DE SIGNIFICADOS (ALTERAÇÃO DE SIGNIFICADOS)

Contrastando com os casos de polissemia construcional, existe um caso de polissemia

regular, referida como extensão de significados, que consiste na criação previsível de

diferentes significados relacionados através de regras lexicais. O formalismo utilizado para

exprimir estas regras é suficientemente expressivo para descrever processos de morfologia

derivacional, conversão, metonímicos e metafóricos.

Uma das motivações para a aplicação destas regras tanto a processos metonímicos

como a processos de morfologia derivacional reside no facto de as regras lexicais criarem

significados derivados a partir de significados-base, muitas vezes relacionados com

alterações morfológicas ou gramaticais subtis. Em Copestake & Briscoe (1995) sublinha-se

que, no Inglês, alguns casos de metonímia, como a alternância CONTEÚDO-CONTINENTE,

podem ser acompanhados de processos derivacionais, como se pode verificar pelos exemplos

em (19).

(19)3 a. He drank a whole bottle (of whiskey).

b. He drank a bottleful (of whiskey).

3 Tradução: Ele bebeu uma garrafa inteira (de whiskey).

Page 138: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

132

As alternâncias que envolvem metonímia podem não envolver qualquer alteração

sintáctica numa determinada língua, mas envolver alterações sistemáticas noutras. Enquanto

no Inglês não há qualquer alteração na forma das palavras que denotam o fruto, por um lado,

e a árvore da qual o fruto é proveniente, por outro (olive, apple)4, resultando num caso de

polissemia regular nesta língua, o mesmo não acontece com línguas como o Português, o

Espanhol e o Italiano. No Português ocorre normalmente uma regra morfológica de sufixação

(maçã - macieira)5, enquanto no Espanhol e no Italiano, ambos apresentam uma alteração no

género da palavra (aceituna - aceituno, pomela - pomelo).

Outro exemplo semelhante ocorre com a alternância ANIMAL-COMIDA, em que não há

qualquer alteração na forma da palavra, tanto no Português (cordeiro) como no Inglês (lamb),

mas em que, contrariamente, no Alemão se procede a um processo de sufixação _vless para

derivar a interpretação de ‘carne’ (lams, lamsvless).

A par das regras de morfologia derivacional, que tanto podem alterar a categoria

sintáctica do item como mantê-la inalterável (construirV → construçãoN; cerejaN → cerejeiraN), as

regras de extensão de significados também podem alterar, ou não, a estrutura sintáctica e

semântica do item sobre o qual são aplicadas (cerejeiraNcontável → cerejeiraNmassivo).

Existem ainda outras semelhanças entre as regras derivacionais e as regras de

extensão de significados: ambos os processos são produtivos e ambos permitem ser

bloqueados. No que respeita à morfologia derivacional, a forma regular roubador não ocorre

normalmente devido à existência da forma ladrão. Por seu lado, no que respeita à extensão de

significados, a geração de boi, enquanto denotando a substância carne, derivada do animal

com o mesmo nome, é bloqueada devido à existência do lexema sinónimo vaca.

4 Tradução: (azeitona/oliveira, maçã/macieira). 5 No caso de oliveira, do latim olivaria, esta forma já sofreu um processo de sufixação no latim a partir da forma latina oliva. Em Português oliva tem, hoje em dia, um uso reduzido, praticamente só literário (“Creio que este voc. desapareceu do uso vencido pelo arabismo azeitona. A partir, porém, do séc. XVI voltou a aparecer, mas apenas como termo de linguagem literária, quer na acepção de “azeitona” , quer na de “oliveira” .” (in Dicionário Etimológico da Língua Portuguesa, José Pedro Machado)).

Page 139: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

133

5.3.1. EXTENSÃO DE SIGNIFICADOS NOMINAIS

Um dos processos de polissemia de extensão de significados mais produtivos é aquele

que gera nomes massivos, que denotam uma substância, a partir de nomes contáveis, que

denotam um objecto físico. As alternâncias ANIMAL-COMIDA, ÁRVORE-MADEIRA e PEDRA

PRECIOSA-MINERAL são disso um exemplo.

Tal como no caso da polissemia construcional, não é assumido que os diferentes

significados deste tipo de expressões estejam exaustivamente listados no léxico. A geração de

novos significados é feita através de regras lexicais que têm como input um significado-base e

como output um significado derivado. A aplicação destas regras está sujeita a processos de

bloqueio (cf. capítulo 3.2).

No entanto, e contrariamente ao caso de polissemia construcional - em que os

diferentes significados são derivados a partir de uma única entrada lexical, permitindo que

sejam co-predicados - no caso de extensão de significados, a aplicação de regras lexicais

impede que os significados-base (input) e derivado (output) estejam acessíveis

simultaneamente. Os processos de co-predicação, permitidos pela polissemia construcional,

dificilmente são aceites na extensão de significados.

(20) a. O cabrito teve de ser amamentado com um biberão.

b. O João comeu cabrito ao jantar.

c. * O João amamenta e come cabrito.

(21) a. A Ana plantou uma cerejeira no quintal.

b. A Ana prefere os móveis em cerejeira.

c. *A Ana planta e prefere cerejeira.

(22) a. O Grão-Mogol é o diamante mais célebre do mundo, com 280 quilates.

b. Algumas ferramentas industriais são feitas de diamante.

c. *O diamante é muito valioso e pode ser utilizado na construção de algumas

ferramentas industriais.

Page 140: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

134

No entanto, no caso da alternância ANIMAL-COMIDA, é importante salientar a

existência de estruturas como a apresentada em (23), em que ambos os significados do item

estão acessíveis simultaneamente.

(23) Foi um prato de cabrito, colhido ali mesmo na Serra da Peneda, que o júri escolheu

como o melhor deste concurso.

Contudo, a alteração sintáctica de nome contável para nome massivo, nalgumas

línguas, a ocorrência de processos derivacionais de sufixação para derivar um dos

significados, noutras, e a existência de estruturas em que não é possível a co-predicação

continuam a ser motivações para que a alternância ANIMAL-COMIDA seja tratada através de

uma regra de extensão de significados.

Outro tipo de processo metonímico bastante produtivo nas línguas é aquele permite

que nomes de objectos e locais denotem indivíduos.

(24) a O terceiro violino é muito convencido.

b. A mesa três quer uma coca-cola.

c. O avião aplaudiu a aterragem do piloto.

(25) a. O país elegeu Jorge Sampaio para Presidente da República.

b. Lisboa admite encerrar o aeroporto devido ao mau tempo.

c. O Governo ouviu a aldeia no ano passado.

Tal como no caso das alternâncias anteriores, a co-predicação também não é possível

com este tipo de estruturas. Os exemplos em (26) mostram que não é possível, na mesma

estrutura, aceder aos significados de ‘objecto físico’ e ‘indivíduos’. O mesmo acontece nos

exemplos em (27) relativamente aos significados de ‘local’ e ‘indivíduos’.

Page 141: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

135

(26) a. *O terceiro violino está riscado e é muito convencido.

b. *A mesa três está suja e quer uma coca-cola.

c. *O avião já tinha feito vários voos sem ir à revisão e aplaudiu a aterragem do

piloto.

(27) a. *O país é banhado a oeste pelo Oceano Atlântico e elegeu Jorge Sampaio para

Presidente da República.

b. *Lisboa fica situada na foz do Tejo e admite fechar o aeroporto devido ao mau

tempo.

c. *O Governo reconstruiu e ouviu a aldeia no ano passado.

No entanto, o teste de co-predicação pode nem sempre dar uma indicação clara acerca

da possibilidade de aceder, na mesma estrutura, a ambos os significados de um item

polissémico, podendo mesmo gerar previsões conflituosas, como adiante se verá.

5.3.2. METÁFORAS

Apesar de a maior parte dos fenómenos de extensão de significados estar relacionado

com processos metonímicos, Briscoe & Copestake (1991) sugere que mecanismos semelhantes

podem também ser usados para dar conta de processos metafóricos. Um desses processos

consiste na aplicação de características particulares de animais a humanos.

(28) Ele é um porco/burro.

Este tipo de extensão de significados é aparentemente produtivo, ainda que as

características envolvidas não possam ser previsíveis a partir do significado do animal. As

propriedades dos animais atribuídas aos humanos são associações estereotipadas do animal

que não estão codificadas na estrutura qualia. Deste modo, a interpretação do nome em frases

Page 142: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

136

como a apresentada em (28) deve ser expressa em termos de uma regra lexical de extensão de

significados, como a apresentada em (29).

(29)

�������������������

�������������������

�������

�������

���

���

==

=

=

=

�������

�������

���

���

==

=

=

=

1SEXRQS

3ORTH

2SYNTAX

1SEXRQS

3ORTH

2SYNTAX

pessoa

0

animal

1

calregra_lexi

5.4. O TESTE DE CO-PREDICAÇÃO

Apesar de se fazer a distinção entre polissemia construcional e extensão de

significados e, consequentemente, de se sugerirem dois métodos diferentes de tratamento da

polissemia regular, essa distinção nem sempre é linear. Não é fácil, através do teste de co-

predicação, distinguir os casos em que os diferentes aspectos de uma entidade estão

codificados numa única entrada lexical dos casos em que é necessário postular a construção

de regras lexicais para determinar o significado apropriado do item lexical.

No âmbito do LG, também se torna difícil distinguir os casos em que os diferentes

tipos podem ser interpretados simultaneamente, sendo ligados pelo operador ‘•’, dos casos

Page 143: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

137

em que os diferentes tipos não podem ser interpretados simultaneamente, sendo ligados pelo

operador ‘°’.

O teste de co-predicação, utilizado em ambos os modelos, pode não dar uma

indicação clara sobre se se consegue aceder simultaneamente aos diferentes significados de

um item polissémico, uma vez que os resultados da coordenação podem ser mais ou menos

antagónicos consoante as construções sintácticas utilizadas.

Ao longo deste trabalho as estruturas de co-predicação têm sido construídas a partir

de três construções sintácticas distintas: (i) coordenação; (ii) orações relativas; (iii) SN’s com

modificadores.

Considerem-se novamente os itens livro e aldeia. Como se verificou anteriormente,

enquanto no caso de livro a co-predicação é possível, sendo tratado como um caso de

polissemia construcional (Copestake & Briscoe, 1995), ou através do operador ‘•’ (Buitelaar,

1998), no caso de aldeia a co-predicação, à partida, não é possível, sendo tratado como um

caso de extensão de significados, ou através do operador ‘°’, conforme as propostas

adoptadas.

(i) CO-PREDICAÇÃO ATRAVÉS DE PREDICADOS COORDENADOS

A coordenação pode ser feita através de predicados adjectivais ou verbais, conforme

se pode observar pelos exemplos (30) e (31), respectivamente.

(30) a. ??Este livro é amarelo e divertido.

b. ??Esta aldeia é ocidental e comunista.

(31) a. O João comprou e memorizou o livro ontem.

b. *O Governo reconstruiu e ouviu a aldeia no ano passado.

Page 144: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

138

(ii) CO-PREDICAÇÃO ATRAVÉS DE ORAÇÕES RELATIVAS

A co-predicação através de orações relativas permite com alguma facilidade aceder

aos vários significados de um item, independentemente de as estruturas envolverem orações

relativas restritivas ou explicativas, como ilustram os exemplos (32) e (33).

(32) a. O livro que tem a capa amarela é muito divertido.

b. A aldeia que não foi reconstruída o ano passado manifestou-se contra o

governo.

(33) a. Este livro, que tem a capa amarela, é muito divertido.

b. Esta aldeia, que não foi reconstruída o ano passado, manifestou-se contra o

governo.

(iii) CO-PREDICAÇÃO ATRAVÉS DE SN’S COM MODIFICADORES

Considerem-se os seguintes exemplos:

(34) a. O João memorizou o livro amarelo.

b. O governo reconstruiu a aldeia comunista.

(35) a. O livro amarelo é divertido.

b. A aldeia ocidental é comunista.6

6 Comparem-se os seguintes exemplos:

(1) a. ??O livro divertido é amarelo. b. ??A aldeia comunista é ocidental.

O facto de a troca de adjectivos tornar as frases anómalas está relacionado com uma ordem generalizada que estabelece que os adjectivos se agrupam de acordo com o seu campo semântico: as características físicas precedem as características abstractas (Demonte, 1999).

Page 145: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

139

(36) a. O livro de capa amarela é divertido.

b. A aldeia do lado ocidental é comunista.

O que se pretende mostrar a partir dos exemplos apresentados em (30) - (36) é que o

teste de co-predicação pode gerar construções gramaticais ou não consoante a estrutura

sintáctica utilizada. De facto, não é possível aceder simultaneamente aos diferentes

significados de aldeia através de estruturas com coordenação, o mesmo não acontecendo com

estruturas com orações relativas ou com SN’s com modificadores, o que torna estes testes

pouco fiáveis.

As construções de co-predicação com orações relativas ou com SN’s modificados

parecem permitir mais facilmente o acesso simultâneo aos vários significados de um item do

que as construções com coordenação.

No âmbito da proposta de Copestake & Briscoe (1995), se itens como aldeia forem

tratados como casos de extensão de significados, a co-predicação não é previsível nem pode

ocorrer. Os diferentes significados não estão acessíveis a partir de uma única estrutura.

Quando um dos significados é derivado a partir de uma regra lexical, o significado-base

deixa de estar acessível. Por este motivo não devia existir nenhuma estrutura em que a co-

predicação fosse possível. Contudo, os exemplos (32b), (33b), (34b), (35b) e (36b), construídos

a partir de orações relativas e de SN’s com modificadores, apresentam casos de co-

predicação, em que os significados de ‘local’ e ‘conjunto de pessoas’ estão acessíveis

simultaneamente. Apenas as construções de co-predicação através de estruturas com

coordenação geram agramaticalidade.

Como se referiu anteriormente, também no âmbito do modelo do LG, o facto de o

teste de co-predicação poder gerar resultados conflituosos torna difícil decidir se os tipos

semânticos dos itens lexicais se encontram relacionados através do operador ‘•’ ou através do

operador ‘°’.

Desta observação levantam-se algumas questões importantes. Pode considerar-se que

o teste de co-predicação através de construções com coordenação, por ser o mais restringido,

é o mais fiável e que, consequentemente, se gerar estruturas agramaticais, então a co-

predicação não pode ocorrer. No entanto, caso gere agramaticalidade, como no caso de aldeia,

Page 146: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

140

em (30b) e (31b), torna-se necessário explicar a possibilidade de aceder simultaneamente aos

diversos significados através de outro tipo de construções.

De facto, o teste de co-predicação através de estruturas com coordenação parece ser o

mais fiável e o único em que os diferentes predicados, encontrando-se, do ponto de vista

sintáctico, ao mesmo nível, estão realmente a co-predicar sobre o mesmo item lexical.

No que respeita às estruturas com orações relativas que, contrariamente às estruturas

com coordenação, apresentam, do ponto de vista sintáctico, uma configuração de adjunção,

admite-se que, ao recuperar o objecto linguístico (livro, aldeia), o pronome relativo recupera

todo o tipo complexo e não apenas um dos tipos simples. Deste modo, o predicado

introduzido pela oração relativa continua a predicar sobre todo o tipo complexo e não sobre

um tipo simples em particular, deixando, assim, de haver co-predicação.

Relativamente às estruturas com SN’s com modificadores, que podem apresentar uma

configuração de adjunção ou complementação, admite-se que a presença do modificador

conduz a uma relação de subtipificação relativamente a um dos tipos simples que compõem

o tipo complexo. Em estruturas como o governo reconstruiu a aldeia comunista, o item aldeia

denotará o tipo complexo composto pelos tipos simples ‘local’ e ‘comunistas’, sendo este

último um subtipo de ‘indivíduos’. De um modo análogo, em estruturas como a aldeia

ocidental/do lado ocidental manifestou-se a favor da regionalização, o item aldeia denotará o tipo

complexo composto pelos tipos simples ‘indivíduos’ e ‘ocidental’, sendo este último um

subtipo de ‘local’. Nestes casos, os itens comunista e ocidental não estão a predicar sobre um

tipo simples (‘indivíduos’ e ‘local’, respectivamente), fazendo eles próprios parte do tipo

complexo. Deste modo, também neste tipo de estrutura sintáctica deixa de haver co-

predicação.

Admitindo que o teste de co-predicação através de construções com coordenação é o

teste mais fiável, é necessário explicar por que razão as estruturas em (30), em que são

coordenados predicados adjectivais, são pouco naturais se não mesmo inaceitáveis. De facto,

como se referiu em 5.2.1, da mesma forma que são impostas algumas restrições à

coordenação de adjectivos quando estes seleccionam papéis qualia diferentes, também

parecem ser impostas algumas restrições à coordenação de adjectivos que seleccionem tipos

semânticos diferentes. Enquanto em estruturas como um livro grande e amarelo ou um livro

Page 147: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

141

metafórico e divertido os diferentes adjectivos seleccionam o mesmo tipo semântico e as frases

são gramaticais, em estruturas como um livro amarelo e metafórico os adjectivos seleccionam

tipos semânticos diferentes tornando a frase inaceitável.

Importa, ainda, salientar o facto de a estranheza das co-predicações poder dever-se,

também, a incompatibilidades entre os predicados. Há que ter em atenção a coerência

semântica das estruturas e evitar predicar propriedades sem uma relação aparente entre si,

uma vez que é fácil construir exemplos de co-predicação de difícil aceitação por incoerência

semântica.

5.5. A PROBLEMÁTICA DE ITENS COMO JORNAL

Existem alguns itens que constituem um tipo mais complexo de polissemia. É o caso

de jornal ou revista, que tanto podem ser interpretados como o ‘objecto físico’ ou como a

‘informação’ nele contida, comportando-se do mesmo modo que livro, carta ou artigo.

Contudo, estes itens também pode ter os significados de ‘instituição’, ‘edifício’ ou ‘grupo de

pessoas’, comportando-se do mesmo modo que banco, fábrica ou escola, entre outros. Atente-se

nos seguintes exemplos:

(37) a. Aquele jornal fica do outro lado da rua.

b. Aquele jornal foi processado por difamação.

c. Aquele jornal manifestou-se ontem, em frente à Assembleia da República,

contra a decisão do tribunal.

d. Aquele jornal está cheio de linguagem metafórica.

e. Aquele jornal está sujo de café.

Nos exemplos em (37) estão presentes os diferentes significados relativamente à

entidade jornal: distinguem-se as propriedades que denotam o ‘edifício’ (a), a ‘instituição’ (b),

o ‘conjunto de pessoas’ (c), o ‘conteúdo informativo’ (d) e o ‘objecto físico’ (e).

Page 148: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

142

A co-predicação entre os significados de ‘edifício’, ‘instituição’ e ‘conjunto de pessoas’

parece ser permitida, conforme ilustram os exemplos em (38).

(38) a. Aquele jornal fica do outro lado da rua e foi processado por difamação.

b. Aquele jornal foi processado por difamação e manifestou-se ontem, em frente à

Assembleia da República, contra a decisão do tribunal.

c. Aquele jornal fica do outro lado da rua e manifestou-se ontem, em frente à

Assembleia da República, contra a decisão do tribunal.

d. Aquele jornal fica do outro lado da rua, foi processado por difamação e

manifestou-se ontem, em frente à Assembleia da República, contra a decisão

do tribunal.

Por outro lado, a co-predicação entre os significados de ‘informação’ e ‘objecto físico’

também parece ser permitida, conforme ilustram os exemplos em (39).

(39) Aquele jornal está cheio de linguagem metafórica e sujo de café, por isso é muito

difícil de ler.

No entanto, a co-predicação entre os significados de ‘instituição’, ‘edifício’ e ‘conjunto

de pessoas’, por um lado, e os significados de ‘objecto físico’ e ‘informação’, por outro, gera

agramaticalidade, como ilustram os exemplos de (40) a (42).

(40) a. *Aquele jornal fica do outro lado da rua e está sujo de café.

b *Aquele jornal fica do outro lado da rua e está cheio de linguagem metafórica.

(41) a. *Aquele jornal foi processado por difamação e está sujo de café.

b. *Aquele jornal foi processado por difamação e está cheio de linguagem

metafórica.

Page 149: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

143

(42) a. *Aquele jornal manifestou-se ontem, em frente à Assembleia da República,

contra a decisão do tribunal e está sujo de café.

b. *Aquele jornal manifestou-se ontem, em frente à Assembleia da República,

contra a decisão do tribunal e está cheio de linguagem metafórica.

Contudo, em alguns casos, a co-predicação entre os significados de ‘instituição’ e

‘objecto físico’ parece aceitável.

(43) O jornal foi processado pela oposição e queimado nas ruas pelos manifestantes.

Estes dados conduzem a uma questão importante no que respeita a itens como jornal:

como é que as suas propriedades semânticas são representadas no léxico?

Uma das propostas é a apresentada em Pustejovsky (1995a: 155). O autor só

contempla três interpretações para jornal: ‘objecto’ físico’, ‘informação’ e ‘instituição’. Jornal

distingue-se, assim, de livro na medida em que este último não pode denotar a instituição

editorial.

Por poder denotar três tipos distintos, itens como jornal distinguem-se, igualmente, no

que respeita à construção do PLC. Deste modo, o PLC de jornal consiste numa construção de

dois tipos, um dos quais é por si só um tipo complexo. A estrutura em (44) representa o modo

como os tipos se combinam numa hierarquia de tipos.

(44) objecto_físico informação

instituição material_impresso (•)

jornal (•) livro

Page 150: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

144

A partir das representações em (45) e (46) pode observar-se que o PLC de jornal é

construído recursivamente através de pares de tipos. Em (45) é construído o PLC relativo ao

tipo complexo objecto_físico•informação - σ1•σ2 - idêntico a nomes como livro. Em (46) é

construído o PLC relativo ao tipo complexo instituição•(objecto_físico•informação),

característico de itens como jornal.

(45) ( ) 2 1

21��:�PLC

�:� �:�

(46) ( ) ( )2 13

213���:

�PLC

��:�

�:�

••

A estrutura qualia de jornal especifica, deste modo, uma relação produto-produtor. O

papel agentivo refere o elemento que denota a relação produto-produtor e o papel formal

refere o elemento que denota o produto.

(47)

�����������

�����������

����

����

==

==

��

���

==

=

••

y)x,,publicar(e

y)w,ler(e

y

sico_objecto_fíinformaçãooinstituiçã

sicoobjecto_fíinformação:y

oinstituiçã: x

jornal

1

2,

2

1

AGENTIVO

TÉLICO

FORMAL

PLC

AESTR_QUALI

ARG

ARGESTR_ARG

Note-se que o tipo complexo instituição•(objecto_físico•informação) nunca ocorre

como valor dos papéis qualia, o que significa que só um dos valores semânticos –

‘objecto_físico•informação’, por um lado, e ‘instituição’, por outro - pode estar disponível.

Page 151: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

145

Deste modo, é possível dar conta da agramaticalidade de frases como as apresentadas em (40)

- (42).

No entanto, esta proposta não contempla a aceitabilidade da frase apresentada em

(43), nem os casos em que jornal também pode ser interpretado como ‘edifício’ e ‘conjunto de

pessoas’. Como se referiu, itens como jornal ou revista denotam dois tipos complexos

distintos, ainda que, de certo modo, relacionados: o tipo complexo objecto_físico•informação

- podendo os tipos que o compõem entrar em estruturas de co-predicação - e o tipo complexo

edifício•(instituição•conjunto_pessoas)7 - cujos tipos também podem entrar em estruturas de

co-predicação. No entanto, através dos testes de co-predicação apresentados em (40) – (42),

verificou-se que a co-predicação entre estes dois tipos complexos gera, normalmente,

agramaticalidade.

Outro modo de representação possível por forma a captar os diferentes significados

de jornal e o modo como eles se relacionam baseia-se na proposta de Buitelaar (1998) e

consiste num PLC que representa o tipo complexo (objecto_físico•informação) °

(edifício•(instituição•conjunto_pessoas)), como se pode ver a partir de (48). O papel agentivo

continua a especificar a relação produtor-produto, o papel formal especifica o produto e o

papel télico o evento de ler. Contudo, ao contrário da representação em (47) os tipos

complexos ocorrem como valor dos papéis qualia. A possibilidade de só um dos tipos

complexos - objecto_físico•informação, por um lado, e edifício•(instituição•conjunto_pessoas),

por outro – estar disponível numa estrutura é representada por meio do operador ‘°’.

7 No seguimento de Pustejovsky (1995a) assume-se que a construção do PLC de jornal relativamente a estes três tipos é feita do seguinte modo:

(1) ( ) essoasconjunto_p oinstituiçã:�PLC

essoasconjunto_p:� oinstituiçã:�

(2) ( ) ( )essoasconjunto_p oinstituiçãedifício:�

PLC

essoasconjunto_poinstituiçã:�

edifício:�

••

Considera-se, deste modo, que a interpretação de ‘ conjunto de pessoas’ está mais estreitamente relacionada com a de ‘instituição’ do que com a de ‘edifício’ .

No que respeita à construção de tipos complexos a partir de três tipos (instituição•edifício•conjunto_pessoas) e não recursivamente através de pares de tipos, Pustejovsky (1995a: 155) defende que “There may, in fact, turn out to be instances of dot objects that are constructed from three dot elements or more, but this is question open to further investigation.”.

Page 152: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

146

(48)

�����������������

�����������������

����

����

==

∧==

����

����

====

=

••

••

y) xz, w,produzir(e

y) xi,,ler(e

w)conter(z,y)conter(x,

z)_w(y)(x

edifício:z

essoasconjunto_poinstituiçã: w

informação:y

sicoobjecto_fí: x

jornal

2

1

4

3

2

1

AGENT

TÉLICO

FORMAL

PLC

AESTR_QUALI

ARG

ARG

ARG

ARG

ESTR_ARG

Em suma, o PLC apresentado em (48) consiste, assim, no novo tipo complexo

(x•y)°(z•(w•k)). Enquanto o operador ‘•’ liga tipos que podem ser interpretados

simultaneamente, o operador ‘°’ liga tipos que não podem ser interpretados

simultaneamente. No entanto, no seguimento de Buitelaar (1998), admite-se que, em alguns

casos, esta restrição possa ser violada e a co-predicação seja permitida, ainda que o autor só

se refira a casos de trocadilhos e uso humorístico da linguagem. Mas dada a relação estreita,

imediatamente reconhecida pelos falantes, entre o produto e o produtor, existente em nomes

como jornal, torna-se possível interpretar estruturas como as apresentadas em (43).

No âmbito da proposta de Copestake & Briscoe (1995), que propõe a existência de

regras lexicais quando não é possível aceder a todos os significados de um item na mesma

estrutura, os autores não defendem, no entanto, a utilização das mesmas por forma a derivar

os significados de jornal - ‘instituição’, ‘edifício’ e ‘conjunto de pessoas’ - que não podem co-

predicar com os significados de ‘informação’ e ‘objecto físico’, ou vice-versa. Contudo, os

Page 153: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS

147

autores também não consideram a existência de uma única entrada lexical que consiga captar

todos os significados de jornal.

“... assuming that a single structure can cover all the senses of newspaper is highly problematic. Constructing a qualia structure to cover all the senses of newspaper in such a way that different predicates can apply appropriately is difficult, since it seems that the copy and the organization sense (at least) should have their own distinct qualia.” (Copestake & Briscoe, 1995: 30)

Copestake & Briscoe (1995) assumem, então, a existência de duas estruturas,

correspondendo uma ao significado ‘objecto físico’, e a outra ao significado ‘instituição’.

“Thus, for newspaper, we assume two structures, one corresponding primarily to the copy and one to the institution. Both of these may be involved in constructional polysemy - the text and parent organisation of the newspaper copy is accessible via its qualia, and conversely the copies are accessible from the structure representing the parent organisation.” (Copestake & Briscoe, 1995: 30)

Da necessidade de criação de um modelo de semântica lexical que consiga captar

todos os significados que um item lexical pode adquirir surgem duas abordagens

interessantes e que mereceram particular destaque. O modelo do LG, inovador no que

respeita ao seu poder generativo, tem sido largamente estudado nos últimos anos e adoptado

por muitos investigadores na tentativa de criar um modelo computacional que consiga captar

o significado adequado dos itens lexicais no contexto apropriado. Desenvolvendo uma

representação semântica com base na noção de co-composicionalidade, o LG permite captar a

variação do significado em função do contexto reduzindo o número de entradas

armazenadas no léxico, tornando-se, assim, num modelo generativo universal, económico e

descritivamente adequado.

Por outro lado, a proposta de Copestake & Briscoe (1995) combina o poder generativo

do LG com a especificidade das regras lexicais, que permitem captar generalizações

específicas de uma língua. De facto, como se referiu na secção 5.3, uma das motivações para a

aplicação das regras lexicais reside no facto de, em algumas línguas, alguns casos de

metonímia serem acompanhados de processos derivacionais. No entanto, para além da

aplicação das regras lexicais poder ser específica de uma determinada língua, acarretam

Page 154: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

148

ainda a desvantagem de não preverem a criação de novos significados. A produtividade e

criatividade das línguas permitem compor significados inesperados em contexto dificilmente

captáveis através das regras lexicais.

Outra das motivações fundamentais para a aplicação de regras lexicais respeitava ao

facto de não ser possível aceder simultaneamente aos diferentes significados de alguns itens

polissémico na mesma estrutura sintáctica, o que constituía um indício de que esses

significados não podiam estar acessíveis a partir de uma única entrada lexical. No entanto,

Buitelaar (1998) propõe, no âmbito do LG, a inserção do operador ‘°’, que também permite

distinguir os casos em que os diferentes significados de um item lexical não podem ser

interpretados simultaneamente, contribuindo, deste modo, para a “riqueza” e economia do

modelo.

Page 155: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

6. CONCLUSÃO

149

6. CONCLUSÃO

Sense delimitation is largely an open problem. It is indeed almost

impossible to state precise and general principles that characterize the

boundaries of different senses of a lexeme and what a sense exactly is.

(Saint-Dizier, 1998a:125)

A polissemia é uma questão bastante complexa que tem constituído, nos últimos

anos, objecto de investigação aprofundada no âmbito da semântica lexical. A criatividade

das línguas naturais e o recurso a processos metafóricos e metonímicos constituem o

factor fundamental para a produção de novos significados.

A distinção entre a polissemia e os restantes fenómenos de ambiguidade lexical,

nomeadamente a vaguidade e a homonímia, ainda que teoricamente pareça bem

estabelecida, e de limites concretos, pode apresentar, na prática, alguns problemas. Por

vezes, pode tornar-se difícil precisar com segurança se se está perante: (i) diferentes

significados relacionados que uma palavra particular possui (polissemia); (ii) modulação

de um significado particular de uma palavra (vaguidade); (iii) diferentes significados

respeitantes a diferentes palavras com a mesma forma (homonímia). Como se pôde

observar no capítulo 2, o contexto desempenha um papel fundamental na delimitação de

sentidos de uma dada palavra, na medida em que conduz à interpretação particular do

seu valor semântico. O que num dado contexto pode ser entendido como uma palavra

vaga, pode, noutro contexto, ser interpretado como uma palavra polissémica.

Centrando-se no fenómeno de polissemia regular (que pressupõe que as

alternâncias de significados ocorrem de forma previsível e sistemática dentro de uma

Page 156: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

150

determinada classe de palavras), este trabalho reuniu um vasto conjunto de exemplos que

representam casos relevantes de polissemia em Português. Verificou-se que se podem

observar itens com comportamento polissémico nas três principais categorias sintácticas

(nominal, verbal e adjectival) e analisaram-se os tipos de relações existentes em cada uma.

Tendo em atenção as relações existentes entre os vários significados dos itens

polissémicos, há que modelizar a informação lexical de modo a permitir o acesso a todas

as possíveis interpretações. Surgem, então, no âmbito da Semântica Lexical

Computacional, várias abordagens de representação dos itens lexicais. Destacam-se neste

trabalho os Léxicos Enumerativos de Sentidos, as Regras Lexicais e o modelo do Léxico

Generativo, analisados detalhadamente no capítulo 3.

Os Léxicos Enumerativos de Sentidos são considerados ineficientes e incompletos

tanto a nível linguístico como a nível computacional. Para além de postularem uma

entrada lexical distinta para cada significado da palavra (o que resulta numa proliferação

de entradas lexicais que, em termos computacionais, implica custos importantes a nível de

eficiência do sistema), os LES tornam-se incompletos na medida em que, dada a

produtividade e criatividade das línguas, não é possível enumerar exaustivamente todos

os significados de um item lexical. Para além disso, os LES acarretam ainda a

desvantagem de não permitirem captar a relação sistemática existente entre os

significados dos itens polissémicos, assumindo um processamento equivalente ao da

homonímia.

Diferente da abordagem enumerativa, as Regras Lexicais (Copestake & Briscoe

(1992, 1995), Ostler & Atkins (1992)) permitem a geração de significados a partir de um

significado-base. As regras estão sujeitas a processos de bloqueio de modo a evitar

ambiguidades desnecessárias, como a geração de um significado que já está lexicalizado,

no léxico, noutra palavra. É o caso da geração do significado de ‘comida’ para o item boi,

que é bloqueado devido à lexicalização de vaca para o mesmo significado. No entanto,

esta abordagem também apresenta algumas desvantagens. Para além do facto de

poderem ser específicas de uma determinada língua ou dialecto, e não universais, as

regras lexicais nem sempre conseguem prever a criação de novos significados, tornando-

se necessário construir novas regras para dar conta dos novos significados.

Tentando dar conta da polissemia regular de forma económica e descritivamente

adequada, o modelo do Léxico Generativo (Pustejovsky, 1995a) assenta em entradas

lexicais complexas e em mecanismos generativos que permitem obter a interpretação

Page 157: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

6. CONCLUSÃO

151

adequada do item polissémico no contexto apropriado. As entradas lexicais são

compostas por três níveis de representação relevantes (Estrutura Argumental, Etrutura

Eventiva e Estrutura Qualia), que codificam toda a informação pertinente relativamente a

um item lexical. A interagir com essa informação encontram-se vários mecanismos

generativos (Coerção de Tipo, Co-composição e Ligação Selectiva) que permitem derivar

os significados em contexto, dando conta da criatividade característica das línguas

naturais.

Por ser baseado na co-composicionalidade, ou seja, na interacção entre o

significado de um dado item com o significado dos seus argumentos, o LG torna-se um

modelo económico (na medida em que reduz o número de entradas armazenadas no

léxico), dinâmico (encarando o léxico como um componente flexível, subespecificado e

sensível ao contexto), universal e, fundamentalmente, capaz de prever os significados das

palavras.

É no quadro do LG que se analisam, no capítulo 4, para o Português, alguns itens

com comportamento polissémico, representantes de cada uma das categorias sintácticas

consideradas. Observa-se como, através de representações no quadro do LG, itens como

livro, velho e começar são adequadamente processados e interpretados.

Uma outra proposta de processamento da polissemia é a de Copestake & Briscoe

(1995) que se fixa num conjunto de fenómenos de referência (co-predicação) que

permitem distinguir diferentes casos de polissemia regular e, consequentemente,

diferentes modos de representação: palavras dotadas de uma descrição complexa

segundo o modelo generativo, por um lado, e significados relacionados através de regras

lexicais, por outro. Um outro argumento a favor da existência de regras lexicais para

explicar os fenómenos de extensão de significados baseia-se na comparação com

processos morfológicos e derivacionais. De facto, em algumas línguas, como o Espanhol, o

Italiano, o Alemão e mesmo o Inglês, alguns processos de alteração de significados são

muitas vezes acompanhados de processos morfológicos, como a alteração do género da

palavra ou processos de sufixação, o que pode indiciar que os processos morfológicos e

semânticos agem em simultâneo.

Todavia, a motivação mais forte para postular dois modos diferentes de

representação dos itens polissémicos reside na possibilidade, ou não, de aceder, na mesma

estrutura, a todos os significados de um item polissémico. Através de testes de co-

predicação, Copestake & Briscoe (1995) propõe que, se for possível aceder

Page 158: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

152

simultaneamente, na mesma estrutura sintáctica, aos diferentes significados de um item,

então este é tratado como um caso de polissemia construcional e representado através de

uma entrada lexical subespecificada. Por outro lado, se não for possível aceder

simultaneamente aos diferentes significados de um item polissémico, então este é tratado

como um caso de extensão de significados e derivado através de uma regra lexical.

No entanto, Buitelaar (1998) propõe, no âmbito do LG, a inserção do operador ‘°’,

que, contrariamente a ‘•’, relaciona tipos que não podem ser interpretados

simultaneamente. A distinção entre estes operadores contribui para a riqueza do modelo

do LG, deixando, deste modo, de haver necessidade de postular a existência de regras

lexicais.

No seguimento da inadequação das definições dos operadores ‘•’ e ‘°’, para o

Português, propostas por Buitelaar (1998) - por serem demasiado “rígidas” - e Pinto (2001)

- por serem pouco precisas -, propõe-se, no capítulo 5, uma nova reformulação no que

respeita à relação existente entre os tipos simples que compõem os tipos complexos de um

dado item.

Na tentativa de construir testes de co-predicação constatou-se, no presente

trabalho, que os mesmos podem não dar uma indicação clara acerca da possibilidade de

aceder, na mesma estrutura, a ambos os tipos semânticos de um item polissémico,

podendo mesmo gerar previsões conflituosas consoante as construções sintácticas

utilizadas. Podendo ser construídos através de estruturas com coordenação, orações

relativas e SN’s com modificadores, concluiu-se que, por ser aquele em que se verifica

uma verdadeira co-predicação, encontrando-se os predicados ao mesmo nível na

estrutura sintáctica, o teste mais fiável é o de co-predicação através de estruturas com

coordenação.

Analisaram-se, ainda, alguns itens que constituem um caso mais complexo de

polissemia, como jornal e revista, propondo-se uma representação no quadro do LG capaz

de captar todos os significados que estes itens podem comportar.

Como se evidenciou ao longo deste trabalho, o contexto é um componente

fundamental no estabelecimento da multiplicidade de significados de um item lexical.

Qualquer sistema de Semântica Lexical Computacional que vise captar e prever o

comportamento polissémico dos itens lexicais tem de ter em atenção que os itens se

relacionam uns com os outros, adquirindo significados diferentes em virtude dos itens

Page 159: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

6. CONCLUSÃO

153

que seleccionam ou pelos quais são seleccionados. Por ter em atenção o contexto, o

modelo do LG parece ser, de facto, aquele que melhor capta e prevê essa alteração de

significados, sendo, como se referiu anteriormente, económico, dinâmico e universal. O

seu poder generativo, do qual se tentou dar conta ao longo deste trabalho, permite prever

o significado de um vasto conjunto de itens em contexto, tendo sido, por isso já muito

estudado e adoptado em várias implementações computacionais.

Sendo um modelo relativamente recente, o LG pode ainda estar incompleto ou ser

pouco preciso relativamente a algumas questões (as estruturas de hierarquia de tipos são

ainda pouco definidas). No entanto, os vários estudos e propostas de que tem sido alvo só

o podem beneficiar e servir para enriquecer e tornar mais sólido o modelo (note-se a

proposta de Buitelaar (1998)).

Um possível trabalho futuro poderá consistir na adaptação da informação

codificada nas estruturas qualia e argumental a bases de dados lexicais electrónicas, como

a WordNet, contribuindo assim para o enriquecimento das mesmas1.

1 De facto, já existem algumas propostas nesse sentido, nomeadamente Mendes & Chaves (2001): “Since WordNet is a lexical inheritance system, the qualia features (and in fact, the relations already available) must be monotonically inherited. Thus, if such an enrichment is to take place, what is semantically specified for a hyperonym is shared by its hyponyms, keeping synsets as simple as possible.” (Mendes & Chaves, op.cit.: 6)

Page 160: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

154

Page 161: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

REFERÊNCIAS

155

REFERÊNCIAS

ALVES, A. T. (1993), “Levantamento e Análise da Bibliografia sobre o Tempo na Língua

Portuguesa (first draft)”, Cadernos de Semântica nº 13, Faculdade de Letras da

Universidade de Lisboa.

APRESJAN, J. D. (1973), “Regular Polysemy”, Linguistics, 142, pp. 5-32.

ASHER, N., A. Lascarides (1995), “Metaphor in discourse”, Representation and Acquisition of

Lexical Knowledge: Polysemy, Ambiguity and Generativity, AAAI Symposyum, Menlo

Park, California.

ASHER, N., J. Pustejovsky (2000), “The Metaphysics of Words in Context”, in

BERKELEY COTTER, M.J.F. (2002), Especificações para a Computação dos Predicados Causativos,

Dissertação de Mestrado, Universidade de Lisboa.

BOUILLON, P. (1996), “Mental State Adjectives: the Perspective of Generative Lexicon”,

Proceedings of COLING-96, Copenhaguen.

BOUILLON, P. (1997), Polymorphie et Sémantique Lexical: Le Cas des Adjectifs, Thèse de Troisième

Cycle, Université de Paris 7 Denis Diderot.

BOUILLON, P. (1999), “The Adjective “Vieux”: the Point of View of “Generative Lexicon””, in

E. Viegas (ed.), Breadth and Depth of Semantic Lexicons, Kluwer, pp. 148-166.

Page 162: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

156

BRISCOE, T., A. Copestake (1991), “Sense Extension as Lexical Rules”, in D. Fass, E.

Hinkelman and J. Martin (eds.) Computational Approaches to Non-literal Language:

Metaphor, Metonymy, Idiom, Speech Acts, Implicature, in Proceedings of the IJCAI Workshop

on Computational Approaches to Non-Literal Language, Sydney, Australia, pp.12-20.

BRISCOE, T., A. Copestake (1996), “Controlling the Application of Lexical Rules”, in E. Viegas

(ed.), Proceedings.of the SIGLEX Workshop on Breadth and Depth of Semantic Lexicons,

ACL, Santa Cruz, California, pp. 7-19.

BUITELAAR, P. (1998), CoreLex: Systematic Polysemy and Underspecification, PhD., Brandeis

University.

CALZOLARI, N. (1991), “Representation of Semantic Information in a Lexical Knowledge

Base”, in T. Briscoe, A. Copestake (eds.), First ACQUILEX Workshop, Cambridge, MA.

CASTELEIRO, J. M. (1981), Sintaxe Transformacional do Adjectivo, Textos de Linguística, Instituto

Nacional de Investigação Científica; Lisboa.

CASTELEIRO, J. M. (coord.) (2001), Dicionário da Língua Portuguesa Contemporânea, Academia

das Ciências/Editorial Verbo, Lisboa.

CHOMSKY, N. (1970), “Remarks on Nominalization”, in R. Jacobs, P. Rosenbaum (eds,),

Readings in English Transformational Grammar, Walthan, MA, Ginn & Co., pp. 184-221.

CHOMSKY, N. (1981), Lectures on Government and Binding, Dordrecht, Foris Publications.

CHOMSKY, N. (1986a), Barriers, MA, The MIT Press.

CHOMSKY, N. (1986b), O Conhecimento da Língua: Sua Natureza, Origem e Uso, Colecção

Linguística, Editorial Caminho.

COPESTAKE, A. (1992), The Representation of Lexical Semantic Information, PhD., University of

Cambridge.

COPESTAKE, A. (1995), “Representing Lexical Polysemy”, in J. Klavans (ed.), Representation and

Acquisition of Lexical Knowledge: Polysemy, Ambiguity and Generativity, AAAI

Symposyum, Menlo Park, California, pp. 21-26.

Page 163: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

REFERÊNCIAS

157

COPESTAKE, A. (2001), “The Semi-generative Lexicon: Limits on Lexical Productivity”,

Proceedings on the 1st International Workshop on Generative Approaches to the Lexicon,

Geneva.

COPESTAKE, A., T. Briscoe (1992), “Lexical Operations in a Unification-Based Framework”, in

J. Pustejovsky, S. Bergler (eds.), Lexical Semantics and Knowledge Representation, Berlin,

Springer-Verlag, LNAI nº 627, pp. 101-119.

COPESTAKE, A., T. Briscoe (1995), “Semi Productive Polysemy and Sense Extension”, in J.

Pustejovsky, B. Boguraev (eds.), Lexical Semantics, Oxford, Clarendon Press, pp. 15-61.

COSTA, J., A. Melo (1998), Dicionário da Língua Portuguesa, 8ª edição, Porto Editora, Porto.

CRISMA, P. (1990), Functional Categories Inside the Noun Phrases, Tesi di Laurea, Università

degli Studi di Venezia.

CRUSE, D.A. (1986), Lexical Semantics, Cambridge University Press.

CRUSE, D.A. (1995), “Polysemy and Related Phenomena from a Cognitive Linguistic

Viewpoint”, in P. Saint-Dizier, E. Viegas (eds.), Computational Lexical Semantics,

Cambridge University Press.

CRUSE, D. A. (2000), “Aspects of the Micro-structure of Word Meanings”, in Y. Ravin, C.

Leacock (eds.), Polysemy: Theoretical and Computational Approaches, Oxford, University

Press, pp. 30-51.

CUNHA, C., L. Cintra (1984), Nova Gramática do Português Contemporâneo, Edições João Sá da

Costa, Lisboa.

DEMONTE, V. (1999) “El Adjetivo: Clases y Usos. La Posición del Adjetivo en el Sintagma

Nominal”, in I. Bosque, V. Demonte (eds.), Gramática Descriptiva de la Lengua Española,

Real Academia Española, Colección Nebrija y Bello, Editorial Espassa.

DIXON, R. M. W. (1991), A New Approach to English Grammar on Semantic Principles, Oxford,

Clarendon Press.

DOWTY, D. (1979), Word Meaning and Montague Grammar: the Semantics of Verbs and Times in

Generative Semantics and Montague’s PTQ, Dordrecht, Reidel.

Page 164: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

158

DOWTY, D. (1985), “On Some Recent Analyses of Control”, Linguistics and Philosophy 8, pp. 1-

41.

FELLBAUM, C., (ed.) (1998), WordNet: an Electronic Lexical Database, MA, The MIT Press.

FELLBAUM, C. (1999), “The Case for Electronic Lexicography: Some Linguistic and

Computational Arguments”, in P. Marrafa, A. Mota (orgs.), Linguística Computacional:

Investigação Fundamental e Aplicações, Associação Portuguesa de Linguística, Edições

Colibri, 1999, Lisboa.

GEERAERTS, D. (1993), “Vagueness’s Puzzles, Polysemy’s Vagaries”, Cognitive Linguistics, pp.

223-72.

GODDARD, C. (2000), “Polysemy: A Problem of Definition”, in Y. Ravin, C. Leacock (eds.),

Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp. 129-

151.

GRIMSHAW, J. (1990), Argument Structure, Cambridge, MA, The MIT Press.

GRISHMAN, R. (1986), Computational Linguistics: An Introduction, Cambridge University Press.

JACKENDOFF, R. (1990), Semantic Structures, Cambridge, MA, The MIT Press.

JOHNSTON, M., F. Busa, (1996), “Qualia Structure and the Compositional Interpretation of

Compounds”, in E. Viegas (ed.), Proceedings.of the SIGLEX Workshop on Breadth and

Depth of Semantic Lexicons, ACL, Santa Cruz, California, pp. 77-88.

KILGARRIFF, A. (1992), Polysemy, PhD., University of Sussex.

KILGARRIFF, A. (1995a), “Inheriting Polysemy”, in P. Saint-Dizier, E. Viegas (eds.),

Computational Lexical Semantics, Cambridge University Press.

KILGARRIFF, A. (1997a), “What is Word Sense Disambiguation Good for?” Proceedings NLP

Pacific Rim Symposium’97, Phuket, Thailand.

KILGARRIFF, A. (1997b), “Using Word Frequency Lists to Measure Corpus Homogeneity and

Similarity between Corpora”.

Page 165: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

REFERÊNCIAS

159

KROVETZ, R. (1998), “More than One Sense Per Discourse”, Proceedings of the ACL-SIGLEX

workshop.

LAKOFF, G. (1970), “A Note on Vagueness and Ambiguity”, Linguistic Inquiry, 1, pp. 357-359.

LAKOFF, G., M. Johnson (1980), Metaphors We Live By, The University of Chicago Press.

LAPATA, M. (2001), “A Corpus-based Account of Regular Polysemy: the Case of Context-

sensitive Adjectives”, Proceedings of NAACL.

LASCARIDES, A., A. Copestake (1995), “Pragmatics and Word meaning”, Proceedings of

Semantics and Linguistic Theory V.

LASCARIDES, A., Copestake, A., Briscoe, T. (1996), “Ambiguity and Coherence”, Journal of

Semantics 13.1, pp. 41-65.

LEVIN, B. (1993), English Verb Classes and Alternations: A Preliminary Investigation, Chicago, The

University of Chicago Press.

LOPES, M. H. (1996), Sintaxe e Aspecto dos Nomes Deverbais em Português, Dissertação de

Mestrado, Universidade do Porto.

LYON, J. (1977), Semantics, Cambridge University Press.

MACHADO, J. P. (1977), Dicionário Etimológico da Língua Portuguesa, 3ª Edição, Livros

Horizonte, Lisboa.

MARRAFA, P. (1993), Predicação Secundária e Predicados Complexos em Português: Análise e

Modelização, Dissertação de Doutoramento, Universidade de Lisboa.

MARRAFA, P. (2001), WordNet do Português: uma Base de Dados de Conhecimento Linguístico,

Instituto Camões.

MATEUS, M. H. M. et alii (1989), Gramática da Língua Portuguesa, Colecção Linguística,

Editorial Caminho.

MENDES, A. (2001), Propriedades Sintácticas e Semânticas de Predicados Verbais com Pluralidade de

Sentidos: o Caso dos Verbos psicológicos, Dissertação de Doutoramento, Universidade de

Lisboa.

Page 166: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

160

MENDES, S., R. P. Chaves (2001), “Enriching WordNet with Qualia Information”, Workshop on

WordNet and Other Lexical Resources, NAACL 2001, Pittsburgh, PA, USA.

MILLER, G.A. (1978), “Semantic Relation Among Words”, in M. Halle, J. Bresnen, G.A. Miller

(eds.), Linguistic Theory and Psycholinguistic Reality, Cambridge, MA, The MIT Press,

pp. 60-117.

MILLER, G. A., C. Fellbaum, (1991), “Semantic Networks in English”, Cognition, 41, pp. 197-

229.

MINEUR, A., Buitelaar, P. (1996), “A Compositional Treatment of Polysemous Arguments in

Categorial Grammar”, in K. van Deemter, S. Peters (eds.), Semantic Ambiguity and

Underspecification, Chicago, Chicago University Press, pp. 125-143.

MOENS, M., M. Steedman (1988), “Temporal Ontology and Temporal Reference”,

Computational Linguistics, vol. 14, pp. 15-28.

MONTAGUE, R. (1974), “Towards a Proper Treatment of Quantification in English”, in R. H.

Thomason (ed.), Formal Philosophy: Selected Papers of Richard Montague, New Haven,

Yale University Press.

NIGHTINGALE, S. (1999), Polysemy and Homonymy in Japanese Verbal Alternations, PhD.,

University of Edinburgh.

NUNBERG, G. (1995), “Transfers of Meaning”, Journal of Semantics, 1.

NUNBERG, G., A. Zaenen (1992), “Systematic Polysemy in Lexicology and Lexicography”,

Proceedings of Euralex92, Tampere, Finland.

OLIVEIRA, F. (1992), “Algumas Questões sobre o Tempo e Aspecto”, Cadernos de Semântica nº

9, Faculdade de Letras da Universidade de Lisboa.

OSTLER, N., B. Atkins (1992), “Predictable Meaning Shift: Some Linguistic Properties of

Lexical Implication Rules”, in J. Pustejovsky, S. Bergler (eds.), Lexical Semantics and

Knowledge Representation, Berlin, Springer-Verlag, LNAI nº 627, pp. 87-100.

PALMER, M. (1998), “Are WordNet Sense Distinctions Appropriate for Computational

Lexicons?”, Proceedings of Senseval, Siglexl98, Brighton, England.

Page 167: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

REFERÊNCIAS

161

PANMAN, O. (1982), “Homonymy and Polysemy”, Lingua, 58, pp. 105-136.

PARTEE, B., M. Rooth (1982), “Generalized Conjunction and Type Ambiguity”, in Bäuerle,

Schwarze, von Stechow (eds.), Meaning, Use and Interpretation of Language, Walter de

Gruyter.

PARTEE, B., A. Meulen, R. Wall (1990), Mathematical Methods in Linguistics, Dordrecht, Kluwer

Academic Publishers.

PAUSE, P., D. Heitz (1998), “Verbal Polysemy: An Open Problem”, Arbeitspapier Nr. 95,

(English Version).

PETERS, W., I. Peters (2000), “Lexicalised Systematic Polysemy in WordNet”, Proceedings of

Second International Conference on Language Resources and Evaluation, Athens.

PINTO, C. (2001), Para a Computação da Polissemia Nominal em Português, Dissertação de

Mestrado, Universidade de Lisboa.

POLLARD, C., I. Sag (1994), Head-Driven Phrase Structure Grammar, University of Chicago

Press.

PUSTEJOVSKY, J. (1991), “The Syntax of Event Structure”, Cognition, 41, pp. 47-81.

PUSTEJOVSKY, J. (1993), “Type Coercion and Lexical Selection”, in J. Pustejovsky (ed.),

Semantics and the Lexicon, Dordrecht, Kluwer Academic Publishers.

PUSTEJOVSKY, J. (1995a), The Generative Lexicon, Cambridge, MA, The MIT Press.

PUSTEJOVSKY, J. (1995b), “Linguistic Constraints on Type Coercion”, in P. Saint-Dizier, E.

Viegas (eds.), Computational Lexical Semantics, Cambridge, Cambridge University

Press, pp. 71-97.

PUSTEJOVSKY, J. (1996), “The Semantics of Complex Types”, Langue Française.

PUSTEJOVSKY, J. (1997), “”Knowledge is Elsewhere”: Natural Language Semantics Meets the

X-Files”, Linguistic Inquiry.

PUSTEJOVSKY, J. (1998), “The Semantics of Lexical Underspecification” Folia Linguistica.

Page 168: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

162

PUSTEJOVSKY, J. (2001), “Type Construction and the Logic of Concepts” in P. Bouillon, F. Busa

(eds.), The Syntax of Word Meaning, Cambridge University Press.

PUSTEJOVSKY, J., P. Anick (1988), “On the Semantic Interpretation of Nominals”, Proceedings of

COLING-1988, Budapest.

PUSTEJOVSKY, J., B. Boguraev (1996), “Introduction: Lexical Semantics in Context”, in J.

Pustejovsky, B. Boguraev (eds.), Lexical Semantics: The Problem of Polysemy, Oxford

University Press, pp. 1-14.

PUSTEJOVSKY, J., P. Bouillon (1996), “Aspectual Coercion and Logical Polysemy”, in J.

Pustejovsky, B. Boguraev (eds.), Lexical Semantics: The Problem of Polysemy, Oxford

University Press, pp. 133-162.

QUINE, W. V (1960), Word and Object; Cambridge, Mass., The MIT Press.

RAPOSO, E. P. (1992), Teoria da Gramática. A Faculdade da Linguagem, Colecção Linguística,

Editorial Caminho.

RAVIN, Y., C. Leacock (2000), “Polysemy: An Overview”, in Y. Ravin, C. Leacock (eds.),

Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp. 1-29.

ROBINS, R. H. (1967), A Short History of Linguistics, Bloomington, Indiana University Press.

SAINT-DIZIER, P. (1995), “Generativity, Type Coercion and Verb Semantic Classes”,

Representation and Acquisition of Lexical Knowledge: Polysemy, Ambiguity and

Generativity, AAAI Symposyum, Menlo Park, California.

SAINT-DIZIER, P. (1998a), “Sense Variation and Lexical Semantics Generative Operations”, in

D.M.W. (ed.), New Methods in Language Processing and Computational Natural Language

Learning, ACL, pp. 121-130.

SAINT-DIZIER, P. (1998b), “A Generative Lexicon Perspective for Adjectival Modification”,

COLING-ACL.

SAINT-DIZIER, P. (1999), “On the Polimorphic Behavior of Word-Senses”, in P. Marrafa, A.

Mota (orgs.), Linguística Computacional: Investigação Fundamental e Aplicações,

Associação Portuguesa de Linguística, Edições Colibri, Lisboa, pp. 29-56.

Page 169: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

REFERÊNCIAS

163

SCHÜTZE, H. (2000), “Disambiguation and Connectionism”, in Y. Ravin, C. Leacock (eds.),

Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp. 205-

219.

SILVA. A. S. (1997), A Semântica de Deixar: Uma Contribuição para a Abordagem Cognitiva em

Semântica Lexical, Fundação Calouste Gulbenkian, Fundação para a Ciência e a

Tecnologia, Ministério da Ciência e da Tecnologia.

TOMURO, N. (1998), “Semi-automatic Induction of Systematic Polysemy from WordNet”,

Proceedings of the Workshop on Usage of WordNet in Natural Language Processing Systems,

at COLING-ACL.

VENDLER, Z. (1967), Linguistics in Philosophy, Ithaca, Cornell University Press.

VERSPOOR, C. (1996), “Lexical Limits on the Influence of Context”, in G. W. Cottrell (ed.)

Proceedings of the Eighteen Annual Conference of the Cognitive Science Society, Lawrence

Erlbaum Associates Publishers, pp. 116-120.

VERSPOOR, C. (1997a), Contextually-Dependent Lexical Semantics, PhD., The University of

Edinburgh.

VERSPOOR, C. (1997b), “Conventinality-Governed Logical Metonymy”, in H. Bunt, L. Kievit,

R. Muskens, M. Verlinden (eds.), Proceedings of the 2nd International Workshop on

Computational Semantics, Tilburg, the Netherlands, pp. 300-312.

WEINREICH, U. (1964), “Webster’s Third: a Critique of its Semantics”, International Journal of

American Linguistics 30, pp. 405-409.

WIERZBICKA, A. (1996), Semantics: Primes and Universals, Oxford, Oxford University Press.

XAVIER, M. F. & M. H. Mateus (orgs.) (1992), Dicionário de Termos Linguísticos, Associação

Portuguesa de Linguística/Instituto de Linguística Teórica e Computacional, 2

Volumes, Edições Cosmos, Lisboa.

Page 170: COMPUTAÇÃO DA POLISSEMIA REGULAR EM · contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia ... subespecificadas para permitirem a derivação,

COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS

164