Processamento de frases sintacticamente...

40
Processamento de frases sintacticamente ambíguas: Estudos de preferências de resolução de orações relativas com duplo antecedente no português europeu [email protected] http// www.labling.psi.uminho.pt Human Cognition Lab Research Group in Psycholinguistics

Transcript of Processamento de frases sintacticamente...

Processamento de frases sintacticamente ambíguas:Estudos de preferências de resolução de orações relativas com duplo antecedente no português europeu

[email protected]

http//www.labling.psi.uminho.ptHuman Cognition Lab

Research Group in Psycholinguistics

http://webs.psi.uminho.pt/LABSPSI/groups/language/index.html

Que linhas de investigação?

Adaptação e construção bases

lexicais

Processamento de ORs

ambíguas

no PEFactores no

reconhecimento visual de palavras

Processamento lexical e

semântico bilingue

Fenómeno do Tip-of-the-Tongue

(TOT)

Human Cognition LabResearch Group in Psycholinguistics

Compreensão de frases

A compreensão de frases é o conjunto de processos cognitivos que permite que compreendamos correctamente aquilo que lemos/ouvimos e/ou aquilo que dizemos/escrevemos.

Apesar da sua complexidade, (quase) todos fazemo-lo bem e aparentemente sem qualquer dificuldade!

Tarefa difícil: complexidade, ambiguidade e rapidez do processamento…

• não se trata de simples recuperação de palavras (como no caso do acesso lexical), mas da sua combinação em unidades de maior nível (sintagmas, orações) e do estabelecimento de relações entre elas, extraindo o seu significado em tempo real...

Human Cognition LabResearch Group in Psycholinguistics

Compreensão de frases Human Cognition LabResearch Group in Psycholinguistics

Parsing

O que é?

Processo a partir do qual os nativos de uma língua (ouvintes e leitores) decidem que palavras são agrupadas com outras palavras (em unidades de maior nível).

Parser Mecanismo

cognitivo humano responsável pela execução da análise/estrutura sintáctica.

Human Cognition LabResearch Group in Psycholinguistics

Etapas na compreensão de frases

Segmentação

• da representação das palavras (oriundas do processador lexical) em unidades estruturais (sintagmas ou orações).

Atribuição de etiquetas sintácticas

• a essas estruturas, i.e., identifica-se o sujeito, o objecto e outros constituintes da frase.

Estabelecimento de dependências estruturais

• entre os diferentes constituintes (a forma de representação que esta estrutura pode adoptar é a de uma árvore sintáctica).

Análise sintáctico-semântica

• processo a partir do qual a representação estrutural anterior é transformada numa representação proposicional (o sujeito, objecto etc. convertem-se em agente, paciente, instrumento etc.).

Construção representação proposicional

• definitiva da oração e realização de inferências que relacionem umas orações com outras, processo que por sua vez alimenta a elaboração de uma representação ou esquema mental do texto ou discurso, de maneira que seja possível uma compreensão eficaz.

Qual a relação entre as diferentes etapas do processamento?

Compreensão de frases Human Cognition LabResearch Group in Psycholinguistics

Perspectiva modular:

Acesso lexical inicial e parsinginicial autónomos.

Ausência de efeitos contextuais iniciais.

Informação flui apenas bottom-up.

Perspectiva interactiva: Acesso lexical e parsing interactivos.

Contexto semântico afecta o acesso lexical e o parsing sintáctico.

Informação flui tanto bottom-upquanto top-down.

vs.

Human Cognition LabResearch Group in Psycholinguistics

Teorias e modelos

Ambiguidade local:

Temporária: depois de processadas todas as palavras da frase ela deixa de existir.

Ambiguidade lexical: palavras com múltiplos sentidos (palavras polissémicas).

Ambiguidade global: Permanente, mesmo depois de processadas todas as

palavras da frase ela subsiste.

Ambiguidade sintáctica: não há ambiguidade nas palavras mas sim na estrutura.

Problemas do parsing: Ambiguidade

Human Cognition LabResearch Group in Psycholinguistics

Porque numa frase sintacticamente ambígua preferimos uma interpretação em detrimento de outra?

Qual o papel do contexto na resolução deste tipo de ambiguidades?

Existem mecanismos universais de resolução deste tipo de ambiguidades?

Que outros factores a podem afectar?

Human Cognition LabResearch Group in Psycholinguistics

Ambiguidade sintáctica

Ambiguidade sintáctica: Modelos

Human Cognition LabResearch Group in Psycholinguistics

• DCT (Fodor, Bever, & Garret, 1974)

• Garden Path (Frazier, 1979)

• Construal (Frazier & Clifton, 1996)

• Recency/Predicate proximity (Gibson et al., 1996)

• Tuning hypothesis (Mitchell & Cuetos, 1991)

• Constraint-based models (e.g., MacRae et al., 1998; McClelland, St. John & Taraban, 1989; Trueswell, Tanenhaus & Kello, 1993

• Conexionsit models (e.g., Christiansen & Chater, 1999, 2001; Elman, 1990; 1993).

Frases Garden-Path (GP): Frases que levam o processador humano responsável pela

compreensão de frases a construir uma estrutura sintáctica inicial, que acaba por se revelar incorrecta o que, portanto, exige uma re-análise sintáctica (e semântica).

A parte inicial da frase faz com que o leitor/ouvinte vá “downthe garden path” e chegue a uma interpretação errónea da mesma (“beco sem saída”) que o obriga a rever a interpretação a que tinha chegado até àquele

momento.

Human Cognition LabResearch Group in Psycholinguistics

Garden Path

Exemplos:“João disse que o professor voltará ontem”

“Enquanto Gil caçou os coelhos correram pelo bosque com medo”“Mãe suspeita de assassinato do filho morre”

Frases Garden-Path (GP): Lentificam normalmente o processamento, o que se traduz, por

exemplo, no aumento da duração das fixações oculares e no aumento do número de regressões:

• aumento das fixações (tempos de leitura) no verbo que desambigua a frase (spit up).

• movimentos oculares regressivos no sintagma nominal ambíguo (thebaby) e no verbo subordinado (dressed).

Human Cognition LabResearch Group in Psycholinguistics

Garden Path

quando uma palavra élida/ouvida recuperamosinformação relativa à suacategoria sintáctica.

O parser identifica asregras gramaticais quecontêm essa categoria.

a estrutura inicial éescolhida com base nasimplicidade estrutural ena aplicação de doisprincípios/estratégias:

Human Cognition LabResearch Group in Psycholinguistics

Garden Path

Heurísticos da simplicidade

Minimal Attachment (MA)• “Attach incoming lexical items into the phrase-

marker being constructed with the fewest nodes consistent with well-formedness rules of language” (Frazier, 1979, p. 76)

• prefere a interpretação que apresenta a estrutura mais simples.

Late Closure (LC)• “When possible, attach incoming lexical items into

the clause or phrase currently being processed (i.e., the lowest possible nonterminal node dominating the last item analyzed)” (Frazier, 1979, p. 76).

• incorpora o novo material na oração ou sintagma que está a ser processado neste momento (i.e. associa-o à informação mais recente).

Human Cognition LabResearch Group in Psycholinguistics

Ambiguidades sintácticas em ORs

Estudos sobre a resolução de ambiguidades sintácticas em frases com orações relativas subordinadas com duplo antecedente [SN-V-SN1-de-SN2-OR ]:

Ex:

“Someone shot the servant of the actress who was on the balcony”

SN1 SN2

OR

Human Cognition LabResearch Group in Psycholinguistics

sugerem que a estratégia do Late Clousure ou de adjunção baixaé preferida em inglês (Cuetos & Mitchell 1988; Frazier & Clifton1996; Carreiras & Clifton 1999; Fernandez, 2003; Traxler, Pickering, & Clifton, 1998).

Preferências de adjunção

LOW ATTACHMENT

(adjunção baixa)

Inglês

Sueco

Norueguês

Romeno

Italiano

Árabe

Chinês

Basco

Português Brasileiro

(…)

HIGH ATTACHMENT

(adjunção alta)

Castelhano

Galego

Sul-africano

Holandês

Alemão

Francês

Grego

Russo

Japonês

Português Brasileiro

(…)

Departamento de Psicologia I Ano lectivo 2009-10 I [email protected]

Human Cognition LabResearch Group in Psycholinguistics

Avaliar o tipo de estratégia de adjunção adoptada por monolingues de PE na resolução de ambiguidades sintácticas em ORs com duplo antecedente:

Resultados prévios inconsistentes:• adjunção alta – tarefa off-line (Maia, Costa, Fernández & Lourenço-Gomes, 2004).

• adjunção baixa – tarefa on-line (Maia, Fernández, Costa & Lourenço-Gomes, 2006; Myamoto, 1999).

Avaliar o papel da “animacidade” do núcleo dos constituintes do SN complexo no tipo de adjunção adoptada (Desmet etal., 2002, 2006).

Comparar os resultados em duas tarefas: completamento de frases (off-line de produção). leitura auto-monitorada (on-line de compreensão).

Human Cognition LabResearch Group in Psycholinguistics

Ambiguidades sintácticas em ORs do PE

Estudo 1: Completamento de frases

Participantes: 50 estudantes universitários (L1=PE)

4 Condições experimentais (Animanidade):

Materiais: 48 frases experimentais + 100 frases distractoras.

Procedimento: completar as frases de forma plausível numa tarefa de lápis-papel em contexto de sala de aula.

1. Animado-Animado (A-A): “António encontrou-se com a filha do treinador que …”

2. Animado-Inanimado(A-I): “Os curiosos aproximaram-se do refugiado da mochila que …”

3. Inanimado-Animado (I-A): “Os curiosos aproximaram-se da mochila do refugiado que …”

4. Inanimado-Inanimado(I-I): “Maria queria o boneco da loja que…”

VD: proporção de escolhas em SN1.

Human Cognition LabResearch Group in Psycholinguistics

Ambiguidades sintácticas em ORs do PE

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

A-A A-I I-A I-I

prop

orçõ

es d

e ad

junç

ão

SN1

SN2

** p<.001

Efeito Animacidade [Fs(3, 147)= 146.34, p<.001]; Fi(3, 44)= 17.41, p<.001]: proporção de respostas a SN1 (adjunção alta) superiores SN2 (adjunção baixa) em todas as condições excepto I-A (p<.001).

Estudo 1Human Cognition Lab

Research Group in Psycholinguistics

**

****

Animado-Animado (A-A) SN1 + Animado-Animado (A-A) SN2

Animado-Inanimado (A-I) SN1 + Animado-Inanimado (A-I) SN2

Inanimado-Animado (I-A) SN1 + Inanimado-Animado (I-A) SN2

Inanimado-Inanimado (I-I) SN1 + Inanimado-Inanimado (I-A) SN2

VDs: tempos de leitura do segmento crítico (desambiguador) + erros perguntas compreensão.

Leitura auto-monitorada

Participantes: 79 estudantes universitários (L1=PE)

8 Condições experimentais [Animacidade (4) X Adjunção (2)]:

Materiais: 106 frases = [48 frases experimentais - 6 de cada condição]

+ [50 frases distractoras] + [8 de prática] em 4 listas.

• frases experimentais do estudo 1 mas forçadas a desambiguar a SN1

ou SN2 pela introdução de uma marca de género na OR que completa a frase do estudo 1. Exemplo:

Human Cognition LabResearch Group in Psycholinguistics

Estudo 2

Efeito Adjunção x Animacidade [Fs(3, 195)=2.89, p<.05]: menores TRs na leitura do segmento crítico nas frases desambiguadas a SN1, excepto na condição I-A onde se leu mais rapidamente o segmento crítico das frases desambiguadas a SN2

(p<.05)

* p<.05

*

255

260

265

270

275

280

285

290

295

300

305

310

A-A A-I I-A I-I

TR

SN1

SN2

Estudo 2Human Cognition Lab

Research Group in Psycholinguistics

***

Efeito Adjunção [Fs(1, 65)=7.90, p<.05]: mais erros nas frases desambiguadas a SN2 do que SN1.

Efeito Animacidade [Fs(3, 195)=8.87, p<.001]: menos erros na condição I-A do que nas restantes (p<.001) (trade-off).

Efeito Adjunção x Animacidade [F(3, 195)=8,12; p<.001]: mais erros nas frases desambiguadas a SN2 (diferenças significativas nas condições A-I e I-I ). Na condição I-A mais erros nas frases desambiguadas a SN1.

Estudo 2

0

2

4

6

8

10

12

14

16

18

A-A A-I I-A I-I

SN1

SN2

Human Cognition LabResearch Group in Psycholinguistics

% e

rros

* p<.05

**p<.001

****

Conclusões:

Em PE regista-se, à semelhança do PB, Espanhol, Holandês, Alemão, Grego etc., a uma tendência para que a resolução deste tipo de ambiguidades se faça recorrendo a uma estratégia de adjunção alta (SN1).

De forma consistente com os estudos em Holandês, a “animacidade” dos nomes do SNC afecta o modo como os nativos do PE resolvem tais ambiguidades tanto em tarefas off como on-line.

• embora a estratégia “natural” no PE pareça ser a adjunção baixa, nas frases I-A prefere-se ou se lê mais rapidamente e com mais acuidade as frases desambiguadas a SN2.

Soares, A. P., Fraga I. C., Comesaña, M., & Piñeiro, A. (2010). El papel de la animacidad en la resolución de ambigüedades sintácticas en português europeo:

Evidencia en tareas de producción y comprensión. Psicothema, 22(4), 691-696.

Soares, A. P., Fraga, I., Comesaña, M., Piñeiro, A., & Pinheiro, A. [2008, Abril]. O papel da animacidade na desambiguação de orações relativas em Português

Europeu: Evidências em tarefas off e on-line. 3º Encontro a Associação Portuguesa de Psicologia Experimental (APPE), Faro, Universidade do Algarve.

Human Cognition LabResearch Group in Psycholinguistics

Estudo 1 e 2

Estudo corpora

Analisar como falantes nativos do PE desambiguam este tipo de estruturas em contextos “naturais” de produção escrita (na linha de Desmet et al., 2002).

Analisar em que medida essas preferências de desambiguação são afectadas pela animacidade e pelo número dos nomes integrados nos SNCs.

Testar a validade da hipótese Tuning (Mitchell & Cuetos, 1991) na explicação dos resultados laboratoriais previamente obtidos para o PE.

• i.e., a ideia de que a frequência com que essas estruturas são desambiguadas em contextos experimentais reflecte a sua desambiguação em contextos “naturais” de produção da língua.

Human Cognition LabResearch Group in Psycholinguistics

Estudo 3

Método

Análise de corpora• para a extracção de frases do PE que obedecessem à estrutura sintáctica

alvo [SN-SV-SN1-de-SN2-OR], recorremos a vários corpora do PE contemporâneo de acesso livre, etiquetados morfo-sintacticamente e disponibilizados pela Linguateca (www.linguateca.pt/ - ex., Avante, CETEM, Clássicos PE, DiaClave, ECI-EE, Frases PP, Natura Minho e Vercial).

Procedimento O recurso à ferramenta AC/DC da Linguateca permitiu a obtenção de

327 frases que foram avaliadas por 2 juízes independentes (96% de acordo - 76 frases excluídas devido ao facto da OR não se associar a nenhum dos SNs e/ou manter a sua ambiguidade).

• as 251 frases seleccionadas foram distribuídas por 4 condições de animacidade de acordo com as características lexicais dos sintagmas nominais.

Estudo 3Human Cognition Lab

Research Group in Psycholinguistics

Estudo 3Human Cognition Lab

Research Group in Psycholinguistics

1%

72%

3%

24%

Distribuição das condições de animacidade

Animado-Animado (AA) Inanimado-Inanimado (II)

Animado-Inanimado (AI) Inanimado-Animado (IA)

Estudo 3Human Cognition Lab

Research Group in Psycholinguistics

**

** p<.001

**

Conclusões:

A análise de corpora revelou que, à semelhança do observado no Holandês (Desmet et al., 2002), a “animacidade” dos constituintes do SNC afecta a estratégia de adjunção adoptada em contextos naturais de produção da língua.

Os dados obtidos em contexto laboratorial no PE reflectem os resultados obtidos no estudo de corpora:

• tal como no estudo 1 e 2, observa-se que as frases I-A tendem a ser desambiguadas com a estratégia de adjunção baixa (SN2) e as frases I-I com a adjunção alta (SN1) .

• apoio à hipótese Tuning.

Soares, A. P., França, P., & Iriarte (em preparação). Relative clause attachment in Portuguese: On-line comprehension corresponds to corpus frequencies when

lexical variables are taken into account.

Soares, A. P., França, P., Iriarte, A., & Comesaña, M. (2011, March). A desambiguação de orações relativas com duplo antecedente em português europeu: Um

estudo de corpora. Poster presented at the 6º Encontro da Associação Portuguesa de Psicologia Experimental (APPE), Coimbra, University of Coimbra,

Portugal.

Human Cognition LabResearch Group in Psycholinguistics

Estudo 3

Objectivos:

Avaliar como a introdução de palavras emocionais no SNC deste tipo de estruturas afecta as preferências de desambiguação em PE.

Avaliar o papel da amplitude da memória de trabalho nas preferências de desambiguação desse tipo de frases contendo palavras emocionais nos seus SNCs.

Emocionalidade:

Grupo “Procesos Cognitivos y Conducta” da Universidade de

Santiago de Compostela (Espanha) (Fraga et al., 2007, 2008; Piñeiro, 2011):

• a valência afectiva parece ser uma variável lexical que influi no processamento sintáctico (tarefas off-line).

• a activação modula a preferência de adjunção registada no espanhol (tarefas off-line).

Human Cognition LabResearch Group in Psycholinguistics

Estudo 4

Emoções:

Respostas a estímulos significativos que se produzem em três sistemas (Lang, 1968):

Human Cognition LabResearch Group in Psycholinguistics

Estudo 4

Perspectiva bidimensional das emoções

Human Cognition LabResearch Group in Psycholinguistics

ANEW (Affective Norms for English Words) propriedades afectivas de 1034 palavras.

IAPS (International Affective Picture System -Lang, Bradley,

& Cuthbert, 2008) 1182 imagens/fotografias que cobrem uma ampla gama de categorias (ex.

animais, natureza, armas, comida, corpos mutilados, cenas eróticas…).

IADS-2 (International Affective Digitized Sounds – Bradley &

Lang, 2007) 167 sons que cobrem uma ampla gama de categorias semânticas (ex. medo,

alegria, tristeza).

Soares, A. P., Comesaña, M., Pinheiro, A. P., Simões, A., & Frade, S. (2012). The adaptation of the Affective Norms for English Words (ANEW) for European

Portuguese. Behavior Research Methods, 44(1), 256-269 doi: 10.3758/s13428-011-0131-7.

Soares, A. P., Comesaña, M., Pinheiro, A. P., Frade, S., Pureza, R., & Costa, A. (2011, March). Palavras, sons e imagens: Normas afectivas de valência,

activação e dominância para o português europeu. Poster presented at the 6º Encontro da Associação Portuguesa de Psicologia Experimental (APPE),

Coimbra, University of Coimbra, Portugal.

Soares, A. P., Comesaña, Simões, A., & Fonte, L. (2010, April). The European Portuguese adaptation of the Affective Norms for English Words (ANEW).

Poster presented at the VIII Congreso de la Sociedad Española de Psicología Experimental (SEPEX), Granada, Spain.

Bases emocionais Human Cognition LabResearch Group in Psycholinguistics

Leitura auto-monitorada

Participantes: 64 estudantes universitários (L1=PE)

8 Condições experimentais [Activação (4) X Adjunção(2)]

Materiais: 106 frases = [48 frases experimentais - 6 de cada condição] + [50

frases distractoras] + [8 de prática].

• frases experimentais forçadas a desambiguar a SN1 ou SN2 pela introdução de uma marca de género na OR que completa a frase.

Activação Alta–Activação Baixa (A-B) SN1 + Activação Alta–Activação Baixa (A-B) SN2

Activação Baixa–Activação Alta (B-A) SN1 + Activação Baixa–Activação Alta (B-A) SN2

Activação Neutra–Activação Alta (N-A) SN1 + Activação Neutra–Activação Alta (N-B) SN2

Activação Neutra–Activação Baixa (N-B) SN1 + Activação Neutra–Activação Baixa (N-B) SN2

VDs: tempos de leitura do segmento crítico (desambiguador) + erros às perguntas de compreensão.

Grupos: grupo total (N=64) e sujeitos classificados com alta (N=20) vs. baixa (N=20) amplitude memória.

Estudo 4Human Cognition Lab

Research Group in Psycholinguistics

Human Cognition LabResearch Group in Psycholinguistics

Estudo 4

Efeito Activação [Fs(3, 63)=20.02, p<.001]: maiores TRs na leitura do segmento crítico na condição N-B do que nas restantes condições experimentais (p<.001).

**p<.001

**

**

**

TR

Human Cognition LabResearch Group in Psycholinguistics

Estudo 4

Efeito Activação [Fs(3, 63)=3.22, p<.05]: mais erros na condição AB do que na BA (p<.05).

* p<.05

*

% e

rro

Human Cognition LabResearch Group in Psycholinguistics

Estudo 4

Efeito Activação [Fs(3, 114)=11.70, p<.001]: TRs mais altos na leitura das frases N-B do que das frases das restantes condições experimentais (p<.001).

Efeito Amplitude memória [Fs(1, 40)=26.18, p<.05]: os sujeitos de alta amplitude de memória leram mais rapidamente o segmento crítico do que os de baixa amplitude de memória.

Efeito Activação x Adjunção [Fs(3, 114)=2.85, p<.05]: TRs mais altos na leitura do segmento crítico das frases N-B quando desambiguadas a SN1 do que SN2 quando comparadas com as frases B-A (p<.05).

ALTA AMPLITUDE MEMÓRIA BAIXA AMPLITUDE MEMÓRIA

TR TR

* p<.05

* *

Human Cognition LabResearch Group in Psycholinguistics

Estudo 4

Efeito Activação [Fs(3, 114)=4.98, p<.001]: mais erros na condição A-B do que na B-A (p<.05).

Efeito Amplitude memória [Fi(1, 40)=7.73, p<.05]: sujeitos de alta amplitude de memória menos erros do que os de baixa amplitude de memória.

Efeito Adjunção x Amplitude memória [Fs(1, 38)=4.18, p<.05; Fi(1, 40)=7.73, p<.05]: sujeitos de baixa amplitude de memória operatória mais erros nas frases desambiguadas a SN2.

ALTA AMPLITUDE MEMÓRIA BAIXA AMPLITUDE MEMÓRIA* *

Conclusões :

Tal como hipotetizado, e de forma consistente com o registado em língua espanhola em tarefas off-line, a introdução de palavras emocionais afectou as preferências de desambiguação sintáctica numa tarefa on-line: os sujeitos leram mais rapidamente frases desambiguadas a SN2 (estratégia de adjunção baixa) embora, como vimos, em PE se observe tendência para SN1.

A amplitude de memória afectou a velocidade (alta amplitude -> maior rapidez) e a acuidade do processamento (baixa amplitude -> mais erros em SN2) ainda que esses resultados não tivessem sido modulados pela posição da palavra emocional activadora no SNC.

Razente, S. N., Soares, A. P., & Comesaña, M. (em preparação). O papel de variáveis emocionais no processamento de orações relativas com duplo

antecedente em sujeitos com alto versus baixo reading span.

Razente, S. N. (2011), Preferências de desambiguação de orações relativas com duplo antecedente contendo palavras emocionais positivas de alto vs. baixo

níveis de activação: O papel da memória operatória, Soares, A. P. , Comesaña. M., Psicologia Experimental e suas Aplicações, Minho.

Razente, S. N., Soares, A. P., & Comesaña, M. (2010, March). O papel de variáveis emocionais no processamento de orações relativas com duplo antecedente

em sujeitos com alto versus baixo reading span. Poster presented at the 5º Encontro da Associação Portuguesa de Psicologia Experimental (APPE), Braga,

University of Minho, Portugal.

Human Cognition LabResearch Group in Psycholinguistics

Estudo 4