Universidade Federal do Rio de Janeiro
EFEITOS COMPOSICIONAIS NO RECONHECIMENTO VISUAL DE PALAVRAS COMPOSTAS EM INGLÊS:
UM ESTUDO COM MEG
DANIELA CID DE GARCIA
2013
Universidade Federal do Rio de Janeiro
EFEITOS COMPOSICIONAIS NO RECONHECIMENTO VISUAL DE PALAVRAS COMPOSTAS EM INGLÊS:
UM ESTUDO COM MEG
DANIELA CID DE GARCIA
Tese de Doutorado apresentada ao Programa de Pós-graduação em Linguística, Faculdade de Letras, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Doutor em Linguística. Orientadores: Aniela Improta França Marcus Antonio Rezende Maia
Rio de Janeiro Setembro de 2013
EFEITOS COMPOSICIONAIS NO RECONHECIMENTO VISUAL DE PALAVRAS
COMPOSTAS EM INGLÊS: UM ESTUDO COM MEG
Daniela Cid de Garcia
Orientadora: Professora Doutora Aniela Improta França Co-orientador: Professor Doutor Marcus Antonio Rezende Maia
Tese de Doutorado submetida ao Programa de Pós-Graduação em Linguística da Universidade Federal do Rio de Janeiro – UFRJ, como parte dos requisitos necessários para a obtenção do título de Doutor em Linguística. Examinada por: _______________________________________________________________ Presidente, Professora Doutora Aniela Improta França – Orientadora _________________________________________________ Professora Doutora Aléria Lage – UFRJ _________________________________________________ Professor Doutor Andrew Nevins – UFRJ/UCL _________________________________________________ Professora Doutora Letícia Sicuro Corrêa – PUC-Rio _________________________________________________ Professor Doutor Augusto Buchweitz – PUCRS/InsCer
Rio de Janeiro, 3 de setembro de 2013
Garcia, Daniela Cid de Efeitos Composicionais no Reconhecimento Visual de Palavras
Compostas em Inglês: um Estudo com MEG / Daniela Cid de Garcia. - Rio de Janeiro: UFRJ/FL, 2013.
xi, 92f.: il.; 31cm Orientadora: Aniela Improta França
Tese (doutorado) – UFRJ/Faculdade de Letras/ Programa de Pós-graduação em Linguística, 2013.
Referências Bibliográficas: f. 93-103. 1. Composicionalidade Semântica. 2. Acesso Lexical. 3.vmPFC. 4. MEG. I. França, Aniela Improta. II. Universidade Federal do Rio de Janeiro, Faculdade de Letras, Programa de Pós-graduação em Linguística. III. Doutor.
RESUMO
EFEITOS COMPOSICIONAIS NO RECONHECIMENTO VISUAL DE PALAVRAS COMPOSTAS EM INGLÊS: UM ESTUDO COM MEG
Daniela Cid de Garcia
Orientador(es): Aniela Improta França e Marcus Antonio R. Maia (Co-orientador)
Resumo da Tese de Doutorado submetida ao Programa de Pós-graduação em Linguística, Faculdade de Letras, da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necessários à obtenção do título de Doutor em Linguística.
Esta tese teve como objetivo examinar as bases neurofisiológicas da computação do sentido em palavras compostas, em uma perspectiva de aproximação entre pesquisa linguística e neurobiologia. O experimento realizado contribui com pistas sobre como operações combinatórias intralexicais são implementadas no cérebro. Utilizamos a técnica de magnetoencefalografia (MEG) para monitorar a atividade eletromagnética cortical durante um teste de leitura em que palavras compostas do inglês foram contrastadas com palavras-controle monomorfêmicas (e.g. SAILBOAT vs. SPINACH). Em primeira análise, o trabalho dialoga com recentes estudos que têm destacado o Campo Medial Anterior (Anterior Midline Field – AMF: componente de MEG que ocorre em torno de 400 ms após a apresentação do estímulo e tem sua fonte geradora no córtex pré-frontal ventromedial) como possível correlato neurofisiológico da composicionalidade semântica. Além disso, assumindo que o AMF possa ser considerado uma medida dependente da composicionalidade semântica intralexical, este trabalho traz evidências preliminares de um possível estágio de recomposição que deve ocorrer no curso temporal do reconhecimento lexical. Esse estágio daria conta da diferença entre palavras transparentes e opacas, já que a decomposição inicial ocorre para ambas. Na manipulação da transparência semântica, palavras opacas apresentaram atividade diferente das palavras transparentes e novas. Palavras-chave: composicionalidade semântica, acesso lexical, vmPFC, AMF, MEG
Rio de Janeiro, setembro de 2013.
ABSTRACT
EFEITOS COMPOSICIONAIS NO RECONHECIMENTO VISUAL DE PALAVRAS COMPOSTAS EM INGLÊS: UM ESTUDO COM MEG
Daniela Cid de Garcia
Orientador(es): Aniela Improta França e Marcus Antonio R. Maia (Co-orientador)
Abstract da Tese de Doutorado submetida ao Programa de Pós-graduação em Linguística, Faculdade de Letras, da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necessários à obtenção do título de Doutor em Linguística.
The aim of this thesis was to examine the neural correlates of the computation of meaning in compound words, bringing together linguistic research and neurobiology. The experiment conducted sheds new light into how intralexical combinatory operations are implemented in the brain. We used the magnetoencephalography technique (MEG) to monitor the cortical eletromagnetic activity during a reading task in which English compound words were contrastred to monomorphemic control words (e.g. SAILBOAT vs. SPINACH). This work dialogues with recent studies that highlight the AMF (Anterior Midline Field – AMF: an MEG component that occurs around 400 ms after the onset of the stimulus and which has its source in the ventromedial prefrontal cortex) as a possible neural correlate for semantic compositionality. Also, assuming that the AMF can also be considered as a dependent measure for intralexical semantic composition, this work presents evidence for a possible morpheme recomposition stage that should take place during the time course of visual word recognition. This stage would account for the difference between transparent and opaque words (SAILBOAT vs. HOGWASH), since there is convergent evidence positing an initial decomposition stage for both transparent and opaque words. In this study, we manipulated this difference, showing that semantic transparency seems to modulate the AMF activity.
Palavras-chave: semantic compositionality, lexical access, vmPFC, AMF, MEG
Rio de Janeiro, setembro de 2013.
SUMÁRIO
1. Introdução …………………………………………………………………… 1
2. Perspectivas para uma Neurobiologia da Linguagem ......................................
2.1. A Linguagem no cérebro ..........................................................................
2.2. Um modelo computacional para a linguagem ..........................................
2.3. Breve Introdução à técnica de Magnetoencefalografia (MEG) ...............
15
15
25
33
3. Mapeando os estágios do reconhecimento visual de palavras complexas – decomposição e recomposição ......................................................................... 3.1. Composicionalidade intralexical ............................................................... 3.2. Localizando o processamento lexical no tempo (e um pouco no espaço também) .................................................................................................... 3.3. Se as palavras são decompostas, como elas se recompõem? ....................
36
36
41
48
4. Uma base neurofisiológica para a composicionalidade semântica: o Campo Medial Anterior (AMF) .....……………………………................... 4.1. A Linguística como modelo cognitivo para estudos neurofisiológicos de semântica ................................................................................................... 4.2. Buscando um correlato para a composicionalidade semântica ................. 4.3. Uma nota sobre a composição sintática – o LATL ...................................
51
55
53
64
5. Efeitos composicionais no reconhecimento visual de palavras compostas em inglês: um estudo com MEG ............................................................................ 5.1. O Estudo ………………………………………………………………....
5.2. Metodologia ......…………………………………………………………
5.3. Análise …..………………………………………………………………
5.4. Resultados ..……………………………………………………………..
5.5. Discussão ..………………………………………………………………
66
66
68
74
78
80
6. Conclusão …..……………………………………………………………….. 87
7. Referências ….……………………………………………………………….. 93
Apêndices ………………………………………………………………………. 104
LISTA DE FIGURAS
Figura Descrição Página
1 Ativação da palavra pela via auditiva 3 2 Composicionalidade em palavras derivadas vs. palavras compostas 11 3 Modelo de Geschwind 16 4 Capa do periódico Neuron 18 5 Broca de Amunts 21 6 Estrutura básica do sistema computacional da linguagem 26 7 Figura esquemática de uma parte do córtex: sinal MEG 33 8 Exemplos de composicionalidade 37 9 Forma da onda associada ao reconhecimento visual de palavras 45
10 Classificação das palavras compostas 49 11 Resultados Kutas & Hillyard, 1980 57 12 Resultados Hagoort et al., 2004 58 13 AMF como índice de composição semântica 62 14 Resultado Bemis & Pylkkänen, 2011 63 15 Esquema da tarefa do experimento completo 71 16 Forma da cabeça sendo digitalizada 73 17 Ambiente magneticamente isolado 74 18 Área de Brodmann 11 77 19 Áreas de Brodmann 38, 20 e 21 77 20 AMF no curso temporal do reconhecimento da palavra 85
LISTA DE GRÁFICOS
Gráfico Descrição Página 1 vmPFC: Amplitudes da condição transparente 79 2 vmPFC: Amplitudes da condição nova 79 3 vmPFC: Amplitudes da condição opaca 79 4 LATL: Amplitudes de todas as condições 80 5 LIFG: Amplitudes de todas as condições 80
LISTA DE TABELAS
Tabela Descrição Página 1 Condições do experimento completo 70 2 Condições do experimento de interesse para a tese 72
Agradecimentos
À Aniela França e ao Marcus Maia, por participarem da minha história acadêmica desde a graduação, incentivando sempre a criatividade e o pensamento inquisitivo e autônomo – elementos essenciais na construção da minha multifacetada trajetória como pesquisadora. À CAPES, pelo apoio financeiro durante o meu Doutorado no Brasil. À CAPES/Comissão Fulbright-Brasil, pelo apoio financeiro durante meu estágio de Doutorado nos Estados Unidos. À Liina Pylkkänen, por ter aceitado supervisionar meu estágio de Doutorado na Universidade de Nova York, sem o qual esta tese não teria sido possível em sua totalidade, e por ter acompanhado de perto o meu trabalho. À Aléria Lage, ao Andrew Nevins, ao Augusto Buchweitz e à Letícia Corrêa – por terem aceitado fazer parte da minha banca, e pelas observações criteriosas que contribuíram para melhorar esta versão final. Ao Teon Brooks, meu colega de pesquisa na NYU, que me ensinou quase tudo que eu sei sobre programação e análise de dados, e me socorreu nos vários momentos em que eu precisei de mais mãos e de mais cabeça. Ao Alec Marantz, pelos comentários e sugestões em cada etapa da pesquisa. Ao Chris Barker, por ter me aceitado como ouvinte em seu curso de Semântica, que teve relevante influência nesta tese. Ao Paul del Prato e à Rebecca Egbert, pela paciência em me explicar como usar o BESA, e pela prontidão resignada em me ajudar cada vez que o Matlab dizia não. Ao Jeff Walker, pela assistência impecável com o MEG. Ao Eduardo Subirats, que possibilitou uma incursão escapista pelos submundos das ficcões latinoamericanas, entre uma magnetoencefalografia e outra. À Fulbright/IIE e à One-to-World, que fizeram com que meu Doutorado sanduíche fosse uma experiência etnográfica para além de plural. A todos os colegas do Lapex e do Acesin, de 2005 a 2013. Ao Alex, à Fernanda, à Juliana, à Liliane, ao Lúcio e à Nathacia, por estarem mais presentes na etapa final da tese, tendo contribuído com observações importantes antes da defesa. Ao Thiago, por todo aquele material de semântica em meus tempos de polissemia. À Paula Luegi, pelas aulas de SPSS, lá no início, e pelos insights sobre palavras compostas, agora no fim. Ao Antônio, pela breve parceria de pesquisa em rastreamento ocular. Ao Márcio Leitão, por incentivar um desvio pela correferência, no meu segundo ano do doutorado. À Cris Oliveira, à Katharine da Hora, à Kátia Abreu, – pela amizade e generosidade acadêmica, e por continuarem tornando indefinido o limite entre trabalho e diversão.
Aos meus professores da graduação e da pós-graduação, pelos tijolos fundamentais da minha formação como linguista. Aos meus alunos (e ex-alunos) da graduação na Letras e em Relações Internacionais, que propiciaram maior densidade à minha experiência de doutoranda. E aos meus colegas de anglo-germânicas, sobretudo Cíntia Rabello, Cláudio Franco e Rodrigo Borba, pelo apoio nesses últimos meses. Aos meus amigos do Rio e de fora do Rio – por não se incomodarem com a monotonia de assunto. A omissão dos nomes aqui será compensada pessoalmente. Ao Antoine, meu bro no Brooklyn. À Yen, à Desi, ao Atum, à Lilian e ao Bill, e a todos os meus amigos em NY e imediações, Fulbrighters e não Fulbrighters, pelos momentos felizes que deram tempero especial ao meu sanduíche. À Marília, por todo o tempo compartilhado durante o doutorado, discutindo Linguística no Burguesão, no Lamas ou no Skype, preparando cursos, escrevendo artigos; pelos viradões, pelos cafés – e por perspectiva em momentos de spleen. Pela energia violeta sempre disponível, mesmo no arranjo geográfico em estilo Órion-Escorpião que caracterizou os dois últimos anos. Ao Gabi e à Marina, por tanto! – e por bibliografia perturbadora, e por discussões que certamente têm impacto no meu modo de entender e fazer ciência. E à Clarice, pelo título especial de tia, que veio junto com o de doutora. Ao Tiago, sempre. E à Daina, à Olivia, ao Eduardo, à Milena, à Márcia, ao Roberto e à Lourdes. À Miriam, ao Francisco, à Márcia, ao Raul, à Laura e ao Fabinho – por tanto amor. À Nancy e ao Farofa, minha família no Queens. E à Miris. Ao Sei, pelo encontro cosmico-serendipídico que aconteceu porque este doutorado existiu, e depois do qual o sentido das coisas não foi mais o mesmo.
Eu dedico esta tese à minha mãe.
Maybe in order to understand mankind we have to look at that word itself. MANKIND. Basically, it's made up of two separate words "mank" and "ind." What do these words mean? It's a mystery and that's why so is mankind.
Jack Handey
_____________________________________________________________________um
Introdução
“Galileu deve ter sido o primeiro a reconhecer claramente a importância da propriedade central da linguagem humana, e uma de suas propriedades mais distintivas: o uso de meios finitos para expressar uma gama ilimitada de pensamentos. […] Os filósofos gramáticos de Port Royal levaram a ideia adiante, referindo-se à ‘maravilhosa invenção’ de um meio de construir […] ‘essa infinidade de expressões, que em nada se assemelham ao que acontece dentro da nossa mente, mas que nos permite revelar [para outros] tudo o que pensamos, e cada movimento da nossa alma’.” (CHOMSKY, 2002: 45)1
Esta tese tem como objetivo geral contribuir com o trabalho de caracterizar as bases
neurofisiológicas da composicionalidade semântica. Especificamente, o objetivo é
examinar a atividade neuronal associada a efeitos pós-lexicais que devem ocorrer entre os
morfemas ativados durante o reconhecimento visual de palavras compostas, identificando
um possível componente de magnetoencefalografia que possa ser usado para testar futuras
hipóteses sobre processos combinatórios no reconhecimento de palavras. Além disso, este
trabalho discute a relação entre Linguística e Neurociência, situando-se dentro de um
programa de pesquisa biolinguístico2 que busca uma associação produtiva entre essas duas
áreas do conhecimento.
1 Galileo may have been the first to recognize clearly the significance of the core property of human language, and one of its most distinctive properties: the use of finite means to express an unlimited array of thoughts. […] [T]he philosopher-grammarians of Port Royal took that further step, referring to the ‘marvelous invention’ of a means to construct […] that infinity of expressions, which bear no resemblance to what takes place in our minds, yet enable us to reveal [to others] everything that we think, and all the various movements of our soul’.” (CHOMSKY, 2002: 45)
2 Biolinguística é o estudo da linguagem em uma perspectiva biológica, considerando seu funcionamento na mente/cérebro, sua evolução na espécie e sua aquisição. Essa área de pesquisa teve início na segunda metade do século XX e aproximou a linguística das ciências matemáticas e biológicas, buscado o que há de universal nas línguas naturais (LENNEBERG, 1967; CHOMSKY, 1959; JENKINS, 2000).
2
O completo entendimento da linguagem como uma faculdade cognitiva requer o
exame minucioso de como se dá o pareamento entre forma e sentido, tanto em termos da
intuição do falante sobre o que deve ser uma expressão interpretável – ou gramatical –,
quanto por meio da caracterização de como esse pareamento ocorre para que essas
expressões sejam produzidas e compreendidas na velocidade em que elas ocorrem. Para
que se entenda como se dá a produção de expressões linguísticas, é necessário caracterizar
como comandos motores são executados, a partir de uma intenção de fala, de modo a
externalizar um determinado sentido. Por outro lado, entender os mecanismos da
compreensão de expressões linguísticas envolve examinar como a informação perceptual é
analisada, desvelando-se o sentido a partir da forma ouvida ou lida.
Dependendo da modalidade – auditiva ou visual –, a infomação perceptual deve
seguir caminhos ligeiramente diferentes até que a unidade linguística seja selecionada. Se
o estímulo é auditivo, deve haver uma ativação incremental, já que os fones são
apresentados serialmente no tempo. Desde que surgem os primeiros traços do estímulo,
portanto, o processamento é iniciado para que a ativação múltipla de todos os concorrentes,
por vezes muitos deles, chegue ao desfecho vitorioso em que só um concorrente persevere
ativo, enquanto todos os outros sejam, o mais rapidamente possível, desativados. A palavra
ativada quase sempre é inserida em contextos de sentença e as pressões de tempo do
processamento são muito grandes. Nesse caso, deve existir um momento de composição
fonética inicial até que se ative a palavra correta. Sendo assim, durante o reconhecimento
auditivo da palavra teacher, por exemplo, serão ativadas palavras que comecem com [t],
com [ti:], com [ti:t∫], e assim por diante (cf. Modelo Cohort – MARSLEN-WILSON &
WELSH, 1978). À medida que cada novo som da palavra é percebido, algumas palavras
são desativadas e outras, com semelhança pelo meio, são ativadas (Figura 1).
3
Se o estímulo é visual, essa primeira rota composicional a partir da ativação
incremental letra por letra não deve ocorrer – ao menos não para leitores fluentes –, já que
os modelos de leitura mais aceitos postulam o reconhecimento paralelo das letras
(DAHEANE, 2009; RAYNER & POLLATSEK, 1987). Esse fato não descarta
necessariamente a ativação de representações sonoras, uma vez que não é claro se a
representação de significado da palavra é dissociada do seu som. Esta tese se concentra
em examinar as bases neurofisiológicas da composicionalidade semântica, à medida em
que ela ocorre durante a compreensão de palavras pela via visual.
Figura 1: Ativação da palavra pela via auditiva.
Após essa ativação de nível mais baixo que ocorre nos momentos mais iniciais da
percepção do estímulo linguístico, esse estímulo deve ser decomposto em unidades
linguisticamente relevantes para as operações combinatórias. As propriedades dessas
partículas elementares da computação linguística – natureza, tamanho etc. – não são
consensuais mesmo dentre as diferentes áreas que têm a linguagem como foco. No entanto,
é incontroversa a fascinante capacidade da linguagem em compor uma infinidade de
sentidos complexos a partir de unidades básicas finitas.
Desvendar o balanço da (in)equação entre o que é armazenado e o que é gerado por
regras é um desafio crucial, que divide e incentiva a pesquisa linguística. Com relação
4
especificamente ao estudo das palavras, essa questão se particulariza em identificar a
natureza da representação lexical na mente e os mecanismos que são utilizados para ativar
essas representações. Uma questão crucial nesse sentido é se o léxico mental é organizado
em morfemas ou em palavras inteiras, de modo que entender o papel da morfologia no
reconhecimento de palavras – e sua dissociação de efeitos semânticos e fonológicos – tem
constituído um dos debates mais fervorosos em estudos sobre o processamento da
linguagem. Esses estudos apontam alguns fatores que poderiam condicionar a organização
do léxico mental e o acesso às unidades computacionais. Por exemplo, seriam palavras
semanticamente transparentes 3 (e.g. SAILBOAT=barco a vela, TEACHER=professor)
acessadas via seus morfemas constituintes, ao passo que palavras opacas (e.g.
HOGWASH=desatino, APARTMENT=apartamento) seriam representadas e acessadas em
sua forma inteira?
Muitas pesquisas em Psicolinguística já foram feitas nas últimas quatro décadas
com o objetivo de investigar os mecanismos envolvidos no reconhecimento lexical –
utilizando sobretudo as técnicas de priming4, decisão lexical e rastreamento ocular – e suas
conclusões dividiram o campo em três cenários distintos (cf. Capítulo 3), de acordo com o
peso que foi dado para um ou outro lado do balanço entre armazenagem e computação. Os
resultados têm convergido em favor dos modelos que postulam um estágio de
decomposição da palavra em seus morfemas constituintes, durante o curso temporal do
reconhecimento (GARCIA, 2009; RASTLE ET AL., 2004; LONGTIN ET AL., 2003;
3 Uma palavra é semanticamente transparente se o seu significado pode ser recuperado a partir do significado dos seus constituintes. Por exemplo, SAILBOAT (barco a vela) é semanticamente transparente porque seu significado se relaciona com o de seus constituintes SAIL e BOAT (barco e vela) 4 Priming é um tipo de experimento que afere efeitos de memória implícita, verificando o quanto a exposição a um determinado estímulo influencia o reconhecimento de outro estímulo apresentado em seguida.
5
ZWITSERLOOD, 1994). Esses resultados têm sido, mais recentemente, corroborados
também por estudos neurofisiológicos (STOCKALL & MARANTZ, 2006; FIORENTINO
& POEPPEL, 2007a).
Em uma primeira análise, esses dados poderiam ser interpretados como um efeito
de identidade, como proposto por Garcia (2009) e Stockall & Marantz (2006), à luz do
modelo teórico não-lexicalista da Morfologia Distribuída (HALLE & MARANTZ, 1993).
Ou seja, como pares prime-alvo do tipo FILA-fileira apresentam um índice significativo de
facilitação (em oposição a pares em que as palavras são apenas ortograficamente
relacionadas, como FILÉ-fileira), essa facilitação poderia ser atribuída a um
compartilhamento da raíz morfológica. Sendo assim, o reconhecimento da palavra fileira é
facilitado porque a raíz de FILA já foi ativada (GARCIA, 2009).
De acordo com essa explicação, palavras semanticamente transparentes deveriam
ser decompostas – e, portanto, obter facilitação na tarefa de priming – e palavras
semanticamente opacas não deveriam ser decompostas. Mesmo dentro de uma proposta
não-lexicalista, a decomposição de palavras semanticamente opacas, como restaurante,
não pareceria uma via razoável, justamente porque, em sendo opacas, o lugar da
arbitrariedade não estaria na camada do verbo restaurar, mas sim na camada do, já nome,
restaurante. Nesse sentido, se restaurante fosse uma palavra de fato completamente
opaca, ela não deveria estabelecer uma relação de identidade com a raíz do verbo
restaurar. De fato, experimentos de priming não encoberto e intermodal apresentam
resultados compatíveis com essa explicação (MARSLEN-WILSON, 1994, LONGTIN ET
AL., 2003). No entanto, estudos com priming encoberto5 que manipularam a transparência
semântica encontraram efeitos de facilitação independente do compartilhamento de raíz
5 Paradigma de priming em que o prime é apresentado muito rapidamente, e seguido por uma máscara (#####), de modo que não seja conscientemente percebido.
6
(RASTLE ET AL., 2004; LONGTIN ET AL., 2003; FIORENTINO & POEPPEL, 2007b).
Isso significa que efeitos de facilitação foram encontrados para qualquer palavra complexa
que pudesse ser segmentada em morfemas e afixos existentes na língua. Sendo assim,
pares como corn-corner (=milho-esquina) e hog-hogwash (=porco-desatino) obtiveram
facilitação tanto quanto pares como clean-cleaner (=limpo-limpador) e sail-sailboat
(=vela-barco a vela), ainda que nos pares corn-corner e hog-hogwash não exista uma
relação por identidade.
Se existe decomposição de qualquer palavra que tenha uma aparente complexidade,
a questão mais atual que se apresenta diz respeito a que mecanismos posteriores a essa
decomposição devem estar em jogo para explicar a ativação do sentido correto em palavras
opacas, como corner e hogwash. Medidas off-line, como os tempos de resposta utilizados
em experimentos psicolinguísticos, não permitem que se obtenha uma caracterização
detalhada da atividade cognitiva à medida em que ela ocorre. Isso dificulta o mapeamento
temporal das atividades associadas à ativação da palavra, já que elas vêm todas
comprimidas na medida final. Para esse tipo de exame mais minucioso, justifica-se o uso
de técnicas de aferição neurofisiológica da atividade cognitiva, que permitem um
acompanhamento temporal mais granularizado das etapas envolvidas no processo
investigado. Essas técnicas são, portanto, ferramentas promissoras para distinguir estágios
que antecedem e que seguem o acesso lexical.
Como existe decomposição nos estágios mais iniciais da ativação de uma palavra, é
possível que exista um momento posterior de composição entre os sentidos dos morfemas
ativados, de modo que seja estabelecido o sentido consistente com o estímulo. Para que se
possam manipular esses efeitos posteriores ao acesso aos morfemas, no entanto, é
necessário que se estabeleça um correlato neurofisiológico da computação semântica, que
sirva de medida dependente para essas atividades combinatórias.
7
Em Psicolinguística, as medidas dependentes associadas a uma certa tarefa
cognitiva se constituem sobretudo em torno de manipulações do fator tempo. Quando
procuramos estudar essa mesma tarefa cognitiva no cérebro, a relação se complexifica,
uma vez que, além do tempo, a atividade relacionada a essa tarefa traz ainda suas
dimensões espaciais. Além disso, entre a tarefa e os dados a ela associados, existe uma
série de manipulações que demandam noções de Engenharia de sinais, Biologia, Física,
Fisiologia e Computação. Já não são evidentes os processos que transformam atividade
neuronal em uma onda bidimensional que pode ser analisada estatisticamente. Ainda
menos óbvia é a correlação entre uma tarefa cognitiva e essa atividade que gerou a onda.
Sendo assim, antes de encontrar, no cérebro, respostas sobre os mecanismos envolvidos no
reconhecimento de palavras, é preciso determinar que circuitos neuronais estão associados
aos mecanismos sob investigação. O problema parece cíclico, e nele se configura o desafio
de associar pesquisa linguística e neurociência experimental.
Essa associação depende da possibilidade de se estabelecer uma relação entre os
primitivos computacionais da linguagem e estruturas cerebrais que sejam capazes de
implementar essas computações (cf. Capítulo 2). Conforme instiga Marantz (2005),
“cinquenta anos de análise da linguagem pela Linguística contemporânea podem ser
associados com uma gama extensa de recursos de imagem e monitoramento do cérebro
para testar hipóteses e redefinir teoria e conhecimento” (MARANTZ, 2005; p.429).6
Poeppel & Embick (2005) ainda acrescentam que
o estudo conjunto sobre cérebro e linguagem – neurociência da linguagem – já obteve alguns resultados básicos correlacionando fenômenos linguísticos com respostas cerebrais, mas ainda não avançou em uma teoria explicativa que identifique a natureza da computação linguística no cérebro. […] A
6 “Fifty years of contemporary linguistic analysis of language can be coupled with a wide range of brain imaging and brain monitoring machines to test hypotheses and refine theory and understanding.” (MARANTZ, 2005; p.429)
8
ausência de uma teoria explicativa desse tipo é o resultado da incompatibilidade em granularidade conceitual e da incomensurabilidade ontológica entre os conceitos fundamentais da linguística e da neurobiologia: o maquinário que invocamos para dar conta de fenômenos linguísticos não pode ser relacionado de nenhuma maneira óbvia com os sistemas biológicos em questão.7
Os resultados obtidos nesta tese, em diálogo com outros trabalhos que vêm sendo
realizados recentemente, podem ajudar a estabelecer correlatos que poderão ser
manipulados para checar hipóteses a respeito do funcionamento da linguagem no cérebro.
Esses trabalhos têm trazido novas abordagens no estudo da neurobiologia da linguagem,
promovendo uma aproximação mais sistemática entre neurociência e pesquisa linguística
(POEPPEL ET AL., 2010; POEPPEL, 2012; HICKOK & POEPPEL, 2004, 2007;
POEPPEL & EMBICK, 2005; GIRAUD & POEPPEL, 2012; MARANTZ, 2005;
PYLKKÄNEN ET AL., 2010) – e buscando redefinir, dessa forma, a estruturação
conceitual da neurociência da linguagem.
Nessa perspectiva, Pylkkänen e Marantz (2003) identificaram alguns dos estágios
por que passa a informação perceptual da palavra, até o acesso lexical. A partir de estudos
utilizando a técnica da magnetoencefalografia, os autores apontam diferentes componentes
associados ao reconhecimento visual de palavras, sensíveis a fatores específicos
relacionados ao estímulo (cf. Capítulo 3). Um desses componentes, o M350, ocorre em
torno de 350 ms após o início da apresentação do estímulo e é sensível a frequência e a
repetição, mas não a fatores pós-lexicais de competição entre representações ativadas pelo
estímulo. Esse componente foi relacionado ao estágio em que ocorre o acesso lexical.
7 “the joint study of brain and language – cognitive neuroscience of language – has achieved some basic results correlating linguistic phenomena with brain responses, but has not advanced in any explanatory theory that identifies the nature of linguistic computation in the brain. […] The absence of an explanatory theory of this type is the result of the conceptual granularity mismatch and the ontological immensurability between the foundational concepts of linguistics and neurobiology: the machinery we invoke to account for linguistic phenomena is not in any obvious way related to the entities and computations of the biological systems in question.” (POEPPEL & EMBICK, 2004: 14-15).
9
Durante o reconhecimento da palavra SAILBOAT, então, ocorre a ativação da raiz
SAIL e a ativação da raiz BOAT, indicadas pelo componente M350. Nesse estágio, o
reconhecimento de palavras como SAILBOAT não é diferente do reconhecimento de
palavras como HOGWASH. Sendo assim, ainda que em tese não exista relação semântica
entre HOG e HOGWASH, a palavra é decomposta nos estágios mais iniciais do
reconhecimento – como indicado por experimentos com priming encoberto e com MEG.
O que diferencia a natureza dessas duas categorias de palavras (transparentes e opacas)
deve ocorrer, portanto, em algum momento de composição semântica posterior ao acesso
às raízes. Nesta tese, procuramos, exatamente, evidências para essa recomposição,
examinando a composição do sentido em palavras compostas.
A composicionalidade em palavras ou expressões linguísticas não é sempre
indiscutível. Uma questão importante para o estudo da linguagem em uma perspectiva
biolinguística deve ser, portanto, que tipo de composicionalidade deve fazer parte do
inventário de operações da linguagem natural. Tradicionalmente, os estudos em
neurociência da linguagem que buscam isolar as bases neurológicas da composicionalidade
semântica têm a tendência de manipular seu material de análise sem especificar o tipo de
computação sob investigação, geralmente utilizando-se de variações em termos de
conhecimento de mundo (KUTAS & HILLYARD, 1980; FEDERMEIER & KUTAS,
1999; HAGOORT ET AL., 2004). Esses estudos não levam em conta necessariamente o
conhecimento linguístico teórico sobre o que é semântica, como caracterizado pela
Semântica Formal. Em função dessa diferença terminológica entre Linguística e
neurociência da linguagem quanto à natureza da representação dos sentidos complexos, os
fenômenos considerados como dentro do escopo da Semântica, em Linguística, deixaram
de ser contemplados.
Resultados recentes têm começado a reverter essa tendência, buscando isolar
10
operações combinatórias básicas, dentro do contexto de sentenças ou sintagmas. Esses
estudos têm associado o Campo Medial Anterior (AMF – Anterior Midline Field) com o
processamento da composição de significados complexos, tanto em sintagmas mínimos
envolvendo a ligação entre um artigo e um nome quanto em sentenças envolvendo coerção
e violações semânticas dentro da selecão verbal. O AMF é um componente de
magnetoencefalografia que ocorre entre 350 e 450 milissegundos após o início da
apresentação de um elemento crítico ligado a algum tipo de computação semântica
(PYLKKÄNEN & McELREE, 2007; PYLKKÄNEN, MARTIN, McELREE & SMART,
2009; BRENNAN & PYLKKÄNEN, 2008; BRENNAN & PYLKKÄNEN, 2010;
PYLKKÄNEN, OLIVERI & SMART, 2009; BEMIS & PYLKKÄNEN, 2011). Esta tese
se soma a essa série de estudos, verificando que esses mesmos efeitos podem ser
reproduzidos por processos de composição semântica entre os morfemas constituintes de
palavras compostas e, dessa forma, estabelecendo o AMF como um possível correlato de
operações combinatórias pós-lexicais.
Bemis & Pylkkänen (2011) encontraram essa correlação em sintagmas adjetivais
constituídos simplesmente pela concatenação entre um nome e um adjetivo. Para fins de
paralelismo e comparabilidade com esses estudos recentes, decidimos investigar essa
atividade em palavras compostas, como SAILBOAT. Como essas palavras são constituídas
pela concatenação de dois morfemas lexicais, analogamente ao que ocorre com a
modificação em sintagmas como red boat, consideramos que seria o tipo de estímulo mais
adequado como primeiro teste que busca encontrar esses efeitos em palavras. Utilizamos a
técnica de magnetoencefalografia (MEG) para monitorar a atividade eletromagnética
cortical durante um teste de nomeação em que palavras compostas do inglês foram
contrastadas com palavras-controle simples (e.g. SAILBOAT vs. SPINACH). O esforço
para a composição do sentido em palavras compostas deve gerar um aumento da amplitude
11
desse componente, quando comparado ao esforço para computar o sentido de palavras
simples. Este trabalho dialoga, portanto, com a literatura sobre o processamento de
palavras, apresentando um possível índice da composicionalidade semântica pós-lexical.
Se esse índice se mostrar replicável e substancial em futuros estudos, poderá ser usado para
informar questões sobre o reconhecimento de palavras que não puderem ser
desambiguizadas utilizando medidas off-line.
O processo de formação da palavra – por derivação, flexão ou composição – pode
ser um fator relevante na segmentação do estímulo e na ativação do sentido da palavra
(Figura 2). Por exemplo, palavras derivadas (e flexionadas), são formadas por uma raíz e
por um morfema categorizador (e.g. [TEACH]ER] ou [PARK]ED]), ao passo que palavras
compostas são formadas por pelo menos duas raízes.
Figura 2: Composicionalidade em palavras derivadas vs. palavras compostas
Considerando uma proposta não-lexicalista como a da Morfologia Distribuída
(HALLE & MARANTZ, 1993), cada uma dessas raízes lexicais – que pode se relacionar
com a palavra inteira de forma transparente, como em SAILBOAT (sail=vela; boat=barco;
sailboat=barco a vela), ou de forma opaca, como em HOGWASH (hog=porco;
wash=lavagem; hogwash=desatino) – deve ser concatenada a um morfema categorizador
12
(e.g. [SAIL]∅]N e [BOAT]∅]N), e o significado dessas duas raízes deve ainda ser
combinado para formar o significado da palavra composta SAILBOAT. Essa combinação
pode ser por uma relação hierárquica de subordinação (SAILBOAT – [barco] [com vela])
ou por coordenação (BITTERSWEET – [amargo] e [doce]). A composição pode ainda ter
palavras com a mesma categoria formal, como em SAILBOAT (nome-nome), ou com
categorias diferentes, como em REDNECK (adjetivo-nome – red=vermelho; neck=
pescoço; redneck=caipira).
As palavras compostas fornecem, portanto, um material altamente farto para se
estudar a relação entre efeitos morfossintáticos e semânticos no acesso lexical, uma vez
que são palavras constituídas por uma relação entre morfemas livres, o que permite
descartar efeitos que podem ser associados apenas à natureza funcional de afixos (Affix
Stripping: TAFT & FORSTER, 1975). Como os constituintes dos compostos são itens
lexicais em si, nos pareceu o melhor objeto para testar efeitos de composição semântica
intralexicais que podem ser análogos a efeitos que ocorrem no nível sintagmático.
Estudar a neurofisiologia da ativação de palavras compostas, explorando os
diferentes níveis da sua complexidade, pode trazer intuições que contribuam fornecendo
dados importantes para teorias sobre o funcionamento da linguagem. Em maior escala,
este trabalho pode trazer novas evidências sobre os mecanismos envolvidos no curso
temporal do reconhecimento de palavras, no caminho ainda apenas incipiente de buscar
uma caracterização explicativa da dinâmica espaço-temporal do circuito cerebral de
construção de sentido.
Para que isso seja possível, no entanto, é necessário que sejamos capazes de
traduzir os sinais enviados pela atividade neuronal em informações relevantes para os
problemas que formulamos. Estabelecer esse elo é tanto um exercício filosófico quanto um
ato de criação – e que eu tento colocar em prática nesta tese para entender, ainda que
13
provisoriamente, como interagem os primitivos linguísticos para construção do sentido
complexo dentro de uma palavra.
Súmula dos Capítulos
De modo a organizar de maneira sistemática a fundamentação teórica desta tese,
seus objetivos e procedimentos de pesquisa, foram elaborados seis capítulos: Neste
Capítulo 1, de Introdução, foi apresentado o objetivo da tese, juntamente com uma revisão
das questões que a contextualizam.
No Capítulo 2, situamos este trabalho de Doutorado como parte de um programa de
pesquisa que busca uma interface factível entre a pesquisa linguística e a neurobiologia.
Esse programa, proposto em Poeppel & Embick (2005), sugere que a tarefa cognitiva seja
explicitada em termos de operações computacionais, de forma a se obter uma adequação
explicativa do funcionamento da linguagem no cérebro. Ainda nesse capítulo, são
apresentadas brevemente as principais características do protocolo de
magnetoencefalografia (MEG), destacando sua importância para estudos em linguagem.
No Capítulo 3, encontra-se um resumo dos estudos sobre o acesso lexical. Nesse
capítulo são apresentados os modelos de processamento de palavras e a convergência dos
resultados na literatura em favor de modelos decomposicionais. O texto é organizado de
maneira a justificar a busca por um momento posterior no reconhecimento da palavra, em
que deve ocorrer a recomposição dos morfemas resultantes da segmentação inicial.
A fim de caracterizar a busca por um correlato neurofisiológico que funcione como
medida dependente para a composição semântica, o Capítulo 4 apresenta estudos que têm
14
destacado o Campo Medial Anterior (AMF) como implicado nesse tipo de operação.
Estudos recentes, adotando o programa de pesquisa apresentado no Capítulo 2, têm
manipulado sistematicamente operações combinatórias em diferentes contextos. Esses
estudos têm revelado resultados consistentes indicando a relação desse componente de
MEG com diferentes tipos de computação semântica, incluindo o processo de modificação
intersectiva em sintagmas adjetivais.
Dialogando com essa literatura, o experimento realizado para esta tese verificou
que esse mesmo efeito é encontrado quando se manipula a composicionalidade em
palavras compostas. No Capítulo 5, encontra-se o relato do experimento, que aponta o
AMF como possível correlato da composição semântica entre os sentidos dos constituintes
das palavras compostas. Assumindo essa possível correlação, o experimento foi
desenhado de maneira a verificar efeitos de transparência semântica, relacionando-se
também com a literatura sobre o processamento de palavras. No Capítulo 6,
apresentaremos a conclusão do trabalho realizado, apontando os desafios e as perspectivas
futuras.
15
_____________________________________________dois
Perspectivas para uma Neurobiologia da Linguagem
2.1 A Linguagem no cérebro
Considerando-se uma perspectiva biolinguística, talvez a maneira correta de
abordar a linguagem no cérebro seja, como propõe Chomsky, revisar o inventário de
princípios fundamentais da linguagem e do cérebro, e, então, conceber uma possibilidade
de unificação – a exemplo do que aconteceu com a Física e a Química por volta do início
do século XX (CHOMSKY, 2000; 2002). Os estudos da neurobiologia da linguagem se
desenvolveram de forma dissociada de estudos linguísticos, de modo que a possibilidade
de se obter um nível explicativo para a linguagem em termos de estrutura e função
cerebrais se manteve pouco provável.
Desde os primeiros indícios mais concretos de que as funções da linguagem
estariam associadas à matéria (cerebral), tem sido crescente o esforço e o otimismo em
caracterizar as bases dessa relação. Estudos seminais que procuraram entender as bases
neurofisiológicas da linguagem o fizeram a partir de dados relativamente rústicos,
provenientes sobretudo da associação de déficits linguísticos a áreas do cérebro que
sofreram lesões.
Muito do que sabemos sobre a importância de certas áreas cerebrais provém de estudos acerca de afasias. Afasia é a perda parcial ou completa das capacidades da linguagem em função de lesões encefálicas, muitas vezes sem a perda de faculdades cognitivas ou da capacidade de mover os músculos utilizados na fala. (BEAR ET AL., 2008; p. 618)
16
O modelo de Wernicke-Geschwind (GESCHWIND, 1979), desenvolvido por
Norman Geschwind a partir de uma expansão de estudos clássicos do século XIX
(BROCA, 1861; WERNICKE, 1874; LICHTHEIM, 1885), ainda é bastante difundido e
“oferece explanações simples para elementos-chave das afasias de Broca e Wernicke”
(BEAR ET AL., 2008; p.625). Basicamente, o modelo é composto pela região de Broca
(giro frontal inferior esquerdo) e pela região de Wernicke (giro temporal superior
esquerdo). O modelo propõe que essas duas áreas sejam conectadas por um feixe de
axônios, denominado fascículo arqueado. Fazem parte também desse sistema áreas
sensoriais e áreas motoras, cuja função é receber e produzir linguagem.
Figura 3: Modelo Wernicke-Geschwind (GESCHWIND, 1979) – Esta representação corresponde à tarefa de repetir uma palavra que foi ouvida. Primeiro, os sinais neurais, resultantes do processamento sonoro pelo sistema auditivo, chegam ao córtex auditivo (primary auditory area). Esses sinais são enviados à Área de Wernicke (Wernicke’s Area), onde
o significado da palavra é compreendido. Em seguida, os sinais que representam a palavra são transferidos para a Área de Broca (Broca’s Area), por meio do fascículo arqueado. Em Broca, as palavras se convertem em um código para informar movimentos musculares. Esse código é enviado a áreas corticais motoras, de modo que a palavra seja produzida.
Devido à sua simplicidade e validade aproximada, esse modelo continua sendo
usado para informar questões sobre o funcionamento da linguagem, especialmente em
contextos clínicos envolvendo dificuldades de fala e de leitura. No entanto, sua
subespecificação – tanto anatômica quanto linguística – aponta a necessidade de uma
17
reformulação teórica para acomodar recentes avanços de cunho técnico e conceitual
(POEPPEL & HICKOK, 2004; GRODZINSKY & AMUNTS, 2006; AMUNTS ET AL.,
2010).
Em termos metodológicos, os últimos trinta anos testemunharam consideráveis
avanços nas técnicas de aferição da atividade neuronal. Técnicas não-invasivas e de alta
resolução espacial e temporal tornaram possível a obtenção de dados neurológicos de alta
qualidade. Essas técnicas podem ser de dois tipos, dependendo da natureza dos processos
fisiológicos que dão origem ao sinal. Técnicas eletromagnéticas (eletroencefalografia –
EEG / magnetoencefalografia – MEG) medem a atividade elétrica ou eletromagnética
proveniente da atividade de um conjunto de neurônios. Essas técnicas têm como vantagem
uma alta resolução temporal, sendo adequadas para acompanhar o curso temporal de
atividades cognitivas. Técnicas hemodinâmicas (ressonância magnética funcional – fMRI /
tomografia por emissão de pósitrons – PET), por outro lado, medem diferenças em
deslocamento sanguíneo associadas à atividade neuronal, e se destacam pela milimétrica
resolução espacial.
Independente da metodologia usada, os dados obtidos tendem a ser caracterizados
em termos topográficos, revelando uma pressuposição pervasiva de que a localização de
funções cognitivas deve representar uma forma de evidência privilegiada para explicar as
faculdades mentais. Esse “imperativo cartográfico” (POEPPEL, 2008) é incitado pela
captura denotativa na capa do periódico Neuron (Figura 4).
As técnicas descritas acima, sobretudo fMRI e PET, permitem que sejam geradas
imagens realísticas do cérebro durante a realização de alguma atividade cognitiva, o que
faz com que elas sejam facilmente apropriadas pela mídia popular em aproximações
supersimplificadas e reducionistas. Essa aparente concretude – quase reificação – da
atividade cognitiva cria uma ilusão de objetividade que mascara a complexidade
18
matemática e epistemológica por trás das cativantes imagens. “Afinal, é preciso muito
processamento computacional e julgamento humano para se chegar de níveis de oxigênio
no sangue até uma foto instantânea de funções cerebrais complexas” (RAZ, 2012)8.
Figura 4: Capa do periódico Neuron 56, de outubro de 2007 (In: POEPPEL, 2008)
O apelo da imagem, no entanto, não se esgota na mídia de massa. Dentro do meio
científico, a retórica sugere que imagens da atividade cerebral são capazes de conferir mais
legitimidade a observações comportamentais, tornando-as “mais científicas” (RACINE
ET AL., 2006a). Também movidas por essa demanda, pesquisas utilizando técnicas
eletrofisiológicas tendem a incluir informação quanto à localização, ainda que a
8 “After all, it takes a great deal of computer processing and human judgment to get from blood oxygen levels to a snapshop of a higher brain function” (RAZ, 2011; p. 265).
19
informação crucial desses estudos esteja no sinal e não no local onde o sinal é gerado.
Conforme reconhece David Poeppel,
É justo afirmar que, no clima atual das pesquisas, um projeto em psicologia cognitiva é considerado mais financiável – ou mais passível de estar no caminho certo – quando seus experimentos são combinados com (e portando ‘verificados’ pelos) dados de imagem. (POEPPEL, 2008; p. 27)9.
E ele ainda pondera:
O fato é que não pode existir uma imagem objetiva da mente funcionando. Em vez disso, o que as imagens refletem é uma gama de predisposições teóricas, contingências técnicas, acidentes experimentais e pressuposições do observador. […] Imagens geram dados, nem mais nem menos, e os dados são úteis e utilizáveis desde que tenham uma interpretação no contexto de uma teoria sobre como a mente é organizada. (POEPPEL, 2008; p. 22)10.
Apesar das armadilhas reducionistas da imagem, a ideia de uma organização
funcional da atividade cognitiva parece ter uma fundamentação genuína. Analogamente à
especificação funcional dos diferentes órgãos do corpo, a ideia de que o cérebro é
organizado em subpartes especializadas em diferentes funções pode ser um passo
importante (MARANTZ ET AL., 2000), ainda que incompleto. Essa noção se justifica,
por um lado, pelas pistas empíricas provenientes do estudo de lesões (BROCA, 1861;
WERNICKE, 1864; DAMASIO, 1994). Por outro, estudos sobre sistemas perceptuais têm
9 It is fair to say that in the current research climate, a research project on cognitive psychology is judged to be more fundable – or more likely to be on the right track – when the cognitive psychological experiments are combined with (and therefore ‘verified’ by) imagined data. 10 The fact of the matter is that there can be no objective image of the mind at work. Rather, every image reflects a range of theoretical predispositions, technical contingencies, experimental accidents, and observer presuppositions. […] Image generates data, no more less, and data are usable and useful insofar as they have an interpretation in the context of a theory about how the mind is organized. (POEPPEL, 2008; p. 22)
20
revelado a eficiência da organologia como importante paradigma empírico. O mapeamento
do sistema visual revelou que conjuntos de neurônios desempenham funções específicas e
que a informação visual é ainda processada de maneira hierárquica (HUBEL, 1995).
Resultados análogos para o sistema auditivo também revelam uma organização topográfica
que parece ser crucial para a computação da representação sonora. Sendo assim, é
justificável pensar que, guardadas as proporções, a localização de funções como parte de
um princípio explicativo possa ser aplicada também às representações cognitivas,
incluindo a linguagem. A associação, porém, não é óbvia e configura uma questão que
deve ser formulada em um contexto teoricamente motivado (POEPPEL, 2012). Se existem
propriedades de circuitos neuronais relacionadas à realização de funções cognitivas
específicas, um desafio para caracterizar essa relação é determinar qual o nível de análise
mais adequado.
A pesquisa sobre as bases neurofisiológicas da linguagem tem adotado essa postura
de procurar topografias funcionais, mas as conexões propostas foram feitas inicialmente
em um nível de análise pouco granularizado. Mesmo em estudos de maior resolução
técnica, os resultados tendem sempre a ser da ordem de uma correlação, não havendo uma
proposta explicativa sobre como o substrato neuronal dá conta das atividades cognitivas.
Poeppel e Embick refletem:
Apesar de esses insights serem certamente interessantes, relevantes clinicamente, e receberem considerável atenção popular, existem claras limitações nessa metodologia. […] Ainda que esse tipo de pesquisa ofereça dados correlacionais importantes, aprende-se pouco sobre a linguagem e sobre o cérebro em um nível explicativo profundo. (POEPPEL & EMBICK, 2005; p. 6)11
11 While such insights are certainly scientifically interesting, clinically relevant, and receive considerable popular attention, there are clear limitations to this methodology […]. Althought this type of research provides the field with important correlative datapoints, one learns little of explanatory depth about language and little about the brain.
21
Pesquisas recentes têm apresentado avanços em determinar a organização
anatômica cortical, reiterando que o modelo clássico não dá conta da complexidade
citoarquitetônica das regiões. A região de Broca, por exemplo, já sofreu uma divisão logo
no início do século XX, devido à descrição citoarquitetônica proposta por Korbian
Brodmann. Mais recentemente, essa área sofreu ainda outras subdivisões, com o avanço
de técnicas neuroanatômicas. Amunts et al. (2010) propõem uma subdivisão da área de
Broca em cerca de dez áreas diferentes em termos de suas propriedades celulares (Figura
5). Se cada uma dessas regiões for responsável por uma computação, isso já apontaria a
necessidade de um nível de representação mais acurado para abordar a linguagem no
cérebro.
Figura 5: Broca (AMUNTS ET AL., 2010)
Além do parcelamento anatômico da área cortical da linguagem, tem sido possível
identificar conexões estruturais entre regiões do cérebro humano in vivo, para além do
fascículo arqueado definido no século XX. Hickok & Poeppel (2007) propõem um modelo
de processamento da fala que estipula um caminho ventral – para o mapeamento entre
som e significado – e uma rota dorsal implicada em integração audiomotora.
Como se pode observar nas informações apresentadas acima – com relação à
anatomia e à conectividade estrutural –, os últimos anos têm testemunhado avanços
Now, it is extremely likely that each subregionperforms at least one different local compu-tation—after all, they are anatomically distinct.And it is worth remembering that we have noteven scratched the surface of possible laminardifferences within and across these cortical fields.(Recall that cortex is a sheet of layers, each ofwhich is distinct in terms of cell types, receptordistribution, inputs and outputs, etc. We knowfrom the study of other regions, using animalmodels, that there are intricate feedforward andfeedback projection schemes, canonical corticalcircuits (Douglas & Martin, 1991), and a richinfrastructure mediating locally distinct organiz-ation.) Suppose then, for the sake of argument,that there are merely five anatomic subdomainsin Broca’s region, and suppose that each anatomicsubdomain supports two types of operation. Theseare rather conservative numbers, but we must thenstill identify 10 types of computation. (This islikely to underestimate vastly the actual complex-ity.) Some of the computations will be applicableto any input data structure (structured linguisticrepresentation, speech signal, or other), since it iswell established that Broca’s region is engaged bynumerous cognitive tasks (Embick & Poeppel,2006). Other computations may be dedicated to
data structures native to the linguistic cognitivesystem. We know next to nothing about preciselywhat kind of conditions need to be met to be pro-cessed by Broca’s region, and in particular by oneof the many areas that constitute this part of theinferior frontal cortex.
So how to proceed? If other examples from thecentral nervous system can serve as a guide (say theretina with its many cell types and associated func-tions, or primary visual cortex with its ocular dom-inance columns and orientation pinwheels),Broca’s region is likely either (i) to support anumber of different types of operations/compu-tations, or (ii) to support similar operations onvery different input data structures to yield differ-ent outputs. In either case, it is our job to acquireand describe data at a much higher resolution thanhas been customary to do justice to the knownorganizational complexity, at least at the level ofknown anatomic distinctions as shown byAmunts et al. (2010). (Imagine, for comparison,studying visual perception without acknowledgingthe role primary visual cortex plays in eye-specificand orientation-selective processing; it would bebizarre.) How can this be achieved? In the nextdecades, we will presumably have access to newtechniques with higher spatial resolving power.
Figure 1. The organization of Broca’s region (Amunts et al., 2010). Reproduced with permission. To view a colour version of this figure,please see the online issue of the Journal.
COGNITIVE NEUROPSYCHOLOGY, 2012, 29 (1–2) 39
MAPS PROBLEM AND MAPPING PROBLEM
Dow
nloa
ded
by [N
ew Y
ork
Uni
vers
ity] a
t 06:
59 2
8 N
ovem
ber 2
012
22
tecnológicos notáveis e um impulso motivador para se obter cada vez mais dados. Isso tem
permitido vislumbrar, para um futuro próximo, uma caracterização detalhada da anatomia
cerebral e de seus circuitos de conexão. No entanto, parece pouco provável que apenas a
cartografia cerebral, por mais detalhada, seja capaz de dar conta de explicar o
funcionamento da linguagem.
Adotando uma perspectiva mecanística do cérebro, Poeppel (2012) sugere que o
que falta para se obter uma adequação explicativa é uma análise funcional da atividade
cognitiva. Ou seja, é necessário que se decomponha essa atividade cognitiva – a
linguagem, por exemplo – em suas computações básicas. O desafio é ambivalente,
apresentando um caráter prático e um caráter teórico. Poeppel (2012) caracteriza essas
duas abordagens para a questão como um problema cartográfico (maps problem), por um
lado, e um problema de alinhamento (mapping problem), por outro. O primeiro diz
respeito à possibilidade de a informação espacial ser capaz de fornecer descrições das
bases neurofisiológicas de cognições, a exemplo do que pôde ser feito de maneira
satisfatória para os sistemas perceptuais. Ou seja, esse problema representa o desafio de
relacionar descrição estrutural com análise funcional, o que, na prática, depende de uma
correta determinacão de qual deve ser o melhor nível de decomposição dessas funções,
levando em consideração a configuração anatômica. O segundo problema se traduz na
dificuldade de se estabelecer uma hipótese de alinhamento isomórfico entre a linguagem e
o cérebro. Cientistas cognitivos (incluindo linguistas que adotam uma perspectiva
biolinguística) têm como objetivo determinar o inventário de partículas elementares da
mente e as operações de interação entre essas partículas. Por outro lado, neurocientistas
procuram determinar a infraestrutura do sistema nervoso, desde componentes subcelulares
até sistemas de maior escala. Por exemplo, um nível analítico pertinente para o
funcionamento da linguagem destacaria morfemas, sintagmas, traços distintivos etc., como
23
elementos fundamentais de representação, e concatenação, linearização, composição
semântica etc., como operações fundamentais. Por outro lado, a neurociência destacaria
neurônios, dendritos etc., como primitivos de representação, e oscilação, sincronização
etc., como operações básicas para interação entre esses primitivos (POEPPEL & EMBICK,
2005). Estabelecer um alinhamento possível dependeria de uma reformulação estrutural
dos primitivos estabelecidos para cada área.
Poeppel e Embick (2005) elaboraram o desafio da aproximação entre linguística e
neurociência identificando dois problemas fundamentais: o problema da incompatibilidade
granular (Granularity Mismatch Problem – GMP) e o problema da incomensurabilidade
ontológica (Ontological Incommensurability Problem – OIP). O primeiro problema diz
respeito à incompatibilidade entre o nível de análise da linguagem, de acordo com os
diferentes domínios do conhecimento. Por exemplo, ao estudar a linguagem, a
neurociência tende a estabelecer categorias muito amplas – como sintaxe, fonologia,
semântica – e procura correlacionar essas categorias com áreas específicas do cérebro. A
Linguística, por sua vez, lida com um inventário de primitivos cujos traços distintivos e
conceituais são mais granularizados. A falta de uma aproximação entre essas áreas
dificulta o entendimento da organização da linguagem em termos de estrutura e função
cerebrais, uma vez que os diferentes níves de representação concebidos pela Neurociência
e pela Linguística não permitem uma coordenação profícua entre a natureza das questões
investigadas. A solução para esse problema pode ser vislumbrada por meio de uma
mudança pragmática, de modo que Linguística e Neurociência possam olhar para a
linguagem em termos do mesmo nível de representação. O GMP se relaciona, portanto,
com o modo como dois domínios diferentes do conhecimento segmentam o objeto de
estudo – no caso, a Linguagem – em representações relevantes para sua a manipulação. O
Problema da Incomensurabilidade Ontológica é mais conceitual e diz respeito à
24
impossibilidade de se estabelecer uma correlação entre os primitivos dos fenômenos
cognitivos – entre eles, os da linguagem – e os primitivos neurobiológicos que funcionam
como infraestrutura para esses fenômenos cognitivos. Da forma como os primitivos da
linguagem e da neurobiologia são hoje concebidos, não é possível estabelecer
isomorfismos plausíveis.
Também não é claro se esses isomorfismos poderão ser eventualmente executados.
Se considerarmos, a exemplo de Chomsky, que existem problemas e mistérios com relação
ao entendimento da linguagem (CHOMSKY, 1991b), a unificação isomórfica entre
linguística e neurobiologia deve estar ainda na categoria de mistério. Como ele reconhece,
“a história da ciência moderna nos ensina lições que não podem ser ignoradas”
(CHOMSKY, 2000). Para que essa unificação fosse concebível, a lista de primitivos da
neurobiologia como é estabelecida hoje precisaria ser reformulada para acomodar
demandas dos sistemas cognitivos – como aconteceu com a Física para se ajustar às teorias
formuladas pela Química.
Ainda que uma unificação isomórfica não seja possível – a linguagem e o cérebro
são domínios que envolvem sistemas de maior complexidade –, uma aproximação entre a
neurociência da linguagem e a pesquisa linguística pode ser vantajosa para as duas áreas
do conhecimento. De uma forma ou de outra, deve-se considerar a relação entre os dois
domínios como uma via de mão dupla (CHOMSKY, 2000). Sendo assim, não se trata do
uso de dados neurofisiológicos para “validar cientificamente” conceitos e categorias
formuladas pela pesquisa linguística. Trata-se de usar categorias linguisticamente
motivadas para investigar como essas categorias abstratas são implementadas na matéria
cerebral, em uma proposta integrada de investigação (POEPPEL & EMBICK, 2005).
Sendo assim, descobertas a respeito da neuroanatomia representarão restrições à
implementação de certas computações cognitivas, da mesma forma que descobertas sobre
25
computações cognitivas devem estabelecer condições a serem implementadas em termos
celulares.
Como o conjunto de primitivos linguísticos não pode ser associado diretamente
com primitivos neurobiológicos (e.g., um dendrito não pode ser associado a um morfema),
a estratégia mais viável de aproximação deve ser 1) determinar computações linguísticas
consideradas básicas – possivelmente incontroversas – e 2) procurar circuitos
neuroanatômicos que sejam capazes de executar essas operações (POEPPEL, 2012).
Assim, o que estaria em questão não seriam propriamente as unidades mínimas da
neurobiologia, mas sim se a combinação dessas unidades, da forma como ela tem sido hoje
concebida, seria funcionalmente apropriada para dar conta da explicação do fenômeno
cognitivo.
Nesse processo, é natural que falsas predições e erros de categoria devam ocorrer.
No entanto, as hipóteses representacionais e computacionais já bem desenvolvidas da
teoria linguística não devem ser desprezadas para se investigar como representações
simbólicas são armazenadas e geradas no cérebro (MARANTZ, 2005). A Gramática
Gerativa – representada em uma de suas formas mais econômicas pelo Programa
Minimalista (CHOMSKY, 1995) – já constitui um modelo cognitivo de linguagem
essencialmente integrável à Neurociência.
2.2. Um modelo computacional para a linguagem
Sendo a linguagem humana um sistema que possui a característica da infinitude
discreta, é possível pensar que ela tenha propriedades computacionais capazes de gerar, a
partir do seu inventário finito de representações, sentenças infinitas. Além disso, se
considerarmos a linguagem como um subsistema cerebral, esse mecanismo computacional
deve ser de alguma forma implementado no nível celular.
26
Gallistel e King (2010) sugerem que todos os animais sejam dotados de uma
capacidade de aprendizado – órgãos de aprendizado –, que podem ser considerados como
órgãos dentro do cérebro. A estrutura desses órgãos permitiria a realização de algumas
computações específicas. Considerando uma perspectiva gerativa, a linguagem pode ser
entendida como um tipo de mecanismo de aprendizado específico do ser humano. Segundo
Chomsky, a aquisição (ontogênese) da linguagem dependeria da ação combinada de três
fatores: 1) um estado inicial geneticamente especificado, analogamente ao estado inicial da
visão; 2) dados provenientes do ambiente; e 3) alguns princípios gerais, como minimização
da complexidade computacional (BERWICK ET AL., 2013; CHOMSKY, 2004). O estado
inicial pode ser pensado como um dispositivo que traduz os dados da experiência para o
estado final, que é a língua adquirida.
Basicamente, a linguagem é um sistema computacional simbólico que associa
forma e sentido e que é interno à mente do falante. Tendo em vista a sua propriedade
criativa, esse sistema deve ser minimamente capaz de concatenar representações
linguísticas, gerando objetos maiores. Ou seja, esse sistema deve incluir uma operação que
construa novos elementos representacionais Z a partir de elementos já construídos X,Y
(BERWICK ET AL., 2013). O sistema computacional da linguagem pode ser representado
pela estrutura abaixo (Figura 6):
Figura 6: Estrutura básica do sistema computacional da linguagem.
27
Cada expressão resultante desse processo de concatenação deve ter uma
interpretação em duas interfaces, através das quais as expressões mentais se conectam com
o mundo exterior (sensório-motora) e com os conceitos e intenções internos ao organismo
(conceptual-intencional). O estudo das bases neurofisiológicas da linguagem deve
considerar funções cerebrais que representem tanto o sistema combinatório central quanto
os sistemas de interface. Por exemplo, o processo de linearização é um tipo de imposição
sobre o sistema sensório-motor. O resultado da operação de concatenação é uma
combinação não ordenada. No entanto, como as palavras precisam ser pronunciadas (e
ouvidas) sequencialmente no tempo, é necessário que exista uma operação responsável
pelo mapeamento entre a representação linguística interna de uma expressão e sua
externalização ordenada. Além disso, ainda que qualquer objeto sintático arbitrário possa
ser concatenado com outro, gerando uma estrutura mais complexa, o resultado dessa
concatenação pode não ser interpretável na interface conceptual. O licenciamento dessas
expressões deve estar relacionado com o algoritmo de rotulação (labeling algorithm – cf.
CHOMSKY, 2013). Essas são computações que devem ser instanciadas por estruturas
corticais diferenciadas e que, de certa forma, estão relacionadas com o que estudos
tradicionais de neurociência tendem a achatar sob o rótulo de sintaxe (ou semântica).
Diferente de sistemas puramente perceptuais como a visão, a linguagem possui
uma instância de percepção e uma de produção. No entanto, dado o seu caráter gerativo,
não deve haver um sistema combinatório exclusivo para produzir expressões linguísticas e
outro exclusivo para compreendê-las. Sendo assim, a construção da representação sonora
de uma expressão deve fornecer também sua representação conceitual. Da mesma forma, a
construção de uma representação conceitual deve fornecer informações que permitam sua
pronúncia (MARANTZ ET AL., 2000).
Uma questão que emerge quando se procura investigar a linguagem em termos de
28
sua implementação cerebral concerne à especificidade linguística dos mecanismos
recrutados. Muitos dos estudos atuais em pesquisa linguística têm se preocupado com as
interfaces sintaxe-semântica e sintaxe-fonologia. Como esses estudos se ocupam da
interação entre o sistema linguístico e outros sistemas, extralinguísticos, eles fornecem
uma base importante para o estudo da linguagem no cérebro. O sistema combinatório
central (operações sintáticas) deve ser implementado em algum circuito de atividade
cortical que seja especificamente humano, ao passo que os sistemas de interface devem
utilizar áreas comuns a seres humanos e animais. Sendo assim, os estudo das interfaces
pode representar um campo importante de investigação para pesquisas filogenéticas
comparativas. Resultados recentes – provenientes de estudos entre espécies sobre o
aprendizado de gramáticas artificiais – têm mostrado distinções interessantes entre
estruturas que devem ser características da linguagem natural e outras estruturas,
envolvidas em outros processos cognitivos (FRIEDERICI, 2011; BERWICK ET AL.,
2013).
Levando em consideração esses fatores, é possível inferir que a pesquisa linguística
fornece explicações sobre o funcionamento da linguagem que podem ser usadas como um
guia teórico sobre como a linguagem é implementada no cérebro. “Como uma primeira
hipótese sobre o alinhamento entre mente e cérebro em termos de linguagem, não existem
razões para não supor que cada operação mental postulada pela teoria linguística
corresponda a computações executadas no cérebro.”12 (MARANTZ ET AL., 2000, p. 5)
Muitos dos fenômenos que são centrais para nós enquanto seres humanos – os mistérios da vida e da evolução, da percepção, dos sentimentos e do
12 As a first hypothesis about the way that mind maps onto brain, we have no reason not to suppose that each mental operation implied by linguistic theory corresponds to a computation carried out by the brain. (MARANTZ ET AL., 2000, p. 5)
29
pensamento – são fenômenos de processamento da informação, e se quisermos entender esses fenômenos de maneira exaustiva, nosso pensamento sobre eles deve incluir essa perspectiva.13 (MARR, 1982; p. 4)
Nesse sentido, se levarmos em consideração que o cérebro deve ser, entre outras
coisas, um dispositivo computacional que combina e transforma informação, a estratégia
de pesquisa proposta por Marr (1982) para a visão deve representar um meio pelo qual se
possa estabelecer uma aproximação entre pesquisa linguística e neurociência da
linguagem.
Se alguém espera atingir um entendimento completo sobre um sistema tão complicado quanto um sistema nervoso – ou um embrião em desenvolvimento, um conjunto de fluxos metabólicos, uma garrafa de gás, ou mesmo um programa de computador –, então esse alguém precisa estar preparado para contemplar diferentes tipos de explicação em diferentes níveis de descrição, que se correlacionam, ao menos em princípio, em um todo coeso, mesmo que uma correlação em todos os níveis seja impraticável. (MARR, 1982; p.20)14
De acordo com Marr (1982), existem diferentes níveis em que se pode entender um
processo de transformação da informação. O autor explica os diferentes níveis de um
processo utilizando o exemplo da adição realizada em um caixa de supermercado. Nível
da teoria computacional: O nível mais abstrato em que se pode pensar esse processo é o
que determina o que é esse processo e por que ele deve ser realizado. No caso da adição,
trata-se de um processo para transformar uma sequência de números em um único número.
Por exemplo, “+ transforma o par (3,4) em 7” (MARR, 1982; p 22). Existem algumas
propriedades que caracterizam a teoria geral da adição, como a comutatividade e a 13 Most of the phenomena that are central to us as human beings—the mysteries of life and evolution, of perception and feeling and thought—are primarily phenomena of information processing, and if we are ever to understand them fully, our thinking about them must include this perspective. (MARR, 1982; p. 4) 14 “If one hopes to achieve a full understanding of a system as complicated as a nervous system, a developing embryo, a set of metabolic pathways, a bottle of gas, or even a large computer program, then one must be prepared to contemplate different kinds of explanation at different levels of descripton that are linked, at least in principle, into a cohesive whole, even if linking the levels in complete detail is impractical.” (MARR, 1982: p. 20)
30
associatividade (cf. MARR, 1982 para uma explicação mais detalhada). O por quê de se
escolher esse processo para o uso em um caixa de supermercado se determina pela
adequação das propriedades desse processo para resolver o problema em questão – no
caso, combinar os preços individuais dos produtos adquiridos no supermercado. Esses
argumentos configuram o que Marr chama de “a teoria computacional da caixa
registradora”.
Nível representacional e algorítmico: Para que esse processo funcione, no entanto,
é necessário que se estabeleçam 1) as representações que serão manipuladas e 2) o
algoritmo através do qual a transformação deve ocorrer. No caso da adição no caixa, as
representações podem ser algarismos indo-arábicos e, sendo assim, o algoritmo utilizado
pode ser aquele usual de somar primeiro os algarismos na casa das unidades até 9 e levar o
dígito restante para a próxima casa, a das dezenas, e assim por diante. Estabelecer esses
fatores configura o segundo nível de análise de um processo. Eles representam como esse
processo deve ser conduzido computacionalmente. Aqui, o autor enfatiza três pontos
importantes: 1) Existe uma gama extensa de opções de representações para a realização de
um processo; 2) a escolha do algoritmo está intimamente ligada com a escolha das
representações (por exemplo, a escolha de números binários em vez de números reais
mudaria o algoritmo de realização da soma); 3) mesmo para uma certa representação fixa,
podem existir diferentes algoritmos para a realização do processo transformacional. Um
dos fatores que pode condicionar a escolha é o dispositivo físico em que esse algoritmo vai
ser implementado, o que nos leva ao terceiro nível de análise. Nível implementacional:
Esse nível deve considerar onde o processo será realizado fisicamente. Novamente, alguns
tipos de algoritmo devem ser mais adequados ao substrato em que a operação será
executada. De acordo com Marr,
31
cada um dos três níveis de análise terá seu espaço no eventual entendimento do processamento da informação perceptual e, é claro, eles estão relacionados de maneira lógica e causal. Mas um importante ponto a ser destacado é que, como esses três níveis estão apenas folgadamente associados, alguns fenômenos podem ser explicados apenas em um ou dois desses níveis.15 (MARR, 1982; p. 25)
O autor acrescenta que, ainda que o nível algorítmico e o nível implementacional
sejam mais acessíveis empiricamente, o nível da teoria computacional deve ser o mais
importante do ponto de vista do processamento da informação. A importância desse nível
se justifica pelo fato de ele se relacionar mais com a natureza das computações que
caracterizam o processo investigado, o que é mais difícil conceber a partir do exame
analítico do dispositivo em que essas computações são implementadas.
Pensando isso em termos de como a linguagem é implementada no cérebro, é mais
difícil que se obtenha um nível de adequação explicativa a respeito da linguagem apenas
estudando analiticamente o cérebro, não existindo uma teoria computacional para guiar
essa investigação. É a teoria computacional, portanto, que define o problema a ser
resolvido, ou a transformação a ser executada, na tarefa de processamento da informação.
Adaptando as palavras de Marr para o contexto da neurobiologia da linguagem, a ideia se
resumiria da seguinte forma: para entendermos o cérebro, precisamos estudar o cérebro;
para entendermos a linguagem, precisamos estudar a linguagem; para entendermos como
uma tarefa linguística é executada no cérebro, precisamos estudar a linguagem e o cérebro.
Isolado, nenhum dos dois será suficiente.
Nesse sentido, esse nível intermediário é fundamental para que sejam especificadas
as representações e os algoritmos que serão executados pelos circuitos implementacionais. 15 Each of the three levels of description will have its place in the eventual understanding of perceptual information processing, and of course they are logically and causally related. But an important point to note is that since the three levels are only rather loosely related, some phenomena may be explained at only one or two of them. (MARR, 1982; p. 25)
32
Assim, esse domínio intermediário contribuirá com um aumento da especificidade das
representações e operações relacionadas às funções linguísticas, levando em consideração
as restrições impostas pelo substrato neuroanatômico. Poeppel (2012) afirma que, se essa
estratégia estiver no caminho certo, pode-se começar tomando como elementares aquelas
computações já menos controversas propostas pelos modelos cognitivos de linguagem.
Tomando essas computações como fundamentais, a pesquisa neurofisiológica deve
procurar circuitos neuronais envolvidos na sua execução. Algumas operações que devem
servir de base para investigação são, por exemplo, concatenação, decomposição,
linearização, rotulação, e outras operações que possam ser implementadas de maneira
relativamente direta em circuitos neuronais (POEPPEL, 2012).
Resumindo, o objetivo dessa estratégia de pesquisa seria buscar um nível
explicativo sobre como a atividade cerebral desempenha funções cognitivas, em uma
perspectiva de levar o entendimento dessa relação para além de uma abordagem apenas
correlacional. Isso dependeria da possibilidade de conceber um nível de granularidade que
seja adequado a essa associação, reconhecendo tanto as restrições do substrato físico
quanto as demandas computacionais do processo cognitivo. Nesse espírito, a observação
simples de que uma certa função está localizada em uma área específica tem pouco a
contribuir com esse propósito explicativo. A mera localização da atividade cognitiva não
diz muita coisa sobre como essa atividade é executada, uma vez que não tornam explícitas
as representações e as computações recrutadas no processo de transformação da
informação.
Sendo assim, a proposta de estudar um nível algorítmico de análise tem como
objetivo exatamente tornar evidentes essas operações envolvidas na função cognitiva. Em
vez de estabelecer correlações entre áreas e funções, a proposta é promover uma
codificação espacial da tarefa cognitiva, que possibilite seu entendimento.
33
2.3. Breve introdução à técnica da Magnetoencefalografia
Atentando para as considerações apontadas acima, o experimento realizado para
esta tese – e reportado no Capítulo 5 – teve como objetivo contribuir com o trabalho de
caracterizar a atividade neuronal associada à composicionalidade semântica. Procuramos
encontrar efeitos da atividade combinatória em um contexto tão básico quanto a
concatenação de dois morfemas lexicais que formam uma palavra composta, em uma
perspectiva de análise mais granularizada dos processos cognitivos que constituem a
linguagem. Para tal fim, utilizamos a técnica de magnetoencefalo-grafia (MEG), cujas
características principais são destacadas a seguir.
Figura 7: Figura esquemática de uma parte do córtex. Os dois cilindros indicam a relação entre a corrente intracelular e os campos magnéticos resultantes. As fontes na parte superior do giro resultam em campos não detectáveis pelo MEG, porque são paralelos ao escalpo. Fontes na fissura resultam em campos tangenciais, detectáveis. À direita, o padrão do campo magnético. A parte hachurada representa o fluxo magnético saindo da cabeça. (LOPES DA SILVA, 2010)
MEG é uma técnica de neuroimagem que funciona captando os campos magnéticos
produzidos por uma corrente elétrica no córtex (Figura 7). Os sinais magnéticos emergem
6 MEG: An Introduction to Methods
that the total current density fi eld tJ consists of J!
i and a passive part (second-
ary current) that obeys Ohm’s law:
t iJ J E= +!!
s (1–1)
where ! is the medium conductivity and E"!
is the electric fi eld. Considering that the div tJ must be zero, since there is no accumulation
of charge anywhere in the medium, we may note that
div divIJ E= """! "!
s (1–2)
BB
A
Qr Qd
BB
Qd
Qr
0
I
0 0
0
Radial and Tangential sources
VI
Direction ofDirection ofpropagationpropagationDirection ofpropagation
Dire
ctio
n of
prop
agat
ion
Figure 1–3 . Schematic drawing of a piece of cortex showing the crown of a gyrus and a sulcus. Two cylinders are drawn to indicate the relation between the direction of the intracellular current and the resulting mag-netic fi elds around the apical dendrite. Sources at the top of a gyrus cause radial fi elds that are not detectable by MEG. Sources in the fi ssures cause tangential fi elds that can be detected at the MEG.
MEG
EEGEEGMEGMEG
Main advantage over EEG: better spatial resolution (millimeters forcortex, worse for deeper sources)
Magnetic fields pass through skull and various tissues undistorted.
Distribution of the magnetic field around the head tells you a lotabout the underlying current generators.
34
ortogonalmente em relação à corrente, de modo que uma corrente radial em relação ao
escalpo não é captada. Ainda, para que algum sinal seja captado, é preciso a transmissão
conjunta de centenas de milhares de neurônios (RODDEN & STEMMER, 2008). Como
os sinais biomagnéticos são muito fracos (cerca de um bilhão de vezes mais fracos que o
campo magnético estático da Terra), é necessário que a medição, por um lado, seja
suficientemente sensível e, por outro, compense o ruído do ambiente.
O ruído gerado por aparelhos elétricos e objetos magnéticos – facilmente
encontrados no ambiente de um laboratório – já é cerca de mil vezes mais forte que
qualquer sinal magnético resultante da atividade neuronal (PARKKONEN, 2010). Para
dar conta do desafio de tornar possível a medida dessas ondas eletromagnéticas, são usados
detectores altamente sensíveis (Superconducting Quantum Interference Device - SQUID).
Além disso, é imprescindível que as medidas sejam feitas em um ambiente
magneticamente isolado. Outro procedimento é ainda utilizar canais de referência,
localizados próximos à cabeça, mas distantes o suficiente para não detectarem atividade
cerebral. O sinal captado por esses canais de referência vai sendo subtraído dos dados
brutos durante a aquisição.
As ondas eletromagnéticas não sofrem perturbação física ao atravessar os tecidos
entre a fonte da atividade e os detectores. Como o sinal não é distorcido, a localização
estimada da fonte é bastante precisa. A técnica de MEG oferece ainda uma excelente
resolução temporal, na ordem de milissegundos, o que é extremamente importante para
estudos sobre a linguagem. Considerar a dimensão temporal na atividade cerebral é
decisivo para caracterizar a dinâmica do processo cognitivo. Por essas razões, e por se
tratar ainda de um método não-invasivo, o MEG tem se destacado como um recurso
idealmente apropriado para analisar modelos de processamento.
35
No entanto, a magnetoencefalografia não está ainda disponível no Brasil para a
realização de pesquisa em neurociência da linguagem. O estudo realizado para esta tese
foi feito no Laboratório de Neurolinguística da Universidade de Nova York (NYU
Neurolinguistics Lab), durante um estágio de Doutorado com apoio oferecido pela
CAPES/Comissão Fulbright-Brasil, sob a supervisão de Liina Pylkkänen. Esta é, portanto,
a primeira tese de Doutorado no Brasil utilizando essa técnica para investigação de
computações linguísticas.
36
_____________________________________________ três
Mapeando os estágios do reconhecimento visual de palavras complexas – decomposição e recomposição
3.1. Composicionalidade intralexical
Examinar o papel das representações lexicais e os mecanismos utilizados para
gerar, criativamente, estruturas complexas a partir dessas representações é uma questão
crucial para o entendimento da arquitetura da linguagem. Essa questão pode ser formulada
em diferentes níveis.
No escopo da teoria da Gramática Gerativa, ela se traduz primeiro em definir quais
são os átomos memorizados que entram na numeração para então serem operados pela
sintaxe. Para suas vertentes lexicalistas – que incluem a versão mais recente da Gramática
Gerativa, o Minimalismo (CHOMSKY, 1995) –, as palavras estão armazenadas em sua
forma plena no léxico e a computação se dá, portanto, no nível supralexical.
Há, por outro lado, propostas não-lexicalistas, que argumentam que a noção
intuitiva de palavra não corresponde necessariamente às unidades mentais das operações
linguísticas, uma vez que não parece se justificar um domínio especial de associação entre
som e sentido no nível lexical (MARANTZ, 1997a; 1997b). A proposta não-lexicalista da
Morfologia Distribuída (HALLE & MARANTZ, 1993; BORER, 2000; HARLEY &
NOYER, 1998a; 1998b) prevê que a computação ocorra em múltiplas fases, distribuída em
diferentes camadas funcionais. A sintaxe operaria, portanto, também no interior da
palavra, fazendo a concatenação entre raiz e morfemas categorizadores. Outra questão
relevante para a Linguística é entender o tipo de informação já presente nessas partículas
estocadas, como, por exemplo, estrutura argumental e informação categorial.
37
Para a Psicolinguística, mapear os processos morfossintáticos e semânticos dentro
da palavra não é uma tarefa simples. Nesse nível, para além dos mecanismos pertencentes
à gramática – ou seja, ao sistema da linguagem em sentido estrito –, devem-se ainda levar
em consideração etapas perceptuais envolvidas na seleção das representações linguísticas.
Nos últimos quarenta anos, muitos estudos têm procurado caracterizar os constituintes
mínimos da representação e do processamento lexical, tendo focado inicialmente na
questão de se as palavras complexas são decompostas.
No quadro a seguir (Figura 8), estão elencados diferentes tipos de palavras, que
constituem uma taxonomia tentativa da composicionalidade intralexical.
Figura 8: Exemplos de composicionalidade (transparentes e opacas) e não-composicionalidade (ortográficas) em palavras derivadas e compostas.
Os tipos de palavras derivadas, na Figura 8, foram retirados de artigos clássicos de
Psicolinguística sobre o processamento de palavras (inclusive os exemplos). Os tipos de
palavras compostas foram elaborados de modo a construir uma lista equivalente à das
palavras derivadas (alguns exemplos são retirados de experimentos com palavras
compostas, também na literatura de processamento de palavras).
A decomponibilidade morfêmica no processamento de palavras foi exaustivamente
investigada, utilizando-se diferentes metodologias – priming, decisão lexical, rastreamento
38
ocular – e dividiu a área entre os que defendem modelos decomposicionais e os que
defendem modelos não-decomposicionais (cf. revisão mais extensa em GARCIA, 2009).
Os modelos decomposicionais defendem que a palavra deve ser armazenada e acessada por
meio de seus constituintes mínimos, os morfemas (TAFT & FORSTER, 1975;
STOCKALL & MARANTZ, 2006). Por outro lado, modelos não-decomposicionais
argumentam que a palavra esteja representada e seja acessada inteira (BUTTERWORTH,
1983; SEIDENBERG & GONNERMAN, 2000).
Os modelos decomposicionais podem ser divididos entre modelos de decomposição
inicial e modelos de decomposição tardia. Estes postulam que a decomposição de palavras
em seus constituintes pode ocorrer após o acesso lexical à palavra inteira (GIRAUDO &
GRAINER, 2000; MARINKOVIC, 2004). Aqueles, por outro lado, defendem que os
morfemas são acessados automaticamente logo no início do processamento da palavra
complexa. Há, ainda, dentro dos modelos de decomposição inicial, os que preveem 1) que
o reconhecimento da palavra se dê por um mecanismo de dupla rota (MARSLEN-
WILSON ET AL., 1994; SHREUDER & BAAYEN, 1995; CARAMAZZA ET AL., 1998;
PINKER, 2000; HAY & BAAYEN, 2005), e 2) que o reconhecimento da palavra se dê por
decomposição plena (full parsing – TAFT, 2004; STOCKALL & MARANTZ, 2006).
Para os modelos não-decomposicionais, a relação entre palavras se daria por
conexões que levam em consideração fonologia e semântica. Sendo assim, efeitos
observados entre palavras complexas e seus constituintes – por exemplo, priming entre
palavras relacionadas – são explicados em termos da coincidência de traços fonológicos e
de sentido. Como esses efeitos podem ser justificados apenas por similaridade, esses
modelos não acham que deva existir um nível morfológico de representação. De fato, em
experimentos de priming não encoberto, palavras semanticamente opacas não obtém
39
facilitação. No entanto, o fato de que não são encontrados efeitos nesse tipo de tarefa não
quer dizer que esses efeitos não existam.
A abordagem não-decomposicional vem sendo desafiada por resultados recentes
utilizando a técnica de priming encoberto (FORSTER, 1998). Nessa técnica, o prime é
apresentado muito rapidamente, de modo que não seja conscientemente percebido. Sendo
assim, a visualização é suficiente para ativar etapas iniciais do reconhecimento lexical, e
essa ativação afeta o reconhecimento da palavra alvo. Esses estudos têm encontrado efeito
diferenciado para palavras morfologicamente relacionadas, que não pode ser atribuído
apenas à semelhança ortográfica e semântica (LONGTIN ET AL., 2003; RASTLE ET
AL., 2004; GARCIA, 2009). Surpreendentemente, efeitos ortográficos não são sequer
detectados nesse tipo de tarefa (LONGTIN ET AL., 2003; GARCIA, 2009). Outra
observação crucial em relação a esses estudos é que o efeito se estende para palavras
semanticamente opacas, ou seja, palavras em que o sentido do todo não pode ser
interpretado a partir do significado dos seus constituintes. Esse achado aponta a existência
de uma fase no reconhecimento da palavra em que os constituintes são acionados levando-
se em consideração características morfo-ortográficas (RASTLE ET AL., 2004), antes do
pareamento semântico.
Palavras como brother, que podem ser “pseudo-segmentadas” em uma raiz e um
sufixo, seriam decompostas tanto quanto palavras como teacher, em que a segmentação é
relevante para o reconhecimento. Porém, ainda que essa decomposição ocorra
independentemente das entradas lexicais, existiria sensibilidade visual para fatores de nível
mais elevado como o reconhecimento de morfemas, de modo que palavras como brothel
não são segmentadas. Nesse caso, ainda que uma “pseudo-raiz” broth- possa ser
reconhecida, o material reminiscente -el não é um sufixo existente na língua. Efeitos desse
tipo se diferenciam do modelo de decomposição plena proposto originalmente por Taft &
40
Forster (1975), o Affix Stripping, para o qual a decomposição da palavra passa
primeiramente por um momento de remoção obrigatória dos afixos, anterior ao acesso
lexical. Essa remoção ocorreria independentemente de o material reminiscente existir ou
não. Para Taft & Forster (1975), portanto, palavras como winter seriam decompostas.
Palavras como brothel, por outro lado, não seriam.
Shoolman & Andrews (2003) e Fiorentino (2006), Fiorentino & Poeppel (2007b)
apresentam resultados análogos aos de Rastle et al. (2004) em palavras compostas, também
utilizando a técnica de priming encoberto. Zwitserlood (2004) encontram ainda efeitos de
decomposição em palavras compostas de holandês, independente da transparência
semântica, utilizando a técnica de priming parcial não encoberto em que a palavra
composta foi usada como prime e o constituinte foi usado como alvo (kerkorgel-orgel –
órgão de igreja-órgão). Analogamente aos estudos com palavras derivadas, não foram
encontrados efeitos para palavras relacionadas apenas ortograficamente.
Alguns dos estudos que manipulam fatores morfológicos no reconhecimento de
palavras indicam que a decomposicionalidade pode ser afetada por fatores semânticos, em
estágios mais posteriores do processamento. Em estudos com priming encoberto,
encontram-se efeitos de decomposição para pares transparentes e opacos, mas, quando a
apresentação do prime é mais longa, esses efeitos são condicionados pela transparência
semântica (RASTLE, 2000; LONGTIN ET AL., 2003). De qualquer forma, levando em
consideração todos esses estudos em conjunto, é possível afirmar, com um alto grau de
acerto, que existe um nível morfêmico de representação no reconhecimento de palavras.
Sendo assim, o debate tem-se configurado mais recentemente em torno do contraste
entre modelos decomposicionais. Basicamente, os modelos de dupla rota consideram que
existe representação tanto no nível da palavra quanto no nível do morfema (HAY &
BAAYEN, 2005). A escolha entre a decomposição ou o acesso direto dependeria de
41
fatores como maior saliência do constituinte ou da palavra inteira, respectivamente. É
verdade que, ainda que medidas off-line, como tempos de resposta, sejam importantes para
fornecer informações sobre o acesso lexical, elas não são sensíveis a valores de frequência
dos constituintes, como, por exemplo, a probabilidade de transição16 (transition probability
– cf. HAY, 2001) entre os morfemas de uma palavra. Essas informações podem ser
determinantes em caracterizar se os efeitos observados de decomposição são provocados
por representações concretas relacionadas apenas a n-gramas ou por representações mais
abstratas que associam a forma visual da palavra a morfemas da língua.
Medidas off-line, por serem obtidas no final do reconhecimento da palavra, tendem
a acumular diferentes computações que podem acontecer em estágios diferentes do acesso
lexical, e ainda incluir processamentos pós-lexicais. Como efeitos de decomposição
podem estar fortemente delimitados no tempo e associados a diferentes computações, o uso
de uma medida mais granularizada se faz necessária para uma melhor caracterização dessa
decomposição.
3.2. Localizando o processamento lexical no tempo (e um pouco no espaço também)
Para uma caracterização de como se dá a implementação da leitura no cérebro, a partir de dados, é essencial que se conheça a localização e o tempo em que ocorre a ativação. 17
(SALMELIN, 2010; p. 347)
O uso da técnica de rastreamento ocular apresenta um ganho importante por
possibilitar que as medidas sejam feitas durante o processo de leitura, podendo ser útil para 16 Probabilidade de transição (TP) corresponde à probabilidade de se encontrar uma palavra inteira, dada sua base (por exemplo, a probabilidade de teacher, dado teach). Essa probabilidade pode ser calculada dividindo-se a frequência superficial (SF) de teacher pela soma de todas as palavras contendo a base teach (lemma frequency – LF). TP=SF/LF. 17 For a data-driven characterization of cerebral implementation of reading, knowledge of both location and timing of the activation is essential. (SALMELIN, 2010; p. 347)
42
caracterizar diferentes estágios do processamento morfológico a partir do movimento dos
olhos. Maia et al. (2007) apresentam resultados associando a técnica de rastreamento
ocular com o efeito Stroop (STROOP, 1935). O estudo revela maior atividade ocular em
condições com morfemas transparentes do que nas com palavras opacas e pseudo-
derivadas, o que os autores interpretaram como indicativo em favor de modelos de dupla
rota. Resultados nessa mesma direção foram encontrados por Andrews et al. (2004) e
Juhasz et al. (2003), que obtiveram efeitos de frequência para primeira fixação (first
fixation) no primeiro constituinte de palavras compostas, e também efeitos na manutenção
da fixação (gaze duration) para os segundos constituintes. Esses estudos também
encontraram efeitos que indicam representação no nível da palavra inteira, tanto em
manutenção da fixação quanto nos tempos totais de leitura. Todos esses resultados indicam
que exista representação no nível sublexical, o que não pode ser explicado por modelos
não-decomposiconais.
Investigações utilizando as técnicas de eletroencefalografia (EEG) e
magnetoencefalografia (MEG) também têm se mostrado convenientes como forma de
mapeamento online das computações envolvidas no processamento lexical. Essas técnicas
têm a vantagem de acompanhar essas computações com uma resolução temporal de
milissegundos. No entanto, para que se possam formular hipóteses testáveis, é necessário
que se tenha uma ideia clara de como componentes relacionados à atividade cerebral
podem estar associados às computações específicas que queremos examinar. Estudos
realizados recentemente com a técnica de magnetoencefalografia têm identificado alguns
componentes na forma da onda obtida ao se medir a atividade eletromagnética associada
ao reconhecimento visual de palavras (TARKIAINEN ET AL., 1999; EMBICK ET AL.,
2001; HALGREN ET AL., 2002; PYLKKÄNEN ET AL., 2002; CORNELISSEN ET AL.,
2003). De acordo com esses trabalhos, a rota para o acesso lexical se daria em pelo menos
43
quatro estágios, durante 400 ms após o início da visualização da palavra. Abaixo
apresentam-se os estágios relacionados à percepção visual em MEG, mas a sequência é
qualitativamente semelhante para estímulos visuais e auditivos (SALMELIN, 2010). Esses
diferentes componentes atuam de forma equivalente aos estágios do reconhecimento visual
postulados por modelos de decomposição inicial. Sendo assim, eles têm se mostrado como
importantes ferramentas para mapear as computações associadas a esses diferentes
estágios, podendo ajudar a resolver, no tempo e no espaço, os dados conflitantes dos
estudos baseados em tempos de resposta.
O primeiro componente, identificado originalmente por Tarkiainen et al. (1999),
ocorre em torno de 100-150 ms após o início da apresentação da palavra e está associado a
características visuais mais concretas, como tamanho e luminância (Type I response). Esse
componente tem origem na região occipital e apresenta sensibilidade para propriedades
ortográficas. Estudos mais recentes realizados por Dikker e Pylkkänen revelam ainda que
pistas sintáticas e léxico-semânticas do estímulo já afetam esse componente (DIKKER &
PYLKKÄNEN, 2011; DIKKER ET AL., 2010).
Após esse estágio, há um momento em que as palavras são decompostas em seus
morfemas constituintes, caracterizada pelo componente M170. Essa decomposição, que é
pré-lexical e tem origem no córtex temporal inferior, ocorre entre 150 e 200 ms e é
sensível a sequências de letras (Type II response TARKIAINEN ET AL., 1999). Estudos
com ressonância magnética funcional (fMRI) localizam uma região no córtex visual que
estaria consistentemente implicada com a identificação de palavras, e que ficou conhecida
como a Área da Forma Visual da Palavra (Visual Word Form Area – VWFA). Essa área
seria resultado de uma reorganização funcional associando a capacidade da leitura com
restrições estruturais do sistema visual (DEHAENE ET AL., 2002; McCANDLISS ET AL,
2003; FRANÇA ET AL., 2013). Lewis et al. (2011) argumentam ainda que a área poderia
44
se chamar Área da Forma Visual de Morfemas, já que, nesse estágio do reconhecimento,
ocorre decomposição da palavra baseada na forma de raízes e afixos. Essa afirmação se
baseia em resultados de uma série de estudos com MEG que trouxeram uma caracterização
temporal mais precisa para as propriedades identificadas nos estudos com neuroimagem
sobre essa área (SALMELIN, 2007; ZWEIG & PYLKKÄNEN, 2009; SOLOMYAK &
MARANTZ, 2009; 2010; LEWIS ET AL., 2011).
Zweig & Pylkkänen (2009) comparam diretamente palavras morfologicamente
complexas e simples, dialogando com a literatura de priming encoberto (LONGTIN ET
AL., 2003; RASTLE ET AL., 2004), e identificam o M170 como a primeira resposta
visual sensível à complexidade morfológica. Solomyak & Marantz (2009, 2010) e Lewis
et al. (2011) apresentam resultados que corroboram a existência de decomposição
obrigatória baseada em relações de frequência entre raízes e afixos (HAY, 2001), a partir
de modulações nas amplitudes do M170. Lewis et al. (2011) encontram ainda evidências
de que possa haver representação da palavra inteira já disponível nos estágios mais iniciais
do reconhecimento lexical – apenas para palavras cuja decomposição não é determinante
para o acesso lexical –, indicando que exista uma rota dupla de acesso atuando desde o
início do reconhecimento da palavra.
Há ainda um terceiro componente, o M250, que ocorre entre 200 e 300 ms após o
início da apresentação da palavra e parece ter origem na parte posterior do hemisfério
esquerdo. Não há consenso quanto às possíveis computações associadas a esse
componente, mas ele parece ter relação com certas propriedades fonológicas do estímulo
(PYLKKÄNEN ET AL., 2002).
Todos esses estágios até aqui estão envolvidos com processamentos pré-lexicais, ou
seja, eles antecedem o pareamento arbitrário entre forma e sentido que caracteriza o acesso
lexical (HALLE & MARANTZ, 1993). Esse pareamento, por sua vez, parece ser captado
45
por um componente mais tardio, em torno de 350 ms após a apresentação visual da
palavra. Esse componente, sensível à frequência e à repetição (PYLKKÄNEN ET AL.,
2002) – mas não à competição entre as representações ativadas pelo estímulo –, tem sido
assumido como correlato do acesso lexical.
Figura 9: forma da onda associada ao reconhecimento visual de palavras (adaptado do website do Laboratório de Neurolinguística da NYU).
Fiorentino & Poeppel (2007) utilizam esse componente para mapear estágios do
curso temporal da decomposição em palavras compostas do inglês, manipulando as
propriedades tidas como envolvidas no acesso lexical – e captadas pelo M350 – para
comparar diretamente palavras compostas com palavras simples. Assumindo que o M350
é sensível a fatores relacionados ao acesso lexical, itens mais curtos e com maior
frequência deveriam apresentar ativação mais rápida do M350 (peak latency). Sendo
assim, os autores previram que, se houvesse ativação dos constituintes das palavras
compostas, eles teriam latências menores do que as palavras simples – maiores e menos
frequentes – com que foram comparadas. Como previsto, as latências do M350 associadas
às palavras compostas foram mesmo menores, indicando ativação dos constituintes em
estágios iniciais do reconhecimento de palavras complexas. Isso aponta para a existência
de representações no nível sublexical. Aqui, é relevante observar que o componente
neurofisiológico utilizado para caracterizar a decomposição não foi necessariamente o
46
mesmo em palavras derivadas e palavras compostas. Nas palavras derivadas, essa
constatação foi feita 1) comparando diretamente palavras derivadas com palavras simples
(ZWEIG & PYLKKÄNEN, 2009), 2) comparando efeitos relacionados à forma visual da
palavra com efeitos relacionados ao sentido (SOLOMYAK & MARANTZ, 2009), ou,
ainda, 3) comparando frequências de sequências ortográficas em final de palavra com
sequências correspondentes a afixos da língua (SOLOMYAK & MARANTZ, 2010).
Cada tipo de manipulação teve efeitos marcados em diferentes componentes na
forma da onda. Manipulações ortográficas obtiveram resposta associada ao M100, ao
passo que manipulações de morfemas e de sentido obtiveram resposta associada ao M170 e
ao M350, respectivamente. Em palavras compostas, a decomposição foi constatada pela
ativação lexical dos constituintes, indicada pelas latências de pico do M350 mais rápidas
que as latências associadas às palavras monomorfêmicas de mesmo tamanho e frequência.
Não foram encontrados efeitos no componente M170, o que indica que houve acesso ao
sentido dos constituintes, e não apenas um desmembramento pré-lexical baseado na forma
visual das raízes. Stockall & Marantz (2006) também utilizam o M350 como índice de
acesso lexical (ativação da raiz) para mostrar que o reconhecimento de palavras
flexionadas envolve sua decomposição em morfemas lexicais e funcionais, independente
da regularidade.
Resumindo, várias formas já foram usadas para verificar as etapas do
reconhecimento visual de palavras. Independente da metodologia utilizada, existe um
consenso sobre o fato de haver um momento do reconhecimento que envolve a ativação de
constituintes. Basicamente, essa decomposição é constatada a partir de diferentes vias,
utilizando diferentes metodologias. Recentemente, estudos eletrofisiológicos têm
procurado localizar no tempo as etapas envolvidas no reconhecimento lexical.
47
Em palavras derivadas, essa decomposição parece mais bem caracterizada,
envolvendo uma distinção mais clara entre o momento em que as palavras são
decompostas com base na forma visual dos morfemas (captada por experimentos
utilizando priming encoberto e detectável pelo componente M170) e o momento posterior
em que se dá o acesso a raiz, com o pareamento entre forma e sentido (detectável pelo
componente M350). Levando-se em consideração os resultados desses estudos, todas as
palavras que podem ser segmentadas em morfemas existentes são segmentadas (teacher ✔;
brother ✔; brothel ✖), nos momentos mais iniciais do reconhecimento.
Palavras compostas, por outro lado, não podem ser decompostas com base em uma
relação entre afixos e raízes. Conforme reconhece Libben (1994), é mais difícil conceber
uma heurística sistemática para a segmentação de palavras compostas em seus morfemas
constituintes. Por serem constituídos apenas por morfemas de classe aberta, a
decomposição não pode ocorrer checando-se uma lista relativamente pequena, como no
caso dos afixos. Além disso, palavras compostas possuem mais chance de serem
segmentáveis em diferentes pontos, gerando múltiplos constituintes possíveis (clamprod
pode ser segmentado em clamp-rod e em clam-prod – cf. LIBBEN ET AL., 1999). De
qualquer forma, é praticamente consensual, entre os estudos realizados com palavras
compostas, que existe acesso aos constituintes durante o curso temporal do
reconhecimento. Essa decomposição, assim como ocorre para as palavras derivadas,
acontece independente da transparência semântica (ZWITSERLOOD, 1994;
FIORENTINO & POEPPEL, 2007b). Ou seja, se as palavras compostas são segmentáveis,
elas devem ser segmentadas (teacup ✔; hogwash ✔ ; penguin ✖).
Sendo assim, se todas as palavras com alguma estrutura interna possível são
decompostas (teacup, hogwash, carpet / teacher, apartment, corner), uma questão que se
configura mais recentemente diz respeito a quais seriam as computações subsequentes que
48
dariam conta da interpretação correta das palavras complexas. Entender quais são as
subrotinas do processamento lexical e quando elas ocorrem no curso temporal do
reconhecimento – e apontar quais medidas dependentes captam essas diferentes subrotinas
– é um trabalho ainda em progresso, e um desafio para pesquisas sobre o acesso lexical.
Este estudo se situa entre trabalhos que procuram buscar essas medidas
dependentes, não se engajando em oferecer respostas que esclarecerão precisamente a rota
de acesso a palavras complexas, consideradas as nuances problematizadas acima. Estamos
aqui partindo do pressuposto de que há ativação no nível sublexical durante o
reconhecimento de palavras compostas. Sendo assim, o objetivo desta tese é examinar a
atividade neuronal associada a efeitos combinatórios pós-lexicais que devem ocorrer entre
os morfemas ativados, identificando um possível componente que possa ser usado para
testar futuras hipóteses sobre processos combinatórios no curso do reconhecimento de
palavras compostas.
3.3. Se as palavras são decompostas, como elas se recompõem?
Quando estudamos palavras compostas, estamos examinando características primordiais de morfologia na linguagem, e os fundamentos da nossa capacidade criativa para processar e representar palavras.18 (LIBBEN, 2006; p.3)
Uma questão em aberto com relação ao processamento de palavras compostas é
quanto a se existe um índice neurofisiológico independente para a composição entre seus
morfemas constituintes. Existem estudos que apontam o papel da composição para dar
conta, sobretudo, do processamento de palavras novas (SCHREUDER & BAAYEN, 1995;
GAGNÉ, 2002; JI ET AL., 2011). Levando-se em consideração o curso da rota visual do 18 When we study compounds, we examine the fundamental characteristics of morphology in language and the fundamentals of the human creative capacity for morphological process and representation. (LIBBEN, 2006; p3)
49
reconhecimento de palavras (PYLKKÄNEN & MARANTZ, 2003), é possível pensar que
exista algum índice, em torno do 400 ms, que possa estar envolvido com as operações
combinatórias pós-lexicais.
Uma característica particular das palavras compostas é o fato de que seus dois
constituintes são associados por uma relação gramatical não expressa (BISETTO &
SCALISE, 2005). Por exemplo, a palavra teacup poderia ser associada à expressão cup for
tea, caracterizando uma relação de subordinação entre seus constituintes. Os constituintes
dos compostos podem ainda estar relacionados por uma relação de coordenação, como no
caso do adjetivo bittersweet, não se esgotando nesses dois tipos as relações possíveis.
Bisetto e Scalise (2005) classificam as palavras compostas como sendo de diferentes tipos,
baseando-se nos tipos de relações entre seus constituintes:
Figura 10: Classificação das palavras compostas (BISETTO & SCALISE, 2005; p. 9)
A classificação como endocêntricas ou exocêntricas está relacionada com o núcleo
da palavra composta, isto é, com o fato de o sentido da palavra inteira ser ou não um
hiperônimo do seu núcleo. Essa classificação parece ser equivalente ao que Libben (1998)
chama de componencial e não-componencial, respectivamente. A classificação em
subordinadas, atributivas ou coordenadas diz respeito à relação sintática entre seus
constituintes.
2. A new proposal
We propose a novel classification of compounds which is based on a very simple
assumption. What is special about compounds is the fact that the two constituents are
linked by a grammatical relation which is not overtly expressed (cf. apron string vs.
string of the apron). Therefore, we would like to suggest that the classification of
compounds be uniquely and consistently based on this criterion8. The possible
grammatical relations holding between the two constituents of a compound are basically
the relations that hold in syntactic constructions: subordination, coordination and
attribution. The classification of compounds we propose is thus the following:
2) compounds subordinate attributive coordinate endo exo endo exo endo exo
Compoundss are classified as ‘subordinate’ whenever there is a ‘complement’
relation between the two constituents. In a compound such as taxi driver, taxi is clearly
the «complement» of the deverbal head. We argue that this is also the case in
compounds such as apron string, where apron is in an «of relation» with string.
Complement relations, however, are not exclusively ‘of relations’: apron string, in fact,
can have different interpretations: ‘string of an apron’, ‘string on a apron’, ‘string in a
apron’, etc. Nevertheless, the relation between the two constituents is always a
complement relation, namely a subordinative one.
8 This position is not completely new. For example Marchand (1969:18) observed that all compounds can be explained on the basis of the syntactic relations underlying the corresponding sentences. This observation is interesting, even though not workable within the lexicalist framework which rejects derivation of compounds from sentences.
50
Outro fator complicador para o entendimento de como as palavras compostas são
processadas é a transparência semântica. Libben (1995) propõe um modelo em que a
ativação das palavras compostas é separada em três níveis: (1) o nível do estímulo, para
dar conta da habilidade que temos de interpretar palavras compostas novas; (2) o nível
lexical, que daria conta do fato de sabermos que “palavras como strawberry (=morango)
contêm o item lexical straw (=canudo), mas não o significado desse item” (LIBBEN, 2005:
p. 58); e (3) o nível conceptual, para dar conta do fator componencialidade. Nesse modelo,
as diferenças em termos de transparência semântica são caracterizadas a partir de uma ação
combinada de ligações facilitatórias e inibitórias entre o nível lexical e o nível conceptual.
Ainda que as relações entre os constituintes das palavras compostas possam ser de
diferentes naturezas, pode-se afirmar que as palavras compostas, em geral, são o resultado
do processo de composição entre o significado de seus constituintes. Isso deve ser
necessariamente verdadeiro pelo menos para palavras novas, já que elas, em princípio, não
devem ter seu sentido idiossincrático representado no léxico mental.
Tomando como pressuposto essa característica das palavras compostas, buscamos,
no estudo realizado para esta tese, apontar atividades neuronais que devam estar
relacionadas a essa composição de sentido. Estudos recentes em neurociência sobre
Semântica têm destacado o Anterior Midline Field (AMF) como um correlato
neurofisiológico plausível para a composição semântica. Esses estudos são reportados no
Capítulo 4.
51
________________________________________________________________quatro Uma base neurofisiológica para a composicionalidade semântica: o Campo Medial Anterior (AMF)
4.1. A Linguística como modelo cognitivo para estudos neurofisiológicos de Semântica
“É impressionante o que a linguagem é capaz de fazer. Com apenas algumas sílabas pode-se expressar um número incalculável de pensamentos, de modo que mesmo uma ideia concebida por um terráqueo pela primeira vez pode ser colocada na forma de palavras que serão entendidas por outra pessoa, para quem essa ideia é completamente nova. Isso seria impossível se não fôssemos capazes de distinguir as partes desse pensamento que correspondem à estrutura de uma sentença.”19 (FREGE, 1923 apud FROMKIN ET AL., 2000)
O estudo realizado para esta tese apresenta evidências de composicionalidade
semântica pós-lexical, investigando substratos neurofisiológicos envolvidos nesse
mecanismo combinatório, na situação específica da composição de duas raízes em palavras
compostas. Em maior escala, o estudo pode ajudar a entender como o significado arbitrário
é instanciado no nível sublexical, identificando a dinâmica da composição semântica
dentro da palavra.
Para que se possa entender como os algoritmos utilizados no processamento de
palavras se instanciam fisicamente no cérebro, é necessário que sejam estabelecidas
correlações entre computações linguísticas e atividade neuronal. Neste capítulo, encontra-
se um resumo de estudos em neurociência da linguagem que se têm ocupado de encontrar
essa correlação especificamente para a composição de sentidos complexos. Esses estudos
têm apontado o Campo Medial Anterior (Anterior Midline Field – AMF) para essa função.
19 “It is astonishing what language can do. With a few syllables it can express an incalculable number of thoughts, so that even a thought grasped by a terrestrial being for the very first time can be put into a form of words which will be understood by someone by whom the thought is entirely new. This would be impossible, were we not able to distinguish parts in the thought corresponding to the part of a sentence, so that the structure of the sentence serves as an image of the structure of the thought” (FREGE, 1923 apud FROMKIN ET AL., 2000)
52
O AMF é um componente de MEG que ocorre em torno de 400 ms após a visualização do
estímulo e cuja atividade elétrica geradora se localiza no córtex pré-frontal ventromedial
(Ventromedial prefrontal cortex – vmPFC).
“Semântica pode querer dizer muitas coisas diferentes, uma vez que há muitas
maneiras de se interessar pelo significado” (PARTEE, 2011). Sendo assim, é importante
definir que aspecto da semântica se quer observar, privilegiando um dos recortes possíveis.
Nesta tese, o que se entende por semântica são as operações composicionais envolvidas na
construção do sentido de palavras ou de expressões linguísticas, de acordo com o princípio
da composicionalidade (FREGE, G., 1892).
De acordo com esse princípio, “o significado de uma expressão é uma função dos
significados de suas partes e da forma como essas partes são combinadas” (PARTEE,
2004). Esse princípio definiu as bases do campo da linguística que se denominou
Semântica Formal e que desde os anos 60 vem contribuindo para uma caracterização dos
mecanismos envolvidos na composição dos significados, a partir de uma colaboração
interdisciplinar entre Linguística, Filosofia e Lógica, Psicologia e outras áreas do
conhecimento.
Ao delimitar uma abordagem composicional para a semântica, estudos que
procuram dar conta do significado devem levar em consideração dois aspectos essenciais:
o significado das partículas elementares da linguagem, por um lado, e, por outro, como os
significados de entidades mais complexas são montados a partir dos significados dessas
partículas. Se podemos entender e produzir sentenças com que nunca tivemos contato,
deve existir uma forma sistemática, transparente e familiar de compor significados
complexos a partir dos significados de seus constituintes. Esses mecanismos devem ser
compartilhados pelos falantes de uma língua.
53
Dentro da perspectiva da neurociência da linguagem, é desejável que modelos
cognitivos da mente sirvam como guias teóricos na formulação de hipóteses sobre suas
bases neurofisiológicas, em uma abordagem que leve em consideração os níveis de análise
de Marr (1982). Conforme afirmam Pylkkänen et al. (2010), “um modelo cognitivo é
crucial, uma vez que sem ele o neurocientista cognitivo não pode saber o que procurar no
cérebro ou qual pode ser a natureza das representações relevantes, ou como diferentes
componentes de um processo podem interagir” (p. 1)20.
No que se refere ao campo da semântica, a tradição dos trabalhos em neurociência
não procurou levar em consideração modelos formais sobre a composição de significado.
Isso resultou em uma dissociação entre as definições e os escopos da palavra semântica
entre essas duas áreas.
“Apesar da clara necessidade de se entender a neurobiologia das funções combinatórias que derivam os significados das sentenças, não existe até o momento uma neurociência das bases neurofisiológicas dessas regras. Em vez disso, a pesquisa em neurociência sobre semântica na maioria das vezes trata da investigação sobre conhecimento conceitual.” (PYLKKÄNEN, et al. 2010).
Isso não quer dizer que e a neurociência da linguagem deva se constituir apenas
como um solo de teste para modelos formulados pela linguística teórica e se esgotar nesses
modelos. Por outro lado, por se tratar de uma ciência que busca entender o funcionamento
da linguagem no cérebro, é relevante que se tenha uma caracterização precisa do que é a
linguagem e de quais são seus mecanismos de funcionamento. E, nesse sentido, ignorar
todos os anos de pesquisa em teoria linguística e em Psicolinguística, e começar um outro
20 “a cognitive model is crucial as without it, the cognitive neuroscientist does not know what to look for in the brain, what the nature of the relevant representations might be, or how the different components of a process might interact with each other.” (PYLKKÄNEN ET AL, 2010; p.1).
54
começo, parece ser uma decisão pouco otimizada. Conforme observam Poeppel & Embick
(2005), categorias linguisticamente motivadas devem guiar o estudo das computações no
cérebro.
É natural, no entanto, que existam questões teóricas diferentes entre essas duas
áreas, justificando sua existência como campos separados do conhecimento, cada um com
seus objetivos e escopos. Pylkkänen et al. (2010) afirmam que não é uma grande questão
de pesquisa para a Linguística, por exemplo, entender como animais e ferramentas são
diferentemente representados no cérebro (MUMMERY et al., 1996). Para esse tipo de
pergunta, a pesquisa linguística teórica tem pouco a contribuir com a neurociência, já que a
Linguística não tem, nesse quesito, uma caracterização em termos de complexidade
estrutural passível de ser apreendida computacionalmente.
Na verdade, o problema de determinar traços e regras dessa natureza foi tópico de uma séria investigação nos últimos anos, e existe a promessa para um desenvolvimento produtivo. Pode-se notar rapidamente que uma análise de conceitos em termos de traços como animacidade, ação etc. dificilmente devem ser adequados, e que certos traços devem ser ainda mais abstratos. 21 (CHOMSKY, 2006)
Sendo assim, é de interesse do linguista teórico e do neurocientista da linguagem
identificar, por meio do trabalho interdisciplinar, como essas duas áreas do conhecimento
podem dialogar de modo a contribuir com um entendimento mais abrangente e refinado do
funcionamento da linguagem.
21 In fact, the problem of determining such features and such laws has once again become a topic of serious investigation in the past few years, and there is some promise of fruitful development. It can be seen at once that an analysis of concepts in terms of such features as animateness, action, etc., will hardly be adequate, and that certain features must be still more abstract.
55
4.2. Buscando um correlato para a composicionalidade semântica
É controverso o lugar da Semântica em uma teoria sobre a linguagem natural.
Segundo Chomsky, deve haver um ceticismo com relação à ideia de que uma teoria da
linguagem deva envolver especificações sobre denotação ou condições de verdade, uma
vez que essas questões são externas ao falante. Uma teoria do significado na linguagem
natural deve considerar as expressões linguísticas em uma perspectiva mais “interna”
(CHOMSKY, 2000; p. 132), ou seja, como uma função cognitiva. De certa forma, essa
abordagem aproxima relações semânticas de relações sintáticas, já que, em um modelo
computacional de Semântica, devem ser estabelecidas, por um lado, as unidades de
significado e, por outro, as operações composicionais para formação de significados
complexos a partir dessas unidades.
De fato, existem teorias sobre Semântica que preveem uma aproximação mais forte
entre Sintaxe e Semântica, sendo o significado das expressões computado completamente
pelo significado de suas partes (MONTAGUE, 1970). Segundo essas teorias de
composicionalidade direta, toda expressão que é reconhecida como um constituinte
sintático deve ter também um valor semântico. Existem, por outro lado, teorias que
permitem uma dissociação entre conteúdo sintático e conteúdo semântico, de modo que a
interpretação envolva algum material encoberto de natureza puramente semântica
(BARKER, 2002; JACKOBSON, 1999).
Para um programa de pesquisa em neurociência da linguagem que considera o
cérebro como um dispositivo que processa informação computacional, é conveniente que a
linguagem seja um sistema simbólico composicional. Nessa perspectiva, Pylkkänen e
McElree (2006) afirmam que “um entendimento completo sobre a compreensão da
linguagem requer um entendimento detalhado do conjunto de operações combinatórias que
56
os falantes têm disponíveis, e de como essas operações interagem com o resto do sistema
de processamento da linguagem”22. Segundo os autores, o primeiro passo necessário para
esse fim é identificar as operações envolvidas na composição semântica, para que se
possam isolá-las em termos de custo para o processamento.
Estudos clássicos com potenciais relacionados a eventos23 (ERPs) identificam o
componente N400 como sendo um índice de integração semântica (KUTAS &
FEDERMEIER, 2000). O N400 é uma onda negativa de ERP que se inicia entre 200 e 300
milissegundos (ms) após a leitura ou audição de uma palavra, e tem seu pico em torno de
400 ms. Essa visão integracionista do N400, ainda que seja a mais duradoura e bastante
defendida no campo da neurociência da linguagem (cf. LAU ET AL., 2008 para uma
revisão dos estudos sobre o N400), não foi estabelecida a partir de manipulações
sistemáticas baseadas em uma definição clara da noção de integração semântica (cf.
PYLKKÄNEN ET AL., 2010). De fato, o que se quer dizer por integração semântica não
é especificado claramente na literatura do N400, geralmente relacionando-se com a
plausibilidade de uma palavra no contexto de uma sentença.
O estudo seminal que definiu as bases para uma série de trabalhos que associaram o
N400 à integracão semânica foi o de Kutas & Hillyard (1980), em que se manipulam as
chamadas “violações semânticas”. Nesse trabalho, as autoras reportam um aumento da
amplitude do N400 relacionado à identificação da última palavra em sentenças como he
spread the warm bread with socks em oposição a sentenças controle como he spread the
22 We believe that a complete understanding of language comprehension requires a detailed understanding of the set of composition operations that comprehenders have at their disposal, and how these operations interface with the rest of the language processing system. (PYLKKÄNEN & McELREE, 2006).
23 ERPs (Event-related potentials – Potenciais relacionados a eventos) são potenciais elétricos gerados no cérebro como consequência da ativação sincronizada de conjuntos neuronais por algum estímulo externo. Esses potenciais são gravados por eletrodos no escalpo e consistem em sequências de ondas com tempo precisamente marcado (LAU ET AL., 2008).
57
warm bread with butter. Esse efeito é atribuído à maior dificuldade de integração da
última palavra à sentença. Essa dificuldade de integração, no entanto, concerne à
implausibilidade da representação da sentença, uma vez que não existe uma violação da
possibilidade de composição semântica. A composição semântica é bem sucedida, mas o
significado da sentença resultante descreve um evento improvável – ou impossível – de
acordo com nosso conhecimento de mundo.
Figura 11: Resultado Kutas & Hillyard (1980)
De fato, existe uma inconsistência entre o que a linguística teórica e o que a
neurociência consideram como uma violação semântica. Para a Linguística, sentenças
como he spread the warm bread with socks não são exemplos de violação semântica, mas
de conhecimento de mundo (PYLKKÄNEN ET AL., 2009). Possivelmente essa seria a
razão por que Hagoort et al. (2004) não encontram diferenças entre o que eles chamam de
violação semântica e de violação de conhecimento de mundo, ao contrastar
sistematicamente sentenças como The Dutch trains are white and very crowded e The
Dutch trains are sour and very crowded. Segundo os autores, white nessa sentença seria
apenas uma violação de conhecimento de mundo, enquanto sour seria uma violação
semântica, uma vez que, de acordo com condições de interpretação, um predicado requer
58
um argumento que seja compatível em traços semânticos. Como sour está relacionado
com paladar, existiria uma restrição semântica na medida em que esse traço não é aplicável
a trens (HAGOORT ET AL., 2004). Os resultados desse estudo revelaram não haver
diferença entre sour e white, quando contrastados com a palavra controle correta, yellow –
a mais plausível, uma vez que os trens holandeses são amarelos. No entanto, tanto sour
quanto white são equivalentes em termos de sua expectativa como possíveis atributos dos
trens holandeses: ambos são completamente inesperados. Como a literatura de ERPs não
explica por que a expectativa semântica deve afetar a integração, esse resultado nulo não
representa um achado conclusivo sobre a natureza da computação semântica.
A chamada incongruência semântica atribuída à palavra sour nesse contexto se
deve a fatores relacionados à checagem de traços, o que não deve ter implicação na
interpretação semântica estrutural da sentença. Ou seja, em termos de integração ao resto
da sentença, yellow, sour e white são equivalentes.
Figura 12: resultados de Hagoort et al. (2004)
Esse design, portanto, não parece ser eficiente para distinguir efeitos de
composicionalidade na frase, uma vez que nas três sentenças tem-se a integração de nomes
this distinction between semantics and prag-matics (6–8), the semantic interpretation of asentence is thought to be separate from and toprecede the integration of pragmatic or worldknowledge information (9). However, a num-ber of researchers (3, 10) have pointed outthat the distinction between linguistic mean-ing and world knowledge is problematic be-cause many words are polysemous, and theirmeaning can only be fully established byinvoking world knowledge (11).
We decided to contribute to settling thisissue by providing neurophysiological evi-dence on the integration of semantic andworld knowledge information. The underly-ing idea is that if a principled distinction canbe made between linguistic meaning andworld knowledge, concomitant processingdifferences should be obtained during theinterpretation of a sentence.
This study presents electroencephalogram(EEG) and functional magnetic resonanceimaging (fMRI) data that speak to this issue.While participants’ brain activity was record-ed, they read three versions of sentences suchas “the Dutch trains are yellow/white/sourand very crowded” (the critical words are initalics). It is a well-known fact among Dutchpeople that Dutch trains are yellow, andtherefore the first version of this sentence iscorrectly understood as true. However, thelinguistic meaning of the alternative colorterm white applies equally well to trains asthe predicate yellow. It is world knowledgeabout trains in Holland that makes the secondversion of this sentence false. This is differentfor the third version. This version contains aviolation of semantic constraints. The coremeaning of sour is related to taste and food.Under standard interpretation conditions, apredicate requires an argument whose seman-tic features match that of its predicate. Forour third sentence, this is clearly not the case,because semantic features related to taste andfood do not apply to trains. One could thusargue that for semantic internal reasons, thethird sentence is false or incoherent (3, 12). Itis our knowledge about the words of ourlanguage and their linguistic meaning thatpose a problem for the interpretation of thethird version of this sentence.
The increased interpretation load of seman-tic and world knowledge violations is assumedto have an effect on electrophysiological brainactivity and on the hemodynamic response. Ifsemantic interpretation precedes verificationagainst world knowledge, the effects of thesemantic violations should be earlier and mightinvoke other brain areas than the effects of theworld knowledge violations.
Based on EEG recordings from 29 elec-trode sites (13, 14), event-related brain po-tentials (ERPs) were computed and time-locked to the onset of the critical words thatembodied the semantic violation, the world
knowledge violation, and their correctcounterpart. ERPs reflect the summation ofthe postsynaptic potentials of a large en-semble of synchronously active neurons.They provide a sampling of the brain’selectrical activity with a very high temporalresolution. We focused on one particularERP effect, referred to as the N400. Theamplitude of this negative-going ERP be-tween roughly 250 and 550 ms, with amaximum at !400 ms, is influenced by theprocessing of semantic information (15).The easier the match between the lexicalsemantics of a particular content word andthe semantic specification of the context,the more reduced the N400 amplitude willbe. The N400 is known to be very sensitiveto semantic integration processes (16, 17).
As expected, the classic N400 effect wasobtained for the semantic violations. For theworld knowledge violations, we also ob-served a clear N400 effect. Crucially, thiseffect was identical in onset and peak latencyand was very similar in amplitude and topo-graphic distribution to the semantic N400effect (Fig. 1). This finding is strong empir-ical evidence that lexical semantic know-ledge and general world knowledge are both
integrated in the same time frame duringsentence interpretation, starting at !300 msafter word onset.
In addition, we used the EEG data to inves-tigate oscillatory brain activity in a wide fre-quency range (1 to 70 Hz) in relation to thesemantic and world knowledge violations. Am-plitude increases of EEG oscillations in specificfrequency bands, such as theta (4 to 7 Hz) andgamma (!30 to 70 Hz), that are induced by acognitive event are thought to reflect the dy-namic recruitment of the relevant neuronal net-works engaged in cognitive processing (18). Awavelet-based time-frequency representation(TFR) of EEG power changes (Fig. 2) revealeda clear gamma peak for the world knowledgeviolation that was not seen for the semanticviolation (19). In contrast, relative to the otherconditions, the semantic violation resulted in anincrease in power in the theta frequency range.Both effects are visible within the latency rangeof the N400. Especially at lower frequencies(e.g., at theta frequencies), the temporal resolu-tion of the wavelet transform is relatively poor.This implies that the relative onset differencebetween theta and gamma activity cannot be takenas a reliable indicator of onset differences in theunderlying neurophysiological events. In particu-
Fig. 1. Grand average (n " 30 subjects) ERPs for a representative electrode site (Cz) for the correctcondition (black line), world knowledge violation (blue dotted line), and semantic violation (reddashed line). ERPs were time-locked to the presentation of the critical words (underlined). Semanticviolations resulted in a larger N400 amplitude between 300 and 550 ms than the control condition[F(1,29)" 73.0, P# 0.0001]. N400 amplitudes to world knowledge violations were also larger thanfor correct controls [F(1,29) " 27.4, P # 0.0001]. The size of the effect was slightly larger forsemantic violations than for world knowledge violations (P # 0.05). The onset of the effects forsemantic and world knowledge violations was not significantly different (14). Spline-interpolatedisovoltage maps display the topographic distributions of the mean differences from 300 to 550 msbetween semantic violation and control (left) and between world knowledge violation and control(right). Topographic distributions of the N400 effect were not significantly different betweensemantic and world knowledge violations (P " 0.9).
R E P O R T S
www.sciencemag.org SCIENCE VOL 304 16 APRIL 2004 439
59
que denotam indivíduos, o que não causa nenhum problema para a gramaticalidade das
frases. De acordo com o quadro teórico da Morfologia Distribuída (HARLEY, 2008), a
anomalia semântica ilustrada é resultado de uma incompatibilidade no conteúdo
enciclopédico das raízes. Os elementos funcionais, no entanto, são sintatica- e
semanticamente coerentes, de modo que as sentenças sejam perfeitamente interpretáveis na
interface conceptual (cf. CHOMSKY, 1957 – Colorless green ideas). Além disso, não
está claro nesses estudos quais seriam os tipos de processos composicionais envolvidos na
distinção, a partir de checagem de traços, entre um conhecimento mais geral e um
conhecimento relacionado a uma cultura específica.
A similaridade no componente N400 de white e de sour, em oposição a yellow,
pode ainda ser atribuída apenas a um efeito de priming semântico entre Dutch trains e
yellow, independente de efeitos integrativos no nível da sentença. Nesse sentido, somente
yellow sofreria efeito de priming semântico por Dutch trains, o que justifica os resultados
indistintos para white e sour, já que a ausência de priming é consistente para as duas
condições. Uma vez que o item inesperado ou não-relacionado foi acessado, a integração
com o contexto da frase deve ser igualmente simples.
Além desses fatores, a duração longa do N400 sugere que esse componente deva
refletir diferentes subrotinas computacionais associadas a diferentes processos cognitivos,
não podendo ser isoladamente um índice específico de composição semântica.
Efetivamente, como descrito no Capítulo 3, diferentes estudos têm perscrutado a estrutura
interna do N400, utilizando a técnica de MEG, e revelado que esse componente pode ser
segmentado em diferentes estágios associados a computações bastante distintas
(PYLKKÄNEN & MARANTZ, 2003), com origem em diferentes localizações corticais.
Sendo assim, uma questão metodológica importante para os estudos com EEG seria
60
determinar, na configuração do componente N400, que partes estão associadas a essas
diferentes computações24.
A literatura de ERPs não reporta manipulações de fatores que afetem
exclusivamente a composição semântica, uma vez que não há uma teoria pressupondo que
a expectativa de uma palavra no contexto de uma sentença afete o processo de composição
do significado complexo dessa sentença. Isso significa dizer que, ao manipular essas
expectativas, não se está manipulando – ao menos não obvia- ou exclusivamente – efeitos
composicionais de sentido.
Isolar o esforço associado a subrotinas linguísticas específicas é essencial para que
seja possível explorar os mecanismos cerebrais que formam as bases da computação da
linguagem. Nessa perspectiva, estudos mais recentes têm procurado identificar, também
utilizando a técnica de magnetoencefalografia (MEG), um componente neurofisiológico
associado puramente a processos de computação semântica (PYLKKÄNEN ET
MCELREE, 2007; PYLKKÄNEN ET AL., 2009; BRENNAN & PYLKKÄNEN, 2008;
BRENNAN & PYLKKÄNEN, 2010; PYLKKÄNEN, OLIVERI & SMART, 2009). Esses
estudos em conjunto vêm contribuindo para estabelecer o componente de MEG
denominado Campo Medial Anterior (Anterior Midline Field - AMF) como um candidato
provável da composição semântica, conforme definida pela Semântica Formal. Esse
componente é gerado no córtex pré-frontal ventromedial (ventromedial prefrontal cortex –
vmPFC), uma área tradicionalmente associada com cognições não-linguísticas, como
24 A manipulação corrente em estudos dom ERP é a extração de potenciais evocados por meio de promediação de várias épocas do EEG. Esse protocolo reduz o nível de ruído, deixando visível o componente relacionado ao evento que se quer estudar. Porém, por se tratar de uma média, essa metodologia acaba por obscurecer informações importantes que só aparecem na variabilidade entre trials. Esse déficit pode ser contornado pelo uso de potenciais induzidos – transformada de Wavelet – que permite que se realize uma análise em um único trial, evitando que se percam variações importantes na forma da onda relacionada ao estímulo. Sendo assim, essa técnica pode permitir que se observem separadamente as diferentes computações captadas de forma difusa pelo N400.
61
aquelas relacionadas a tomada de decisão e teoria da mente (BECHARA ET AL., 2000
SHAMAY-TSOORY ET AL., 2007; MAGUIRE ET AL., 2010).
Utilizando a técnica de MEG, Pylkkänen & McElree (2007) buscam isolar efeitos
de composicionalidade semântica manipulando sua transparência em relação à estrutura
sintática. Para esse fim, os autores utilizam sentenças em que a composição do significado
complexo não se dá de maneira explícita, envolvendo um elemento que não está expresso
na estrutura sintática. Por exemplo, frases como the author began the book (coerção
semântica) foram comparadas com frases como the author wrote the book. Dessa forma,
foi possível isolar composição semântica distinta de composição sintática. Além disso,
essas condições ainda foram constrastadas com uma condição de violação semântica, the
author disgusted the book. Os efeitos foram distintos para violação semântica e coerção.
As sentenças com coerção semântica obtiveram um aumento da amplitude no AMF entre
350-450 ms.
Esses estudos foram feitos tendo como pressuposto que a existência de coerção
implica dificuldade de processamento, a partir de evidências apresentadas por McElree et
Al. (2001) e Traxler et al. (2002) com experimentos utilizando leitura automonitorada e
rastreamento ocular. Para esses autores, a dificuldade se dá devido à maior complexidade
léxico-semântica dos predicados em que ocorre a coerção. Esses resultados foram
questionados por De Almeida (2004), que tentou replicar os efeitos acima em dois
experimentos de leitura automonitorada e não obteve resultados significativos. De
Almeida sugere que operações de coerção sejam inferências pragmáticas computadas a
partir de representações semânticas que se encontram para além da Forma Lógica, não
afetando o processamento online. No entanto, Pickering et al. (2004) reportam resultados
de um novo experimento que evidencia novamente maiores custos de processamento para
sentenças em que ocorre coerção.
62
Outros estudos com coerção dentro de adjetivos, coerção aspectual e coerção em
verbos incoativos (cf. PYLKKÄNEN ET AL., 2010) revelaram também atividade
aumentada no componente AMF, sendo a fonte da atividade localizada consistentemente
no vmPFC (Figura 13).
Figura 13: AMF como índice de composição semântica (In: PYLKKÄNEN ET AL, 2010)
Dialogando com os estudos clássicos de N400, e contribuindo para o debate sobre a
diferenciação entre semântica e conhecimento de mundo (HAGOORT ET AL., 2004),
Pylkkänen et al. (2009) desenvolvem uma forma de contrastar diretamente violações
26
Figure 1: Summary of all our AMF results to date, including the typical MEG response to a visual word presentation in a sentential context (top panel). The upper left corner depicts the AMF field pattern and a typical localization. In the stimulus examples, the critical word is underlined.
63
semânticas e de conhecimento de mundo, a partir de manipulações específicas com as
restrições semânticas do prefixo -un. Foram comparadas sentenças do tipo 1) the wine was
being uncorked, que são bem formadas semanticamente e não violam conhecimento de
mundo, 2) the wine was being unchilled, que violam restrições semânticas com o uso do
prefixo -un, e 3) the thirst was being uncorked, que são bem formadas semanticamente,
mas violam conhecimento de mundo. As frases do tipo 2 obtiveram atividade aumentada
no córtex pré-frontal ventromedial (vmPFC), o que não ocorreu com as frases do tipo 3.
Bemis & Pylkkänen (2011) investigam se a mesma atividade é encontrada ao se
manipular a composicionalidade semântica em um ambiente sintagmático. Nesse estudo,
foi encontrado aumento da atividade no vmPFC quando a palavra crítica era precedida por
um adjetivo, criando um sintagma adjetival, como em red boat. Essa condição foi
contrastada com condições em que a palavra crítica era precedida por um outro
substantivo, como em cup boat e em que ela era precedida por uma sequência de letras,
como em xkq boat (Figura 14).
Figura 14: Aumento significativo da atividade relacionada à condição de modificação intersectiva (BEMIS & PYLKKÄNEN, 2011).
Levando em consideração os estudos reportados acima, assumimos o Campo
Medial Anterior (AMF), gerado no vmPFC, como sendo um índice plausível de
64
composição semântica. Sendo assim, o esforço para a composição do sentido em palavras
compostas – a partir dos sentidos de seus morfemas constituintes – deve gerar um aumento
da amplitude desse componente, quando comparado ao esforço relacionado a palavras
simples. O experimento realizado para esta tese, e reportado no Capítulo 5, teve como
objetivo testar se a complexidade lexical em estímulos visuais afeta o AMF, podendo esse
componente se configurar também como índice de composicionalidade entre os sentidos
dos constituintes de palavras compostas.
4.3. Uma nota sobre a composição sintática – o lobo frontal anterior esquerdo (LATL) Bemis & Pylkkänen (2011) foi o primeiro estudo que explorou a
composicionalidade semântica em um contexto tão restrito quanto a combinação entre um
adjetivo e um nome. Os autores mediram estritamente a atividade relacionada à operação
semântica de modificação intersectiva, isolando assim uma composição única de sentido
(red boat vs. cup, boat). Por outro lado, a junção entre um adjetivo e um nome forma um
sintagma adjetival, envolvendo, além da composição semântica, uma operação sintática. A
composição semântica provocou maior atividade no vmPFC, em conformidade com os
estudos apresentados acima, que destacaram o AMF como correlato de operações
combinatórias de sentido. Além disso, foi também observado um efeito distinto,
localizado no lobo temporal anterior esquerdo (left anterior temporal lobe – LATL),
indicando atividade dissociada para composição semântica e concatenação sintática. O
LATL tem sido apontado, em uma série de estudos com imagem, como implicado em
composições sintáticas básicas (FRIEDERICI ET AL., 2000; ROGALSKY & HICKOK,
2008).
65
No experimento realizado para esta tese, manipulamos a composição do sentido
complexo em palavras compostas, a partir da composição dos sentidos de seus morfemas
constituintes (duas raízes). Nesse contexto, é possível que exista também uma
sobreposição de efeitos sintáticos e semânticos, se houver uma etapa de concatenação
sintática entre as duas raízes que compõem a palavra.
66
__________________________________________________________________cinco Efeitos composicionais no reconhecimento visual de palavras compostas em inglês: um estudo com MEG 5.1. O estudo
Este estudo teve como objetivo investigar mecanismos de operação combinatória
durante o reconhecimento visual de palavras compostas, contribuindo para a caracterização
dos processos básicos que fundamentam a propriedade essencial da linguagem humana de
expressar uma quantidade infinita de ideias a partir de meios finitos (CHOMSKY, 2002): a
infinitude discreta. Através da dinâmica espacial e do curso temporal dos estágios do
reconhecimento lexical, por meio de seus efeitos nos componentes neurológicos, seria
possível mapear mecanismos implicados na decomposição e composição sintático-
semânticas das palavras a partir de seus constituintes. E assim, em tese, poderia se chegar
até às questões mais primitivas de como é instanciado o significado arbitrário.
Conforme resenhado no Capítulo 3, estudos realizados na última década têm
encontrado evidências de decomposição morfológica já nos estágios iniciais da ativação
lexical (RASTLE ET AL., 2004; LONGTIN ET AL., 2003; ZWEIG & PYLKKÄNEN,
2009; SOLOMYAK & MARANTZ, 2010, FIORENTINO & POEPPEL, 2007). No
entanto, ainda não há uma caracterização na literatura quanto aos mecanismos básicos de
composição semântica que podem estar em jogo no nível lexical. Se existe de fato um
estágio de decomposição obrigatório no reconhecimento de palavras, deve haver um
momento posterior no curso temporal do acesso lexical em que os constituintes devem ser
recombinados. Ji (2011) sugere que a decomposição morfológica inicial das palavras
compostas, deflagrada pela existência de qualquer forma de complexidade estrutural,
67
tornaria disponíveis representações lexicais e semânticas (cf. LIBBEN, 1995), a partir das
quais deve ocorrer uma tentativa mais tardia de composição de sentido.
Resultados recentes têm associado o córtex pré-frontal ventromedial (vmPFC) com
o processamento da composição de significados complexos, tanto em sintagmas mínimos
envolvendo a ligação entre um artigo e um nome (BEMIS & PYLKKÄNEN, 2011) quanto
em sentenças envolvendo coerção e violações semânticas (cf. revisão em PYLKKÄNEN,
2010). Procuramos, com este estudo, verificar se esses mesmos efeitos podem ser
reproduzidos por processos de composição semântica intralexicais como, por exemplo, a
modificação relacional que ocorre entre as duas raízes que compõem palavras compostas
em inglês.
Este experimento foi realizado durante um estágio de Doutorado
(CAPES/Fulbright-Brasil) no Laboratório de Neurolinguística da Universidade de Nova
York. Devido ao tempo restrito de acesso às instalações e às máquinas disponibilizadas
pelo laboratório, o experimento foi realizado como parte de um experimento maior, ainda
em andamento e análise. Para fins de clareza, aqui será descrito todo o desenho do
experimento. Contudo serão reportadas apenas as análises pertinentes a esta tese.
Utilizamos a técnica de magnetoencefalografia (MEG) para monitorar a atividade
eletromagnética cortical durante um teste de nomeação não-alvo, em que palavras
compostas do inglês foram contrastadas com palavras-controle monomorfêmicas (e.g.
SAILBOAT vs. SPINACH). A justificativa para o uso da língua inglesa foi tanto
metodológica quanto logística: a composição é um processo de formação de palavras
produtivo e sistemático no inglês (PLAG, 2003). O laboratório de Neurolinguística na
Universidade de Nova York (NYU), nos Estados Unidos, desenvolve as pesquisas que
verdadeiramente balizam as linhas de pesquisa em que nos especializamos em nosso
68
laboratório aqui no Brasil25 – acesso lexical e processos de decomposição morfológica.
Sua infraestrutura conta com diversos aparelhos para aferição da atividade neuronal e com
pesquisadores capacitados nas técnicas mais refinadas de processamento de sinais
bioelétricos, dentro de um enfoque que dialoga com modelos teóricos seriais de
processamento de linguagem, o que vai ao encontro das expectativas do nosso laboratório..
5.2 Metodologia
Participantes
Participaram deste experimento 15 falantes nativos de inglês, destros, com visão
normal ou corrigida e idade média em torno de 23 anos. Todos assinaram um documento
de consentimento aceitando participar da pesquisa, que foi previamente aprovado pelo IRB
(Institutional Review Board)26 da Universidade de Nova York.
Material
Todos os estímulos consistiram em substantivos compostos (e.g. SAILBOAT) e
simples (e.g. SPINACH), com tamanho e frequência superficial controlados. Para fins
exploratórios incitados pela literatura de processamento de palavras, manipulamos a
transparência semântica, incluindo palavras semanticamente transparentes (e.g.
SAILBOAT, em que as raízes contribuem para o significado da palavra inteira – sailboat:
25 O Laboratório ACESIN (Laboratório de Acesso Sintático), coordenado por Aniela Improta França, é pioneiro no Brasil em investigações eletrofisiológicas em neurociência da linguagem, atuando desde 2005 como um braço de pesquisa da Pós-graduação em Linguística da UFRJ, apoiado pelas agências de fomento FAPERJ, CNPq e CAPES. 26 Comitê de ética designado formalmente para aprovar, monitorar e avaliar pesquisa biomédica e comportamental envolvendo humanos.
69
sail=vela; boat=barco; sailboat =barco à vela) e opacas (e.g. HOGWASH, em que o
significado da palavra não é derivado do significado de suas raízes – hogwash: hog=porco;
wash=lavar; hogwash=desatino). Não controlamos outros tipos de relação entre os
constituintes, como o tipo de relação sintática e a componencialidade (BISETTO &
SCALISE, 2005; LIBBEN, 1995).
311 palavras compostas do inglês foram compiladas de estudos anteriores e
categorizadas com relação à transparência semântica por meio de um teste de relação
semântica realizado com a ferramenta Amazon Mechanical Turk. Nesse teste, os
participantes foram orientados a avaliar, em uma escala de 1 a 7, o quanto cada constituinte
das palavras compostas se relacionava com o significado da palavra inteira (cf. Likert
Scale: LIKERT, 1932). Na escala, 1 correspondia a “não relacionado” e 7 correspondia a
“muito relacionado”. Cada um dos 20 participantes foi apresentado, randomicamente, a
apenas um dos constituintes de cada palavra composta. As palavras compostas foram
classificadas como semanticamente opacas (e.g. HOGWASH) se a soma dos escores de
seus constituintes estivesse no intervalo 1-6, e semanticamente transparentes (e.g.
SAILBOAT) se a soma dos escores de seus constituintes estivesse no intervalo 10-14.
Sessenta compostos foram selecionados para cada categoria.
Incluímos ainda palavras compostas inexistentes no inglês (nova, e.g,
LADYFORK), para explorar efeitos obrigatórios de composicionalidade. Como essas
palavras não podem estar representadas no léxico mental dos participantes (LIBBEN,
1995), devemos obrigatoriamente encontrar efeitos combinatórios durante sua ativação.
Sessenta palavras compostas novas foram geradas utilizando as palavras restantes do teste
de relação, que não estavam entre as 60 selecionadas para as categorias TRANSPARENTE
e OPACA. Os constituintes desses compostos foram selecionados randomicamente e
recombinados para formar palavras inexistentes em inglês. Para evitar a formação
70
ocasional de uma palavra existente, as frequências das palavras formadas foram checadas
na base de dados English Lexicon Project, devendo ser igual a zero.
Desenho Experimental
O experimento completo teve como objetivo comparar quatro tipos diferentes de
palavras compostas (transparentes, opacas, novas e ortográficas). Essas quatro
modalidades foram contrastadas em dois tipos de priming – repetição (identidade) e
parcial. Para a condição de priming com repetição, a palavra composta foi utilizada tanto
como prime como para alvo (TEACUP-teacup). Para a condição de priming parcial,
utilizou-se como prime o primeiro constituinte da palavra composta (TEA-teacup). Essas
duas condições foram contrastadas com controles em que o prime não tinha relação com o
alvo (DOORBELL-teacup; DOOR-teacup). A Tabela 1 ilustra o desenho completo do
experimento. Todos os participantes leram todos os itens (total de 960), que foram
divididos em quatro listas de 240 palavras e randomizados dentro de cada lista. A ordem
de apresentação das listas foi contrabalanceada entre sujeitos.
Tabela 1: Desenho do experimento completo de priming com nomeação.
Os sujeitos foram orientados a ler em voz alta a segunda palavra de cada par
apresentado, conforme ilustrado na Figura 15. Neely (1991) reporta resultados de
nomeação consistentes com os de decisão lexical, e a justificativa para a escolha desse tipo
Lexicon Project’s word frequencies (Balota et al., 2007).
2.2 Experiment Design
This study contrasted four different word types, each with 60 items: transparent, opaque, orthographics,
and novel compounds. These word types were compared in two types of priming, repetition and partial
(constituent). For the repetition priming condition, the full compound was shown as both the prime and the
target as compared to the constituent priming where the constituent of word (in this study, first-constituent
only) is used as a prime for its whole word target. These priming conditions were compared to their unrelated
controls. These conditions were latin-squared and blocked such that each word appeared in each of the
condition per block. To account for any possible long-lag priming effects, we factored in block order into our
design producing a completely within-subjects, fully factorial design: Word Type (4) ⇥ Constituency (2) ⇥
Priming (2) ⇥ Block Order (4).
Transparent Opaque Novel Orthographicprime target prime target prime target prime target
control doorbell teacup heirloom hogwash keybook winecloud brothel spinachidentity teacup teacup hogwash hogwash winecloud winecloud spinach spinachcontrol door teacup heir hogwash key winecloud broth spinach
constituent tea teacup hog hogwash wine winecloud spin spinach
Table 1: Design Matrix
2.3 Procedure
Prior to the experiment, each participant was capped with an EasyCap 29-channel passive scalp electrode
system placed with electrodes arranged according to the international 10/20 system. The impedances were
measured and corrected to below 10 kW. The participant then had their head shape digitized using the
Polhemus Fastrak system. Along with head shape, five head position marker coils are digitized to co-register
the participant’s head inside the MEG helmet where this coordinate space is later transformed to each
participant’s MRI space. The participant was then tested in a magnetically-shielded chamber, which is
integrated with an active shielding system.
The study used a partial priming word naming task. In this task, a fixation cross first appears followed
by a prime then a target. All of the visual presentations are 300 ms with an inter-stimulus interval of
600ms. The task is for the participant to read aloud the target word from the onset on the screen. Audio
was sampled from the presentation of the target to the activation of a voice trigger (see Appendix). Their
9
71
de tarefa aqui foi reduzir a quantidade de estímulos, não sendo necessária a inclusão de
não-palavras.
Figura 15: A tarefa consistia em ler em voz alta a segunda palavra de cada par apresentado.
Cada palavra experimental foi apresentada por 300 milissegundos (ms) e precedida
por uma cruz de fixação, que também permanecia na tela por 300 ms. O intervalo entre
cada estímulo visual era de 300 ms. A tarefa era ler em voz alta a palavra alvo de cada
trial. O experimento completo de priming não será analisado nesta tese.
Para fins deste estudo, consideramos apenas os dados neurofisiológicos
relacionados à leitura do prime na condição de repetição (TEACUP-teacup). Assim, o
efeito de composicionalidade semântica intralexical será examinado como na leitura de
palavras isoladas, uma vez que as palavras usadas como prime não devem sofrer
influência das palavras precedentes, não relacionadas. Sendo assim, adotamos uma
metodologia análoga àquela usada por Zweig & Pylkkänen (2009), em que os autores
comparam diretamente palavras complexas – derivadas – com palavras monomorfêmicas,
em uma tarefa de decisão lexical.
Dessa forma, nosso desenho se reduz à simples comparação entre as palavras
compostas (TEACUP) e as palavras ortográficas (SPINACH) que serviram como primes
72
na condição de priming com repetição (TEACUP-teacup) do experimento descrito acima.
Como estamos utilizando os dados neurofisiológicos relacionados à leitura das palavras
que serviram como prime, não há dados comportamentais para essas palavras, uma vez que
não há nomeação das mesmas. Evitamos, assim, artefatos associados a movimentos
voluntários, que podem comprometer a análise dos efeitos de principal interesse
(HANSEN ET AL., 2010).
Essa análise foi pensada de maneira a isolar a atividade neuronal relacionada com
mecanismos computacionais básicos envolvidos na composição de sentido em palavras
compostas, a partir da combinação dos sentidos de seus constituintes. Para esse fim,
palavras compostas (TRANSPARENTES e OPACAS) foram contrastadas com palavras
controle simples (SIMPLES) de mesmo tamanho, conforme ilustrado na Tabela 2, a seguir.
As palavras compostas NOVAS foram incluídas como forma de explorar um efeito
indiscutível de composicionalidade.
Condições Exemplos
TRANSPARENTE SAILBOAT
OPACA HOGWASH
NOVA LADYFORK
SIMPLES SPINACH
Tabela 2: Desenho experimental analisado.
Considerando o recorte descrito acima, cada participante foi exposto então a 240
palavras experimentais, 60 pertencentes a cada condição. Essas palavras experimentais
foram apresentadas randomicamente entre 720 palavras distratoras, que constituíam, por
sua vez, os outros itens do experimento de priming com nomeação.
73
Antes do experimento, a forma da cabeça de cada sujeito era digitalizada e quatro
pontos localizadores eram marcados, usando o sistema Fastscan. A forma da cabeça é
usada durante a análise para possibilitar a localização da fonte da atividade de interesse
para o nosso estudo. Esses marcadores são corregistrados para localizar a cabeça do
participante em relação aos sensores do magnetoencefalógrafo, gerando sua imagem de
ressonância magnética (MRI). Uma das vantagens da técnica de MEG é justamente poder
localizar a fonte da atividade elétrica.
Figura 16: Forma da cabeça sendo digitalizada. O rosto foi coberto nesta figura para preservar a identidade do participante.
Durante o experimento, os participantes permanecem deitados em um ambiente
magneticamente isolado, e são capazes de ler os estímulos projetados em uma tela. Os
dados de MEG foram coletados usando um sistema gradiométrico axial de cabeça inteira,
com 157 canais (Kanazawa Institute of Technology, Nonoichi, Japão). A gravação foi
feita em corrente direta (DC) – ou seja, sem filtro passa-alto –, com filtro passa-baixo de
200Hz, e com filtro notch de 60Hz.
Após a aquisição dos dados, foi aplicado um redutor de ruído e um filtro passa-
baixo a 40Hz. A gravação de todo o experimento foi segmentada nas épocas de interesse,
de -100 ms, antes do aparecimento da palavra experimental, a 900 ms após o aparecimento.
O início do intervalo é importante para garantir que haja uma base de atividade neuronal
74
não relacionada ao evento, de modo que a atividade relacionada ao evento possa ter um
patamar com a qual será comparada. O final do intervalo foi determinado com o intuito de
garantir que nenhuma atividade relacionada ao evento fosse perdida, considerando que
atividades relacionadas ao reconhecimento de palavras devem se dar até cerca de 500 ms
(PYLKKÄNEN & MARANTZ, 2003).
Figura 17: ambiente magneticamente isolado (foto ilustrativa).
Utilizando a forma da cabeça de cada sujeito, foram criados os arquivos de MRI a
partir dos quais foi gerado um modelo esférico ideal para cada participante. Foram
rejeitados trials em que a amplitude máxima excedia o limite de 3000 fT. As médias para
cada sujeito, em cada condição, foram geradas utilizando o software BESA
(http://www.besa.de/). Foram excluídos da análise os sujeitos em que mais de 30% dos
trials foram rejeitados, permanecendo apenas 8, nos quais foi feita a análise estatística.
5.3. Análise
Composicionalidade semântica. Para observar efeitos relacionados à composição
semântica intralexical, examinamos a atividade localizada em uma região de interesse
75
específica – vmPFC – determinada a partir de estudos anteriores que investigaram questões
semelhantes (cf. Capútulo 4). Para verificar se havia efeito significativo nessa região,
aplicamos um teste não-paramétrico de permutações baseadas em clusters (MARIS, 2007),
para o intervalo de interesse em torno das palavras experimentais (300 ms até 500 ms após
o aparecimento da palavra). Conforme destacam Maris & Oostenveld (2007),
existem muitos aspectos nos dados de origem biológica que podem diferir entre condições experimentais, o que implica maior exigência dos modelos estatísticos usados para analisar esses dados. Os modelos não-paramétricos atendem em grande medida essas exigências. 27 (MARIS & OOSTENVELD, 2007; p. 178)
Especificamente, foi utilizado o teste estatístico desenvolvido para a análise de
Bemis & Pylkkänen (2011), capaz de isolar clusters de pontos no tempo nos quais a
atividade na região de interesse exibe um padrão esperado, de acordo com a hipótese sobre
a composicionalidade intralexical nas palavras compostas.
Composição sintática. Aplicamos esses mesmos parâmetros para a análise da atividade
localizada no lobo temporal anterior esquerdo (left anterior temporal lobe – LATL), que
tem sido associada com composição sintática (BEMIS & PYLKKÄNEN, 2011;
BRENNAN ET AL., 2010). Como os mecanismos sintáticos que regem a composição
entre palavras em uma sentença não devem ser distintos dos mecanismos que regem
morfemas dentro das palavras (MARANTZ, 1998), esperamos encontrar um efeito da
composicionalidade intralexical nessa área.
27 there are many aspects of the biological data that may differ between the experimental conditions[…]. This puts serious demands on the statistical framework that will be used for the analysis of these data, and the nonparametric statistical framework meets these demands to a large extent.
76
Decomposição morfêmica. A fim de comparar nossos resultados com estudos de
decomposição lexical anteriores, procuramos também efeitos no giro fusiforme inferior
esquerdo, conhecido como a área da forma visual da palavra (visual word form área –
VWFA). Estudos que contrastaram palavras simples com palavras derivadas complexas
encontraram aumento das amplitudes para palavras complexas, em torno de 170 ms após a
apresentação da palavra.
Região de interesse 1: Córtex pré-frontal ventro-medial (vmPFC)
Conforme foi relatado mais detalhadamente no Capítulo 4, estudos recentes têm
destacado atividades no vmPFC como estando associadas a processos de composição
semântica. Pylkkänen & McElree (2007), Brennan & Pylkkänen (2008, 2010), Pylkkenen
et al. (2009b) obtiveram aumento da atividade cortical nessa região ao manipular a
quantidade de computações necessárias para a composição de sentido em sentenças de
mesmo tamanho. Pylkkänen et al. (2009a) relataram ainda atividade aumentada nessa
região quando foram apresentadas aos participantes sentenças com violações semânticas,
em oposição a sentenças bem formadas, com violações apenas relacionadas com
conhecimento de mundo. Essa atividade isolada nesses estudos ocorre em torno de 400 ms
após o aparecimento da palavra crítica para o experimento, e foi denominada como Campo
Medial Anterior (Anterior Midline Field - AMF). Bemis & Pylkkänen (2011) apresentam
resultados similares ao contrastar nomes em contextos composicionais – e.g. antecedidos
por um adjetivo, como em red boat – com nomes em contextos não composicionais – e.g.
após uma sequência de letras, como em xkq boat, ou dentro de uma lista, como em cup,
boat.
A localização precisa dos efeitos encontrados no vmPFC é variável entre os
estudos. Por isso, para verificar o papel dessa região no processamento da composição de
77
sentido intralexical, nossa região de interesse foi localizada aproximadamente em toda a
área de Broadmann 1128 (Bemis & Pylkkänen, 2011).
Figura 18: Área de Brodmann 11
Região de interesse 2: Lobo temporal anterior esquerdo – LATL
Como este estudo comparou palavras complexas com palavras simples, incluímos o
lobo temporal esquerdo como área de interesse. Estudos similares comparando sentenças
(FRIEDERICI ET AL., 2000) ou sintagmas adjetivais (BEMIS & PYLKKÄNEN, 2011)
com listas de palavras encontraram aumento consistente da atividade nessa área, associado
à complexidade sintática. A área de interesse foi definida englobando a parte esquerda da
Área de Brodmann 38 e a porção esquerda mais anterior das Áreas de Brodmann 20 e 21.
Figura 19: Áreas de Brodmann 38, 20 e 21, respectivamente.
28 A Área de Brodmann 11 (BA11) está localizada no córtex frontal e cobre a parte medial da superfície ventral do lobo frontal.
78
Região de interesse 3: Giro Fusiforme Inferior Esquerdo (Área da Forma Visual da Palavra - VWFA) – LIFG
O giro fusiforme inferior esquerdo (left inferior fusiform gyrus – LIFG) tem sido
apontado em estudos com fMRI como estando relacionado com a forma visual da palavra
(COHEN ET AL., 2002; DEHAENE ET AL., 2002). Estudos com MEG têm destacado
um efeito para decomponibilidade morfêmica localizado nessa área, em torno de 150-200
ms (M170) após a visualização do estímulo (ZWEIG & PYLKKÄNEN, 2009; LEWIS ET
AL., 2011; SOLOMYAK & MARANTZ, 2009). Esses efeitos são encontrados em
palavras derivadas, não havendo ainda estudos que tenham encontrado efeitos no
componente M170 em palavras compostas.
5.4. Resultados
vmPFC. Os resultados revelaram um efeito significativo da complexidade lexical no
vmPFC, em torno de 400 ms após o aparecimento da palavra na tela para as condições
transparente (p=0,018) e nova (p=0,024), para o intervalo entre 300 ms e 500 ms,
conforme ilustrado nos Gráficos 1 e 2 . As amplitudes da condição opaca não
apresentaram diferença significativa em relação à condição controle (p=0.096), para o
mesmo intervalo entre 300 e 500 ms (Gráfico 3).
LATL. O teste de permutação não revelou clusters significativos associados à composição
sintática, para nenhuma das condições analisadas (Gráfico 4).
LIFG. O teste de permutação não revelou clusters significativos associados à
decomposição morfêmica, para nenhuma das condições analisadas (Gráfico 5).
79
Gráfico 1: amplitudes da condição transparente (TR) comparada com a condição controle simples (ORab). Áreas em preto destacam diferença significativa (p=0.018) entre as amplitudes no intervalo.
Gráfico 2: amplitudes da condição nova (NV) comparada com a condição controle simples (ORab). Áreas em preto destacam diferença significativa (p=0.024) entre as amplitudes no intervalo.
Gráfico 3: amplitudes da condição opaca (OP) comparada com a condição controle simples (ORab). Área em cinza destaca cluster, porém a diferença entre as amplitudes no intervalo não é significativa (p=0.096).
80
Gráfico 4: Não foram encontrados clusters significativos para a condição transparente (TR), opaca (OP) ou nova (NV), quando contrastadas com a condição simples (ORab).
Gráfico 5 : Não foram encontrados clusters significativos para a condição transparente (TR), opaca (OP) ou nova (NV), quando contrastadas com a condição simples (ORab).
5.5. Discussão
O resultado deste estudo está de acordo com a literatura do processamento da
composicionalidade e destaca-se por observar efeitos combinatórios em um contexto tão
mínimo quanto a composição entre duas raízes para formar uma palavra composta. Esse é
mais um indicativo de que há uma relação do AMF com a construção de significados
linguísticos mais básicos – ou mais gerais –, não associados apenas ao tipo de computação
recrutada para a resolução de mudança de tipo (semantic mismatch).
Esses efeitos se mostraram apenas nas condições Transparente e Nova, não
81
havendo efeito significativo para a condição Opaca. Esses resultados podem indicar que
existe uma ativação transitória dos morfemas constituintes, nas palavras opacas. Ou seja,
nos estágios mais iniciais do reconhecimento, o estímulo é decomposto, havendo ativação
das raízes. Em seguida, como os significados dessas raízes não são relevantes para a
ativação do sentido da palavra inteira, eles seriam descartados, não havendo o momento de
recomposição detectado para as palavras transparentes e novas. Foi apontada a existência
de um cluster para essa condição, representado pela zona em cinza no Gráfico 3, porque o
p-valor estava abaixo do limite definido para p<0.3). As comparações múltiplas, no
entanto, não indicaram significância para esse cluster (p=0.096). Esse resultado, “na
margem”, pode ter sido determinado pelos itens utilizados na condição opaca. Controlar a
transparência semântica em palavras compostas é uma tarefa intricada. Isso se deve ao
fato de que os constituintes de palavras compostas, mesmo as opacas, apresentam alguma
relação originária (histórica, etimológica) com a palavra inteira, não sendo simples
controlar a variabilidade entre sujeitos em recuperar essa relação. Sendo assim, não há
como garantir que os resultados obtidos no teste de relação semântica utilizando o Amazon
Mechanical Turk sejam reproduzidos pelos participantes do experimento com MEG. As
palavras compostas utilizadas neste experimento são equivalentes às palavras consideradas
como “opacas etimologicamente relacionadas”, em experimentos clássicos de
Psicolinguística com palavras derivadas. Seriam palavras com relação [+morfológica]
[+ortográfica ou fonológica] [-semântica], como, por exemplo, apartment (RASTLE ET
AL., 2000). Novamente, não é simples determinar de maneira direta a invisibilidade do
sentido de apart na palavra apartment. Uma solução que contornaria esse problema
poderia ser usar palavras do tipo carpet, que pode ser decomposta em car e pet, mas que
não é, na realidade, uma palavra composta. Palavras pseudocompostas desse tipo seriam
equivalentes às palavras pseudoderivadas como brother.
82
Como no contraste realizado no experimento desta tese houve uma sobreposição da
complexidade sintática e semântica (palavras semanticamente complexas são também
sintatica- ou morfologicamente complexas), esperávamos encontrar efeitos tanto de
composição semântica – indicada pelo aumento do AMF – quanto de composição sintática
– indicada pelo aumento da atividade no lobo temporal anterior esquerdo (LATL),
apontado por estudos recentes como estando implicado em composições sintáticas básicas
(BEMIS & PYLKKÄNEN, 2011; BRENNAN & PYLKKÄNEN, 2010). No entanto, neste
estudo não foram identificados clusters indicando aumento significativo da atividade no
LATL. Apesar de não se poder estabelecer uma análise conclusiva baseada na ausência de
um efeito, pode-se argumentar aqui que o tipo de análise realizada – por exemplo, o
critério para localizar a área de interesse – não teve força suficiente para produzir uma
relevância estatística. Por outro lado, há ainda a possibilidade de que a manipulação da
complexidade intralexical não seja mesmo capaz de gerar efeitos combinatórios
detectáveis dentro dos parâmetros utilizados, da mesma forma como foi alcançada no nível
sentencial e sintagmático pelos outros pesquisadores (BEMIS & PYLKKÄNEN, 2011;
BRENNAN & PYLKKÄNEN, 2010). É importante ressaltar que, ainda que as palavras
compostas utilizadas nesta tese sejam bastante similares aos sintagmas utilizados por
Bemis & Pylkkänen (2011), existe uma diferença estrutural entre o tipo de composição
envolvida. O tipo de computação não foi controlado a priori durante a escolha dos nossos
estímulos. No entanto, uma análise post hoc revela que o tipo predominante foi aquele
encontrado em palavras como TEACUP. Nessas palavras, existe uma hierarquia diferente
da existente em sintagmas como red boat, utilizados em Bemis & Pylkkanen (2011). Em
SAILBOAT, existe uma estrutura hierárquica não explícita envolvendo uma composição
do tipo [CUP] [for TEA], que culmina em uma atribuição de papel temático. Isso não
ocorre na composição red boat, em que há uma relação do tipo [red]+[boat]. Hoje há uma
83
vasta literatura lançando a ideia de que existe uma fisiologia diferente para esses diferentes
tipos de computação (FRIEDERICI, 2011; BERWICK & CHOMSKY, 2011; BERWICK
ET AL., 2013). Para que se obtenha uma caracterização mais completa do processamento
das palavras compostas, experimentos futuros devem levar em conta esses fatores.
É interessante destacar que também não foram encontrados efeitos de
decomposição morfo-ortográfica no giro fusiforme inferior esquerdo, relacionados com a
forma visual da palavra ou do morfema (COHEN ET AL., 2002; DAHAENE ET AL.,
2002; LEWIS ET AL., 2011). O efeito no componente M170 foi relatado por Zweig &
Pylkkänen (2009), ao comparar palavras derivadas com palavras simples, analogamente ao
que fizemos com palavas compostas no experimento desta tese. Como ainda não há
estudos que encontram M170 em palavras compostas, isso poderia ser um indício de que
esse componente esteja de alguma forma associado à presença de morfemas flexionais (cf.
Affix Stripping – TAFT & FORSTER, 1975). Essa afirmação, no entanto, precisaria ser
investigada de maneira mais sistemática. Estudos anteriores revelam decomposição inicial
em palavras compostas (FIORENTINO E POEPPEL, 2007b), independentemente da
transparência semântica, o que indica decomposição pré-lexical. Porém, não é claro que os
mesmos mecanismos estejam envolvidos na decomposição de palavras derivadas e
palavras compostas, ainda que os resultados comportamentais de priming e decisão lexical
sejam qualitativamente análogos.
Considerando que palavras complexas sejam representadas e acessadas por meio de
seus constituintes, as palavras compostas podem ser abordadas como sendo o resultado de
uma simples concatenação entre dois elementos lexicais. No entanto, a exata relação que
pode existir entre esses dois elementos é bastante variável (JACKENDOFF, 2002;
DRESSLER, 2006; JAREMA, 2006; BISETTO & SCALISE, 2005). De acordo com
Libben (2006), palavras compostas devem ser facilmente segmentáveis entre seus
84
morfemas constituintes. Caso contrário, palavras compostas novas não seriam
interpretáveis. Por outro lado, existe um domínio idiossincrático que coloca essas palavras
“em uma interseção entre itens lexicais e sentenças, refletindo as propriedades tanto das
representações linguísticas na mente, quanto do processamento gramatical” (LIBBEN,
2006)29. Modelos eficientes de processamento lexical devem ser capazes de dar conta
dessas diferenças.
Dentro de uma perspectiva de buscar uma organologia computacional da
linguagem (EMBICK & POEPPEL, 2005), estudos recentes, apresentados acima, têm
procurado restringir mais detalhadamente as computações implicadas na construção do
sentido complexo (cf. revisão em PYLKKÄNEN ET AL., 2011). Assim, esses estudos
visam contribuir para uma caracterização mais completa dos mecanismos neurofisiológicos
implicados na dinâmica espaço-temporal da construção de sentido, especificamente, e –
ainda mais ambiciosamente – na compreensão e produção de expressões linguísticas em
geral. Esss pesquisas, nessa direção, têm apontado o vmPFC e o LATL como áreas
implicadas em mecanismos relacionados a essa dinâmica de construção de sentido.
Esses estudos, incluindo o realizado para esta tese, se enquadram em um momento
de importante mudança paradigmática na pesquisa sobre as bases neurofisiológicas da
linguagem (POEPPEL & EMBICK, 2005; MARANTZ, 2005). Diferentemente de
modelos clássicos que descrevem uma rede compartimentada em áreas corticais
responsáveis por funções tão complexas quanto Sintaxe, Semântica e Fonologia, essa nova
perspectiva procura decompor essas funções em seus primitivos computacionais. Uma vez
bem caracterizados esses primitivos, o desafio é relacioná-los com estruturas e funções
corticais localizadas, analogamente à abordagem de Marr (1982) para a percepção da
29 “compound words are structures at the cross-roads between words and sentences reflecting both the properties of linguistic representation in the mind and grammatical processing.” (LIBBEN, 2006; p. 3)
85
visão. Como já foi ponderado no Capítulo 2, essa tarefa não é óbvia e depende do sucesso
em estabelecer uma ponte provável entre o nível de representação algorítmica e o nível
implementacional (MARR, 1982). Concretamente, isso significa encontrar bases
estruturais e funcionais do cérebro que possam servir como substrato físico para a
realização dessas tarefas de processamento.
Com relação ao processamento de palavras compostas, especificamente, o resultado
deste estudo destaca a existência de um índice de MEG associado à composição pós-
lexical, tanto para palavras compostas transparentes quanto para as novas. Como esse
componente ocorre em torno dos 400 ms, parece um candidato plausível para atuar na
recomposição desses primitivos semânticos, já que o acesso lexical ocorre aos 350 ms
(Figura 20).
Figura 20: Estágios do processamento lexical (adaptado do website do Laboratório de Neurolinguística da NYU)
Esse índice, no entanto, se generaliza para outros domínios além da modificação
relacional que ocorre entre as duas raízes de uma palavra composta, abrangendo também
regras que envolvem a resolução de coerção em sentenças (PYLKKÄNEN & McELREE,
2007; BRENNAN & PYLKKÄNEN, 2008; 2010) e a distinção entre restrições semânticas
e conhecimento de mundo (PYLKKÄNEN ET AL., 2009). Essas características apontam
para um mecanismo combinatório bastante geral e plurifacetado.
86
Além disso, a região de onde parece emergir o AMF também é associada, em
estudos distintos, a cognições não linguísticas como tomada de decisão, recompensa e
teoria da mente (WALLIS, 2007; MAGUIRE ET AL., 2010; AMODIO & FRITH, 2006).
Ainda assim, têm sido encontrados efeitos consistentes no vmPFC sempre que se manipula
a composicionalidade semântica, o que pode indicar que o AMF seja um componente
associado à realização da composicionalidade em um domínio mais geral. Como afirma
PYLKKÄNEN (2011),
é bem possível que o cérebro realize composição de maneira bastante similar em vários domínios – e essa intuição é o que amplamente impulsiona nosso trabalho sobre a generalidade do AMF –, mas não acreditamos que um modelo cognitivo raso seja o tipo de teoria mais adequado para nos guiar na realização de experimentos. Se não procurarmos no cérebro certas distinções motivadas teoricamente, certamente não as encontraremos, caso elas de fato estejam lá.30 (PYLKKÄNEN ET AL, 2011; p.18).
Nesse sentido, é possível considerar a hipótese do AMF como sendo um correlato
da composicionalidade semântica, levando-se em conta que esses mecanismos
combinatórios são utilizados em diferentes níveis. Isso indicaria que a composição
semântica ocorre em um sistema que envolve diferentes regiões, cujas funções podem ser
mais gerais ou mais específicas em termos das computações a que estão associadas.
30 “We actually think it is quite possible that the brain performs composition in various domains in rather similar ways—this intuition is largely what drives our work on the domain generality of the AMF—but we do not believe that a flat cognitive model is the right kind of theory to guide us when designing experiments. If we do not look for certain (theoretically well-motivated) distinctions in the brain, we certainly will not find them, should they, in fact, be there.” (PYLKKÄNEN ET AL., 2011)
87
_____________________________________________seis
Conclusão
Este trabalho procurou discutir como os avanços teóricos na pesquisa linguística e a
disponibilidade de técnicas cada vez mais sensíveis para medir a atividade cortical têm
trazido mudanças na maneira de se explorarem as bases neurofisiológicas da linguagam.
Nessa pespectiva de mudança paradigmática, o experimento realizado para esta tese teve
como objetivo examinar efeitos combinatórios de sentido dentro de palavras compostas em
inglês.
A construção do sentido complexo não é uma tarefa trivial. Algumas vezes,
expressões superficialmente similares apresentam leituras consideravelmente distintas.
Essa diferença, no entanto, não pode ser deduzida em termos da relação sintática entre os
constituintes de cada expressão. Por exemplo, qualquer falante de inglês é capaz de intuir
a diferença entre sentenças como 1) The stylist combed the hair straight (O cabeleireiro
penteou o cabelo até ficar liso) e 2) The stylist combed the hair wet31 (O cabeleireiro
penteou o cabelo enquanto o cabelo estava molhado). Em (1), straight (liso) é o resultado
do ato de pentear. Em (2) wet (molhado) descreve o estado em que estava o cabelo durante
o ato de ser penteado. Ainda que straight e wet ocupem a mesma posição sintática na
oração, nenhum falante da língua diria que, na frase 2, o ato de pentear fez com que o
cabelo ficasse molhado. A pesquisa linguística que estuda a interface sintaxe-semântica
tem oferecido explicações para essas diferenças, apresentando um modelo teórico de como
o sentido complexo deve ser computado.
Curiosamente, no entanto, a pesquisa em neurociência da linguagem se
desenvolveu sem considerar esses trabalhos. Estudos que se propuseram estudar as bases
31 Exemplos retirados de Pylkkänen & McElree (2006).
88
neurofisiológicas da semântica o fizeram sem determinar o tipo de computação a ser
investigada, estabelecendo correlações genéricas e subespecificadas. Recentemente, no
entanto, avanços nas técnicas de imagem e neuroanatômicas trouxeram um aumento na
resolução dos dados, mostrando a necessidade de reformulação dos modelos tradicionais.
A aproximação entre a neurociência e as ciências cognitivas (entre elas, a pesquisa
linguística) permitiu um aperfeiçoamento também da resolução conceitual, tornando
explícitos computacionalmente os processos a serem investigados.
Com relação especificamente à composição semântica, estudos recentes utilizando
a técnica da magnetoencefalografia têm buscado uma aproximação mais sistemática desses
modelos computacionais. Esses trabalhos têm manipulado diretamente as propriedades
composicionais dos estímulos, buscando não só localizar, mas entender como se dá a
codificação desse sistema de construção de sentidos complexos (PYLKKÄNEN ET AL.,
2011).
Segundo essas pesquisas, o sistema envolvido em processos combinatórios deve
incluir pelo menos o lobo temporal anterior esquerdo – LATL (BRENNAN ET AL., 2010;
BEMIS & PYLKKÄNEN, 2011) e o córtex pré-frontal ventromedial – vmPFC
(PYLKKÄNEN ET MCELREE, 2007; PYLKKÄNEN ET AL, 2009; PYLKKÄNEN,
OLIVERI & SMART, 2009; BEMIS & PYLKKÄNEN, 2011). O LATL tem sido
associado com a composição sintagmática entre um nome e um adjetivo (red boat), mas
não com a composição entre um predicado e um argumento (eats meat). O vmPFC está
envolvido com diferentes tipos de computação semântica, desde a resolução de coerção
(PYLKKÄNEN & McELREE, 2007) até a simples operação de modificação intersectiva
(BEMIS & PYLKKÄNEN, 2011).
O experimento realizado para esta tese, utilizando a técnica de MEG, indicou que o
vmPFC estaria também implicado na composição do significado de duas raízes lexicais de
89
uma palavra composta, corroborando a generalidade das operações combinatórias
codificadas espacialmente nessa área. A atividade associada ao vmPFC foi encontrada
comparando sistematicamente palavras compostas (SAILBOAT) com palavras simples
(SPINACH), variando, assim, a carga computacional. A leitura das palavras compostas
obteve maiores amplitudes na forma do Campo Medial Anterior (AMF), componente
gerado em torno de 400 ms após o início da apresentação da palavra.
Para fins de diálogo com a literatura sobre o processamento de palavras, o desenho
experimental foi preparado de forma a manipular a transparência semântica. Sendo assim,
as palavras compostas foram separadas em três condições: 1) transparentes, 2) opacas, e 3)
novas. As palavras novas foram incluídas para forçar efeitos de composicionalidade, uma
vez que essas palavras não estariam representadas no léxico mental. Além disso, existem
argumentos sugerindo que qualquer palavra composta lexicalizada nunca é
semanticamente transparente (LIBBEN, 2006). Por exemplo, o significado lexicalizado da
palavra teacup é xícara para chá (e também pode ser usada para outras bebidas, geralmente
quentes, mas não necessariamente). Mas alguém que não conhece o significado dessa
palavra pode inferir que seja uma xícara de chá, com chá… A transparência semântica foi
exaustivamente estudada em pesquisas sobre o processamento de palavras e foi apontada
como fator de decomponibilidade no acesso lexical, sobretudo em experimentos de
priming não-encoberto e intermodal. Estudos recentes, no entanto, utilizando priming
encoberto e magnetoencefalografia, revelam uma decomponibilidade mais radical que não
é condicionada pela relação semântica entre os constituintes e o todo. Como ocorre essa
decomposição generalizada nos estágios mais iniciais do reconhecimento lexical, deve
haver um estágio posterior de recomposição que possa dar conta das diferenças entre
palavras transparentes e opacas. O efeito encontrado para palavras opacas não foi
90
estatisticamente significativo em relação aos controles ortográficos, indicando uma
diferença entre essas palavras e as palavras transparentes e novas.
A seleção das palavras compostas para o experimento desta tese não levou em
consideração os diferentes tipos de relação entre os constituintes (por exemplo,
coordenação ou subordinação), uma vez que essa informação não deveria ser relevante
para o desenho experimental utilizado. O objetivo era apenas comparar palavras de maior
carga computacional com palavras simples, monomorfêmicas. Esse tipo de manipulação
pode ser interessante para testes futuros, tanto para restringir ainda mais os tipos de
computação que devem estar associadas com o vmPFC quanto para testar hipóteses sobre o
processamento de palavras compostas32. As palavras compostas, assim como frases
envolvendo coerção, também podem ser um objeto interessante para se testar o mismatch
sintático-semântico, já que elas apresentam uma relação combinatória que não é expressa
formalmente.
Entre as perspectivas futuras, figura também a possibilidade de se realizar uma
análise acústica das palavras compostas – sobretudo as novas –, para verificar se elas são
pronunciadas como uma palavra ou como duas palavras. Dessa forma examinamos o status
lexical das palavras compostas pela via fonológica, diferenciando-as de sintagmas
adjetivais. Ainda, manipulações futuras devem também levar em conta a diferença entre
palavras opacas pseudocompostas (CARPET) e etimológicas (HOGWASH), se aquelas
32 Recentemente, estudos utilizando a técnica de DTI (Diffusion Tensor Imaging) – que é capaz de detectar a densidade da substância branca, diretamente relacionada com a conexão entre regiões no cérebro – têm se somado aos estudos funcionais de imagem, possibilitando uma caracterização mais acurada da dinâmica envolvida no sistema neuronal de processamento da linguagem. Esses estudos têm apontado a existência de pelo menos duas rotas ventrais e duas rotas dorsais responsáveis pela transferência de informação entre regiões do cérebro envolvidas em operações linguísticas (FRIEDERICI & GIERHAN, 2013). As evidências disponíveis têm permitido distinguir computações hierárquicas de listas coordenadas. Essa informação pode ser útil para manipular as relações entre os constituintes das palavras compostas.
91
forem suficientemente produtivas na língua. No experimento realizado para esta tese,
também não foi controlada a possibilidade de algumas das palavras serem polissêmicas.
Por exemplo, a palavra hogwash tem tanto o significado de “desatino” quanto de
“lavagem” (comida para porcos). Se considerarmos o segundo significado, a opacidade se
perde. Além disso, é possível ainda que haja efeitos indesejáveis de frequência, uma vez
que um dos significados tende a ser mais frequente. Outra manipulação que deixamos de
incluir foi a transparência/opacidade de apenas um dos constituintes da palavra composta,
gerando quatro categorias diferentes: Transparente-Transparente (SAILBOAT), Opaca-
Opaca (HOGWASH), Transparente-Opaca (SHOEHORN) e Opaca-Transparente
(YELLOWBELLY). Esses fatores deverão ser levados em consideração em nossos
experimentos que darão seguimento a esta pesquisa.
Nesta tese, identificamos um possível correlato para a composicionalidade
semântica pós-lexical e discutimos alguns desafios e perspectivas envolvidos na tentativa
de aproximar linguística e neurobiologia. Crucialmente, as operações computacionais
definidas pela pesquisa linguística devem contribuir para conferir maior caráter explicativo
à neurociência da linguagem. O caminho contrário, no entanto, é um pouco mais
complexo.
Para a linguagem, essa abordagem biolinguística me parece bastante sólida. Mas perguntas básicas ainda devem ser respondidas antes que haja muita esperança sobre a implementação celular de procedimentos recursivos. […] Podemos antecipar que as diferentes ontologias vão interagir, criando condições significativas de um nível de análise para o outro, talvez em última análise convergindo para a unificação. Mas não devemos confundir truísmos por teses concretas, não havendo espaço para dogmatismo sobre como o assunto pode caminhar para uma resolução.33 (CHOMSKY, 2000; p. 27)
33 For language, this biolinguistic approach seems to me very sound. But elementary questions remain to be answered before there will be much hope of solving problems about the cellular implementation of recursive procedures. (p. 20) […] We may anticipate that richer bodies of doctrine will interact, setting significant conditions from one level of analysis for another, perhaps ultimately converging in true unification. But we should not mistake truisms for substantive theses, and there is no place for dogmatism as to how the issues might move toward resolution.
92
Não obstante, o exercício de pensar como as computações linguísticas são
implementadas em diferentes domínios deve ser informativo para a pesquisa linguística, da
mesma forma que o são experimentos comportamentais e julgamentos de gramaticalidade.
Este foi o primeiro experimento que apontou o Campo Medial Anterior (AMF)
como um correlato para a composição do sentido complexo em palavras compostas. Esse
componente têm sido encontrado sistematicamente em uma série de trabalhos que
manipulam diferentes tipos de operações combinatórias e, nesta tese, mostramos que ele
também é sensível à composicionalidade entre morfemas lexicais. Assim como o M350 já
tem sido usado como um índice de acesso lexical, podendo informar questões relativas à
ativação da raiz de uma palavra, o AMF pode ser usado como uma medida dependente
para examinar os efeitos combinatórios posteriores à ativação dos morfemas. Os modelos
psicolinguísticos e da teoria linguística já fazem distinções mais sofisticadas sobre as
relações entre constituintes, condicionadas por fatores como transparência semântica,
componencialidade, estrutura hierárquica, núcleo, ordem e categoria dos constituintes. Há
ainda muitas questões em aberto sobre o processamento lexical, que não nos propusemos
responder, tais como o lugar da arbitrariedade em palavras multimorfêmicas e a dinâmica
das interações entre constituintes de palavras compostas em diferentes tipos de relações. A
pesquisa aqui reportada, no entanto, deve contribuir para que se possa levar adiante o
entendimento de como representações e computações interagem na dinâmica espaço-
temporal da ativação de uma palavra.
93
_______________________________________referências Almeida, R. G. (2004) The effect of context on the processing of type-shifting verbs. Brain and Language, 90, 249-261. Amodio DM., Frith CD. Meeting of minds: the medial frontal cortex and social cognition. Nat Rev Neurosci. 2006 Apr;7(4):268-77. Amunts K, Lenzen M, Friederici AD, et al. (2010) Broca's region: novel organizational principles and multiple receptor mapping. PLoS Biol 8(9): e1000489. doi:10.1371/journal.pbio.1000489. Andrews S., Miller B. & Rayner K. (2004) Eye fixation measures of morphological segmentation of compound words: There is a mouse in the mousetrap. European Journal of Cognitive Psychology, 16(2), 285-311. Barker C. (2002) Continuations and the nature of quantification. Natural Language Semantics. 10:211–242. Bear MF., Connors, BW., Paradiso MA. (2007). Neuroscience: Exploring the Brain, 3rd edition. Lippincott Williams & Wilkins: USA. Bechara A, Damasio H, Damasio AR. (2000) Emotion, decision making and the orbitofrontal cortex. Cerebral Cortex,10: 295-307. Bemis DK., & Pylkkänen L. (2011). Simple Composition: An MEG investigation into the comprehension of minimal linguistic phrases. Journal of Neuroscience, 31(8): 2801-2814. Berwick, R.C. and Chomsky, N. (2011). The Biolinguistic Program: The Current State of its Evolution. In A.M. Di Sciullo and C. Boeckx (eds.). The Biolinguistic Entreprise: New Perspectives on the Evolution and Nature of the Human Language Faculty. 19–41. Oxford: Oxford University Press. Berwick RC, Friederici AD, Chomsky N, Bolhuis JJ. (2013) Evolution, brain, and the nature of language. Trends Cogn. Sci. 17, 89–98. Bisetto A, Scalise S. (2005) Classification of compounds. Lingue e Linguaggio 2: 319-332. Borer, H. (2000) Exo-skeletal vs. endo-skeletal explanations: syntactic projections and the lexicon. Unpublished ms., University of Southern California, Los Angeles. Brennan J, Pylkkänen L. (2008) Processing Events: Behavioral and neuromagnetic correlates of aspectual coercion. Brain and Language, 106, 132-143. Brennan J, Pylkkänen L. (2010) Processing Psych Verbs: Behavioral and MEG Measures
94
of Two Different Types of Semantic Complexity. Language and Cognitive Processes, 25 (6), 77-807. Broca P. (1861) Perte de la Parole, ramollissement chronique et destruction partielle du lobe antérieur gauche du cerveau. Bulletin de la Société Anthropologique, 2, 235-238. Brooks T, Garcia DC, Marantz A, Pylkkänen L. (2013). Combinatorial Effects within Compound Words during Visual Word Recognition. Poster presented at the 20th Annual Cognitive Neuroscience Society Meeting, San Francisco, CA. Butterworth B. (1983) Lexical representation. In B. Butterworth (Ed.), Language production, Vol. 2. London: Academic Press. Caramazza A, Shelton JR. (1998) Domain-specific knowledge systems in the brain: The animate-inanimate distinction. Journal of Cognitive Neuroscience, 10, 1-34. Chomsky N. (1957) Syntactic Structures, The Hague: Mouton. Chomsky N. (1991b) Linguistics and cognitive science: Problems and mysteries. In: Kasher A (ed). 1991, pp. 26-53. Chomsky N. (1995) The Minimalist Program. MIT Press. Chomsky N. (2000) New Horizons in the Study of Language and Mind. Cambridge, England: Cambridge University Press. Chomsky N. (2002) On Nature and Language. Cambridge University Press, 2002. Chomsky N. (2004) Beyond explanatory adequacy. In The cartography of syntactic structures. Vol. 3. Oxford: Oxford University Press. Chomsky N. (2013) Problems on projection. Lingua. Cohen L, Lehéricy S, Chochon F, et al. (2002) Language-specific tuning of visual cortex? Functional properties of the visual word form area. Brain. 125: 1054-1069. Cornelissen K, Laine M, Tarkiainen A, et al. (2003). Adult brain plasticity elicited by anomia treatment. Journal of Cognitive Neuroscience, 15, 444–461. Damasio AR. (1994) Descartes’ Error: Emotion, Reason, and the Human Brain. Grosset/Putnam, New York. Dehaene S. (2009) Reading in the brain. Penguin Viking, 2009. Dehaene S., Le Clec'h G., Poline JB, LeBihan D, Cohen L (2002). The visual word form area. A prelexical representation of visual words in the fusiform gyrus. NeuroReport,
95
13:321--325, 2002. Dikker S, Rabagliati H, Farmer TA, Pylkkänen L. (2010) Early occipital sensitivity to syntactic category is based on form typicality. Psychological Science, 21 635-40. Dikker S, Pylkkänen L. (2011) Before the N400: effects of lexical-semantic violations in visual cortex. Brain and Language, doi:10.1016/j.bandl.2011.02.006. Dressler WU, et al. On the typology of inflection class systems. Folia Linguista. 40: 51-74. Embick D, Hackl J, Schaeffer M, Kelepir A, Marantz A. (2001). A magnetoencephalographic component whose latency reflects lexical frequency. Cognitive Brain Research 10; 345–348. Embick, D., Poeppel, D. (2004). Defining the relation between linguistics and neuroscience. To appear in Twenty-first century psycholinguistics: Four cornerstones, Anne Cutler (ed.), Lawrence Erlbaum Associates. Federmeier KD, Kutas M. (1999) A rose by any other name: long-term memory structure and sentence processing. J. Mem. Lang. 41, 469–495 Fiorentino, R. (2006). Masked morphological priming of compound constituents: Specifying the locus of morpho-orthographic segmentation effects using English compound words. Unpublished rawdata.
Fiorentino R, Poeppel D. (2007) Compound words and structure in the lexicon. Language and Cognitive Processes, 12, 953-1000. Fiorentino R, Poeppel D. (2007b) Processing of compound words: An MEG study. Brain and Language, 103, 18-19. Forster KI. (1998) The pros and cons of masked priming. Journal of Psycholinguistic Research, 27, 203-233. França AI, Lemle M, Gesualdi A, Cagy M, Infantosi AFC. (2008) A neurofisiologia do acesso lexical: palavras em portugues. Veredas 2: 34-49. França AI, Costa MU, Garcia DC. (2013) Neurociência, alfabetização e mestrado profissional: uma perspectiva para a educação dos brasileiros. Olhares Transversais em Pesquisa, Tecnologia e Inovação. Tempo Brasileiro. 13-40. Frege G (1892). Über Sinn und Bedeutung (On Sense and Reference) Zeitschrift für Philosophie und philosophische Kritik100: 25-50. Translations from the Philosophical Writings of Gottlob Frege, 3rd ed., Blackwell, 1980. (1st ed. 1952). Frege G. (1923) Compound Thoughts Translated by P. Geach and R. H. Stoothoff in B. McGuiness (ed.) Collected Papers on Mathematics, Logic and Philosophy. Oxford: Basil
96
Blackwell. Friederici A, Frisch S. (2000) Verb Argument Structure Processing: The Role of Verb-Specific and Argument-Specific Information. Journal of Memory and Language 43. Friederici AD (2011) The Brain Basis of Language Processing: From Structure to Function. Physiol Rev, 91, 1357-1392. Friederici, A. D., & Gierhan, S. M. E. (2013). The language network. Current Opinion in Neurobiology, 23(2), 250-254. Fromkin V, et al (ed.). (2000) Linguistics: An introduction to linguistic theory. Malden, MA: Blackwell Publishers. Gagné CL. (2002) Lexical and relational influences on the processing of novel compounds. Brain and Language. 81, 723-735. Gallistel CR, King AP. (2010) Memory and the Computational Brain: Why Cognitive Science Will Transform Neuroscience. Published Online. DOI: 10.1002/9781444310498 Garcia DC. (2009) Elementos Estruturais no Acesso Lexical: o Reconhecimento de Palavras Multimorfemicas no Português Brasileiro. Dissertação de Mestrado. Rio de Janeiro: UFRJ/Faculdade de Letras. Geschwind N. (1979) Specializations of the human brain. Scientific American. 241(3):180–199. Giraud AL, Poeppel D. (2012) Cortical oscillations and speech processing: emerging computational principles and operations. Nature Neuroscience. 2012 Mar 18. doi: 10.1038/nn.3063. Giraudo H, Grainger J. (2000) Effects of prime word frequency and cumulative root frequency in masked morphological priming. Language and Cognitive Processes, 15, 421-444. Grodzinsky Y, Amunts K, eds. (2006) Broca’s Region. New York: Oxford University Press. Hagoort P, Hald L, Bastiaansen M, Petersson KM. (2004) Integration of word meaning and world knowledge in language comprehension. Science. Apr 16;304(5669):438-41. Epub 2004 Mar 18. Halgren E, Dhond R, Christensen N, et al. (2002) N400-like MEG responses modulated by semantic context, word frequency, and lexical class in sentences. Neuroimage, 17, 1101-1116.
97
Halle M, Marantz A. (1993) Distributed morphology and the pieces of inflection. In K. Hale and S.J. Keyser, eds., The View From Building 20: Linguistic Essays in Honor of Sylvain Bromberger. Cambridge, MA: MIT Press, 111 – 176. Hansen P, Kringelbach M, Salmelin R. (2010) MEG: An Introduction to Methods. Oxford University Press, Oxford, UK. Harley, H., Noyer, R. 1998a. 'Licensing in the non-lexicalist lexicon: nominalizations, vocabulary items and the Encyclopaedia.' In MITWPL 32: Papers from the UPenn/MIT Roundtable on Argument Structure and Aspect, ed. Heidi Harley. MITWPL, Cambridge, 119-137. Harley H, Noyer R. (1998b) Mixed nominalizations, short verb movement, and object shift in English. In Proceedings of NELS 28, ed. by P.N. Tamanji & K. Kusumoto, GLSA, Amherst, 143-157. Harley H. (2008) Compounding in Distributed Morphology. To appear in Lieber R. and Stekauer, P. (eds.). The Oxford Handbook of Compounding. Hay J. (2001) Lexical frequency in morphology: Is everything relative? Linguistics, 39, 1041–1070. Hay J, Baayen R. (2005) Shifting paradigms: gradient structure in morphology. Trends in Cognitive Sciences 9(7). 342-348. Heim I, Kratzer A. (1998) Semantics in Generative Grammar. Malden, Massachusetts: Blackwell Publishers. Hickok G, Poeppel D. (2004) Dorsal and ventral streams: a framework for understanding aspects of the functional anatomy of language. Cognition. 92, 67–99. Hickok G, Poeppel D. (2007) The cortical organization of speech perception. Nature Reviews Neuroscience. 8: 393-402. Hubel, D. (1995). Eye, brain, and vision. New York, NY: Scientific American Library.
Jackendoff R. (2002) Foundations of Language: Brain, Meaning, Grammar, Evolution. Oxford University Press. Jacobson P. (1999) Towards a variable-free semantics. Linguistics and Philosophy. 22, 117-184. Jarema G. (2006) Compound representation and processing: A cross-language perspective, In The representation and processing of compound words, LIBBEN, G. and JAREMA G., New York : Oxford University Press, 2006, pp. 45-70. Ji, H., Gagné, C. L., & Spalding, T. L. (2011) Benefits and costs of lexical decomposition
98
and semantic integration during the processing of transparent and opaque English compounds. Journal of Memory and Language, 65, 406-430. Juhasz BJ, Starr M, Inhoff AW, Placke L. The effects of morphology on the processing of compound words: Evidence from naming, lexical decisions, and eye fixations. British Journal of Psychology. 2003;94:223–244. Kutas M, Hillyard SA. (1980a). Reading between the lines: Event-related brain potentials during natural sentence processing. Brain and Language, 11(2), 354–373. Kutas, M. & Hillyard, S. A. (1980b). Reading senseless sentences: Brain potentials reflect semantic incongruity. Science, 207, 203–205. Kutas, M. & Federmeier, K. D. (2000). Electrophysiology reveals semantic memory use in language comprehension. Trends in Cognitive Sciences, 4(12), 463-470. Lau, E., Phillips, C., & Poeppel, D. (2008). A cortical network for semantics: (de)constructing the N400. Nature Reviews Neuroscience, 9, 920-933. Lewis, G., Solomyak, O., & Marantz, A. (2011). The neural basis of obligatory decomposition of suffixed words. Brain & Language, 118, 118-127. Lichtheim, L. (1885). On aphasia. Brain, 7, 433-484. Libben, G. (1994). Computing hierarchical morphological structure: a case study. Journal of Neurolinguistics, 8(1), 49-55. Libben, G. (1998). Semantic transparency in the processing of compounds: consequences for representation, processing, and impairment. Brain and Language, 61, 30-44. Libben, G., Derwing, B.L. & de Almeida, R.G. (1999). Ambiguous novel compounds and models of morphological parsing. Brain and Language, 68, 378-386. Libben, G. (2006). Getting at psychological reality: On- and off-line tasks in the investigation of hierarchical morphological structure (pp. 235-255). In G. Wiebe, G. Libben, T. Priestly, R. Smythe & S. Wang (Eds), Phonology, Morphology, and the Empirical Imperative: Papers in Honour of Bruce L. Derwing. Tapei: Crane. Likert, R. A technique for the measurement of attitudes. Archives of Psychology, Vol 22 140, 1932, 55. Longtin, Catherine-Marie, Juan Segui and Pierre A. Hallé. (2003). Morphological priming without morphological relationship. Language and Cognitive Processes 18.3:313-334. Lopes da Silva, F. (2010), MEG: An Introduction to Methods, Oxford University Press, chapter Electrophysiological Basis of MEG Signals, pp. 1–23.
99
Maguire EA, Kumaran D, Hassabis D, Kopelman MD. (2010) Autobiographical memory in semantic dementia: a longitudinal fMRI study. Neuropsychologia. 48(1):123-36. Maia, M., Lemle, M. & França, A.I. (2007). Efeito Stroop e rastreamento ocular no processamento de palavras, Ciências & Cognição, vol 4 p.2-17 Marantz, A. 1997a. 'No escape from syntax: Don't try morphological analysis in the privacy of your own Lexicon.' Proceedings of the 21st Annual Penn Linguistics Colloquium: Penn Working Papers in Linguistics 4: 2, ed. Alexis Dimitriadis et.al. 201-225. Marantz, A. 1997b. Stem suppletion, or the arbitrariness of the sign. Talk given at the Université de Paris VIII. Marantz, A., Miyashita, Y., O'Neil, W. (2000) Image, language, brain : papers from the First Mind Articulation Project Symposium. Cambridge, Mass : MIT Press Marantz, A. (2005). Generative linguistics within the cognitive neuroscience of language. 2005, The Linguistic Review 22, 429-445 Marinkovic, K. (2004). Spatiotemporal dynamics of word processing in the human cortex. Neuroscientist, 10, 142–152. Maris, E., Oostenveld, R. (2007) Nonparametric statistical testing of EEG- and MEG-data NICI, Biological Psychology, Radboud University Nijmegen, Nijmegen, The Netherlands F.C. Donders Center for Cognitive Neuroimaging, Radboud Universityf Nijmegen, Nijmegen, The Netherlands Marr, D. (1982). Vision: A Computational Investigation into the Human Representation and Processing of Visual Information. San Francisco: Freeman. Marslen-Wilson, W., et al. (1994). Morphology and meaning in the English mental lexicon. Psychological Review, 101, 3-33. Marslen-Wilson WD, Welsh, A. (1978). Processing interactions and lexical access during word-recognition in continuous speech. Cognitive Psychology, 16, 29-63. McCandliss, B. D., Cohen, L., & Dehaene, S. (2003). The Visual Word Form Area: Expertise for reading in the fusiform gyrus. Trends in Cognitive Sciences, 7(7), 293-299. McElree, B. & Dosher, B. A. (2001). The focus of attention across space and time. Behavioral and Brain Sciences, 24, 129-130. Montague, R. (1970). Universal grammar, Theoria, 36, 373 – 398
100
Mummery, Patterson, Hodges, & Wise (1996). Proceedings: Biological Sciences, Vol. 263, No. 1373 Neely, J. H. (1991). Semantic priming effects in visual word recogni- tion: A selective review of current findings and theories. In D. Besner & G. W. Humphreys (Eds.), Basic processes in reading: Visual word recognition (pp. 264-336). Hillsdale, NJ: Erlbaum. Parkkonen, L. (2010) Instrumentation and Data Processing. MEG. An Introduction to Methods. New York: Oxford University Press, 24–64. Partee, Barbara H. (2004). Compositionality in Formal Semantics: Selected Papers of Barbara Partee. Oxford: Blackwell Publishers. Partee, Barbara H. 2011. Formal semantics: Origins, issues, early impact. In Formal Semantics and Pragmatics. Discourse, Context, and Models. The Baltic Yearbook of Cognition, Logic, and Communication. Vol. 6 (2010), eds. B.H. Partee, M. Glanzberg and J. Skilters, 1-52. Manhattan, KS: New Prairie Press. Pickering M.J., Garrod S. (2004) Toward a Mechanistic Psychology of Dialogue. Behavioral and Brain Sciences, 27, pp. 169–225. Pinker S. (2000) Words and Rules: The Ingredients of Language. Phoenix: Harper Perennial. Plag, I. (2003) Word-formation in English. Cambridge Textbooks in Linguistics. Cambridge: Cambridge University Press. 254 pages. Poeppel, D., Embick D. (2005). Defining the relation between Linguistics and Neuroscience. In Anne Cutler (ed.), Twenty-First Century Psycholinguistics: Four Cornerstones, 103-118. Mahwah, NJ: Lawrence Erlbaum. Poeppel, D. (2008). The cartographic imperative: Confusing localization and explanation in human brain mapping. In Bredekamp, Bruhn & Werner (Eds.), Bildwelten des Wissens. "Ikonographie des Gehirns" (Bildwelten volume 6.1, Spring 2008). Poeppel, D. & Monahan, P. (2010). Feedforward and feedback in speech perception: Revisiting analysis by synthesis. Language and Cognitive Processes. Poeppel, D. (2012). The maps problem and the mapping problem: Two challenges for a cognitive neuroscience of speech and language. Cogn Neuropsychol, 29(1-2):34-55. Pylkkänen, L., Stringfellow, A., & Marantz, A. (2002). Neuromagnetic evidence for the timing of lexical activation: An MEG component sensitive to phonotactic probability but not to neighborhood density. Brain and Language, 81, 666–678. Pylkkänen, L., & Marantz, A. (2003). Tracking the time course of word recognition with
101
MEG. Trends in Cognitive Sciences, 7, 187-189. Pylkkänen, L. & McElree, B. (2006). The syntax-semantic interface: On-line composition of sentence meaning. Handbook of Psycholinguistics (2nd Ed), 537-577. NY: Elsevier. Pylkkänen, L. & McElree, B. (2007). An MEG Study of Silent Meaning. Journal of Cognitive Neuroscience, 19, 1905-1921. Pylkkänen, L., Martin, A. E., McElree, B., & Smart, A. (2009). The Anterior Midline Field: Coercion or Decision Making? Brain and Language, 108, 184-90. Pylkkänen, L., Oliveri, B., Smart, A. (2009). Semantics vs. World Knowledge in Prefrontal Cortex. Language and Cognitive Processes, 24, 1313-1334. Pylkkänen, L., Brennan, J., Bemis, D. K. (2010) Grounding the Cognitive Neuroscience of Semantics in Linguistic Theory. Language and Cognitive Processes. Racine, E., I. Gareau, H. Doucet, G. Jobin, D. Laudy, G. Jobin, and P. Schraedley-Desmond. 2006. Hyped biomedical science or uncritical reporting? Press coverage of genomics (1992-2001) in Québec. Social Science & Medicine 62 (5): 1278-90. Rastle, K., Davis, M. H., Marslen-Wilson, W. D., & Tyler, L. K. (2000). Morphological and semantic effects in visual word recognition: A time-course study. Language and Cognitive Processes, 15, 507?537. Rastle, Kathleen, Matthew Davis, and Boris New. (2004). The Broth in my Brother’s Brothel: Morpho-Orthographic Segmentation in Visual Word Recognition. Psychonomic Bulletin & Review 11.6:1090-1098. Rayner, K.,Pollatsek, A. (1987). Eye movements in reading: A tutorial review. In M. Coltheart (Ed.), Attention and performance XII: The psychology of reading (pp.327-362). Hillsdale, NJ: Erlbaum. Raz, A. (2012). Critical Neuroscience: From Neuroimaging to Tea Leaves in the Bottom of a Cup. In S. Choudhury and J. Slaby (Eds.). Critical Neuroscience, Wiley-Blackwell. Rodden, F.A., Stemmer, B. (2008). A Brief introduction to common neuroimaging techniques. Handbook of the Neuroscience of Language, Oxford: Elsevier. 57-67. Rogalsky, C., & Hickok, G. (2008). Selective attention to semantic and syntactic features modulates sentence processing networks in anterior temporal cortex. Cerebral Cortex, 19, 786-796.
Salmelin R. (2007) Clinical neurophysiology of language: the MEG approach. Clin Neurophysiol. 118: 237-254. Salmelin R. (2010) MEG and reading: from perception to linguistic analysis. MEG. An
102
Introduction to Methods. New York: Oxford University Press, 346–372. Schreuder, R. and Baayen, R. (1995) Modeling morphological processing. In Feldman, L. B. (ed), Morpholog- ical Aspects of Language Processing. Lawrence Erlbaum, Hillsdale, New Jersey, 131–154. Seidenberg, M.S., & McClelland, J.L. (1989). A distributed, developmental model of visual word recognition and naming. Psychological Review, 96, 523–568. Seidenberg, M. S., & Gonnerman, L. M. (2000). Explaining derivational morphology as the convergence of codes. Trends in Cognitive Sciences, 4, 353-361. Shamay-Tsoory SG, Aharon-Peretz J, Levkovitz Y. (2007) The neuroanatomial basis of affective mentalizing in schizophrenia: comparison of patients with schizophrenia and patients with localized prefrontal lesions. Schizophr Res; 90: 274–83. Shoolman, N.., Andrews, S. (2003) Racehorses, reindeers and sparrows: Using masked priming to investigate morphological influences on word identification. Masked priming: The state of the art. Psychology Press. Schreuder, R. and Baayen, R. (1995) Modeling morphological processing. In Feldman, L. B. (ed), Morpholog- ical Aspects of Language Processing. Lawrence Erlbaum, Hillsdale, New Jersey, 131–154. Solomyak, O., & Marantz, A. (2009). Lexical access in early stages of visual word processing: A single-trial correlational MEG study of heteronym recognition. Brain and Language, 108, 191–196. Solomyak, O., & Marantz, A. (2010). MEG Evidence for early morphological decomposition in visual word recognition: A single-trial correlational MEG study. Journal of Cognitive Neuroscience, 22, 2042-2057. Stockall, L., Marantz, A (2006). A single route, full decomposition model of morphological complexity: MEG evidence. The Mental Lexicon, 1(1), 85-123. Stroop, J. R. (1935). Studies of interference in serial verbal reactions. Journal of Experimental Psychology, 18, 643-662. Taft, M & Kenneth I. Forster. (1975) Lexical storage and retrieval of prefixed words. Journal of Verbal Learning and Verbal Behavior 14(6). 638-647. Taft, M. (2004). Morphological decomposition and the reverse base frequency effect. The Quarterly Journal of Experimental Psychology Section A, 57, 745–765. Tarkiainen A, Helenius P, Hansen PC, Cornelissen PL, Salmelin R. (1999) Dynamics of letter string perception in the human occipitotemporal cortex. Brain; 122: 2119±32.
103
Traxler, M. J., Pickering, M. J., & McElree, B. (2002). Coercion in sentence processing: Evidence from eye-movements and self-paced reading. Journal of Memory and Language, 47, 530–547. Wallis, S.A. (2007) Annotation, Retrieval and Experimentation. In Meurman-Solin, A. and Nurmi, A.A. (eds.) Annotating Variation and Change. Helsinki: Varieng, UoH. Wernicke, C. (1874) 1968. The symptom complex of aphasia (1874). Reprinted in English in Proc. Boston Colloq. Philos. Sci. 4: 34-97. Zweig, E. & Pylkkänen, L. (2009). A visual M170 effect of morphological complexity. Language and Cognitive Processes, 24, 412 - 439. Zwitserlood, P. (1994). The role of semantic transparency in the processing and representation of Dutch compounds. Language and Cognitive Processes, 9, 341- 368.
104
Apêndice 1: Lista de Estímulos________________________________________________
Transparentes Opacas Novas Ortográficas
drainpipe ragtime doorbug tactile dollhouse deadline backlink hatchet
swearword hamstring dragonfield vantage barnyard showcase moonship partisan
snowflake fullback newsbell stampede nightlight sealink racebox squadron shipwreck tailgate floodlist cardinal
teacup hallmark stoolline warranty moonlight gangplank tombprint harmonica bookstore deadlock wallwork carnivore doorstep stalemate sketchmark capillary backbone crosspiece rosehorn messenger racehorse blockhead rainpool plaintiff snowball copyright snowbrush penalty headache jackpot breaklight secondary bedroom sideburns kingpigeon scandal foghorn blacksmith shoetape scarlet farmland sideboard doorholder against doorknob kingpin mailgum beatnik birthday shorthand doorline brothel
lamplight loophole mailbook dialog shoebox spitfire slideman fuselage
cheekbone stoolpigeon joyflake inferno girlfriend blackjack heirman jerkin bullfight freeholder foothandle phonetic pillbox rosewater frostpal plush
cornfield brainchild swimfriend quartz campsite highbrow barnmate salmonella songbook sideline hairmill shovel hairbrush teetop craftschild stirrup teamwork joystick woodbug chagrin newspaper figurehead hairhold blotter
mailbag flashback nightsuit scaffold videotape butterfly healthache glaucoma doorbell wallflower racepaper starwart crewman greenhorn railpot template campfire scapegoat doorcoat porridge rainstorm turncoat whirlgate kerchief northeast bulkhead humproll treason
105
flowerpot starboard lumberbag crescent doorhandle fanfare campway casserole
footpath snapdragon litterbroker nocturn fairyland watercress ladyfork worship honeybee bandwagon cheekstep operate bookshelf blowhard spitboard trombone farmhouse longhand meatwork abreast
haircut cocktail lifewater abstain candlelight mainstay bedstep acclaim
gunshot warhead freeroad worship litterbin pineapple dishloom acetone flagpole dighouse sandalstring acrobat
woodshed blackmail racefall account courtroom cowboy guideknife warlock bathroom hogwash sideboard welcome paintbrush bloodshot rainport vaccilate
sailboat beeline skinshell tadpole soybean watertable housecase sublime seawater piecemeal sketchcraft steadfast sunlight highlight stairland spearmint
bowstring bootlegger crewpath yellow
106
Apêndice 2: Amazon Mechanical Turk_________________________________________
Compound Rating Task On a scale from 1 to 7 where 1 is very badly and 7 is very well, how well can
you get the overall meaning of this compound word from the words within? On a scale from 1 to 7, how well does this word contribute to the meaning of the compound word? Ex. churchgoer 7 church 7 7 goer 7 briefcase __ brief __ case __
battlefield __ battle __ field __
dollhouse __ doll __ house __
sideline __ side __ line __
heirloom __ heir __ loom __
fairyland __ fairy __ land __
chinaware __ china __ ware __
doorhandle __ door __ handle __
crosspiece __ cross __ piece __
spyglass __ spy __ glass __
newsletter __ news __ letter __
bulkhead __ bulk __ head __
roommate __ room __ mate __
mainstay __ main __ stay __
stepmother __ step __ mother __
candlelight __ candle __ light __
pinprick __ pin __ prick __
greenhorn __ green __ horn __
toothpaste __ tooth __ paste __
bloodstain __ blood __ stain __
flapjack __ flap __ jack __
longhand __ long __ hand __
breakwater __ break __ water __
feedback __ feed __ back __
107
Con
sent
and
Han
dedn
ess
form
s an
d In
form
atio
n Sh
eet
1.Yo
ur su
bjec
t must s
ign
an a
ppro
ved
info
rmed
con
sent
form
for e
very
day
they
pa
rtici
pate
in a
stud
y; c
onse
nt fo
rms a
re lo
cate
d in
the
fold
ers s
tore
d in
the
trays
ne
xt to
the
Dig
itizi
ng P
C.
If it
is th
e fir
st ti
me
the
parti
cipa
nt h
as v
isite
d th
e la
b th
ey m
ust a
lso
fill o
ut a
han
dedn
ess f
orm
and
a p
erso
nal i
nfor
mat
ion
shee
t.
!
!!
!!
MEG
, How
to u
se th
e sy
stem
--17
Parti
cipa
nts
Info
rmat
ion
Shee
t
Edin
burg
h H
ande
dnes
s For
m
Apêndice 3: Formulários _____________________________________________________________________
MEG
, How
to u
se th
e sy
stem
--17
10
. Set
ting
up th
e Pa
rtic
ipan
t in
the
expe
rim
ent
C
onse
nt a
nd H
ande
dnes
s for
ms a
nd In
form
atio
n Sh
eet
1.
You
r sub
ject
must s
ign
an a
ppro
ved
info
rmed
con
sent
form
for e
very
day
they
par
ticip
ate
in
a st
udy;
con
sent
form
s are
loca
ted
in th
e fo
lder
s sto
red
in th
e tra
ys n
ext t
o th
e D
igiti
zing
PC
.
If it
is th
e fir
st ti
me
the
parti
cipa
nt h
as v
isite
d th
e la
b th
ey m
ust a
lso
fill o
ut a
han
dedn
ess
form
and
a p
erso
nal i
nfor
mat
ion
shee
t.
E
dinb
urgh
Han
dedn
ess F
orm
___
_
____
____
____
____
____
____
___
P
artic
ipan
ts In
form
atio
n Sh
eet
C
onse
nt F
orm
__
108
Apêndice 4: Análise preliminar dos resultados comportamentais no Experimento de
Priming
Esses resultados não se relacionam diretamente com a análise reportada nesta tese.
Apenas a fim de ter um parâmetro de comparação com a literatura de processamento de
palavras, analisamos os efeitos de priming sobre os tempos de nomeação na condição
parcial (TEA-teacup).
Para esse fim, realizamos uma ANOVA (repeated-measures). Os tempos de
nomeação foram definidos como o intervalo entre o início da apresentaçãoo do alvo até a
ativação do gatilho de som acionado pela voz do participante. Qualquer efeito de priming
encontrado nas palavras-alvo servirá também como garantia de que os primes foram lidos e
processados durante a tarefa, já que não temos tempos de nomeação associados a eles.
Resultado. A análise feita sobre a condição de priming parcial revelou um efeito
significativo, indicando que os tempos de nomeação foram menores para os alvos, quando
esses eram antecedidos por um prime dentro das condições experimentais – em oposição a
primes não relacionados [F1(1,4)=11.87, p=0.02)]. Esse resultado é suficiente para indicar
que os primes estavam sendo lidos e processados. BROOKS ET AL.(2013) apresentam
uma análise neurofisiológica do efeito de priming desses mesmos dados, tendo encontrado
clusters significativos no lobo fusiforme posterior e no lobo temporal posterior, áreas
associadas ao fluxo ventral da linguagem (HICKOK & POEPPEL, 2004).
Não encontramos efeitos de interação entre priming e tipo de palavra (transparente,
opaca, nova, ortográfica), havendo apenas uma tendência, de modo que as condições
transparente, opaca e nova tiveram tempos de nomeação marginalmente mais rápidos que a
condição ortográfica [F1(1,4)=2.83, p=0.08]. Essa tendência está de acordo com estudos
anteriores que apontaram facilitação entre palavras compostas e seus constituintes,
independente da transparência semântica (ZWITSERLOOD, 2004).
Top Related