Textos e Gramáticas. O fronteamento de constituintes no...

25
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. Projeto de Pós Doutorado FAPESP Supervisora : Charlotte Marie Chambelland GALVES (IEL/UNICAMP) Candidata à bolsa de Pós-Doutorado: Cristiane NAMIUTI Temponi (IEL/UNICAMP)

Transcript of Textos e Gramáticas. O fronteamento de constituintes no...

Textos e Gramáticas.O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente

anotados.

Projeto de Pós Doutorado

FAPESP

Supervisora:

Charlotte Marie Chambelland GALVES (IEL/UNICAMP)

Candidata à bolsa de Pós-Doutorado:

Cristiane NAMIUTI Temponi (IEL/UNICAMP)

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

RESUMO

Este projeto de pesquisa insere-se no âmbito do projeto temático Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística – Fase II

(processo FAPESP 04/03643-0) e tem como objetivo mapear a sintaxe de textos históricos a fim de trazer mais subsídios para

descrever e entender a gramática média do português e as mudanças que pontuaram na história da língua. As reflexões, bem como a

metodologia de classificação e a análise de dados terão como pano de fundo o quadro teórico de Princípios e Parâmetros da

Gramática Gerativa (cf. Chomsky, 1995).

Já avançamos na questão gramatical trazendo fatos importantes que corroboram a hipótese de Galves (1996, 1998, 2001, 2004) de ter

havido um estágio gramatical intermediário entre o Português Arcaico e o Português Europeu Contemporâneo. De posse dos resultados

obtidos na pesquisa sobre a interpolação (cf. Namiuti, a sair) somados aos resultados de Galves, Britto & Paixão de Sousa sobre a

ênclise e a próclise e os de Paixão de Sousa (2004) sobre a posição do sujeito, sustenta-se a hipótese de uma gramática intermediária

PA - PE. Atestamos (Cf. Namiuti, tese a sair) que a interpolação dos constituintes do VP, bastante produtiva nas orações

dependentes do português arcaico, desaparece da produção literária no século 16, e a não adjacência entre o complementador e o clítico

se torna mais comum: a ordem ‘C-cl-X-(neg)V’ abre espaço para a ordem ‘C-X-cl-(neg)V’. Neste mesmo século encontramos um

padrão proclítico nas orações não dependentes afirmativas, e ainda, a interpolação da negação ganha novos contextos (‘não’ passa a

ser interpolado em ambientes de variação ‘clV’ / ‘Vcl’). Interpretamos estes fatos como o reflexo da mudança no domínio de

hospedagem do clítico, que deixa de se relacionar com o núcleo mais alto da estrutura da frase e passa a se relacionar exclusivamente

com o complexo verbal.

Algumas propostas de estabilização da ordem em Português relacionam a perda do fenômeno da interpolação com a perda do

fronteamento dos constituintes do Sintagma Verbal para a esquerda do verbo (cf. Martins 1997, 2005, e Parcero 1999). No entanto,

acreditamos que a perda da possibilidade do fronteamento não é a razão para o desaparecimento do fenômeno da interpolação, uma

vez que constatamos que este último já é obsoleto no século 16, enquanto o primeiro parece ser ainda bastante produtivo até o

século 18 (cf. Paixão de Sousa 2004). Neste projeto procuraremos comprovar empiricamente que é a permanência da possibilidade

deste fronteamento, somada à mudança no domínio do clítico, que faz prevalecer a próclise sobre a ênclise nas orações raízes XV

nos textos dos séculos 16 e 17, e ainda, surgir novas possibilidades para a interpolação da negação.

O nosso objetivo é, portanto, fazer uma nova investigação sobre o fronteamento dos constituintes no período gramatical chamado

por Galves (2004) de Português Médio. Para tanto contraporemos as orações com fronteamento às orações em que os sintagmas

permanecem em posição pós-verbal. Para que esse estudo possa ser realizado numa base empírica suficiente e confiável,

trabalharemos com textos do Corpus Tycho Brahe sintaticamente anotados, e participaremos dessa anotação, corrigindo o output do

anotador (parser) automático.

1

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

I. INTRODUÇÃO

A questão central presente nas pesquisas diacrônicas no quadro teórico da gramática gerativa, e que também

consideraremos aqui, é: De que forma os dados refletem alterações no plano das gramáticas?

Na perspectiva gerativista, o conceito de Gramática remete à possibilidade de se gerarem as estruturas, e não ao

inventário de estruturas. Essas possibilidades são limitadas pela “Gramática Universal”, que faz parte das faculdades

inatas do ser humano. A Gramática Universal oferece “princípios” imutáveis e “parâmetros” que podem ser

especificados (ou “fixados”) diferentemente em gramáticas particulares – determinando, assim, os limites de variação

entre as gramáticas (Chomsky e Lasnik 1993). Cada gramática, neste sentido, representa uma determinada parametrização

dos princípios da Gramática Universal. Portanto, a gramática na teoria gerativa, será uma entidade individual. As

gramáticas individuais emergem nos falantes a partir da interação entre os princípios da Gramática Universal (ou seja,

inatos) e a experiência lingüística de cada falante (ou seja, os dados a que está exposto na fase de aquisição, produzidos

pela geração anterior).

Desse ponto de vista, a mudança gramatical é uma função da relação entre a capacidade inata e a experiência lingüística

vivenciada pelas sucessivas gerações de falantes. Neste quadro, a gramática é um objeto teórico, enquanto os dados de

língua são um objeto empírico a ser interpretado. Portanto, ao levantar hipóteses sobre gramáticas, os estudos

gerativistas buscam interpretar teoricamente os dados da língua.

Os dados documentados relativos a mudanças apresentam-se, tipicamente, como dados de variação entre formas antigas

e formas novas nos textos. Note-se, entretanto, que quando se admite que a mudança de uma gramática para outra

envolve a fixação (ou “marcação”) diferente dos parâmetros via aquisição da linguagem pela criança, esta mudança

deverá ser conceituada, por necessidade teórica, como um evento abrupto.

Temos então um aparente paradoxo: a mudança gramatical, em tese um evento abrupto, manifesta-se nos dados como

um evento de variação gradual. Assim, a interpretação dos dados históricos num estudo de mudança gramatical precisa

contar com um quadro metodológico que permita abordar o problema da variação diacrônica.

Em nosso estudo, partimos do quadro delineado a partir de Kroch (1989), que salienta que a variação nos textos não se

deve confundir com variação nas gramáticas. Ou seja: as mudanças nas línguas, instanciadas nos documentos históricos

como variação gradual, são reflexos de mudanças gramaticais que devem ocorrer de modo abrupto. Nos casos de

mudança gramatical, a variação entre formas antigas e novas na linha do tempo não pode ser conceituada como uma

“oscilação” produzida por uma única gramática particular. Ao contrário, cada forma parece corresponder a diferentes

fixações de um parâmetro. Nestes casos, a variação nos textos pode ser compreendida como fruto da convivência, no

2

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

plano do uso, de formas geradas por diferentes gramáticas. É o que Kroch (1994) chama de “Competição de

Gramáticas”, processo no qual as formas antigas são gradualmente expulsas do uso pelas formas inovadoras.

No que concerne especificamente o problema da identificação de etapas gramaticais, ou a periodização, a contribuição

central do conceito de Competição de Gramáticas é a idéia de que a emergência de uma nova gramática será identificada

pelo surgimento de formas novas nos dados. (Cf. Galves, Paixão de Sousa e Namiuti, 2006).

Os estudos pioneiros sobre a diacronia do português no quadro gerativista (cf. Martins 1994; Torres Morais, 1995;

Ribeiro, 1996 entre outros) levaram em conta a periodização delineada pela tradição, que, de forma geral, divide a

história da língua em três grandes ciclos – o Português Arcaico, o Português Clássico, e o Português Europeu Moderno. Entretanto

costumam considerar apenas 2 períodos gramaticais – a gramática antiga e a gramática moderna. Esta hipótese de duas

fases gramaticais é em parte o resultado do fato de que a história do português carecia de estudos aprofundados que

focalizassem os períodos posteriores ao século 16, uma vez que esse século é considerado como o marco inicial das

línguas modernas (cf. Mattos e Silva 1992 para uma síntese dos estudos sobre periodização do português). No caso da

língua portuguesa, essa concepção mostrou-se particularmente inadequada, porque, como argumenta Galves (2004), além

do surgimento posterior do português brasileiro, o próprio português europeu sofre mudanças notáveis depois do séc. 16.

Com os estudos baseados no Corpus Tycho Brahe1, que reúne textos de autores portugueses nascidos entre 1380 e 1845,

é possível defender a existência de 3 Gramáticas, ou seja, dois estágios gramaticais anteriores ao Português Europeu Moderno.

Nossa proposta consiste em mapear a sintaxe dos textos históricos, focalizando o fronteamento de constituintes nas

sentenças, a fim de descrever a sintaxe do Português Médio e (re)afirmar as hipóteses lançadas no âmbito do projeto

temático. Para isto trabalharemos para a disponibilização da versão sintaticamente anotada dos textos do Corpus do

Português Histórico Tycho Brahe. Nesta empreita, corrigiremos os textos anotados automaticamente pelo parser, desenvolvido

por Daniel Bikel na Universidade da Pensilvânia, com o auxílio da ferramenta de correção das etiquetas sintáticas -

Corpus Draw2. Os textos corrigidos serão usados para o (re)treinamento do parser automático.

Nas seções seguintes apresentaremos o estado da arte com relação aos avanços nas pesquisas sobre as gramáticas do

Português, sobretudo no que diz respeito à questão do Português Médio. Também falaremos do corpus Tycho Brahe e

do empreendimento tecnológico ligado à sua construção. E, finalmente, apresentaremos nosso plano de trabalho.

1 No âmbito do Projeto Temático Padrões Rítmicos Fixação de Parâmetros e Mudança Lingüística. FAPESP (98/3382-0 e 04/03643-0) e desenvolvido no Instituto de Estudos da Linguagem (IEL-UNICAMP), sob a coordenação da Professora Doutora Charlotte Marie Chambelland Galves. O projeto tem como quadro teórico o modelo de Princípios e Parâmetros e utiliza, para modelar o estudo da mudança lingüística, o ferramental teórico que vem sendo desenvolvido por A. Kroch e colaboradores. Trata-se de um projeto eminentemente pluridisciplinar, exigindo competências variadas. Assim a equipe executora é formada por sintaticistas, fonólogos, foneticistas, especialistas em história do português, físicos-estatísticos, probabilistas, estatísticos e cientistas da computação.2 Corpus Draw é uma ferramenta de edição/correção de textos anotados sintaticamente desenvolvida na Universidade da Pensilvânia. Tal ferramenta faz parte do pacote Corpus Search. http://corpussearch.sourceforge.net/

3

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

II AS GRAMÁTICAS QUE PONTUARAM NA HISTÓRIA DO PORTUGUÊS

Embora as periodizações sugeridas pela tradição dos estudos históricos se apresentem variadas a depender dos autores, é

possível reconhecer algumas delimitações amplas.

O primeiro período histórico que se costuma reconhecer é o Português Arcaico (doravante PA), a língua que se registra

desde os primeiros documentos até os fins da Idade Média. Seria, portanto, a língua representada nos manuscritos

medievais de todo gênero (poéticos, notariais, históricos). É no século 16 que a tradição historiográfica do português

localiza o divisor de águas principal na história da língua, separando a língua antiga da moderna.

“Tomando o século XII como início do português histórico, distinguiremos na evolução do idioma dous períodos principais: o do português antigo, que é a linguagem escrita usada até fins do século XV e ainda nos primeiros anos do século seguinte; e o do português moderno, que é a linguagem empregada dessa época em diante” (Said Ali, 1921).

Grande parte da tradição reconhecerá, entretanto, que a língua representada nos textos clássicos portugueses não é ainda

a língua portuguesa contemporânea. Este período intermediário entre o medieval e o contemporâneo foi chamado por

muitos historiadores de Português Clássico (doravante PC), e incluiria textos quinhentistas tardios, textos seiscentistas e

textos setecentistas.

Todavia, já na segunda metade do século 14 e no século 15 se revelavam as formas do PC coexistindo com as formas do

período arcaico. Fato que levou alguns estudiosos a designar este período de transição da língua medieval para a clássica

de Português Médio (cf. Cardeira 2005, Castro 1991, entre outros). Portanto, é possível considerar que a fase gramatical

intermediária entre o PA e o Português Europeu Moderno (doravante PE) compreende um período maior que o Clássico.

Galves (2004) chamou de Português Médio (doravante PM) este período gramatical que abarca a fase denominada de

Português Médio por Cardeira (2005) e Castro (1991) e a fase denominada de Português Clássico pela tradição.

Depois desta fase intermediária, costuma-se identificar no século 19 o momento em que a língua portuguesa

contemporânea se estabelece nos textos: a escrita oitocentista já não registra os padrões característicos da fase clássica, e

é próxima do português da Europa hoje. Vários trabalhos realizados com base no Corpus Tycho Brahe mostraram que a

gramática moderna surge nos textos com a geração de escritores nascidos no primeiro quarto do séc. 18.

II.1 Colocação de clíticos e gramática

Dois aspectos da sintaxe dos clíticos pronominais se destacam pelas alterações de padrão na diacronia do português: as

ordens relativas clítico-verbo ~ verbo-clítico e a interpolação.

No português e espanhol dos séculos 13 a 16, em orações principais afirmativas não introduzidas por operadores os

clíticos podem ocorrer quer em posição pré-verbal, quer em posição pós-verbal. Esta variação acontece quando o verbo

4

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

não está em posição inicial e é precedido ou do sujeito, ou, de um sintagma preposicional, um sintagma adverbial, uma

oração anteposta, ou ainda da conjunção copulativa e. Em todos os casos o clítico apresenta-se necessariamente

adjacente ao verbo.

(01) E a donzela foi-se e deo agoa à rainha (Pr. Livro de Linhagens. Piel & Mattoso 1980:23. Apud Martins 2002:263)

(02) E a donzela lhe disse entom que achara um mouro doente (Pr. Livro de Linhagens. Piel & Mattoso 1980:28. Apud Martins 2002: 263).

(03) O espírito é como vento, com o mesmo com que uns vão para cima, vão outros para baixo; eu acho-me bem em caminhos chãos, ainda que me seja preciso vadear serras e meter debaixo dos pés os montes (Chagas, 1631, em Paixão de Sousa, 2004).

(04) Ele me disse que pasmava como lhe abastava o que tinha (Sousa, 1554, em Paixão de Sousa, 2004).

(05) Se alegais o nome que tendes de cristãos , digo-vos que nada vos deve Deus por isso, porque que ídolos ou heresias deixastes vós, por seguir a Cristo? (Bernardes-1644 em Paixão de Sousa, 2004, pág: 78)

(06) Jà que vio todas redusidas à sua obrigaçaõ, e vistidas às suas leys , lhes deu à sua custa hum jantar muy regalado, querendo ter mimosas aquellas, a quem se confessaua obrigada; ... (Céu-1658 em Paixão de Sousa, 2004, pág: 78)

Nesses contextos, a ênclise é categórica no Português Europeu Moderno (doravante PE). A próclise predomina nos textos

anteriores ao PE, ou seja, escritos entre 1400-1700; nos textos mais antigos, escritos entre 1200-1400, a ênclise era a

opção predominante (cf. Ribeiro 1996, Martins 1994). Este fato é curioso, uma vez que as demais línguas românicas (com

exceção do Galego) eram enclíticas, passaram a proclíticas e assim permaneceram (cf. Galves, 1996).

Os fatos relativos à variação ênclises versus próclises são importantes para compreendermos a gramática média. Paixão de

Sousa (2004), bem como Galves e Paixão de Sousa (2005) consideram que a alternância Vcl vs. clV nos textos

representativos dos anos 1500 e 1600, corresponde a uma alternância possibilitada por uma mesma gramática (a

gramática do PM). Nos textos representativos dos anos 1700 e 1800, a variação é o efeito de uma competição de

gramáticas (no sentido de Kroch 1994, 2001), que por sua vez evidencia a emergência da gramática do PE.

Um outro fato que distingue o Português das outras línguas românicas é a conservação por mais tempo de traços

característicos das línguas arcaicas da România, como a interpolação. Em orações subordinadas, finitas, e em orações

principais introduzidas por operadores, os clíticos são sempre pré-verbais no português. No entanto, também nestas

configurações a posição do clítico apresenta-se variável nos textos dos séculos 13 a 16. Neste caso há variação entre a

adjacência clítico-verbo e a interpolação. Idênticos constituintes frásicos podem ocorrer ora à esquerda da seqüência clítico-

verbo, ora interpolados entre o clítico e o verbo.

(07) como se nesta carta contem (NO, 1538. Martins 1994)(08) como nesta carta se contem (Lx, 1532. Martins 1994)

A interpolação é, portanto, a construção na qual o clítico pronominal não se apresenta contíguo ao verbo – ou noutros

termos, na qual um outro constituinte sintático se interpola entre o pronome e o verbo. Trata-se de uma construção 5

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

característica dos textos mais antigos do português (bem como do romance ibérico em geral, cf. Rivero, 1994, 1997,

Martins 1994, 1997, 2002, entre outros) e que se torna obsoleta nos autores nascidos no século 16 (cf. Namiuti, a sair).

A interpolação da negação, porém, continuou a ser registrada e é ainda atestada no português europeu moderno (cf. ,

entre outros, Mira Mateus et alli, 2003, Magro 2007, Namiuti, a sair).

Os estudos sobre a colocação pronominal na diacronia do português (cf. entre outros, Martins 1994, Parcero 1999 e Fiéis

2001) demonstraram que a interpolação dos diversos elementos do sintagma verbal era freqüente até o século 16 e

restrita aos contextos de próclise obrigatória.

Considero que os fatos relativos à interpolação são importantes para compreendermos a mudança que remonta ao séc.

14 se considerarmos a afirmação de Cardeira (2005) sobre as formas clássicas já anunciadas na segunda metade desse

século, somada à questão teórica da aquisição e mudança delineada a partir de Kroch 1989). Antes disso, a interpolação

de constituintes generalizados do sintagma verbal é própria das orações dependentes com contigüidade (C-cl). Este

fenômeno reflete a preferência do clítico por uma posição adjacente à conjunção subordinativa e é característico da

gramática arcaica (cf. Matos e Silva 1998, entre outros).

Na fronteira entre os séculos 15 e 16, quando a próclise passa a ser predominante também nas orações não dependentes,

constatei (Namiuti, tese a sair)3 o surgimento de novos contextos de interpolação da negação que passa a ocorrer

interpolada também nos domínios de variação ‘clV’/’Vcl’ (orações raízes e infinitivas introduzidas por preposições que

não condicionavam a próclise categórica, como a preposição ‘em’).

(09) “E, pelo ElRei Dom João o III querer casar, e êle não querer , lhe não deram satisfação de seus serviços ...” (Couto-1548)(010)“E sintido do mal, que o fizera com ele a infirmidade em o não enterrar,” (Sousa – 1556)

As primeiras ocorrências de interpolação da negação encontradas em contextos de variação clV/Vcl foram atestadas por

Martins (1994) no final do século 15. Esta diferente possibilidade de interpolar a negação mostrou-se freqüente nos

textos do corpus Tycho Brahe e identificou-se como um grupo coeso.

Nas orações dependentes, identifiquei, no século 16, que a queda na freqüência da interpolação generalizada (de

elementos diferentes da negação) segue o aumento da não-contigüidade ‘C-cl’ nas sentenças negativas com cl-neg-V. Logo

em seguida na linha do tempo vemos o completo desaparecimento do fenômeno da interpolação generalizada nos textos.

Interpretei estes fatos como evidência da emergência de uma nova gramática em textos anteriores ao século 16, em

conformidade ao que Galves (2004) afirma sobre o PM.

3 Corpus do português histórico anotado – Tycho Brahe – http://www.ime.usp.br/~tycho/corpus6

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

Seguindo a proposta delineada por Kroch (1994, 2001), a interpolação de elementos diferentes da negação ainda atestada

nos textos quinhentistas deve ser interpretada como variação no uso de formas em competição, uma vez que novos

padrões de ordenação já foram indiciados nesta época.

A questão central aqui é o fato dos constituintes fronteados estarem deixando de aparecer linearmente entre o clítico e o

verbo para aparecer entre o conectivo e a seqüência linear clítico-verbo. Contudo, é importante notar que os dados que

apresentamos devem refletir não uma mudança de posição dos constituintes fronteados, uma vez que o fronteamento,

inclusive de complementos verbais, continua a ser produtivo até o início do século 184, mas uma mudança na posição do

pronome clítico. Tal mudança está relacionada ao domínio de hospedagem do clítico (mas não necessariamente no seu

estatuto de clítico) (cf. Namiuti, tese a sair).

Propomos no quadro teórico da Morfologia Distribuída (MD) (cf. Embick e Noyer 2001, entre outros) que os pronomes

clíticos no PA são movidos na sintaxe para esquerda do núcleo mais alto da oração, seja ele C°5 (nas orações encaixadas),

ou ∑°6 (nas orações raízes), e que seguem deslocamento local sofrendo assim a inversão prosódica com seu hospedeiro.

Desse ponto de vista, a interpolação de constituintes na gramática arcaica (GA) deriva da inversão prosódica mantendo a

adjacência C-cl. E é também por este motivo que temos a predominância da ênclise em orações XV. Para corroborar

esta proposta, lembramos que o PA permitia a assimilação entre consoantes finais de complementadores e

quantificadores e a líquida que constitui o primeiro segmento do pronome (por as > polas, pulas, poila ...), apontados por

Barbosa (1996)

Quanto à gramática média (GM), esta terá resultado da mudança que veda a possibilidade da interpolação e dá lugar à

próclise nas orações matrizes XV, sendo X interno à estrutura oracional (cf. Galves e Paixão de Sousa 2005). Tal

4 Cf. Paixão de Sousa (2004) e Gibrail (em andamento)5 A teoria da gramática gerativa, adotando a representação X', além das projeções lexicais propõe que o ‘dicionário mental’ contém também projeções funcionais. Os núcleos funcionais têm função eminentemente gramatical. A flexão verbal constitui uma categoria funcional que a teoria convencionou chamar de IP (sigla vinda do inglês para ‘sintagma flexional’ - inflection phrase). INFLº ou I° é o núcleo do sintagma da flexão verbal, IP. As análises dentro da perspectiva atual da teoria optaram por dividir o nódulo da flexão verbal – IP – em tempo e concordância – respectivamente TP (tense phrase) e AgrP (agreement phrase). A relação de dominância entre estas categorias foi bastante discutida (ex: Chomsky 1989, Pollock 1989, Laka 1990, Ouhalla 1990, Iatridou 1990, Belletti 1990, Zanutti 1991, entre muitos outros trabalhos). Não são raras análises que propõem duas projeções de Agr°: uma para o sujeito (AgrSP), outra para o objeto (AgrOP). Além da flexão verbal, outra projeção funcional essencial na teoria é a projeção que traduz a subordinação – CP (complementizer phrase). C° é o núcleo desta projeção funcional.6 Martins (1994) traz as observações de Laka (1990) para o inglês e para o basco, e de Chomsky (1957) para o inglês, de que existe um paralelismo entre construções negativas e construções afirmativas enfáticas. Em inglês tanto a negação quanto a afirmação enfática implicam a presença de ‘do’.

(01) Mary didn’t leave(02) Mary did leave [enfático, acento de intensidade sobre did]

Dada a similaridade de processos sintáticos envolvidos na negação e na afirmação enfática, Laka (1990) propõe que ambas são instanciações de uma categoria funcional Σ (“Speech Act”).

Martins (1994) propõe que ΣP faz parte da estrutura da frase e está presente não só nas orações enfáticas, mas em todas as frases, e que a colocação dos clíticos nas línguas românicas depende da natureza desta categoria funcional Σ, situada na estrutura frásica entre CP e IP: morfologicamente “forte” ou “fraca”; e com ou não conteúdo lexical. E argumenta em favor desta hipótese mostrando que a ênclise em orações não dependentes, a existência de construções de VP nulo e a opção por certo padrão de resposta afirmativa (mínima) a interrogativas totais (“tens visto o João? Tenho/#Sim”) são fenômenos associados entre si, manifestados apenas nas línguas em que Σ tem traços-V fortes.

Σ° é, portanto, o núcleo de polaridade situado acima dos nódulos INFL e presente em todas as orações, ora instanciado como afirmação, ora como negação, ora como foco.

7

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

mudança estará estreitamente relacionada com o domínio de hospedagem do clítico que deixa de ser independente do

verbo e passa a ser dependente dele. Nesta gramática clítico e verbo estão incorporados em Σ°.7

II.2 Interpolação e fronteamento

Com relação ao fronteamento de constituintes no PA e Clássico, encontramos na literatura a associação da perda do

fronteamento com a perda da interpolação generalizada. A segunda mudança teria conseqüência na primeira. No

entanto, o fronteamento dos vários constituintes verbais permanece durante toda a época clássica, ao passo que a

interpolação generalizada já é obsoleta no século 16.

Martins (1997, 2005) mostra que a ordem OV é bastante freqüente no PA, podendo ser o reflexo do deslocamento à

esquerda (left deslocation), do foco identificacional, ou ainda, do scrambling dentro do domínio de IP. Este terceiro tipo

de movimento não é permitido em PE moderno8, e é opcional no PA, como nos mostram os exemplos abaixo atestados

por Martins (2005:182).

(011) Sse pela u~etura uos algu~e a dita v~ya enbargar (Documento notarial, século 13)(012) Sse pela u~etura uos algu~e enbargar a dita v~ya (Documento notarial, século 13)

A autora propõe que o scrambling de objeto no PA é o movimento para Spec AgrS, e afeta DPs, PPs, AdvPs

(respectivamente: sintagmas determinantes, sintagmas preposicionais, e adverbiais) e orações reduzidas de infinitivo ou

particípio. E ainda ressalta que tal fenômeno não é restrito a apenas um constituinte por oração, mas vários constituintes

podem ser movidos, e que também é encontrado tanto em orações com sujeito nulo, quanto com sujeito lexical (como

nos exemplos acima).

Segundo Martins (2005), no PA, AgrS teria uma seleção de traços ininterpretáveis (um traço EPP) com uma propriedade

de atrair todo – F (atract-all-F), ou seja todo sintagma com um traço forte. Em sua análise AgrS permitiria múltiplos Specs e

os constituintes movidos por scrambling ocupariam os Specs de AgrS. A ordem OV deverá, portanto, ser própria das

orações encaixadas, já que, de acordo com a proposta de Martins (2005), nas orações não dependentes do PA, o verbo se

move para um núcleo mais alto que AgrS° Assim, uma vez que os constituintes movidos por scrambling são os mesmos

que podiam ser interpolados entre o clítico e o verbo, e ainda nos mesmos contextos (orações dependentes), Martins

7 Não podemos propor que a diferença GA-GM em relação aos clíticos está na tipologia periférico/nuclear, pois assumimos a hipótese de Martins (2003) de que os pronomes clíticos em português sempre foram nucleares. Daí a possibilidade de intervirem entre a negação e o verbo, e de ocorrerem em mesóclises.

8 No Português Europeu contemporâneo, a ordenação de constituintes é, normalmente, estruturada obedecendo a um padrão SVO, em que o verbo é seguido de seus complementos. Algumas exceções a esse padrão são encontradas no PE, mas, como aponta Martins (2005), os deslocamentos atuais estão mais diretamente relacionados a questões de focalização ou topicalização dos elementos fronteados, refletindo recursos de ordem discursiva. Já no PA, como sabemos, e em outras línguas românicas arcaicas e germânicas modernas, a anteposição de constituintes do VP ao verbo é muito freqüente, (cf. entre outros, Rivero,1993; Ribeiro, 1995 e Parcero 1999).

8

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

(2005) correlaciona o desaparecimento da interpolação com à perda desta propriedade de AgrS selecionar múltiplos

Specs.

A anteposição de constituintes do VP ao verbo nos séculos 15, 16 e 17 é também o objeto de investigação de Parcero

(1999). A autora convencionou chamar de fronteamento qualquer deslocamento de constituintes do VP para uma

posição pré-verbal, como nos exemplos abaixo, tirados de sua dissertação – página 2:

(013) mostrava que muy espantada viera a sua alma das penas (VDS 24-38) 9

(014) dinheiros aos que carregar quiriam (DFR 85-6)(015) Rogue a Deos por my que apostolo he de Deos (VDS 338-28)

No que diz respeito às estruturas com interpolação, Parcero (1999) entende este fenômeno como um tipo específico de

Fronteamento.

O trabalho de Parcero foi pioneiro em investigar o fronteamento e a interpolação de constituintes concomitantemente e

ainda tratar a interpolação como um tipo específico de fronteamento. Esses fenômenos envolvem, principalmente os

constituintes complementos e adjuntos. A princípio, Parcero verifica que parece não haver restrições sintáticas sobre o

tipo de constituinte que pode ser fronteado: (Parcero 1999:17).

(016) e pode enquerer ... que honrra e estado tinha (DFR 11-279).(017) Porque por todos daras conta e rrazom a Deos (VDS 21-16).(018) Sabede que natural cousa he de cada hua cousa demendar (VDS 9-30).(019) Parecia que em seu coraçam nam jazia o contrário (GRS 1817)(020) Tudo o que agora tomasse (PRG 30-214).(021) depois que adubado fosse (DFR 60-321).(022) Nos bees d’aquelles que paguar nom quisessem (DFR 49-321)

Um objeto direto, como em (16); um complemento oblíquo, em (17); um predicativo, em (18); um adjunto adverbial de

lugar, em (19); um adjunto adverbial de tempo, em (20); o particípio passado em (21) e o infinitivo em (22).

A autora constatou que não há uma diminuição na percentagem de elementos fronteados do século 15 ao 17. Porém,

nota que os constituintes complementos deixam de ser fronteados no século 17 enquanto os adjuntos permanecem

sendo fronteados.

Quanto às construções com clíticos, fundamentais para uma análise completa, Parcero (1999) atestou o fenômeno da

interpolação nos mesmos contextos atestados por Martins (1994), contextos de próclise categórica, preferencialmente em

orações encaixadas. Então computou todas as ocorrências de clíticos em sentenças encaixadas, encontrando três tipos

9 Parcero (1999) utiliza as iniciais dos textos que constituem o corpus seguidas do número da página ou da carta (quando se tratar de cartas) e/ou do número da linha em que se encontra o dado diante de cada dado para os identificar.

DFR –Crônica de D. FernandoVDS – Vida de SantosGRS –Livro das Obras de Garcia ResendeDCP – Ásia Década PrimeiraPRG – PeregrinaçãoCTS – Cartas Espirituais/Cartas Familiares

9

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

principais de construções: cl-X-V, que corresponde ao contexto de interpolação, cl-V-X e X-cl-V, que se referem às

estruturas de clíticos adjacentes ao verbo. Estas ordens alternam livremente nos textos.

Parcero (1999) argumenta, com os dados apresentados no quadro abaixo (quadro 1), que as estruturas com o clítico

adjacente ao verbo são, no geral, mais comuns que a interpolação dos constituintes e ainda aumentam sua freqüência no

século 16 e 17. A autora também aponta nesse quadro que as construções ‘cl-X-V’ e ‘cl-suj-V’ desaparecem no século 17,

enquanto as construções ‘X-cl-V’ e ‘suj-cl-V’ aumentam e as construções ‘cl-V-(X)’ e ‘cl-neg-V’ permanecem estáveis.

Quadro 1

SéculoData aproximada

Texto

XV XVI XVII TOTAL1434 1450 1533 1550 1570 1670 DOSDFR VDS GRS DCP PRG CTS DADOS

Com interpolação

cl X V 29/27% 6/6% 4/4% 14/14% 2/1% 0 55/8%cl neg V 9/8% 14/14% 14/12% 8/8% 29/18% 24/15% 98/13%cl suj V 9/8% 7/7% 1/1% 9/10% 1/1% 0 27/4%

Sub-total 47/43% 27/27% 19/17% 31/32% 32/20% 24/15% 180/25%

Sem interpolação

cl V (X) 46/43% 66/67% 49/42% 45/48% 80/51% 64/40% 350/48%X cl V 6/6% 4/4% 43/37% 9/10% 27/18% 51/32% 140/19%Suj cl V 8/8% 2/2% 4/4% 9/10% 17/11% 21/13% 61/8%

Sub-total 60/57% 72/73% 96/83% 63/68% 124/80% 136/85% 551/75%TOTAL 107 99 115 94 156 160 731

Entretanto faltam estruturas que deviam ser consideradas no quadro acima, para uma interpretação mais exata da

situação. Uma vez que Parcero (1999) considera ‘clnegV’ e as construções ‘SV’, deveria também considerar ‘negclV’ e

‘VS’. Sem isso, teremos um leque de variação incompleto para extração de freqüências, o que pode comprometer a

interpretação dos resultados obtidos.

Separamos os dados do quadro 1 por contexto para entender melhor as opções de ordem de cada texto.

Quadro 2Século XV XVI XVIIData 1434 1450 1533 1550 1570 1670Texto DFR VDS GRS DCP PRG CTS

cl suj V 9/52% 7/77% 1/20% 9/50% 1/5% 0Suj cl V 8/48% 2/23% 4/80% 9/50% 17/95% 21/100%TOTAL 17 9 5 18 18 21

Quadro 3Século XV XVI XVIIData 1434 1450 1533 1550 1570 1670Texto DFR VDS GRS DCP PRG CTScl X V 29/83% 6/60% 4/9% 14/61% 2/7% 0X cl V 6/17% 4/40% 43/91% 9/39% 27/93% 51/100%

TOTAL 35 10 47 23 29 51

Os quadros acima sugerem uma instabilidade no uso da interpolação no século 16 revelada pela grande diferença

encontrada nos textos representativos deste século (enquanto a interpolação generalizada é marginal em PRG, em DCP é

bastante freqüente – 50%). Note que esta relação nada nos diz sobre a preferência do fronteamento nos textos, uma vez 10

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

que não medimos ‘cl-V-X’, nem estudamos a natureza do sujeito pré-verbal ou consideramos ‘cl-V-Suj’. Aqui só medimos

a possibilidade de interpolação de constituintes pré-verbais.

Quanto ao fronteamento, somemos as estruturas X-cl-V e cl-X-V, por hipótese estruturas de fronteamento, e vamos

contrapor com a estrutura cl-V-X, sem o fronteamento, para sabermos de fato o quão freqüente é o fronteamento no

corpus de Parcero.

Quadro 4Século XV XVI XVIIData 1434 1450 1533 1550 1570 1670Texto DFR VDS GRS DCP PRG CTS

X cl V + cl X V 35/43% 10/13% 47/49% 23/34% 29/26% 51/44%cl V (X) 46/57% 66/87% 49/51% 45/66% 80/74% 64/56%TOTAL 81 76 96 68 109 115

Comparando os quadros de 2 a 4, podemos notar que o fronteamento nas construções com clítico se mantém até o

século 17. Todavia, a construção de fronteamento mais freqüente no primeiro texto do século 15 é clXV, enquanto que

no século 17 é XclV. Este fato vai ao encontro de nossa proposta de que a perda do fenômeno da interpolação não está

relacionada com a perda do fronteamento. Perde-se a interpolação, mas o fronteamento ainda existe na língua Clássica.

Concordamos com Parcero (1999) de que o fronteamento de constituintes e a interpolação são fenômenos relacionados,

uma vez que a interpolação é opcional e o clítico pode se colocar ora antes dos constituintes movidos (fronteados) ora

depois (cl-X-V / X-cl-V). Mas não parece ter sido a perda da possibilidade do fronteamento a causa do desaparecimento

da interpolação. Como vimos, a perda do fenômeno da interpolação é anterior ao século 17. A possibilidade do

fronteamento teria persistido durante a época clássica, o que explicaria uma série de propriedades da língua nesta época.

É importante salientarmos que o corpus considerado no estudo de Parcero (1999), além de não ser um corpus anotado, é

composto de somente 6 textos, 2 do século 15, 3 do século 16, e 1 do séc. 17, o intervalo entre alguns textos chegando a

100 anos.

Paixão de Sousa traz evidências, baseadas em 20 textos do corpus anotado do Português Histórico Tycho Brahe, de que o

fronteamento é ainda uma construção importante no português clássico, e que a possibilidade de tal construção ajuda a

explicar os padrões da colocação de clíticos nesta fase.

Corroborando a hipótese de Galves (1996, 1998), Paixão de Sousa (2004:163) argumenta que a passagem do sistema médio

(PC) para o moderno (PE) seria a passagem de um sistema de XVS para um sistema de SVX, onde há uma dissociação

entre a posição pré-verbal do sujeito, e a posição dos elementos fronteados, agora restritos aos sintagmas focalizados.

A autora constatou que de fato em todos os períodos há construções SVO, assim como há construções VS com ênclises

e próclises, porém observou diferenças importantes para a passagem do PC para o PE moderno no século 18:

11

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

“as ordens com XV e com próclises tornam-se menos freqüentes; a ordem X-XclVS desaparece dos textos já na primeira metade do século 18; e as ordens VSX caem de 0,07 para 0,01 nos textos entre a segunda metade do século 17 e o texto do século 19.Isto permite afirmar que a queda do patamar de cerca de 20% para o patamar de cerca de 10% de ordens VS é explicável fundamentalmente como uma queda na freqüência de construções que instanciam o fronteamento de constituintes para uma posição acima da posição de sujeitos.Tomo assim os fatos referentes à inversão como relevantes para compreender o sistema dos textos médios, e sua diferença com os modernos. A despeito de não se ter disponível uma análise mais sistemática da natureza da posição de fronteamento em termos discursivos, estes fatos todos tomados em conjunto indicam ser razoável propor que nos textos clássicos, está ativa uma posição pré-verbal para fronteamento de constituintes regida por propriedades do tipo “V2” (Paixão de Sousa, 2004:162)

Para corroborar a hipótese, Paixão de Sousa (2004:157) mostra que as ordens VS com ênclises no PC são, em sua

maioria, casos de V1 absolutos – ou seja, #VclS. Apenas no texto de Ortigão (1836) a proporção de #VclS será superada

pela proporção de X-VclS. Além disso, não se registra, em nenhum período, casos de inversão com ênclises em ordens

V3 (X-X-VclS).10

A autora também chama a atenção para o fato da ordem XclVS, que seria a configuração mais característica do

fronteamento, ser o tipo de inversão mais freqüentemente atestada nos textos do séculos 16 e 17. (Cf. Paixão de Sousa,

2004:161).

Sendo assim, para Paixão de Sousa 2004, no Português Clássico, a ordem SV é fruto ora do fronteamento do sujeito, ora de

sua topicalização. Segundo a autora:

“... observando as tendências de freqüência de diferentes classes de construções XV com próclises, veremos que o comportamento dos sujeitos pré-verbais referenciais com próclises é comparável ao de elementos necessariamente fronteados.” (Paixão de Sousa 2004: 85)

“.... constituintes que não podem participar da operação de adjunção nunca aparecem com ênclises. Podemos portanto considerar que no sistema médio, a ênclise é uma característica indicadora de adjunção. Em vista disso defenderei que os sujeitos em SVcl podem ser classificados como adjuntos nos textos até o século 18, período em que apresentam um comportamento comparável aos demais adjuntos (mas como veremos, isso diferencia os textos mais modernos dos textos médios, uma vez que a freqüência de ocorrência de SVcl neles é mais elevada que a freqüência de outros XVcl).” (Paixão de Sousa 2004: 85)

Os resultados apresentados por Gibrail11 (2007, tese em andamento) corroboram fortemente a hipótese de Paixão de

Sousa e nossa análise para as 3 gramáticas que pontuaram na história da língua portuguesa. A autora mostra que nos

autores nascidos nos séculos 16 e 17 há a atuação de uma gramática V2 no licenciamento das várias formas de

10 Cabe salientar que existe na história do português dois tipos de inversão ‘verbo-sujeito’: as inversões românicas e as germânicas.

As inversões românicas se instanciam preferencialmente como #VS, ou mais caracteristicamente, #VXS, e correspondem a uma focalização do sujeito, que ocupa uma posição pós-verbal mais baixa, ou seja, pode estar depois dos complementos do verbo. Nestes casos, a inversão é de fato uma propriedade dos sujeitos, que permanecem em VP – ou são extrapostos à direita, a depender da análise; de qualquer modo, o que está em jogo neste caso é a natureza do sujeito. Este tipo de construção pode ser identificada nas ordens VXS, ou seja, em que entre o verbo e o sujeito há um outro constituinte de VP (...)

Já a inversão germânica – #XVS, ou mais caracteristicamente #XVSX – não é, a rigor, uma inversão. Pois o que está em jogo nestes casos não é o sujeito, que está em sua posição “regular” – mas sim o movimento de um outro constituinte de VP para uma posição mais elevada que a posição regular do sujeito. Este movimento envolve a subida do constituinte em questão para ocupar o especificador de determinada categoria funcional para cujo núcleo o verbo por sua vez se move – explicando a ordem linear XVS. O sujeito, assim, é “deixado para trás” – e isto pode acontecer mesmo com sujeitos que não são focos. Na verdade, nestas configurações o constituinte X pré-verbal será o elemento mais saliente da sentença. As ordens VS deste tipo se configuram tipicamente como XVSX (...)

Para poder verificar a freqüência de cada tipo de inversão, é preciso separar do total de ordens VS o sub-conjunto dos dados em que a posição do sujeito em relação aos demais constituintes pós-verbais possa ser bem documentada (ou seja, separar apenas (X)VXS e (X)VSX). (Paixão de Sousa 2004: 160, 161)

11 GIBRAIL, Alba Verôna Brito. (tese em andamento). Formas de Manifestações de Estruturas de Tópico do Português Clássico: Mudança de Comportamento Sintático na Diacronia. Apresentação no workshop do projeto temático Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística - IEL/UNICAMP. Agosto, 2007. O levantamento de dados de Gibrail considera as construções com topicalização nas orações não-dependentes e marca o estatuto do sujeito (lexical ou nulo) e, quando lexical, sua posição (SV, VS) em textos do corpus Tycho Brahe. Entretanto, falta no trabalho a automação e a versatilidade que serão conquistadas com a disponibilização do corpus Tycho Brahe anotado sintaticamente.

12

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

manifestação de estruturas de tópico.

Os dados de Gibrail, também extraídos do Corpus Tycho Brahe, mostram uma grande tendência de licenciamento de

objetos em posição de tópico em estruturas V2, ou seja, XV, com e/ou sem clítico (96,5% de ordem XV, contra 2,5% de

XXV e 1% de XXXV, no século 16; e 94,7% de ordem XV, contra 5,1% de XXV e 0,2% de XXXV). Gibrail atesta a

diminuição da freqüência de uso de estruturas de topicalização, paralelamente à evolução da freqüência de uso de

estruturas de CLLD (clitic left deslocation) em função da restrição de licenciamento de sintagmas topicalizados na categoria

de elementos fronteados.

Nosso objetivo será estender a descrição feita dos domínios não dependentes por Paixão de Sousa (2004) (orações com

clíticos) e Gibrail (em andamento) (orações com clítico e sem clítico) para os domínios dependentes finitos, uma vez que

o fenômeno do fronteamento e da interpolação é característico deste ambiente (cf. Martins 2005). As construções sob

análise nas orações dependentes com e sem pronomes clíticos serão:

Nas orações com sujeito nulo localizaremos as ordens:

(i) (X)XV vs VX(X)(23) Ho Ifante foy ho derradeyro que ſe delle deſpedio beyjan-dolhe has mãos. (Duarte Galvão, 1435)

(24) .... em ſuas excellentes cavallarias, como por ellas ſe moſtra, ho animoſo fervor, e ardente esforço de Julio Ceſar, e ha ſegurança muy confiada de Publio Cipiaõ Afriquano, em tanto grão , que todo ho que eſtava por fazer, cometia como ſe ho tiveſe jàa feyto, e ho que muy deficil ſe acha ſendo tam activo. (Galvão, 1435)

(25) De nhuma lhe acodiam tantos, como de Beja, ho que cauſou fiquar ha a Villa muito minguoada de gente, que para ſua defenſaõ lhe fazia miſter. (Galvão, 1435)

(26) os quaes dotou de muitas poſeſsões ,e guarneceo de grandes ornamentos, no que he bem de notar , e ſeguir ha muita devoçaõ dos Cavalleyros daquelle tempo , que com todas ſuas preſas, e trabalhos, e grandes, e continuas deſpezas, em guerra taõ ſanta , e quaſi do Reyno ha dentro ſendo entam ho Reyno mais pequeno, e menos rico, nom ſe deſcuydàraõ por eſo de todo ho ſerviço de Deos, ... (Galvão, 1435)

(27) Finalmente que desta e de toda a mais caça de que acima tratei, participam (como digo) todos os moradores, e mata-se muita dela à custa de pouco trabalho em toda a parte que querem: porque não há lá impedimento de coutadas como nestes Reinos, e um só Índio basta ( se é bom caçador) a sustentar uma casa de carne do mato: ao qual não escapa um dia por outro, que não mate porco ou veado, ou qualquer outro animal destes de que fiz menção . (Gândavo, 1502)

(28) Acautela ele os maridos, a que façam ter as suas mulheres as receitas de cozinha escritas por outros e por Ramalho Ortigão não se importando que elas conheçam pessoalmente este último sujeito, mas somente o "Cozinheiro dos Cozinheiros" que ele redigia. (Ortigão, 1836)

Considero que não é possível propor uma análise baseada apenas nas ordens XV vs VX, pois nas sentenças sem clítico,

ou com clítico adjacente ao verbo nem sempre é claro diferenciar as construções de deslocamento à esquerda e foco

identificacional, também permitidas no PE moderno (cf. Martins, 2002, 2005), do fronteamento permitido apenas nas

fases antigas.

Para refinar a análise, buscarei as construções com o sujeito expresso, também considerando a posição do clítico nas

sentenças que contiverem o pronome:

(ii) SXV(X) e (X)VSX13

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

(029)e jàa nom tinham modo de defençaõ, ſe nom deſemparar ho palanque, e acolherſe àcerqua; mas ho Senhor Deos, que he poderoſo em todalas couſas, quando ſe hos homens em ellas nom ſabem, nem podem valer ... (Galvão, 1435)

(030)nom peleyjando, que peleyjando receaes ſe fogiſemos as batalhas ha que nos Deos, e noſas vontades taõ acerqua trouxeraõ ... (Galvão, 1435)

(031)... à honra da morte , e payxaõ que N.Senhor recebeo na Cruz,pelo qual hee de crer , ~q lhe quiz Deos aſi apparecer ... (Galvão, 1435)

(032)As quais capitanias el-Rei Dom João o terceiro , desejoso de plantar nestas partes a Religião Cristã , ordenou em seu tempo, escolhendo para o governo de cada uma delas vassalos seus de sangue e merecimento , em que cabia esta confiança. (Gândavo, 1502)

(033) Finalmente que desta e de toda a mais caça de que acima tratei , participam (como digo) todos os moradores , e mata-se muita dela à custa de pouco trabalho em toda a parte que querem: porque não há lá impedimento de coutadas como nestes Reinos, e um só Índio basta ( se é bom caçador) a sustentar uma casa de carne do mato: ao qual não escapa um dia por outro, que não mate porco ou veado, ou qualquer outro animal destes de que fiz menção . (Gândavo, 1502)

(034) Durou ho cerquo perto de ſinquo mezes, por ha Cidade ſer muy for- te , de ſitio, e cerqua, e eſtarem dentro muitos Mouros,'q ha muy bem defendião , fizeraõ-ſe neſte cerquo grandes eſcaramuças , e fortes combates, em que ſe matavam muitos Cavalleyros de huma parte , e da outra. (Galvão, 1435)

(iii) XSV e VXS

(035) nem manteuda cõ ElRey de por meyo em ſua terra , que abaſtava para elles leyxarem-na em poder de Chriſtãos como fora ſeu dezejo , e aſi ſe foraõ ha ElRey , e lho dice- raõ muy francamente, ho que lhes elle muito agradeceo , offerecen-do-ſe, que ſe alguns delles, e de ſuas gentes quizeſem fiquar em ſua terra, elle lhe daria luguares para povoarem (Galvão 1435)

(036) que ſegundo cuydo, e eſpero prazerà ha Deos, que voſos deſejos, e meus, eu volos darey compridos com muito prazer , e honra (Galvão 1435)

(037) QUE viaje à roda do seu quarto quem está à beira dos Alpes, de Inverno, em Turim, que é quase tão frio como São Petersburgo - entende-se. Mas com este clima, com este ar que Deus nos deu, onde a laranjeira cresce na horta, e o mato é de murta, o próprio Xavier de Maistre, que aqui escrevesse, ao menos ia até o quintal. (Garrett 1799)

As construções em (ii) são mais características das gramáticas V2 (cf. Paixão de Sousa 2004) e por isso o diagnóstico do

fronteamento traz menos ambigüidade nestes casos.

De acordo com Martins (2002: 285) o processo sintático de deslocação do objeto para uma posição pré-verbal interna à

frase, designado scrambling pela autora, resulta na ordem SOV. Segundo Martins (2002), este processo de anteposição

verbal do objeto não perdura em nenhuma das línguas românicas, mas manten-se representado em outras línguas da

família germânica, como no alemão e no neerlandês. Já as ordens OSV e OVS resultariam do deslocamento a esquerda

clítica ou da focalização enfática, estruturas que persistem no português contemporâneo.

Por outro lado, ponderando a posição pós-verbal do sujeito, a ordem XVSX não seria uma inversão da posição do

sujeito, como no PE, mas o movimento de um outro constituinte de VP para uma posição mais elevada que a posição

regular do sujeito (cf. Paixão de Sousa (2004), também cf. nota 11). Este movimento envolve a subida do constituinte em questão

para ocupar o especificador de determinada categoria funcional para cujo núcleo o verbo por sua vez se move – explicando a ordem linear

XVS. O sujeito, assim, é “deixado para trás” – e isto pode acontecer mesmo com sujeitos que não são focos. (Paixão de Sousa 2004: 160,

14

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

161). Já a inversão VXS corresponderia mais caracteristicamente a uma focalização do sujeito (cf nota 11). Portanto, as

ordenações em (ii) são as principais construções sob análise e as em (iii) são freqüentes no PE moderno e por isso é

crucial medi-las nos textos para se descobrir quando exatamente vão superar as construções apresentadas em (ii).

Desta forma, para verificar a freqüência de cada tipo de inversão, é preciso separar do total de ordens VS o subconjunto

dos dados em que a posição do sujeito em relação aos demais constituintes pós-verbais possa ser bem definida, ou seja,

separar (X)VXS e (X)VSX.

Também vamos ponderar a natureza de X refinando os tipos de X que aparecerão nos textos. Investigaremos

separadamente os complementos e adjuntos. Na categoria complemento, separaremos os sintagmas dativos dos

acusativos. Na categoria adjunto, refinaremos o tipo (adverbiais, preposicionais, nominais, ...).

Desta forma pretendemos trazer subsídios para comprovar nossa proposta, delineada a partir da argumentação trazida

em Namiuti (a sair), de que a perda da possibilidade da interpolação é anterior ao desaparecimento do fronteamento na

língua portuguesa. Ou seja, a possibilidade do processo sintático do fronteamento mantem-se após a re-análise do

pronome clítico para clítico exclusivamente verbal. E ainda corroborar a hipótese de Galves (1996, entre outros

trabalhos) e Paixão de Sousa (2004).

III – O CORPUS TYCHO BRAHE

Como lembra Paixão de Sousa (2006), os estudos históricos realizados com base em textos antigos dependem, antes de

tudo, da garantia da fidelidade às formas originais dos textos – sendo este o pilar de sustentação que qualquer estudo

lingüístico, em qualquer quadro teórico, deve pressupor. No caso dos corpora eletrônicos, esse pressuposto fundamental

pode ser integrado a outros requisitos, como a necessidade de quantidade, agilidade e automação no trabalho estatístico

de seleção de dados. Paixão de Sousa (2006) defende que a conjunção dessas vertentes configura o principal desafio do

trabalho de edição especializada e análise lingüística de textos antigos no meio eletrônico.

Foi com este espírito que foi desenvolvido o Corpus Tycho Brahe.

O corpus Tycho Brahe é um corpus anotado do português histórico que disponibiliza seus textos em formato

ortograficamente transcrito e morfologicamente etiquetado, e está investindo em um analisador sintático para os textos

Medievais e Clássicos. Os textos analisados morfo-sintaticamente permitem uma pesquisa lingüística mais precisa e

rápida com recuperação instantânea de informações nos textos analisados.

Elaborado nos moldes do corpus parseado do Inglês Médio PPCME (Penn-Helsinki Parsed Corpus of Middle English), o Corpus

Anotado do Português Histórico Tycho Brahe consiste em um corpus eletrônico composto por textos em prosa, escritos em

português por falantes nativos do português europeu, nascidos entre 1380 e 1845 (cf. 15

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

http://www.ime.usp.br/~tycho/corpus). O objetivo do Corpus Tycho Brahe é disponibilizar publicamente dados

históricos do português europeu anotados de tal maneira que os estudiosos de sua história possam recuperar

rapidamente informações categoriais e estruturais pertinentes à análise morfo-sintática da língua.

A construção do Corpus Tycho Brahe (CTB) envolveu, portanto, a elaboração de ferramentas computacionais de

anotação, das quais as principais são: 1) o etiquetador morfológico automático desenvolvido por Marcelo Finger (IME-USP),

tendo sido posteriormente implementado um segundo etiquetador morfológico por Fábio Kepler (IME-USP); 2) o

analisador automático para o Português que está sendo desenvolvido a partir do treinamento de um analisador universal

elaborado na Universidade de Pensilvânia por Daniel Bikel (Department of Computer & Information Science). O

treinamento inicial desse analisador foi possível graças ao desenvolvimento de um sistema de anotação sintática, nos

moldes do sistema proposto por Taylor e Kroch (1998)12, para o Inglês Médio, e da anotação manual de 50.000

palavras de um texto por Helena Britto, pós-doutoranda da primeira fase do projeto temático. No entanto é necessário

muito mais que 50.000 para que o parser demonstre um resultado satisfatório.

Segundo a metodologia proposta no PPCME, a etiquetagem morfológica dos textos constitui o primeiro passo do

processo de anotação, servindo de base para a codificação sintática subseqüente. Contudo, é importante ressaltar que

os textos automaticamente etiquetados são disponibilizados independentemente, uma vez que já contêm por si

informações relevantes para estudos da língua, como se mostrou com as pesquisas apresentadas na Seção anterior. Por

isso, cada um dos textos, representados por aproximadamente cinqüenta mil (50.000) palavras cada, deverá estar

disponível em três formatos:

i. ortograficamente transcritos: Senhor: Ofereço a Vossa Majestade as Reflexões sobre a vaidade dos homens

ii. morfologicamente etiquetados: Senhor/NPR :/. Ofereço/VB-P a/P Vossa/PRO$-F Majestade/NPR as/D-F-Reflexões/NPR-P sobre/P a/D-F vaidade/N dos/P+D-P homens/N-P

iii. sintaticamente anotados: (IP-MAT (NP-SBJ *pro*) (NP-VOC (NPR Senhor)) (. :) (VB-P Ofereço) (PP (P a) (NP (PRO$-F Vossa) (NPR Majestade))) (NP-ACC (D-F-P as) (NPR-P Reflexões) (PP (P sobre) (NP (D-F a) (N vaidade) (PP (P+D-P dos) (NP (N-P homens))))))

12 http://www.ling.upenn.edu/hist-corpora/16

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

O sistema de anotação sintática é uma árvore que pode ser visualizada sob a forma de parênteses etiquetados, como no

exemplo acima, ou no formato arbóreo quando visualizada no Corpus Draw.

Uma sentença declarativa é codificada como um IP-MAT (um “IP matriz”) ao passo que uma subordinada é codificada

como um CP, que seleciona um IP-SUB (um “IP-subordinado”). Todos os sintagmas são diretamente ligados ao nó raiz:

o sujeito (NP-SBJ), o verbo (SR-P), e o objeto direto (NP-ACC) no caso representado na figura do Corpus Draw13.

iv. Isto é o mesmo que oferecer em um pequeno livro aquilo de que o mundo todo se compõe, e que só Vossa Majestade não tem: feliz

indigência, e que só em Vossa Majestade se acha. (AIRES-A_001,03.8)14

As relações entre os nós da árvore são de dois tipos: dominância e precedência. Na figura acima, o IP-MAT domina

imediatamente os nós NP-SBJ, SR-P e NP-ACC. O nó NP-SBJ precede imediatamente TR-P, e precede não

imediatamente o NP-ACC . As buscas são feitas com base nestas relações.

Para estudar, por exemplo, o fronteamento dos NPs acusativos em sentenças subordinadas deve-se escrever um

comando de busca do tipo:

13 Simplificação em relação à teoria X’, ramificações não binárias, ausência de projeção de VP e outros módulos da teoria. A anotação sintática não deve, nem pretende, seguir as tendências de análise mais recentes dentro de determinada Teoria lingüística. A intenção em apresentar um corpus anotado sintaticamente é disponibilizar um maior número possível de estruturas a serem recuperadas automaticamente, e não apresentar uma análise de dados. Por isso, se fez necessário estabelecer critérios sistemáticos de anotação sintática, disponíveis no manual em:

http://www.ime.usp.br/~tycho/corpus/manual/syntax.html.

14 As sentenças são identificada com: o nome do arquivo – Aires-A_001, o número da página – 03, o número da sentença - 08. 17

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

Que se traduz: IP-SUB domina imediatamente NP-AC, e também o verbo finito (VB|TR|ET|HV|SR-*). NP-ACC

precede imediatamente verbo finito, e não domina imediatamente categoria vazia ou clítico.

Tal comando permite que se encontrem todas as sentenças com a ordem ‘Objeto Direto-Verbo’ em sentenças

encaixadas.

Os dados são salvos automaticamente em um arquivo de saída. O arquivo contém um cabeçalho com informações sobre

a data e o texto em que foi feita a busca; bem como sobre a ferramenta utilizada – o CorpusSearch e a formulação da

busca.

Os dados são impressos logo após o cabeçalho da seguinte forma:

1) com a sentença sem anotação;

2) informação sobre o(s) dado(s) considerado(s) naquela sentença, no exemplo: no 41° IP-SUB o NP acusativo

considerado é o de número 42 e o verbo - 45 (os números são atribuídos automaticamente pela ferramenta para a

identificação do dado).

3) A sentença anotada.

18

define: port.def

print_indices: t

node: IP*

query: (IP-SUB iDoms NP-ACC)

AND (IP-SUB iDoms tns_vb)

AND (NP-ACC iPrecedes tns_vb)

AND (NP-ACC iDoms !\**|SE|CL)

porque os erros facilmente se desculpam em favor de um morto; se bem que pouco vale um livro, quando para merecer algum sufrágio, necessita que primeiro morra o seu Autor;(AIRES-A_001,09.101)*~//*41 IP-SUB: 41 IP-SUB, 42 NP-ACC, 45 VB-P, 43 Q*/( (41 IP-SUB (42 NP-ACC (43 Q pouco))

(45 VB-P vale) (47 NP-SBJ (48 D-UM um) (50 N livro)) (52 , ,) (54 CP-ADV (55 WADV quando)

(57 IP-SUB (58 NP-SBJ *pro*) (60 PP (61 P para)

(63 IP-INF (64 VB merecer) (66 NP-ACC (67 Q algum) (69 N sufrágio))))

(71 , ,) (73 VB-P necessita) (75 CP-THT (76 C que)

(78 IP-SUB (79 ADVP (80 ADJ primeiro)) (82 VB-SP morra) (84 NP-SBJ (85 D o) (87 PRO$ seu) (89 NPR Autor)))))))

(93 ID AIRES-A_001,09.101))

/~*

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

No final do arquivo de saída a busca trás automaticamente a quantificação hits/tokens/total – onde hits é o número de

dados / tokens é o número de sentenças que contém dados / e total é o total de sentenças do(s) texto(s).

Esta busca pode ser ampliada, por exemplo, com buscas que prevêem todo o tipo de oração, ou qualquer constituinte

fronteado. Ou ainda pode ser sofisticada, por exemplo, considerando a posição do sujeito ou seu estatuto nulo, ou ainda a

posição do verbo, se segue ou precede imediatamente o elemento em foco.

Nosso objetivo será contribuir para a disponibilização dos textos do corpus Tycho Brahe anotados sintaticamente para

que seja possível buscar as sentenças finitas (com e sem clíticos) que contenham elementos fronteáveis e medir a

freqüência do fronteamento em 13 textos do Corpus Tycho Brahe, ponderando a posição do sujeito e do verbo, e as

sentenças com sujeito nulo.

Este trabalho também envolverá a implementação e criação dos comandos de busca (queries) dos dados relevantes para a

investigação que pretendemos realizar. A atividade de correção da anotação sintática certamente contribuirá na

implementação das buscas. Também a criação das queries poderá permitir reflexões sobre a própria anotação sintática

implementada no corpus Tycho Brahe.

Nosso trabalho consistirá, portanto, em três tarefas centrais:

1) A correção da anotação sintática de 2/3 dos 20 textos previstos pelo projeto temático para serem disponibilizados

para pesquisa nos 2 próximos anos (o que equivale a 13 textos). Este processo envolve a utilização da ferramenta

Corpus Draw.

2) A implementação de buscas utilizando a linguagem x-query para estudar a variação XV/VX

(http://corpussearch.sourceforge.net/CS-manual/QueryLanguage.html).

3) A análise dos dados para fundamentar a hipótese apresentada na Seção anterior.

IV. PLANO DE TRABALHO E CRONOGRAMA DE SUA EXECUÇÃO

Ano 1: 01 de março de 2008 a 28 de fevereiro de 2009

Correção da anotação de 5 textos e início da criação das buscas e do levantamento de dados. A busca e a análise dos

dados será feita conforme a disponibilização dos textos anotados.

19

SUMMARY: source files, hits/tokens/total ..\port\aires.psd 12/12/4498whole search, hits/tokens/total

12/12/4498

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

A divisão dos textos parte do pressuposto de que o analisador automático ainda não foi suficientemente treinado

para produzir uma anotação satisfatória e com isso a correção levará mais tempo neste primeiro ano.

Depois da correção de cada texto será feito o levantamento dos dados. Desta forma investiremos em uma

dinâmica que enriquece as tarefas de correção e busca. Pois as experiências com a implementação das queries e com

a busca podem contribuir na estabilização da anotação, bem como trazer saídas para eventuais lacunas no sistema

de anotação proposto. Também a experiência da correção da anotação promove uma intimidade com o sistema

que potencializa o poder da busca.

Nesta primeira etapa Focalizaremos os textos dos séculos 16 e 17

1)Luís de Sousa (1556)2) Francisco Rodrigues Lobo (1579)3) Antônio Vieira (1608) cartas4) Antonio Vieira (1608) Sermões5) Antônio das Chagas (1631)

Redação do relatório parcial, com os dados dos 5 textos corrigidos e sua interpretação.

Ano 2: 01 março de 2009 a 28 de fevereiro de 2010

Correção e análise dos dados dos 8 textos restantes.

1) Cavaleiro de Oliveira (1702) cartas2) Antonio da Costa (1714)3) Ramalho Ortigão (1836)4) Diogo do Couto (1542)5) Francisco de Holanda (1517)6) Pedro de Magalhães Gandavo (150? -1579)7) Duarte Galvão (1435 – 1517)8) Fernão Lopes (1380 – 1460)

Redação do relatório final, com a apresentação e interpretação de todos os dados.

Ao longo destes 2 anos propomos também a organização, no âmbito do projeto temático, de oficinas, com vista à

formação de outras equipes para a metodologia de trabalho com textos anotados.

REFERÊNCIAS

ANDERSON, S. (1982): “Where is morphology?”. Em : Linguistic Inquiry, n° 13, pp 571-612.

ANDERSON, S. (1992): A-morphous morphology. Cambridge, Cambridge University Press.

BAKER, M. (1998): Incorporation. A theory of grammatical fuction changing. Chicago. University of Chicago Press.

BARBOSA, P. (2000). “Clitics: a window into the null subject property.” Em: João Costa (org) Portuguese Syntax. New York: Oxford University

Press.

BELLETTI, A. (1990): Generalized verb moviment: Aspects of verb syntax. MS, University de Genève.

20

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

BOBALJIK, J. D. (1995) Morphosyntax: On the syntax of verbal inflation. Ph. D. Dissertation. Cambridge, Massachusetts. Massachusetts Institute of

Technology.

CARDEIRA, Esperança. (2005). Entre o Português Antigo e o Português Clássico. Imprensa Nacional Casa da Moeda. Lisboa.

CARDINALETTI, Ana e STARKE, Michal. (1999). “The typology of structural deficiency: A case study of three classes of pronouns”. Em: Clitics

in the Languages of Europe. Editado por Henk Van Riemsdijk. WdeG.

CASTRO, Ivo (2006) Introdução à História do Português. Edições Colibri. Lisboa.

CAVALCANTE, Silvia Regina de Oliveira (2007). “O sistema de anotação sintática em um corpus eletrônico do português: Propostas e desafios”.

Em Mesa Redonda ABRALIN 2007: Lingüística de Corpus e História da Língua Portuguesa: Propostas, Resultados e Desafios. Belo Horizonte,

MG.

CHOMSKY, Noam. (1970). “Remarks on nominalization”. Em: JACOBS, R & ROSENBAUM P. (orgs.) Reedings in English transformational grammar.

Waltham, MA, Ginn.

CHOMSKY, Noam. (1979). Principles and parameters in linguistic theory. MIT.

CHOMSKY, Noam. (1981). Lectures on government and binding. Dordrecht: Foris.

CHOMSKY, Noam. (1986). Barriers. Cambridge (MA). MIT Press.

CHOMSKY, Noam. (1993). “Minimalist program for linguistic inquiry”. In HALLE, K. & KEYSER, J. (eds) View from the building 20. Cambridge

(MA). MIT Press.

CHOMSKY, Noam. (1995). The Minimalist Program. Cambridge (MA). MIT Press.

COSTA, João & DUARTE, Inês (2002): “Preverbal subjects in null subjects languages are not necessarily dislocated”. Em: Journal of Portuguese

Linguistic, 1, 159-175.

COSTA, João, e MARTINS, Ana Maria (2004). “What is strong functional head?”. Lisbon: Whorkshop on Alternative Views on the Functional Domain.

COSTA, João. & Charlotte. GALVES (2002). “External subjects in two varieties of Portuguese. Evidence for a non-unifiede analysis”. Em: Claire

Beyssade, Reineke Bok-Bennema, Frank Drijkoningen, Paola Monachesi (eds). Proceedings of going Romance 2000, Amsterdam/Philadelphia: Jhon

Beijamins.

COSTA, João. (1996). "Positions for subjects in European Portuguese". In Proceedings of WCCFL XV. Stanford: CSLI.

COSTA, João. (1998). Word order and constraint interaction: A constraint based approach, PhD Dissertation, LeidenUniversity

COSTA, João. (1999). “Word order and configurationality in European Portuguese”. Em: J. Costa (ed.) Portuguese Syntax – New comparative

studies. Oxford University Press, Oxford.

COSTA, João. (2000): “Spec, IP ou deslocado? Prós e contras das duas análises dos sujeitos pré-verbais”. Em: DELTA. Vol 17, n°2. São Paulo.

Embick, D. E Noyer, R. (2001). "Movement operations after syntax". Em: Linguistic Inquiry. 32: 4, 555-595

FIÉIS, Maria. Alexandra Jesus. (2001) “Interpolação em Português Medieval como adjunção a XP”. Em: Actas do XVI - Encontro Nacional da

Associação Portuguesa de Linguística, Lisboa, APL, 197-211.

FINGER, Marcelo. (1999). “Técnicas de otimização da precisão empregadas no etiquetador Tycho Brahe”.

http://www.ime.usp.br/~tycho/participants/compl_list.html

FINGER, Marcelo. (s/d): “Etiquetagem Morfo-sintática: uma aplicação do aprendizado computacional ao processamento da linguagem”. (inédito)

FONTANA, Joseph Fontana. (1996). "Phonology and syntax in the intepretation of the Tobler-Mussafia law". Em: Appoaching second. Second position

clitics and related phenomena. Editado por A. L. Halpern e A. M. Zwicky. CSLI Publications.

GALVES, Charlotte (1996). “Colocação de clíticos e mudança gramatical no português europeu”. Comunicação no 12° Encontro da Associação

Portuguesa de Linguística, Braga, Portugal.

GALVES, Charlotte. (1998) Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística. UNICAMP CAMPINAS. (Projeto de pesquisa FAPESP)

GALVES, Charlotte (2001). Ensaios sobre as gramáticas do português. Editora da Unicamp. Campinas-SP

GALVES, Charlotte. (2004) Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística – Fase II. UNICAMP CAMPINAS. (Projeto de pesquisa

FAPESP)

GALVES, Charlotte (2002) – “Syntax and Style: clitic placement in Padre Antonio Vieira”. Em: Santa Barbara Portuguese Studies, vol. VI, trad. port,

"Sintaxe e estilo: a colocação de clíticos nos sermões do Padre Vieira”, in E. Albano, M.I. Hadler Coudry, S. Possenti & T. Alckmin (orgs.)

Saudades da Língua, Mercado de Letras, 2003, págs. 245-260.

GALVES, Charlotte e BRITTO, Helena. (1998). “A construção do Corpus Anotado do Português Histórico Tycho Brahe: o sistema de anotação

morfológica”. http://www.ime.usp.br/~tycho/participants/compl_list.html.

GALVES, Charlotte, BRITTO, Helena e FINGER, Marcelo. (1998). “Computational and linguistic aspects of the construction of The Tycho Brahe

Parsed Corpus of Historical Portuguese”. http://www.ime.usp.br/~tycho/participants/compl_list.html21

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

GALVES, Charlotte, BRITTO, Helena e PAIXÃO DE SOUSA, Maria Clara (2005) – “Clitic Placement in Europena Portuguese: Results from the

Tycho Brahe Corpus”. Em: Journal of Portuguese Linguistics, Vol 4 , n.1, Special Issue on variation and change in the Iberian languages: the Peninsula

and beyond.

GALVES, Charlotte, Cristiane NAMIUTI e Maria Clara PAIXÃO DE SOUSA, (2006) – “Novas perspectivas para antigas questões: revisitando a

periodização da língua portuguesa”. Em: Grammatische Structuren des Europäischen Portugiesisch. Annette Endruschat / Rolf Kemmler / Bárbara Schäfer-

PrieB (Hrsg). Turbigen: Calapinus Verlag, págs 45-75.

GALVES, Charlotte, e PAIXÃO DE SOUSA, Maria Clara (2005) – “Clitic placement and the position of subjects in the history of European

Portuguese”. In T. Geerts, I. Van Ginneken & H. Jacobs (orgs.) Languages and Linguistic Theory, Selected papers from ‘Going Romance’ 2003, John

Benjamins, 2005, pp. 93-107.

GIBRAIL, Alba Verôna Brito. (em andamento). “Formas de Manifestações de Estruturas de Tópico do Português Clássico: Mudança de

Comportamento Sintático na Diacronia”. Apresentação no workshop do projeto temáticoI Padrões Rítmicos, Fixação de Parâmetros e Mudança

Lingüística - IEL/UNICAMP. Agosto, 2007.

Halle (1990). "An Aproach to Morphology". Em: NELLS 20,150-184.GLSA, University of Massachusetts, Amherst.

HALLE, M. E MARANTZ, M. (1993): “Distributed Morphologie and the pieces of inflection”. Em: Halle, K. e Keyser. J. (eds.) View from the

Building 20: Essays in Linguistics in honor of Sylvain Bromberger. Cambridge, MA, MIT Press.

HELLAN, Lars e Christer PLATZACK, (1999). "Pronouns in Scandinavian languagues: An overview". eM: Clitics in the Languages of Europe. Editado

por Henk Van Riemsdijk. WdeG.

HUBER, Joseph. (1986). - Gramática do Português Antigo. Lisboa, Gulbenkian.

KROCH, Anthony. (1989). "Reflexes of grammar in patterns of language change". Em: Language Variation and Change. p. 199-244. Cambridge

University Press.

KROCH, Anthony. (2003). "Mudança sintática". http://www.ling.upenn.edu/ kroch. Traduzido por Silvia Cavalcante.

LAKA, I. (1990). Negation in Syntax: On the Nature of Functional Categories and Projections. Ph. D. Dissertation. Cambredge, Massachussets: MIT.

MAGRO, Catarina (2006). “A interpolação nos dados dialectais do CORDIAL-SIN”. I Encontro sobre Variação e Mudança em Português. Braga/Guião.

MARANTZ, A. (1995): “A late Notion on late insertion”. Em: Explorations in Generative Grammar, ed. Young-Sum Kim, et al.. Hankuk Publising Co.,

Seoul, págs 396-413.

MARANTZ, A. (1998): “Clitics, Morphological Merger, and the Mapping of Phonological Structure”. Em: M. Hammond e M. Noonan (eds.),

Theoretical Morphology. Academic Press. San Diego, págs 253-270.

MARTINS, Ana Maria (1994) – Clíticos na história do português. Tese de Doutoramento, Universidade de Lisboa. Mimeo.

MARTINS, Ana Maria (1997) – “Mudança Sintática. Clíticos, negação e um pouquinho de Scrambling”. Em: Estudos Lingüísticos e Literários,. nº 19,

Salvador: Programa de Pós Graduação da Universidade Federal da Bahia.

MARTINS, Ana Maria (2000): “Polarity Items in Romance: Underspecification and Lexical Change.” Em: Diachronic Syntax: Models and Mechanisms.

Orgs. Pintzuk, Susan, George Tsoulas e Anthony Warnes. Oxford University Press.

MARTINS, Ana Maria. (2002). "Mudança Sintática e História da Língua Portuguesa". Em: História da Língua e História da Gramática. Actas do

Encontro. Colecção Poliedro 11. Universidade do Minho. Centro de Estudos Humanísticos. Braga 2002.

MARTINS, Ana Maria. (2003a) “Deficient pronouns and linguistic changes in Portuguese and Spanish” Deficient pronouns and linguistic change in

Portuguese and Spanish. In J. Schroten (Ed.), Romance Language and Linguistic Theary 2001: Selected Papers from 'Going Romance' 2001.

Amsterdam and Philadelphia: John Benjamins.

MARTINS, Ana Maria. (2003b). “From Unity to Diversity in Romance Syntax. Portuguese and Spanish”. In: Kurt Braunmüller, Gisella Ferraresi

(eds) Aspects of Multilingualism in European Language History. vol 2. University of hamburg. John Bejanmins Publishing Company. Amsterdam /

philadelphia.

MARTINS, Ana Maria. (2005). “Clitic Placement, VP-Ellipsis and Scrambling in Romance”. Em: Batilbori, Montse, Maria Lhuïsa Hermanz, Carme

Picallo, e F. Roca (eds.) Gramaticalization and Parametric Variation. Oxford University Press.

MATOS, Gabriela Ardisson (1994). ''A Distribuição de Despojamento”. Em: Inês Duarte e Isabel Leiria (orgs) Congresso Internacional sobre o Português.

vol II. Edições Colibri.

MATTOS E SILVA, Rosa Virginia (1989) – Estruturas trecentistas: Elementos para uma gramática do português arcaico. Lisboa: Imprensa Nacional Casa da

Moeda

MATTOS E SILVA, R. V. (1991). Português arcaico, Fonologia. S.Paulo: Contexto.

MATTOS E SILVA, R. V. (1992). Para uma caracterização do período arcaico do português. Mimeo.

MATTOS E SILVA, R. V. (1994). Português arcaico, Morfologia e Sintaxe. S.Paulo. Contexto.22

Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.

MIOTO, C., M. C. Figueiredo Silva e R. V. Lopes. (1999) Manual de Sintaxe. Florianópolis, SC: Insular.

MUIDINE, Soraia Aboo (2000): Os pronomes i e em(de) no português dos séculos XIII ao XVI. Dissertação de Mestrado, Lisboa.

NAMIUTI, C. (2006). "Um estudo sobre o fenômeno da interpolação de constituintes na história do português". Em: Cadernos de Estudos

Lingüísticos. Número 48(2). Págs: 171-194. Campinas-UNICAMP.

NAMIUTI, Cristiane (a sair). "Aspectos da História Gramatical do Português: Interpolação, Negação e Mudança". Tese de Doutorado.

IEL/UNICAMP. Campinas, SP.

NAMIUTI, Cristiane. (2004). “O corpus anotado do português histórico: um avanço para as pesquisas em lingüística histórica do português”. Em:

Revista Virtual de Estudos da Linguagem – ReVEL. Ano 2, n. 3

[http://www.revel.inf.br/site2007/_pdf/3/artigos/revel_3_reconhe+1:65536cimento_de_termos_e+1:65536_producao.pdf]

NAMIUTI, Cristiane. (2007). “O Sistema de Anotação Morfológica em um Corpus Eletrônico do Português: Precisão e Eficiência na Busca e

Seleção de Dados”. Em Mesa Redonda ABRALIN 2007: Lingüística de Corpus e História da Língua Portuguesa: Propostas, Resultados e Desafios.

Com a participação de Maria Clara Paixão de Sousa (coordenador) e Silvia Regina de Oliveira Cavalcante. Belo Horizonte, MG.

NOYER, R (2004): “Distributed Morphology”. http://www.ling.upenn.edu/~rnoyer/dm/

PAIXÃO DE SOUSA, Maria Clara (2004) – Língua Barroca: sintaxe e história do português nos 1600. Tese de Doutoramento. Instituto de Estudos da

Linguagem. Universidade Estadual de Campinas. Campinas-SP

PAIXÃO DE SOUSA, Maria Clara (2005). Memórias do Texto. Revista Texto Digital, ISSN 1807-9288, ano 2 n.1

2006.<http://www.textodigital.ufsc.br/num02/paixao.htm>

PAIXÃO DE SOUSA, Maria Clara (2006). Hypertext: concepual and methodological frontiers. Comunicação ao Seminário Internacional

Literaturas: del Texto al Hipertexto. Faculdade de Filología, Universidade Complutense de Madrid. Madri, 22 de Setembro, 2006.

PAIXÃO DE SOUSA, Maria Clara. (2002). Mudança Lingüística e fatores extra Gramaticais: o Caso no Português Clássico. Relatório de bolsa de doutorado

fapesp: 01/08465-5.

PARCERO, Lúcia. (1999). Fronteamentos de constituintes no português dos séculos XV, XVI e XVII. Dissertação de Mestrado, UFBa, Salvador-Ba.

POLLOCK, J. I. (1989): “ Verb Movement, UG and the Structure of IP”. Em: Linguistic Inquiry 20, págs.365-424.

RAPOSO, Eduardo Paiva (1994): Afectives operators and clausal structure in European Portuguese and European Spenish. Versão inédita.

RAPOSO, Eduardo Paiva. (2000). "Clitic positions and Verb movement". Portuguese Syntax: New

RIBEIRO, Ilza (1995) A sintaxe da ordem do português arcaico: o efeito V2. Tese de Doutoramento, Instituto de Estudos da Linguagem, Universidade

Estadual de Campinas.

RIBEIRO, Ilza. (1996). "Questões sobre a ordem dos constituintes no português arcaico e no português clássico". Em: Boletim ABRALIN Nº 17.

RIVERO, Maria Luiza. (1994). “Negation, imperatives and Wackernagel effects”. EM: Revista di Linguistica.

RIVERO, Maria Luiza. (1997). “On two locations for complement clitic pronouns: Serbo-Croatian, Bulgarian and Old Spanish” Em: Parameters of

Morphosyntatic change. Editado por: Ans Van Kemenade and Migel Vicenti. Cambridge University Press, p 170-206.

SARAIVA, António José (1970). História da Literatura Portuguesa. Livraria Bertrand

Silva, C. V. (2002) “Ordens de constituintes no Latim Medieval e no Português Antigo: scrambling e interpolação”. Em: Actas do XVII Encontro

Nacional da Associação Portuguesa de Linguística, Lisboa: APL.

SPENCER. Andrew (1991). Morphological Theory. Blackwell press.

TEYSSIER, P. (1982). - História da língua portuguesa. Lisboa, Sá da Costa.

TORRES MORAES, Maria Aparecida, (1995) – Do português clássico ao português moderno: um estudo da cliticização e do movimento do verbo. Tese de

Doutoramento, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas.

ZANUTTINI, Rafaella (1991): Syntatic Properties of Sentential Negation. A Comparative Study of Romance Languages. PhD Thesis. University of

Pennsylvania.

23