Universidade Federal de Minas Gerais Faculdade de Letras Luis ...
62
Universidade Federal de Minas Gerais Faculdade de Letras Luis Filipe Lima e Silva UM ESTUDO SOBRE A FOCALIZAÇÃO NO PORTUGUÊS BRASILEIRO Belo Horizonte 2013
Figura 31 - Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02 37
Figura 32 - Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03 38
Figura 33 - Anaacutelise acuacutestica do enunciado [335] do texto bfamcv02 40
Figura 34 - Anaacutelise acuacutestica do enunciado [453] do texto bfamcv04 42
Figura 35 - Anaacutelise acuacutestica do enunciado [175] do texto bfamcv03 44
Figura 36 - Anaacutelise acuacutestica do enunciado [187] do texto bfamcv03 46
Figura 37 - Anaacutelise acuacutestica do enunciado [188] do texto bfamcv03 47
Figura 38 - Anaacutelise acuacutestica do enunciado [41] do texto bfamcv03 49
Figura 39 - Anaacutelise acuacutestica do enunciado [288] do texto bfamcv03 51
Figura 310 - Anaacutelise acuacutestica do enunciado [290] do texto bfamcv03 52
Figura 311 - Anaacutelise acuacutestica do enunciado [252] do texto bfamcv03 53
Figura 312 - Anaacutelise acuacutestica do enunciado [97] do texto bfamcv02 54
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Figura 31 - Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02 37
Figura 32 - Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03 38
Figura 33 - Anaacutelise acuacutestica do enunciado [335] do texto bfamcv02 40
Figura 34 - Anaacutelise acuacutestica do enunciado [453] do texto bfamcv04 42
Figura 35 - Anaacutelise acuacutestica do enunciado [175] do texto bfamcv03 44
Figura 36 - Anaacutelise acuacutestica do enunciado [187] do texto bfamcv03 46
Figura 37 - Anaacutelise acuacutestica do enunciado [188] do texto bfamcv03 47
Figura 38 - Anaacutelise acuacutestica do enunciado [41] do texto bfamcv03 49
Figura 39 - Anaacutelise acuacutestica do enunciado [288] do texto bfamcv03 51
Figura 310 - Anaacutelise acuacutestica do enunciado [290] do texto bfamcv03 52
Figura 311 - Anaacutelise acuacutestica do enunciado [252] do texto bfamcv03 53
Figura 312 - Anaacutelise acuacutestica do enunciado [97] do texto bfamcv02 54
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Figura 31 - Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02 37
Figura 32 - Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03 38
Figura 33 - Anaacutelise acuacutestica do enunciado [335] do texto bfamcv02 40
Figura 34 - Anaacutelise acuacutestica do enunciado [453] do texto bfamcv04 42
Figura 35 - Anaacutelise acuacutestica do enunciado [175] do texto bfamcv03 44
Figura 36 - Anaacutelise acuacutestica do enunciado [187] do texto bfamcv03 46
Figura 37 - Anaacutelise acuacutestica do enunciado [188] do texto bfamcv03 47
Figura 38 - Anaacutelise acuacutestica do enunciado [41] do texto bfamcv03 49
Figura 39 - Anaacutelise acuacutestica do enunciado [288] do texto bfamcv03 51
Figura 310 - Anaacutelise acuacutestica do enunciado [290] do texto bfamcv03 52
Figura 311 - Anaacutelise acuacutestica do enunciado [252] do texto bfamcv03 53
Figura 312 - Anaacutelise acuacutestica do enunciado [97] do texto bfamcv02 54
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Figura 31 - Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02 37
Figura 32 - Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03 38
Figura 33 - Anaacutelise acuacutestica do enunciado [335] do texto bfamcv02 40
Figura 34 - Anaacutelise acuacutestica do enunciado [453] do texto bfamcv04 42
Figura 35 - Anaacutelise acuacutestica do enunciado [175] do texto bfamcv03 44
Figura 36 - Anaacutelise acuacutestica do enunciado [187] do texto bfamcv03 46
Figura 37 - Anaacutelise acuacutestica do enunciado [188] do texto bfamcv03 47
Figura 38 - Anaacutelise acuacutestica do enunciado [41] do texto bfamcv03 49
Figura 39 - Anaacutelise acuacutestica do enunciado [288] do texto bfamcv03 51
Figura 310 - Anaacutelise acuacutestica do enunciado [290] do texto bfamcv03 52
Figura 311 - Anaacutelise acuacutestica do enunciado [252] do texto bfamcv03 53
Figura 312 - Anaacutelise acuacutestica do enunciado [97] do texto bfamcv02 54
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Figura 31 - Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02 37
Figura 32 - Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03 38
Figura 33 - Anaacutelise acuacutestica do enunciado [335] do texto bfamcv02 40
Figura 34 - Anaacutelise acuacutestica do enunciado [453] do texto bfamcv04 42
Figura 35 - Anaacutelise acuacutestica do enunciado [175] do texto bfamcv03 44
Figura 36 - Anaacutelise acuacutestica do enunciado [187] do texto bfamcv03 46
Figura 37 - Anaacutelise acuacutestica do enunciado [188] do texto bfamcv03 47
Figura 38 - Anaacutelise acuacutestica do enunciado [41] do texto bfamcv03 49
Figura 39 - Anaacutelise acuacutestica do enunciado [288] do texto bfamcv03 51
Figura 310 - Anaacutelise acuacutestica do enunciado [290] do texto bfamcv03 52
Figura 311 - Anaacutelise acuacutestica do enunciado [252] do texto bfamcv03 53
Figura 312 - Anaacutelise acuacutestica do enunciado [97] do texto bfamcv02 54
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Figura 31 - Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02 37
Figura 32 - Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03 38
Figura 33 - Anaacutelise acuacutestica do enunciado [335] do texto bfamcv02 40
Figura 34 - Anaacutelise acuacutestica do enunciado [453] do texto bfamcv04 42
Figura 35 - Anaacutelise acuacutestica do enunciado [175] do texto bfamcv03 44
Figura 36 - Anaacutelise acuacutestica do enunciado [187] do texto bfamcv03 46
Figura 37 - Anaacutelise acuacutestica do enunciado [188] do texto bfamcv03 47
Figura 38 - Anaacutelise acuacutestica do enunciado [41] do texto bfamcv03 49
Figura 39 - Anaacutelise acuacutestica do enunciado [288] do texto bfamcv03 51
Figura 310 - Anaacutelise acuacutestica do enunciado [290] do texto bfamcv03 52
Figura 311 - Anaacutelise acuacutestica do enunciado [252] do texto bfamcv03 53
Figura 312 - Anaacutelise acuacutestica do enunciado [97] do texto bfamcv02 54
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Figura 31 - Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02 37
Figura 32 - Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03 38
Figura 33 - Anaacutelise acuacutestica do enunciado [335] do texto bfamcv02 40
Figura 34 - Anaacutelise acuacutestica do enunciado [453] do texto bfamcv04 42
Figura 35 - Anaacutelise acuacutestica do enunciado [175] do texto bfamcv03 44
Figura 36 - Anaacutelise acuacutestica do enunciado [187] do texto bfamcv03 46
Figura 37 - Anaacutelise acuacutestica do enunciado [188] do texto bfamcv03 47
Figura 38 - Anaacutelise acuacutestica do enunciado [41] do texto bfamcv03 49
Figura 39 - Anaacutelise acuacutestica do enunciado [288] do texto bfamcv03 51
Figura 310 - Anaacutelise acuacutestica do enunciado [290] do texto bfamcv03 52
Figura 311 - Anaacutelise acuacutestica do enunciado [252] do texto bfamcv03 53
Figura 312 - Anaacutelise acuacutestica do enunciado [97] do texto bfamcv02 54
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Figura 31 - Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02 37
Figura 32 - Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03 38
Figura 33 - Anaacutelise acuacutestica do enunciado [335] do texto bfamcv02 40
Figura 34 - Anaacutelise acuacutestica do enunciado [453] do texto bfamcv04 42
Figura 35 - Anaacutelise acuacutestica do enunciado [175] do texto bfamcv03 44
Figura 36 - Anaacutelise acuacutestica do enunciado [187] do texto bfamcv03 46
Figura 37 - Anaacutelise acuacutestica do enunciado [188] do texto bfamcv03 47
Figura 38 - Anaacutelise acuacutestica do enunciado [41] do texto bfamcv03 49
Figura 39 - Anaacutelise acuacutestica do enunciado [288] do texto bfamcv03 51
Figura 310 - Anaacutelise acuacutestica do enunciado [290] do texto bfamcv03 52
Figura 311 - Anaacutelise acuacutestica do enunciado [252] do texto bfamcv03 53
Figura 312 - Anaacutelise acuacutestica do enunciado [97] do texto bfamcv02 54
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
LISTA DE FIGURAS
Figura 31 - Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02 37
Figura 32 - Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03 38
Figura 33 - Anaacutelise acuacutestica do enunciado [335] do texto bfamcv02 40
Figura 34 - Anaacutelise acuacutestica do enunciado [453] do texto bfamcv04 42
Figura 35 - Anaacutelise acuacutestica do enunciado [175] do texto bfamcv03 44
Figura 36 - Anaacutelise acuacutestica do enunciado [187] do texto bfamcv03 46
Figura 37 - Anaacutelise acuacutestica do enunciado [188] do texto bfamcv03 47
Figura 38 - Anaacutelise acuacutestica do enunciado [41] do texto bfamcv03 49
Figura 39 - Anaacutelise acuacutestica do enunciado [288] do texto bfamcv03 51
Figura 310 - Anaacutelise acuacutestica do enunciado [290] do texto bfamcv03 52
Figura 311 - Anaacutelise acuacutestica do enunciado [252] do texto bfamcv03 53
Figura 312 - Anaacutelise acuacutestica do enunciado [97] do texto bfamcv02 54
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
LISTA DE TABELAS
Tabela 31 - Dados acuacutesticos do enunciado [146] do texto bfamcv02 37
Tabela 32 - Dados acuacutesticos do enunciado [63] do texto bfamcv03 38
Tabela 33 - Primeira tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 34 - Segunda tabela dos dados acuacutesticos do enunciado [335] do texto bfamcv02 40
Tabela 35 - Dados acuacutesticos do enunciado [453] do texto bfamcv04 43
Tabela 36 - Primeira tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 37 - Segunda tabela dos dados acuacutesticos do enunciado [175] do texto bfamcv03 44
Tabela 38 - Dados acuacutesticos do enunciado [187] do texto bfamcv03 46
Tabela 39 - Dados acuacutesticos do enunciado [188] do texto bfamcv03 47
Tabela 310 - Primeira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 311 - Segunda tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 312 - Terceira tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 49
Tabela 313 - Quarta tabela dos dados acuacutesticos do enunciado [41] do texto bfamcv03 50
Tabela 314 - Dados acuacutesticos do enunciado [288] do texto bfamcv03 51
Tabela 315 - Dados acuacutesticos do enunciado [290] do texto bfamcv03 52
Tabela 316 - Dados acuacutesticos do enunciado [252] do texto bfamcv03 53
Tabela 317 - Primeira tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 54
Tabela 318 - Segunda tabela dos dados acuacutesticos do enunciado [97] do texto bfamcv02 55
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
SUMAacuteRIO
1 INTRODUCcedilAtildeO 12
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO 12
22 TIPOS DE FOCO 13
221 Foco sintaacutetico 14
222 Foco morfoloacutegico 18
223 Foco semacircntico 21
224 Foco prosoacutedico 24
3 METODOLOGIA DA PESQUISA 29
31 OBJETIVO 29
32 CORPUS 30
321 C-ORAL-ROM 30
322 C-ORAL-BRASIL 32
33 PROCEDIMENTOS METODOLOacuteGICOS 34
4 ANAacuteLISE DOS DADOS 35
41 FOCO PROSOacuteDICO 35
42 FOCO SINTAacuteTICO 41
43 FOCO MORFOLOacuteGICO 45
44 FOCO PROSOacuteDICO VERSUS EcircNFASE 47
5 CONSIDERACcedilOtildeES FINAIS 55
REFEREcircNCIAS 56
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
12
1 INTRODUCcedilAtildeO
A focalizaccedilatildeo eacute um fenocircmeno linguiacutestico cada vez mais estudado e que possui
importante papel na comunicaccedilatildeo oral Sua importacircncia na gramaacutetica das liacutenguas naturais
bem como nas situaccedilotildees comunicativas eacute grande podendo ser observada pela assunccedilatildeo de
Davis (2009 p 2) ldquoFOCUS is present in every language and that it is present in every
utterance of every languagerdquo1 Embora haja divergecircncia por parte de alguns autores quanto agrave
proposta de Davis assume-se de qualquer forma que a focalizaccedilatildeo nas liacutenguas naturais eacute um
importante recurso comunicativo promovido nas diversas interaccedilotildees linguiacutesticas do cotidiano
pois sinaliza propriedades semacircnticas especiacuteficas atraveacutes de recursos prosoacutedicos
morfoloacutegicos e configuraccedilotildees sintaacuteticas dedicadas a destacar um item Nas liacutenguas romacircnicas
e germacircnicas sobretudo a estrateacutegia prosoacutedica da focalizaccedilatildeo eacute fundamental para a
realizaccedilatildeo do foco conforme mencionam Beaver amp Clark (2008 p xxi) ldquoRomance and
Germanic languages and English in particular focus is commonly marked by prosody with
changes in pitch used to mark focused expressionsrdquo2 Natildeo obstante estejam presentes e
podendo estar em co-ocorrecircncia nas liacutenguas desses troncos estrateacutegias sintaacuteticas como as
construccedilotildees clivadas e morfoloacutegicas como adveacuterbios e quantificadores focais o que poderaacute
ser constatado ao longo deste trabalho
Este trabalho estaacute divido em duas partes a primeira (cf seccedilatildeo 2 e subseccedilotildees) que
procura expor ao leitor atraveacutes da consideraccedilatildeo de diferentes estudos de variadas abordagens
teoacuterico-metodoloacutegicas uma revisatildeo bibliograacutefica ao mesmo tempo concisa e imparcial que
objetiva cobrir de modo satisfatoacuterio o tema da focalizaccedilatildeo e seus desdobramentos nos estudos
linguiacutesticos e a segunda (cf seccedilotildees 3 e 4 e subseccedilotildees) que consiste na exposiccedilatildeo do objetivo
e da metodologia da pesquisa do corpus utilizado da anaacutelise dos dados e das decorrentes
consideraccedilotildees sobre o foco no Portuguecircs Brasileiro falado informal aleacutem da discussatildeo sobre
a diferenciaccedilatildeo entre o foco prosoacutedico e a ecircnfase Por fim a seccedilatildeo 5 consiste nas
consideraccedilotildees finais
2 PANORAMA GERAL DOS ESTUDOS SOBRE O FOCO
O fenocircmeno da focalizaccedilatildeo tem sido estudado por vaacuterias aacutereas da linguiacutestica ndash
sintaxe semacircntica prosoacutedia etc ndash e sob diferentes abordagens teoacuterico-metodoloacutegicas ndash
1 ldquoO FOCO estaacute presente em toda liacutengua e estaacute presente em todo enunciado de toda liacutenguardquo
2 ldquoNas liacutenguas romacircnicas e germacircnicas e no inglecircs em particular o foco eacute marcado normalmente pela prosoacutedia
com variaccedilotildees no pitch para marcar as expressotildees focalizadasrdquo
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
13
formal funcional pragmaacutetica etc Cada estudo independente da aacuterea ou da abordagem
teoacuterica tem revelado que a focalizaccedilatildeo apresenta importante papel na gramaacutetica das liacutenguas
naturais pois o foco seu principal componente manifesta-se nelas por diferentes estrateacutegias
linguiacutesticas Neste capiacutetulo seratildeo apresentados os diferentes meios em que o foco pode se
manifestar isto eacute os tipos de foco O objetivo deste capiacutetulo eacute mostrar que o foco ocorre
atraveacutes de diferentes estrateacutegias nas liacutenguas e que cada liacutengua escolhe uma ou mais
estrateacutegias para sua realizaccedilatildeo
21 TIPOS DE FOCO
O fenocircmeno que abrange o foco eacute a focalizaccedilatildeo que pode ser definida como o ldquoato de
focalizar ou seja de acentuar de ressaltar de pocircr em relevorealceevidecircncia um
determinado item do textordquo (GONCcedilALVES 1998 p 32) As liacutenguas naturais expressam esse
realce com diferentes estrateacutegias seja por meio da sintaxe da prosoacutedia ou da morfologia seja
com o uso de uma estrateacutegia ou de mais de uma atuando em conjunto A focalizaccedilatildeo eacute
considerada um fenocircmeno discursivo-pragmaacutetico ldquopois o usuaacuterio pode centrar sua atenccedilatildeo a
uma parcela do enunciado que julgue relevante enfatizando-ardquo (GONCcedilALVES 1998 p 33)
Assim sendo a focalizaccedilatildeo estaria vinculada tanto agraves estrateacutegias argumentativas do falante
quanto ao conteuacutedo informacional do enunciado Segundo Gonccedilalves (1998 p 39) o foco
ldquopode incidir em qualquer constituinte do enunciado (palavras morfemas sintagmas e
pequenas oraccedilotildees)rdquo
Mesmo com a definiccedilatildeo do fenocircmeno da focalizaccedilatildeo as descobertas dos estudos
sobre a biparticcedilatildeo da frase a respeito do conceito de foco natildeo foram descartadas (cf
BARBOSA 2005) Gonccedilalves (1998 p 32) menciona que o constituinte focalizado eacute ldquoa
parcela do texto apresentada como a mais informativarelevanterdquo e que os elementos fora de
foco constituem ldquoinformaccedilatildeo apresentada previamente ao ouvinterdquo ou os elementos que os
interlocutores julgam conhecidos Ainda segundo Gonccedilalves o foco apresentaria informaccedilatildeo
nova Eacute neste ponto que pode haver confusatildeo Os autores ampliam o escopo de investigaccedilatildeo
mas manteacutem certos conceitos de estudos preacutevios e de diferentes correntes teoacutericas sem
explicitar qual ou quais estatildeo sendo levados em consideraccedilatildeo Para Gonccedilalves (1998 p 33) a
informaccedilatildeo nova isto eacute o que eacute focalizado eacute ldquonew natildeo porque natildeo foi mencionado
previamente mas eacute new exatamente porque o falante tende a interpretar como natildeo suscetiacutevel
de recuperaccedilatildeo (a) nem a partir do texto precedente (co-texto) e (b) nem por meio do
contexto pragmaacutetico (situacional) imediatordquo Nota-se que o autor utiliza uma noccedilatildeo
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
14
pragmaacutetica do que seria informaccedilatildeo novadada A diamesia oral eacute muito mais ampla do que a
escrita no sentido de que a unidade de referecircncia da fala eacute o enunciado ndash organizado segundo
princiacutepios pragmaacutetico-ilocucionaacuterios ndash jaacute na escrita a unidade de referecircncia eacute a frase ndash
organizada segundo princiacutepios loacutegico-sintaacuteticos ndash aleacutem de haver caracteriacutesticas distintivas
entre falaescrita por exemplo hesitaccedilotildees interrupccedilotildees sobreposiccedilotildees etc Como a
focalizaccedilatildeo eacute considerada um fenocircmeno discursivo as noccedilotildees estudadas no niacutevel da frase natildeo
conseguem abranger todos os aspectos que a liacutengua oral apresenta por isso novas definiccedilotildees
satildeo propostas contudo em muitos casos preservando determinadas terminologias de estudos
anteriores
Cada liacutengua escolhe uma ou mais estrateacutegias para a focalizaccedilatildeo Pode-se ateacute mesmo
classificaacute-las tipologicamente com relaccedilatildeo agrave manifestaccedilatildeo do foco em cada uma Contudo
muitas vezes essas estrateacutegias se organizam conjuntamente para a manifestaccedilatildeo do foco no
caso da focalizaccedilatildeo sintaacutetica e a prosoacutedica coocorrerem nas construccedilotildees clivadas por
exemplo Assim como um morfema poder licenciar um conjunto de alternativas semacircnticas
de escopo em uma sentenccedila servindo de gatilho para a manifestaccedilatildeo prosoacutedica do foco
Todavia nosso objetivo nesta seccedilatildeo eacute mostrar os vaacuterios tipos de foco em isolamento apesar
de que a interface com outro componente gramatical seraacute explicada quando necessaacuterio A
exposiccedilatildeo natildeo seraacute exaustiva uma vez que este tipo de trabalho natildeo permite uma discussatildeo
mais longa da literatura
221 Foco sintaacutetico
O foco tem recebido grande atenccedilatildeo nos estudos da sintaxe gerativa Itens de natureza
discursiva como o toacutepico e o proacuteprio foco passam a fazer parte da estrutura interna das
sentenccedilas dentro dessa abordagem teoacuterica Eles ocupam uma posiccedilatildeo na parte mais alta da
sentenccedila caracterizada por ser uma estrutura funcional sendo a outra parte da sentenccedila a
estrutura lexical Com a proposta de extensatildeo do sistema CP (RIZZI 1997)3 dois
subsistemas satildeo criados o primeiro constituiacutedo por ForceP e FinP e o segundo por TopP e
FocP A categoria ForceP determina o tipo de sentenccedila enquanto FinP determina sua
finitude Os constituintes toacutepico e foco satildeo interpretados em Spec de seus respectivos
sintagmas O sistema CP entatildeo passa a ser representado da seguinte forma (QUAREZEMIN
2009 p 22)
3 Segundo Quarezemin (200921) ldquoa extensatildeo do CP ocorre para acomodar certos constituintes com
propriedades discursivas e de escopo aleacutem de derivar sua interpretaccedilatildeo da relaccedilatildeo Spec-nuacutecleordquo
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
15
(1) ForceP
Force0 TopP
Top0 FocP
Foc0 TopP
Top0 FinP
Fin0 IP
As categorias TopP e FocP4 soacute aparecem na estrutura se houver constituintes com
funccedilotildees de toacutepico e foco na sentenccedila A categoria TopP aparece duas vezes na estrutura
porque eacute considerada recursiva Isso significa que pode haver mais de um toacutepico na sentenccedila
Na estrutura FocP natildeo aparece duas vezes pois a natureza quantificacional do foco natildeo
permite tal repeticcedilatildeo Para Rizzi (1997) e Belletti (2001) ldquoa noccedilatildeo de foco estaacute diretamente
relacionada agrave posiccedilatildeo que este constituinte ocupa na sentenccedila Para eles um constituinte eacute
interpretado como foco somente se ele ocupa a posiccedilatildeo de Spec de FocPrdquo (ASSIS 2003 p
360)
Nessa abordagem o toacutepico ldquoveicula informaccedilatildeo jaacute conhecida pelos participantes do
discursordquo enquanto o comentaacuterio ldquoeacute um tipo de predicado complexo que se aplica ao toacutepicordquo
(QUAREZEMIN 2009 p 22) No exemplo da autora your book eacute o toacutepico e o que estaacute
depois da viacutergula eacute o comentaacuterio
(2) Your book you should give t to Paul (not to Bill)5
Ela afirma que na fala o toacutepico eacute marcado por uma pausa Diferentemente do toacutepico
o foco eacute ldquodestacado por um acento proeminente e expressa a informaccedilatildeo do discurso natildeo
4 Haacute outras propostas sobre qual o lugar que as categorias funcionais TopP e FocP ocupam na estrutura da
sentenccedila extensatildeo de vP (Belletti 2001 2004a) e extensatildeo de DP (Giusti 2002) 5 ldquoSeu livro vocecirc deve dar t para o Paul (natildeo para o Bill)rdquo
16
pressuposta pelo ouvinte enquanto a pressuposiccedilatildeo representa o conhecimento compartilhado
pelos interlocutoresrdquo (QUAREZEMIN 2009 p 23)
(3) YOUR BOOK you should give t to Paul (not mine)6
Com isso Quarezemin (2009 p 46) afirma que ldquoa interpretaccedilatildeo semacircntica da
sentenccedila que apresenta a articulaccedilatildeo foco-pressuposiccedilatildeo natildeo deve ser confundida com a
interpretaccedilatildeo da sentenccedila que tem a biparticcedilatildeo toacutepico-comentaacuteriordquo A autora menciona a
relaccedilatildeo entre foco-prosoacutedia dizendo que os paracircmetros acuacutesticos da descriccedilatildeo do foco satildeo a
F0 a duraccedilatildeo e a intensidade Na fonologia o foco recebe a proeminecircncia ou outro acento
tonal especiacutefico A autora diz que ldquoo foco ou um membro do sintagma focalizado sempre
recebe o acento principal da sentenccedila enquanto a pressuposiccedilatildeo natildeo pode ser acentuada nos
mesmos niacuteveisrdquo (QUAREZEMIN 2009 p 52)
Em liacutenguas como o espanhol o italiano e o PE o foco de informaccedilatildeo ocupa uma
posiccedilatildeo no final da sentenccedila em casos que ocorre a inversatildeo do sujeito
(4) Egrave partitoha parlato [F Gianni]7
(Chi egrave partitoha parlato)
No exemplo de Quarezemin (2009 p 69) acima nota-se o foco estreito Gianni no
final da sentenccedila visto que esse item responde agrave pergunta chi egrave partitoparlato Haveria o
foco largo isto eacute toda a resposta de (4) seria foco se essa resposta correspondesse agrave pergunta
(QUAREZEMIN 2009 p 70)
(5) Che cosa egrave successo8
Um tipo especiacutefico de focalizaccedilatildeo sintaacutetica satildeo as construccedilotildees clivadas Resenes
(2009 p 17) explica que a clivagem eacute ldquoum processo sintaacutetico que serve para focalizar
constituintes porque prepara um lugar especiacutefico na sentenccedila para alojar o focordquo Os
elementos que cumprem essa funccedilatildeo satildeo a coacutepula o complementizador que ou um elemento
wh As propriedades semacircnticas e sintaacuteticas das sentenccedilas clivadas e pseudo-clivadas natildeo
6 ldquoO SEU LIVRO vocecirc deve dar t para o Paul (natildeo o meu)rdquo
7 ldquoPartiufalou o Gianni (Quem partiufalou)rdquo
8 ldquoO que aconteceurdquo
17
seratildeo abordadas profundamente visto que esse natildeo eacute o objetivo principal deste trabalho As
sentenccedilas clivadas apresentam a estrutura [ser + XPi + que [IP eci]] jaacute as pseudo-clivadas [[CP
whi ti] + ser +XPi] (RESENES 2009 p 14) O XP deve ser a parte natildeo-pressuposta da
sentenccedila ou o foco da sentenccedila o sintagma que carrega a informaccedilatildeo nova e que segundo a
abordagem gerativa carrega tambeacutem a proeminecircncia prosoacutedica O foco dessas sentenccedilas eacute do
tipo de identificaccedilatildeo exaustiva isto eacute indicado pela propriedade semacircntica [x e apenas x]
Apresentamos como exemplo em PB uma clivada e uma pseudo-clivada respectivamente
(6) Foi [F a Luana] que comprou um livro
(7) Quem comprou um livro foi [F a Luana]
Em inglecircs as clivadas satildeo conhecidas como it-clefts pois nessa liacutengua eacute obrigatoacuteria a
realizaccedilatildeo do expletivo na posiccedilatildeo inicial da sentenccedila
(8) It was [F John] who died in a car crash9
Haacute vaacuterios tipos de realizaccedilatildeo dessas sentenccedilas por exemplo clivada sem coacutepula
clivada com dupla coacutepula pseudo-clivada reduzida etc
Na liacutengua Ayutla Mixteca em que a ordem canocircnica da sentenccedila eacute VSO a
focalizaccedilatildeo se daacute atraveacutes da mudanccedila de posiccedilatildeo do elemento que se deseja focalizar para
uma posiccedilatildeo preacute-verbal ldquobecause the first element of any list is perceptually salient
preverbal position tends to grant the item filling it some degree of highlighting This position
is therefore often used for constituents that a speaker wishes to focus in some wayrdquo
(HOLLENBACH 1995 p 1)10
Seguem os exemplos de Hills (1990 p 27-28 apud
HOLLENBACH 1995 p 2)
(9) mburu xi‟i‟ tikui
donkey drinks water
bdquoThe donkey is drinking water‟11
(10) tikui xi‟i‟ mburu
9 ldquoFoi [F o Joatildeo] que morreu num acidente de carrordquo
10 ldquoporque o primeiro elemento de qualquer lista eacute perceptualmente saliente a posiccedilatildeo preacute-verbal tende a
conceder ao item carregando-o com algum grau de realce Esta posiccedilatildeo eacute portanto frequentemente usada para
constituintes em que o falante deseja focalizar de algum modordquo 11
ldquoO macaco estaacute bebendo aacuteguardquo
18
water drinks donkey
bdquoThe donkey is drinking water‟12
Entretanto Hollenbach (1995 p 2) adverte que a relaccedilatildeo semacircntica do foco com a
posiccedilatildeo preacute-verbal eacute obscura jaacute que um constituinte pode ocorrer na posiccedilatildeo preacute-verbal sem
que o falante deseje focalizaacute-lo Entatildeo a autora investiga as condiccedilotildees para que a focalizaccedilatildeo
do constituinte preacute-verbal ocorra13
Ela identificou vaacuterias condiccedilotildees para a identificaccedilatildeo do
foco na posiccedilatildeo preacute-verbal nas liacutenguas do grupo Mixteca entre elas a pausa (11) e a inserccedilatildeo
de conjunccedilotildees coordenadas (12) depois do elemento focalizado
(11) juaacutea ta‟u da ntuku
John splits he firewood
bdquoAs for John he is splitting firewood‟ (Yosonduacutea FARRIS 1992 p 28 apud
HOLLENBACH 1995 p 3)14
(12) sa‟an mi neacute din tavi di kuidaacutedo di
man that and willdo very you care you (Cuicatec BRADLEY 1991
p 493 apud HOLLENBACH 1995 p 3)
Esses satildeo exemplos que a focalizaccedilatildeo natildeo se daacute exclusivamente pela sintaxe mas que
co-ocorre com ela ou seja eacute necessaacuterio que haja mais elementos linguiacutesticos aleacutem da
posiccedilatildeo preacute-verbal para que a focalizaccedilatildeo ocorra de forma satisfatoacuteria
222 Foco morfoloacutegico
O foco morfoloacutegico eacute expresso atraveacutes de certos morfemas que dependendo da
liacutengua seratildeo cliacuteticos ou morfemas livres Nesse caso ldquoum bdquoMorfema de Ecircnfase‟ seraacute o
elemento responsaacutevel pela iluminaccedilatildeo do elemento destacado no textordquo (GONCcedilALVES
1999 p 336) Natildeo obstante isso natildeo signifique que o foco natildeo possa ser expresso por outros
meios nas liacutenguas em que predominam o meio morfoloacutegico para que a focalizaccedilatildeo ocorra
Esse tipo de focalizaccedilatildeo eacute mais comum em liacutenguas natildeo-indo-europeias como em liacutenguas
12
ldquoO macaco estaacute bebendo aacuteguardquo 13
Hollenbach investigou as condiccedilotildees do foco natildeo soacute na liacutengua Ayutla Mixteca mas em seis variedades do
Mixteca duas do Trique e uma do Cuicatec Essas liacutenguas fazem parte grupo Mixteca que por sua vez faz
parte da famiacutelia das liacutenguas Otomangues faladas sobretudo no sul do Meacutexico As liacutenguas da famiacutelia
Otomangue apresentam a ordem canocircnica VSO 14
ldquoQuanto ao Joatildeo ele estaacute partindo a lenhardquo
19
indiacutegenas brasileiras por exemplo em marubo e em mekens O aacuterabe e o japonecircs tambeacutem
satildeo exemplos de liacutenguas em que ocorre a focalizaccedilatildeo morfoloacutegica Hagesawa (2010 p 1)
explica que no japonecircs ldquoone of the most general properties of focus particles is to relate a
proposition which is newly introduced by the sentence containing a focus particle and
propositions available in the contextrdquo15
Em japonecircs a partiacutecula -shika introduz a noccedilatildeo de exclusividade o que eacute expresso
pela palavra only em inglecircs Essa noccedilatildeo eacute a mesma do foco de identificaccedilatildeo encontrado nas
sentenccedilas clivadas do PB por exemplo Segue o exemplo de Hagesawa (2010 p 4)
(13) Miho-shika ko-na-katta
Miho-SHIKA come-NEG-PAST
bdquoOnly Miho came‟16
No exemplo (13) a funccedilatildeo do morfema -shika pode ser parafraseada como ldquosomente
Miho veio e mais ningueacutemrdquo Quanto ao padratildeo prosoacutedico das partiacuteculas de foco no japonecircs
Hagesawa (2010 p 33) afirma que
although Japanese focus particles have their own accent patterns
when they occur without a focused constituent or they are stressed as
shown in (14) and (15) they lose their accent pattern and follow the
tone melody of their host when they are suffixed17
18
O autor apresenta os seguintes exemplos
(14) Shikamade-o jisyo-de shirabe-ta
HL HL
SHIKAMADE-ACC dictionary-with lookup-PAST
bdquoI looked up bdquoshika‟‟made‟ in a dictionary‟19
(15) A Yuka-mo ki-ta-no
Yuka-also come-PAST-Q
15
ldquouma das propriedades mais gerais das partiacuteculas de foco eacute relacionar uma proposiccedilatildeo que eacute receacutem-
introduzida pela sentenccedila contendo uma partiacutecula de foco e proposiccedilotildees disponiacuteveis no contextordquo 16
ldquoSomente Miho veiordquo 17
A numeraccedilatildeo dos exemplos natildeo segue a original 18
ldquoconquanto as partiacuteculas de foco do japonecircs tecircm seus padrotildees proacuteprios de accent quando ocorrem sem um
constituinte focalizado ou estatildeo stressed como mostrado em (14) e (15) elas perdem o seu padratildeo de accent e
seguem a melodia tonal do seu hospedeiro quando elas satildeo sufixadasrdquo 19
ldquoEu procurei bdquoshika‟‟made‟ em um dicionaacuteriordquo
20
bdquoDid Yuka also come‟
B Uun Yuka-shika ko-na-katta
HL
no Yuka-SHIKA come-NEG-PAST
bdquoNo only Yuka came‟20
Na liacutengua Mekens todas as questotildees wh apresentam o cliacutetico foco te como no
exemplo abaixo de Galucio (2002 p 67)
(16) aapo=te o-tek pogabeg-a ke i-koop ikatildeotilde tete
Who=foc 1s-house open-Theme say 3s-aux+mov that time
bdquordquoWho opened my houserdquo She was saying that time‟21
Haacute tambeacutem o uso do recurso sintaacutetico pois o constituinte focalizado sempre aparece
no iniacutecio da sentenccedila A autora menciona que a informaccedilatildeo natildeo-pressuposta das respostas agraves
perguntas wh tambeacutem apareceratildeo na forma de construccedilotildees focalizadas Isso faz com que a
ordem canocircnica ndash SOV ndash dessa liacutengua se altere em sentenccedilas como (17) abaixo por exemplo
extraiacuteda de Galucio (2002 p 68) Notam-se nas duas oraccedilotildees que os sujeitos ocorrem
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
29
Haacute ainda estudos que guiados pelos pressupostos teoacutericos buscam analisar o foco
prosoacutedico sem fazer uso das metodologias de produccedilatildeo ou percepccedilatildeo Esses estudos se
baseiam somente em dados de introspecccedilatildeo Pode-se citar como exemplo o estudo de Othero
(2011 p 1) que analisa ldquorespostas possiacuteveis em PB e em PE a perguntas com elementos-QU
que trazem constituintes focalizadosrdquo O autor considera que ldquoo constituinte que serve de
resposta agrave pergunta eacute a informaccedilatildeo nova ou seja eacute o elemento que serve de foco
informacionalrdquo (OTHERO 2011 p1) Atraveacutes da Teoria da Otimalidade Othero busca
investigar ldquocomo restriccedilotildees prosoacutedicas sintaacuteticas e de estrutura informacional competem
entre si e atuam de maneira determinante na ordem dos elementos da frase em PBrdquo (idem p
4)
3 METODOLOGIA DA PESQUISA
Esta seccedilatildeo eacute destinada aos objetivos do presente trabalho aos procedimentos
metodoloacutegicos tomados na pesquisa bem como para a explicaccedilatildeo do corpus utilizado
31 OBJETIVO
Este trabalho tem por objetivo (i) mostrar as estrateacutegias de focalizaccedilatildeo no Portuguecircs
Brasileiro atraveacutes de dados de fala espontacircnea retirados do corpus que seraacute descrito na
proacutexima seccedilatildeo o C-ORAL-BRASIL e (ii) distinguir o foco prosoacutedico de ecircnfase com dados
desse corpus Natildeo seraacute levado em consideraccedilatildeo o papel da frequecircncia tampouco seraacute feita
uma anaacutelise quantitativa dos dados O aspecto qualitativo da anaacutelise dos dados eacute primordial
neste trabalho47
O objetivo principal eacute fornecer uma visatildeo panoracircmica da focalizaccedilatildeo na fala
espontacircnea aleacutem de propor uma classificaccedilatildeo para o foco prosoacutedico e a ecircnfase As anaacutelises
seratildeo semacircnticas levando consideraccedilatildeo o formalismo que se ajusta melhor agrave representaccedilatildeo da
entoaccedilatildeo do foco pragmaacuteticas baseadas no contexto discursivo em que o enunciado foi
proferido bem como prosoacutedicas com auxiacutelio do software Praat (BOERSMA amp WEENINK
2011) para medir os paracircmetros acuacutesticos A percepccedilatildeo da proeminecircncia prosoacutedica tem papel
fundamental na identificaccedilatildeo do foco prosoacutedico e da ecircnfase pois foi a partir dela que se
retiraram os dados para a posterior anaacutelise
47
Natildeo obstante a anaacutelise quantitativa seja de igual importacircncia ainda que natildeo a abordemos no presente
trabalho
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
30
Muito se tem estudado sobre as estrateacutegias de focalizaccedilatildeo do PB contudo em vaacuterios
desses estudos os dados utilizados e seus respectivos contextos de ocorrecircncia satildeo possiacuteveis
candidatos a aparecerem na comunicaccedilatildeo oral entretanto natildeo haacute muitos estudos que mostram
que realmente a situaccedilatildeo ou determinado dado ocorre de fato na liacutengua e como esse dado
ocorre Em (i) procurar-se-aacute mostrar as estrateacutegias de focalizaccedilatildeo no PB com dados de fala
espontacircnea isto eacute dados orais da comunicaccedilatildeo humana em situaccedilotildees reais estabelecendo a
relaccedilatildeo contexto pragmaacutetico de enunciaccedilatildeoentoaccedilatildeopropriedade semacircntica extraiacutevel
Foco prosoacutedico e ecircnfase muitas vezes satildeo confundidos ou satildeo considerados como
sendo um fenocircmeno uacutenico por exemplo As diferenccedilas podem ser sutis mas eacute fato que se
trata de fenocircmenos distintos Alguns autores classificam tipos de ecircnfase dentro do fenocircmeno
do foco prosoacutedico Gonccedilalves (1997) por exemplo menciona a Ecircnfase Contrastiva a Ecircnfase
Intensiva e a Ecircnfase por Silabaccedilatildeo como tipos de foco prosoacutedico e ainda subdivide outros
tipos de ecircnfase dentro das jaacute mencionadas Apoiando-se em Gonccedilalves (1997) Batista (2007)
classifica a ecircnfase como ldquoo ato de acentuar ressaltar focalizar de por em evidecircncia em
determinado item do textordquo (grifo nosso) ou seja a ecircnfase seria um fenocircmeno mais amplo
que abrangeria a tambeacutem a focalizaccedilatildeo Em (ii) tentar-se-aacute propor uma nova classificaccedilatildeo
para o foco prosoacutedico e para a ecircnfase a fim de contribuir na desambiguizaccedilatildeo desses dois
fenocircmenos
32 CORPUS
O corpus utilizado para a pesquisa neste trabalho foi o C-ORAL-BRASIL Esse
corpus eacute a quinta ramificaccedilatildeo do corpus C-ORAL-ROM que seraacute brevemente descrito na
proacutexima seccedilatildeo
321 C-ORAL-ROM
C-ORAL-ROM (cf CRESTI et al 2002 MONEGLIA 2002 CRESTI amp
MONEGLIA 2003a 2003b 2005 CRESTI amp GRAMIGNI 2004 CRESTI et al 2004
MONEGLIA 2005) eacute um projeto coordenado pelos professores Emanuela Cresti e Massimo
Moneglia ambos do LABLITA48
(Laboratorio Linguistico del Dipartimento di Italianistica
dell‟Universtiagrave di Firenze) na Universidade de Florenccedila Esse projeto reuacutene corpora de fala
48
Cf lthttplablitaditunifiitgt
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
31
espontacircnea49
das principais liacutenguas romacircnicas da Europa espanhol francecircs italiano e
portuguecircs europeu As universidades que participam do projeto satildeo sobretudo Universitagrave di
Firenze Universiteacute de Provence Fundaccedilatildeo da Universidade de Lisboa e Universidad
Autoacutenoma de Madrid
A extensatildeo do C-ORAL-ROM totaliza 772 textos 1300000 palavras e 1232735h
de fala Os arquivos de som de cada gravaccedilatildeo satildeo em formato wav (Windows PCM 22050hz
a 16bit) As transcriccedilotildees satildeo em formato CHAT (MAC WHINNEY 1994) com metadados
em formato CHAT e IMDI Em cada gravaccedilatildeo haacute um alinhamento textosom em formato
xml que pode ser visualizado com o software WinPitch (MARTIN 2005) Esse alinhamento
consiste em que ldquoeach unit of text (be syllable word syntagm or sentence) receives a time
index corresponding to the time position in the sound filerdquo (MARTIN 2004)50
Assim
quando esse processo eacute estabelecido ldquoan operator can select an aligned unit of text and listen
to the corresponding speech segmentrdquo (idem)51
O C-ORAL-ROM natildeo pretende representar a variaccedilatildeo foneacutetica diatoacutepica mas procura
representar a variaccedilatildeo diafaacutesica da liacutengua bem como a variedade de atos de fala De acordo
com Moneglia (2005) os paracircmetros de variaccedilatildeo privilegiados no C-ORAL-ROM satildeo a)
canal b) estrutura do evento comunicativo c) domiacutenio social do uso d) uso formal e informal
e) domiacutenio de aplicaccedilatildeo da variedade formal Levando em consideraccedilatildeo esses paracircmetros o
corpus foi divido em dois usos principais formal e informal No uso formal haacute os canais
natural (pex debate poliacutetico pregaccedilatildeo religiosa conferecircncia etc) e de miacutedia (pex de
raacutedio ou televisatildeo noticiaacuterio entrevista reportagem etc) aleacutem de gravaccedilotildees telefocircnicas
privadas ou interaccedilatildeo homem-maacutequina No uso informal haacute os contextos privado-familiar e
puacuteblico ambos contando com monoacutelogos diaacutelogos e conversaccedilotildees Nos metadados da cada
gravaccedilatildeo haacute informaccedilotildees do falante como sexo idade profissatildeo e grau de escolaridade e da
gravaccedilatildeo como descriccedilatildeo da situaccedilatildeo duraccedilatildeo qualidade acuacutestica e nuacutemero de palavras Os
corpora satildeo anotados quanto as partes do discurso (PoS) e do lema tendo para cada liacutengua
uma tecnologia diferente Pi-Tagger (Italiano) Cordial Analyzer (Francecircs) Brill (Portuguecircs)
e Grampal (Espanhol)
49
Por fala espontacircnea entende-se ldquoa fala que natildeo eacute previamente programada natildeo realiza um texto anterior a sua
execuccedilatildeo e portanto eacute passiacutevel de menor controle por parte do falanterdquo (ROCHA 2010 p 22) Cresti amp
Moneglia (2003a p 713) ainda mencionam que ldquola imprevedibilitagrave e variabilitagrave egrave la caratteristica dominante del
parlalo spontaneordquo
ldquoa imprevisibilidade e a variabilidade eacute a caracteriacutestica dominante da fala espontacircneardquo 50
ldquocada unidade de texto (seja siacutelaba palavra sintagma ou sentenccedila) recebe um iacutendice de tempo correspondente
agrave posiccedilatildeo de tempo no arquivo de somrdquo 51
ldquoum operador pode selecionar uma unidade alinhada de texto e ouvir o segmento de fala correspondenterdquo
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03
ROCHA B M A unidade informacional de introdutor locutivo no portuguecircs brasileiro uma
anaacutelise baseada em corpus (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2010
ROCHA B N R de M Caracteriacutesticas prosoacutedicas do toacutepico em PE e o uso do pronome
lembrete (Dissertaccedilatildeo de Mestrado) Belo Horizonte UFMG 2011
ROOTH M Focus In S Lappin (ed) Handbook of Contemporary Semantic Theory
Oxford Blackwell p 271-297 1995
SILVERMAN K et al ToBI A Standard for Labelling English Prosody In Proceedings of
the International Conference on Spoken Language Proessing (ICSLP) vol 2 p 867-860
Banff 1992
SOSA J M La entonacioacuten del espantildeol Su estructura foacutenica variabilidad y diatectologiacutea
Madrid Caacutetedra 1999
TOLEDO G A Sentildeales prosoacutedicas del foco In Revista Argentina de Linguumliacutestica 5 p 205-
203 1989
VAINIO M amp JAumlRVIKIVI J Focus in production tonal shape intensity and word order
In J Acoust Soc Am 121 p 55-61 2007
62
XU Y Effects of tone and focus on the formation and alignment of F0 contours In Journal
of Phonetics 27 p 55-105 1999
WOLTERS M amp WAGNER P Focus perception and prominence In W Hess B
Schroumlder W Lenders amp T Portele (eds) Computers Linguistics and Phonetics between
Language and Speech Proceedings of the 4th
Conference on Natural Language Processing
KONVENS-98 volume 1 of Computer Studies in Language and Speech p 227-236 Peter
Lang 1998
32
Esse corpus eacute arquitetado seguindo os pressupostos da Teoria da Liacutengua em Ato (cf
CRESTI 2000) A TLA eacute uma teoria pragmaacutetica da liacutengua que atraveacutes da pesquisa de
corpora de liacutengua oral espontacircnea busca descrever as possiacuteveis unidades informacionais da
fala e seus respectivos padrotildees prosoacutedicos bem como os fenocircmenos linguiacutesticos orais sejam
segmentais suprassegmentais informacionais morfossintaacuteticos de variaccedilatildeo etc Cresti
(2000) afirma que cada enunciado corresponde a um ato de fala que veicula portanto uma
accedilatildeo A prosoacutedia eacute um importante componente para construccedilatildeo da teoria pois seu papel eacute
mediar o domiacutenio da accedilatildeo (ilocuccedilatildeo) e o domiacutenio da expressatildeo linguiacutestica (enunciado) De
acordo com a TLA a fala espontacircnea pode ser segmentada em enunciados Essa segmentaccedilatildeo
se basearia em criteacuterios prosoacutedicos em que perfis entoacionais ou quebras prosoacutedicas
percebidas como terminais marcariam o fim de cada enunciado Portanto as transcriccedilotildees satildeo
segmentadas prosodicamente isto eacute haacute uma marcaccedilatildeo a cada quebra prosoacutedica Sendo
percebida como natildeo-terminal a quebra eacute marcada com uma barra simples bdquo‟ sendo
percebida como terminal a quebra eacute marcada com uma barra dupla bdquo‟ o que indica o fim de
um enunciado Essas quebras podem ser segmentadas fazendo uso da percepccedilatildeo bem como
ter seu status checado atraveacutes da curva de F0 Cresti et al (2004 p 577) por exemplo
mencionam que ldquothe utterance boundaries frequently occur together with significant wave
interruptionsrdquo52
Parte do corpus recebe tambeacutem uma anotaccedilatildeo com as unidades
informacionais descritas pela TLA e pela Informational Patterning Theory53
(CRESTI
2000)
322 C-ORAL-BRASIL
O C-ORAL-BRASIL54
(cf RASO amp MELLO 2009 2010 2012 RASO amp
MITTMANN 2009 MITTMANN et al 2009) eacute um projeto que busca estudar o portuguecircs
brasileiro oral espontacircneo atraveacutes da compilaccedilatildeo de um corpus e se constitui a quinta
52
ldquoos limites do enunciado frequentemente ocorrem em conjunto com significativas interrupccedilotildees de ondardquo 53
Acerca dos pressupostos dessa teoria Cresti amp Moneglia (2010 p 14) explicam que ldquothe core of the utterance
corresponds to a part called Comment which necessarily deals with one prosodic unit (PU) and constitutes the
information unit (IU) whose function is to accomplish the illocutionary force of the utterancerdquo A prosoacutedia
entatildeo seria o recurso que desempenharia a estrutura informacional do enunciado A estrutura informacional do
enunciado eacute constituiacuteda por sua unidade principal - o Comentaacuterio Contudo haacute outras unidades opcionais
internas ao comentaacuterio A correspondecircncia entre o padratildeo prosoacutedico e o padratildeo informacional eacute a base da
Informational Patterning Theory (CRESTI amp MONEGLIA 2010)
ldquoo nuacutecleo do enunciado corresponde a uma parte chamada de Comentaacuterio que necessariamente lida com uma
unidade prosoacutedica (UP) e constitui a unidade de informaccedilatildeo (UI) cuja funccedilatildeo eacute realizar a forccedila ilocucionaacuteria do
enunciadordquo 54
Cf lthttpwwwc-oral-brasilorggt
33
ramificaccedilatildeo do projeto C-ORAL-ROM O C-ORAL-BRASIL eacute coordenado pelos professores
Tommaso Raso e Heliana Mello ambos da Faculdade de Letras55
(FALE) da Universidade
Federal de Minas Gerais (UFMG) Os trabalhos satildeo desenvolvidos no Laboratoacuterio de Estudos
Empiacutericos e Experimentais da Linguagem56
(LEEL) atualmente coordenado pelo professor
Tommaso Raso
O C-ORAL-BRASIL iniciado oficialmente em 2007 segue os moldes dos corpora
do projeto C-ORAL-ROM Contudo foram feitas algumas adaptaccedilotildees em relaccedilatildeo ao projeto
principal que refletem a realidade sociolinguiacutestica do Brasil Por exemplo a fala de uma
pessoa europeia que possui segundo grau equivaleria agrave de uma pessoa brasileira que possui o
tiacutetulo de terceiro grau desde que natildeo exerccedila uma profissatildeo que necessite desse tiacutetulo Nesse
sentido o corpus pretende representar de certa forma a variaccedilatildeo diastraacutetica pois consta
ldquocom falantes das vaacuterias faixas soacutecio-culturais tanto interagindo com falantes da mesma
faixa quanto com falantes de faixas diferentesrdquo (RASO amp MELLO 2009 p 22) A variedade
diatoacutepica foi sobretudo a de Belo Horizonte e regiatildeo metropolitana
Seguindo o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem privilegiou a variaccedilatildeo
diafaacutesica em detrimento da diatoacutepica Assim haacute diversos contextos situacionais que satildeo
definidos de acordo com a combinaccedilatildeo das seguintes variaacuteveis tipo de atividade nuacutemero e
tipologia dos participantes da atividade lugar da interaccedilatildeo e assunto da interaccedilatildeo (RASO amp
MELLO 2009) As gravaccedilotildees se dividem nos contextos familiar-privado e puacuteblico aleacutem de
ambos contarem com monoacutelogos diaacutelogos e conversaccedilotildees Acerca da definiccedilatildeo de contextos
familiar-privado e puacuteblico Raso amp Mello (2009 p 23) explicam que esta ldquodeve ser
entendida com base no papel exercido pelo falante no momento da interaccedilatildeordquo Assim
considerou-se o comportamento do falante como fator para definir o contexto se se comporta
com base social o contexto eacute puacuteblico se se comporta com base particular-individual o
contexto eacute familiar-privado
Assim como o C-ORAL-ROM o C-ORAL-BRASIL tambeacutem conta com uma parte de
gravaccedilotildees de fala formal e outra informal todavia apenas a segunda estaacute concluiacuteda e
publicada a parte formal ainda estaacute em fase de compilaccedilatildeo Assim sendo sempre que o
corpus C-ORAL-BRASIL for mencionado neste trabalho seja atraveacutes de sua descriccedilatildeo seja
pelos dados coletados para a anaacutelise se referiraacute somente agrave parte informal
O corpus eacute constituiacutedo por 139 textos contendo 208130 palavras totalizando
210852h de fala Os arquivos de som satildeo em formato wav as transcriccedilotildees em rtf os
55
Cf lthttpwwwletrasufmgbrsitegt 56
Cf lthttpwwwletrasufmgbrCMSindexasppasta=leelgt
34
arquivos de alinhamento que podem ser visualizados com o software Winpitch (MARTIN
2005) em xml e os metadados (informaccedilotildees extra-textuais que especificam as caracteriacutesticas
dos falantes ndash idade sexo profissatildeo grau de escolaridade etc ndash e as particularidades da
situaccedilatildeo) em txt As gravaccedilotildees foram feitas com gravadores digitais PDD60 Marantz e com
kits wireless (microfones de lapela receivers e transmitters) Sennheiser Evolution EW100
G2 em algumas gravaccedilotildees fez-se uso de microfones omnidirecionais Sennheiser MD 421 e
do mixer Xenyx 1222
As transcriccedilotildees obedecem ao formato CHILDES-CLAN (MAC WHINNEY 2000)
buscando ldquocapturar fenocircmenos que podem refletir fenocircmenos de gramaticalizaccedilatildeo e
lexicalizaccedilatildeo em cursordquo (RASO amp MELLO 2009 p26-27) Alguns deles satildeo por exemplo
afeacutereses (estar gt taacute) apoacutecopes (olha gt o‟) reduccedilatildeo de preposiccedilotildees (para gt pra) etc para
informaccedilotildees mais detalhadas sobre o processo e formaccedilatildeo de transcritores bem como dos
criteacuterios adotados para a transcriccedilatildeo dos fenocircmenos de gramaticalizaccedilatildeo e lexicalizaccedilatildeo e da
segmentaccedilatildeo prosoacutedica do C-ORAL-BRASIL cf Mello et al (2012) O parser adotado para
a anotaccedilatildeo morfossintaacutetica do corpus foi o PALAVRAS (BICK 2000)57
Apresenta-se um exemplo de um trecho de uma transcriccedilatildeo segmentada
prosodicamente e etiquetada informacionalmente do corpus C-ORAL-BRASIL
(29) bfamcv03
TON [41] eacute =EXP= se o meu pai tambeacutem nũ tivesse morrido =TOP= tava vivo
=CMB= tava com noventa-e-seis ano =COM=$
CAR [42] hhh bicho bobo =COM=$ [43] vai abrir =SCA= ltumgt quadrinho
=COM=$
A sigla bfamcv03 significa corpus bdquoBrasil‟ (b) contexto familiar (fam) nuacutemero de
falantes conversaccedilatildeo (cv) e 03 o nuacutemero do texto TON e CAR satildeo as iniciais dos
participantes da interaccedilatildeo Os nuacutemeros entre colchetes [41] [42] e [43] indicam o nuacutemero de
cada enunciado As barras simples bdquo‟ marcam uma unidade tonal no niacutevel acuacutestico e uma
informacional no niacutevel pragmaacutetico As barras duplas bdquo‟ marcam o fim de um enunciado As
siglas EXP TOP CMB COM e SCA indicam as unidades informacionais de expressivo
toacutepico comentaacuterios muacuteltiplos ligados comentaacuterio e escansatildeo respectivamente
33 PROCEDIMENTOS METODOLOacuteGICOS
57
Para mais informaccedilotildees sobre esta anotaccedilatildeo cf Bick (2012)
35
Com o intuito de identificar o fenocircmeno em questatildeo no corpus pesquisado foram
tomados os seguintes procedimentos metodoloacutegicos
(i) Foram escolhidos aleatoriamente 3 textos do corpus C-ORAL-BRASIL
(ii) Em seguida o pesquisador escutou cada texto e ao mesmo tempo lendo a
transcriccedilatildeo marcou os enunciados que eram possiacuteveis candidatos a ser foco
prosoacutedico ou ecircnfase ou seja aqueles que apresentavam uma proeminecircncia
prosoacutedica mais saliente
(iii) Os enunciados escolhidos foram recortados atraveacutes do software Winpitch (MARTIN
2005)
(iv) Novamente com a transcriccedilatildeo e com o arquivo de aacuteudio foi observado o contexto de
enunciaccedilatildeo dos enunciados
(v) Atraveacutes do contexto de enunciaccedilatildeo o item foi julgado ser foco ou ecircnfase Mais
detalhes desse julgamento seratildeo mostrados na seccedilatildeo 4
(vi) Por fim foi feita a anaacutelise acuacutestica dos enunciados com o software Praat (BOERSMA
amp WEENINK 2011) considerando duraccedilatildeo da siacutelaba e da vogal (ms) F0 maacutexima e
miacutenima (Hz) e intensidade maacutexima e miacutenima (dB) de cada siacutelaba do enunciado
Salientamos que dado a natureza do trabalho a escolha por priorizar o aspecto
qualitativo em detrimento do quantitativo resultou ser mais produtivo embora de forma
alguma acreditamos que a anaacutelise qualitativa substitua a quantitativa mais bem as duas
seriam o ideal Eacute necessaacuterio salientar tambeacutem que o uso da percepccedilatildeo para a identificaccedilatildeo
dos fenocircmenos estudados neste trabalho foi fundamental ainda que a participaccedilatildeo de
mais informantes seria mais eficaz na validaccedilatildeo dos enunciados que apresentam os
fenocircmenos considerados
4 ANAacuteLISE DOS DADOS
Primeiramente seratildeo mostrados os dados do C-ORAL-BRASIL referentes agraves
estrateacutegias de focalizaccedilatildeo no PB A estrateacutegia prosoacutedica seraacute a primeira seguida da sintaacutetica e
da morfoloacutegica Logo depois a anaacutelise se voltaraacute para o objetivo (ii) deste trabalho ou seja o
da proposta de distinccedilatildeo entre foco prosoacutedico e ecircnfase
41 FOCO PROSOacuteDICO
36
O foco prosoacutedico possui motivaccedilatildeo pragmaacutetico-discursiva expressa por propriedades
semacircnticas sejam elas de contrastividade ou exclusividade O objetivo do foco prosoacutedico eacute
destacar um item por meio de uma proeminecircncia prosoacutedica Haacute um contexto especiacutefico para
sua ocorrecircncia No caso do foco prosoacutedico expressando contrastividade esse contexto deve
ser o contraste por meio da negaccedilatildeo ou correccedilatildeo do conteuacutedo proposicional ou a adiccedilatildeo de
um conteuacutedo informativo para contrastar um enunciado ou uma accedilatildeo extralinguiacutestica anterior
O foco deve apresentar uma proeminecircncia prosoacutedica indicando a contrastividade
(30) bfamcv02
TER [135] e aiacute ela taacute assim matildee $
TER [136] soacute falta soacute o sofaacute $
TER [137] ltaiacute eugt falei assim entatildeo lthhh osgt [1] os +$
RUT [138] ltNossagt $
JAE [139] ltocecirc vai dargt $
TER [140] natildeo $
TER [141] o sofaacute vatildeo vez que agraves vezes a Rute distribui com ela Tonita ltCcedilatildeogt $
RUT [142] lta famiacuteliagt toda $
TER [143] a famiacutelia toda e daacute um sofaacute lthhhgt $
RUT [144] lteacute pobre mas ampsogt [2] mas ltsofaacute nũ deve sergt barato natildeo $
TER [145] ltmas eacute carogt $
TER [146] eacute caro $
RUT [147] sofaacute eacute caro $
TER [148] eacute $
Em (30) trecircs amigas conversam sobre o casamento da filha de uma delas As
participantes discutem quem deveria dar um sofaacute de presente para a noiva Em tom de humor
TER menciona que com a ajuda de toda a famiacutelia um sofaacute poderia ser dado agrave noiva RUT
diz entatildeo que um sofaacute natildeo deve ser barato e TER realizando uma proeminecircncia prosoacutedica
focaliza o item bdquocaro‟ dizendo que um sofaacute eacute caro Este exemplo se trata de um foco
prosoacutedico com a propriedade semacircntica de contrastividade isto eacute x e natildeo y bdquoum sofaacute eacute caro
e natildeo barato‟ A afirmaccedilatildeo de RUT de que um sofaacute natildeo deve ser barato natildeo implica que esse
sofaacute seja caro podendo custar um preccedilo mediano contudo TER focaliza contrastivamente
dizendo que o preccedilo de um sofaacute de fato eacute caro
paulo
Anexaccedilatildeo de arquivo
[30] bfamcv02wav
paulo
Nota
Accepted definida por paulo
paulo
Nota
Completed definida por paulo
37
FIGURA 31 ndash Anaacutelise acuacutestica do enunciado [146] do texto bfamcv02
TABELA 31 ndash Dados acuacutesticos do enunciado [146] do texto bfamcv02
Trans58
eacute ca ro
DurS 0224236 0245923 0160544
DurV 0224236 0199333 0116313
F0Mx 203020 253046 267004
F0Mn 171728 168452 157687
IntMx 56577 65168 62412
IntMn 41397 47293 57097
No enunciado [146] nota-se que a siacutelaba tocircnica do foco ou seja bdquoca‟ eacute a mais longa
do enunciado bem como apresenta o maior valor de intensidade maacutexima Essa siacutelaba
apresenta o segundo maior valor de F0 maacutexima do enunciado A duraccedilatildeo da vogal da tocircnica
do foco eacute a segunda maior O movimento da curva de F0 eacute descendente-ascendente
O foco prosoacutedico tambeacutem pode expressar a contrastividade sem fazer referecircncia a um
enunciado anterior Isso acontece quando a situaccedilatildeo pragmaacutetica permite a ocorrecircncia desse
foco Em (31) cinco amigos jogam sinuca conversam e datildeo palpites sobre o jogo Em algum
58
As abreviaturas das tabelas e as medidas de cada paracircmetro acuacutestico satildeo respectivamente Transcriccedilatildeo
Duraccedilatildeo da Siacutelaba (ms) Duraccedilatildeo da Vogal (ms) F0 Maacutexima (Hz) F0 Miacutenima (Hz) Intensidade Maacutexima (dB) e
Intensidade Miacutenima (dB)
38
momento do jogo CEL adverte que TON deve matar a bola nuacutemero cinco Pelos enunciados
[64] e [65] infere-se que REN estava tentando matar a bola nuacutemero oito e natildeo a cinco
Mesmo sem REN disser bdquoeu vou matar o cinco‟ a accedilatildeo que ele deveria estar fazendo
motivou CEL a utilizar o foco prosoacutedico expressando contrastividade isto eacute bdquomate a bola
cinco e natildeo a oito‟
(31) bfamcv03
CEL [58] ltagora tem que matar o cincogt $
CAR [59] cecirc erra lttambeacutem Toninho aiacute ficava o seisgt +$
CEL [60] ltocirc Toninho cecirc tem que matar o cinco socircgt $
REN [61] agora cecirc mata o onze aiacute $
REN [62] nũ daacute natildeo $
CEL [63] natildeo socirc o cinco Renato $
CEL [64] oito $
CEL [65] que isso $
FIGURA 32 ndash Anaacutelise acuacutestica do enunciado [63] do texto bfamcv03
TABELA 32 ndash Dados acuacutesticos do enunciado [63] do texto bfamcv03