transcrição de dados de LS ELAN

28
Transcrição de dados de uma língua sinalizada: um estudo piloto da transcrição de narrativas na língua de sinais brasileira (LSB) 1 Leland McCleary (Universidade de São Paulo) Evani Viotti (Universidade de São Paulo) 1. O problema de transcrição das línguas sinalizadas Este artigo relata uma experiência de transcrição de uma narrativa contada em língua de sinais brasileira (LSB). 2 A experiência foi iniciada como um primeiro passo em direção à constituição de um corpus de gravações e transcrições de LSB, sinalizada por surdos adultos fluentes. A experiência foi inicialmente concebida como treinamento da equipe de pesquisa no uso de um sistema de transcrição. Entretanto, logo nos demos conta de que os sistemas de transcrição em uso são limitados, e que sistemas mais adequados ainda estão em processo de desenvolvimento e experimentação. Infelizmente, apesar de as línguas sinalizadas já estarem sendo estudadas por lingüistas por quase meio século, o problema de sua transcrição continua sendo um desafio sem solução clara. Diferentemente das línguas orais, que há milhares de anos têm sido representadas por um sistema quase-fonológico -- o alfabético -- que se presta à transcrição de texto oral e que pôde ser, sem grandes inovações, adaptado à representação fonético-fonológica, as línguas sinalizadas carecem de qualquer sistema de escrita largamente aceito, que possa servir como base de uma transcrição própria. Se, por um lado, essa falta de um sistema de escrita 1 McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada: um estudo piloto da transcrição de narrativas na língua de sinais brasileira (LSB). In H. Salles (Org.), Bilingüismo e surdez. Questões lingüísticas e educacionais. Brasília, DF: Editora da UNB. Esta é uma versão expandida de uma comunicação apresentada no Simpósio Língua de Sinais e Bilingüismo durante o IV Congresso Internacional da ABRALIN, Universidade de Brasília, 17 a 19 de fevereiro de 2005, como parte da mesa redonda "Língua de Sinais: Constituição e transcrição de corpora". A língua de sinais brasileira também é conhecida por 'língua brasileira de sinais' e 'Libras'. 2 O trabalho relatado aqui foi desenvolvido na USP a partir de 2003 pelo "Grupo de Língua" do grupo de pesquisa Estudos da Comunidade Surda: Língua, Cultura, História, coordenado por Leland McCleary. Desde 2005, tem o apoio do CNPq através do projeto "Estudos da Comunidade Surda: Formação de Corpus de Língua de Sinais Brasileira", coordenado por Evani Viotti (Processo 47.9077/2004-5). Agradecemos ao laboratório A Escola do Futuro, USP, pelo apoio.

Transcript of transcrição de dados de LS ELAN

Page 1: transcrição de dados de LS ELAN

Transcrição de dados de uma língua sinalizada: um estudo piloto da transcrição de narrativas na língua de sinais brasileira (LSB)1

Leland McCleary (Universidade de São Paulo) Evani Viotti (Universidade de São Paulo)

1. O problema de transcrição das línguas sinalizadas

Este artigo relata uma experiência de transcrição de uma narrativa contada em

língua de sinais brasileira (LSB).2 A experiência foi iniciada como um primeiro passo em

direção à constituição de um corpus de gravações e transcrições de LSB, sinalizada por

surdos adultos fluentes. A experiência foi inicialmente concebida como treinamento da

equipe de pesquisa no uso de um sistema de transcrição. Entretanto, logo nos demos

conta de que os sistemas de transcrição em uso são limitados, e que sistemas mais

adequados ainda estão em processo de desenvolvimento e experimentação. Infelizmente,

apesar de as línguas sinalizadas já estarem sendo estudadas por lingüistas por quase meio

século, o problema de sua transcrição continua sendo um desafio sem solução clara.

Diferentemente das línguas orais, que há milhares de anos têm sido representadas por um

sistema quase-fonológico -- o alfabético -- que se presta à transcrição de texto oral e que

pôde ser, sem grandes inovações, adaptado à representação fonético-fonológica, as línguas

sinalizadas carecem de qualquer sistema de escrita largamente aceito, que possa servir como

base de uma transcrição própria. Se, por um lado, essa falta de um sistema de escrita

1 McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada: um estudo piloto da transcrição de narrativas na língua de sinais brasileira (LSB). In H. Salles (Org.), Bilingüismo e surdez. Questões lingüísticas e educacionais. Brasília, DF: Editora da UNB. Esta é uma versão expandida de uma comunicação apresentada no Simpósio Língua de Sinais e Bilingüismo durante o IV Congresso Internacional da ABRALIN, Universidade de Brasília, 17 a 19 de fevereiro de 2005, como parte da mesa redonda "Língua de Sinais: Constituição e transcrição de corpora". A língua de sinais brasileira também é conhecida por 'língua brasileira de sinais' e 'Libras'. 2 O trabalho relatado aqui foi desenvolvido na USP a partir de 2003 pelo "Grupo de Língua" do grupo de pesquisa Estudos da Comunidade Surda: Língua, Cultura, História, coordenado por Leland McCleary. Desde 2005, tem o apoio do CNPq através do projeto "Estudos da Comunidade Surda: Formação de Corpus de Língua de Sinais Brasileira", coordenado por Evani Viotti (Processo 47.9077/2004-5). Agradecemos ao laboratório A Escola do Futuro, USP, pelo apoio.

Page 2: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

2

significa que as línguas sinalizadas não sofreram influência de uma modalidade escrita,

persistindo apenas em sua corporalidade original,3 por outro, significa que os lingüistas não

têm acesso a corpora de textos escritos das línguas sinalizadas por onde começar sua

análise, e nem a uma ferramenta básica por meio da qual construir um sistema de

transcrição.

Evidentemente, é de extrema utilidade para o analista poder representar a língua

objeto de estudo de forma fixa e simplificada.4 Nos últimos cinqüenta anos, várias

propostas de representação das línguas sinalizadas têm sido apresentadas, e continuam

sendo adaptadas, juntamente com propostas de sistemas de escrita para uso escolar e

popular. Esses sistemas variam desde aqueles que são mais codificados/analíticos, como o

sistema de William Stokoe (Stokoe 1960; Stokoe, Casterline & Croneberg 1965), até aqueles

que são mais gráficos/icônicos, como o sistema de SignWriting, de Valerie Sutton (Sutton

1996), ambos baseados em traços (ou parâmetros) distintivos (Martin 2000). Esses

sistemas não têm atingido aceitação geral na literatura lingüística, pela dificuldade de leitura

que apresentam para pessoas não especialmente treinadas.5 O que tem sido adotado, em

geral, é alguma variação de um sistema de glosas, em que uma palavra em inglês (ou outra

língua oral), grafada em maiúsculo, é usada para representar o sinal manual com o mesmo

3 Para uma discussão de corporalidade como extensão do conceito de oralidade, ver McCleary (2002). 4 O fato de o sistema de notação obrigatoriamente fazer uma seleção dos fenômenos a serem registrados significa a não-neutralidade do sistema diante a análise (para uma discussão clássica, ver Ochs 1979). Enquanto, por um lado, é desejável registrar o maior número de fenômenos que possam ser significativos para não empobrecer ou enviesar a análise, por outro lado, uma transcrição demasiadamente carregada de detalhes pode prejudicar a análise. Não há como evitar essa tensão. 5 A transparência de um sistema de transcrição e seu acesso por não especialistas é uma questão interessante. A informatização permite a criação de sistemas de extrema complexidade, como o do projeto CHILDES (MacWhinney 2006) e como o “Berkeley transcription system for sign language research” (BTS) (Hoiting & Slobin 2002), derivando poderosos instrumentos de busca, cálculo e comparação translingüística da dispendiosa etiquetagem das transcrições. Essa complexidade, por si só, não é problema. Entretanto, o que se espera dessas ferramentas são mecanismos para formatar relatórios de diversos tipos, que possam ilustrar as generalizações de forma transparente para leitores não especialmente treinados.

Page 3: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

3

sentido. Algumas marcações não-manuais são acrescentadas por códigos sobrescritos, e

alguns usos do espaço de sinalização são representados por letras ou números subscritos.

No Brasil, o mesmo tem acontecido. Nos textos pioneiros de Ferreira Brito,

publicados a partir de 1984, foi usado um sistema de notação por glosas (Ferreira Brito

1995: 207-209), apesar de a autora ter também publicado (com Remi Langevin) um

detalhado sistema analítico de notação por traços (Ferreira Brito 1995: 211-242). Desde

então, o sistema de transcrição por glosas tem sido usado, como o padrão, com algumas

variações, em dissertações e teses sobre a gramática da LSB (Felipe 1988, 1998; Santos

2001: 277-280; Chan-Vianna 2003: iv-v; Finau 2004: 227-228).6 Tal notação parece servir

razoavelmente bem para estudos baseados em intuições de falantes bilíngües, a respeito de

enunciados apresentados ou eliciados isoladamente, e em comparações pontuais com

descrições de outras línguas sinalizadas. Hoje, contudo, a literatura internacional aponta

para as limitações desses procedimentos e confirma a necessidade de se estudarem as

línguas sinalizadas por meio de corpora de língua produzida por sinalizadores fluentes

(Liddell 2003). E para a análise de trechos de discurso espontâneo, o sistema de glosas

simples que tem sido usado apresenta uma série de limitações. Em sua tese sobre aspecto,

baseada em gravações de relatos de surdos, Finau (2004) complementa as transcrições

tradicionais de glosas (e sobre- e subscritos) com figuras tiradas da filmagem em vídeo

correspondentes a cada sinal manual, às vezes acrescentando setas, na própria figura, para

marcar movimento. Embora esse recurso ajude, os fenômenos significativos observados

acabaram por não ser registrados de forma sistemática, deixando a análise sem uma

sustentação empírica suficientemente explicitada.

6 Quadros (1999) usa uma combinação de transcrição por glosas e transcrição por SignWriting, numa tentativa de contornar algumas das deficiências da primeira.

Page 4: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

4

Outros pesquisadores que trabalham com texto corrido também sentem as

dificuldades de trabalhar com uma notação por glosas, principalmente quando o objetivo é

estudar fenômenos globais, como a coesão textual. Observem o seguinte trecho de

transcrição de narrativa (Pereira & Nakasato 2002):

PORQUE ELA (apontando para um lugar longe dos dois) DOENTE LÁ ENTENDER (expressão facial de pergunta) (abaixando um pouco o corpo como se falasse com uma criança, levanta o corpo e olha para a esquerda com expressão facial de concordância) SIM MAMÃE (como se Chapeuzinho Vermelho estivesse olhando para a mãe) TUDO BEM (movimento de virar o corpo para o lugar estabelecido para o Chapeuzinho Vermelho e olha um pouco abaixo, balançando a cabeça) ENTÃO (movimento de girar o dedo indicador, interpretado como ENTÃO) (com a mão traça o caminho, mais expressão facial de entender?) CASA VOVÓ ENTENDER OLHAR (expressão facial de atenção) CAMINHO.

O exemplo mostra a dificuldade de se descrever narrativamente o que está sendo

sinalizado com sinais manuais, expressões faciais e outras marcações não-manuais, e ao

mesmo tempo produzir uma transcrição que ilumine a análise estrutural, tanto da frase

quanto da construção de texto. Um dos problemas que se percebe é a dificuldade de se

identificarem possíveis segmentos de discurso (frases ou orações), pelo fato de os sinais

manuais serem apresentados linearmente, intercalados por comentários. Isso acarreta

várias conseqüências para a análise, já que fenômenos importantes para uma análise textual,

como repetições, paralelismos estruturais e subordinação, podem passar despercebidos.

Outro problema é a sobreposição de descrição e interpretação. Nas explicações "expressão

facial de pergunta/de concordância/de entender/de atenção", não está claro se cada

descrição se refere a um determinado conjunto convencionado de traços faciais (por

exemplo, cabeça erguida, sobrancelhas franzidas, etc.), ou se a denominação indica a

interpretação global e intuitiva da expressão dentro do contexto. Sem dúvida, tal tipo de

transcrição representa um avanço sobre a simples tradução para o português, e sobre uma

transcrição por glosas não-comentada. Além disso, contribui para uma maior compreensão

do papel das marcações não-manuais na construção de um texto narrativo. Entretanto,

ainda deixa a desejar quando se pensa na constituição de um corpus de textos transcritos

Page 5: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

5

que possa servir de base para vários tipos de análises lingüísticas -- morfológica, sintática,

pragmática e discursiva -- e análises comparativas com outras línguas sinalizadas, o que

pede maior discriminação e padronização.

Mesmo nos casos mais simples, quando é usada para representar sentenças eliciadas

isoladamente, a transcrição por glosas traz dois inconvenientes que queríamos evitar na fase

inicial de nossa descrição. Primeiro, achamos precipitado o uso de indicações com valor

gramatical para marcações não-manuais, como de tópico, interrogação, ou negação. Tais rótulos

pressupõem uma análise sintática/semântica/pragmática, e podem ocultar algumas

diferenças sutis na produção das marcações não-manuais, que talvez sejam significativas.

Outro inconveniente da transcrição por glosas que achamos que deveria ser evitado é a

desvinculação do nome do sinal (sua glosa) da descrição de sua forma. Essa consideração

não é levantada na literatura. O senso comum atrás da prática de se usar a glosa

desvinculada de uma descrição é o de que "todo o mundo sabe" como determinado sinal é

executado. No entanto, isso não é verdade. Vários fatores podem fazer com que os sinais

sejam realizados de maneira diferente da forma mais conhecida, como, por exemplo,

variação regional e micro-regional, ocorrência de processos fonológicos e sinonímia. Um

problema relacionado a esse é a padronização do nome do sinal; muitas vezes, ao se

atribuir nome ao sinal, a tendência é a de se traduzir o sinal com base no sentido dominante

no contexto específico sendo transcrito, mesmo quando tal tradução não é o nome mais

típico do sinal sendo executado.

Tais considerações fizeram com que nossa primeira experiência de transcrição,

antes de ser um treinamento no uso de um sistema, fosse uma exploração sobre teoria e

técnicas de transcrição de línguas sinalizadas, com o objetivo de desenvolver um sistema

que atendesse nossos propósitos.

Page 6: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

6

2. A formação do corpus: A História da Pêra

Decidimos iniciar nosso corpus com textos corridos, produzidos por surdos

fluentes. Essa decisão se deveu, em parte, ao fato de não termos, como nosso objetivo

inicial, o estudo de pontos gramaticais específicos, e, em parte, aos alertas que tínhamos

encontrado na literatura, relativamente às limitações de análises de línguas de sinais,

baseadas em frases eliciadas e descontextualizadas.

Entretanto, a questão de como eliciar tais textos não é trivial. Na época,

descartamos a idéia de registro de conversações espontâneas entre adultos surdos por sua

grande complexidade: aos problemas de transcrição, acrescentaríamos os dos fenômenos

de interação e gerenciamento dos turnos de fala. Narrativas baseadas em histórias escritas

em português correriam o risco de sofrer interferência da fonte em língua oral. Essa opção

também limitaria nossos colaboradores-informantes a surdos leitores do português.

Decidimos, então, nos valer da técnica de estimular a produção de narrativa com base em

uma história contada a partir de imagens, técnica essa já usada em estudos sobre narrativas

em línguas sinalizadas.7 Resolvemos usar a história da pêra, uma história encenada e filmada

sem palavras, planejada especificamente para a eliciação de narrativas a serem usadas para

fins de análise comparativa translingüística. O projeto da história da pêra, iniciado nos anos

70 por Wallace Chafe, já produziu uma literatura considerável, abrangendo várias línguas

de famílias distintas (Chafe 1980).8

7 Por exemplo, Morgan (1999) elicia narrativas usando o livro de história em figuras, Frog, where are you?. Rayman (1999) usa o desenho animado, The tortoise and the hare, de Disney. 8 Uma vantagem não esperada de termos adotado a história da pêra foi a descoberta de outros pesquisadores trabalhando com narrativas em várias línguas sinalizadas, que também estão usando a história da pêra como estímulo, notadamente na Universidade de Novo México (Sherman Wilcox, c.p.).

Page 7: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

7

Conseguimos o filme em forma digital,9 mas resolvemos passá-lo para VHS, para

facilitar seu uso em aparelhos de vídeo e TV comuns. Em consonância com as práticas

estabelecidas para o uso do filme, mostramos o vídeo em sessões individuais para cada um

dos surdos que se dispuseram a colaborar conosco, uma ou duas vezes, conforme

preferissem. A seguir, cada surdo recontou a história para um usuário da LSB,

preferencialmente surdo, que ainda não tivesse visto o filme e não conhecesse a história.10

As narrativas foram filmadas em fita digital, com uma câmera posicionada ao lado da

pessoa para a qual a história estava sendo contada. A gravação original foi passada para

VHS, com cópias para os pesquisadores, e guardada para uso posterior em forma digital.

3. O processo de transcrição

Gravadas algumas narrativas baseadas no filme da pêra, passamos ao processo de

transcrição. Para iniciar nosso experimento, escolhemos a narrativa contada pelo

colaborador surdo, Alex Melendez. Inicialmente, um membro do grupo fez uma glosa

tosca da narrativa, registrando todos os sinais manuais percebidos, sem a preocupação de

formatar o texto em sentenças ou construções gramaticais em português.11 Essa primeira

transcrição tinha a seguinte forma:

OK ÁRVORE FAZENDA CAMPO HOMEM CHAPÉU3 BIGODE COSTELETA TRABALHAR CAPINAR ÁRVORE APANHAR CESTA É PÊRA ERRAR HISTÓRIA HOMEM APANHAR AVENTAL

9 Agradecemos a Wallace Chafe a disponibilização do material. 10 Nem sempre foi possível satisfazer todos os critérios ideais, por falta de número suficiente de surdos nas várias sessões de gravação; no entanto, as condições de contação de cada caso foram registradas, permitindo análises posteriores, para verificar se essas condições tiveram algum efeito sensível sobre a forma das narrativas. 11 Queremos agradecer a Alex Melendez pela generosa colaboração, não só na hora da gravação, como nas várias horas em que participou das reuniões para discutir o filme e a transcrição; agradecimentos também aos membros da equipe.

Page 8: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

8

A seguir, assistimos coletivamente ao filme da contação da história, verificando os

sinais transcritos, um por um. Com o objetivo de padronizar os nomes dos sinais (as

glosas atribuídas), e de vincular a glosa a uma descrição bem detalhada da forma do sinal,

optamos por usar, como referência básica, o Dicionário enciclopédico ilustrado trilíngüe da língua

de sinais brasileira - Libras, de Capovilla & Raphael (2001). Essa decisão foi tomada levando-

se em conta a importância do dicionário como registro da LSB, sua larga distribuição, e

principalmente as cuidadosas anotações sobre a forma de cada sinal. Os sinais da gravação

que correspondiam a um sinal do dicionário recebiam, como nome, a palavra em português

que aparecia como verbete do dicionário. Esses nomes de sinais é que passaram a

constituir a glosa. Nesses casos, fazíamos, também, uma anotação para informar a página

do dicionário em que se encontrava o verbete. Aos sinais usados na gravação que foram

produzidos de forma diferente daquela encontrada no dicionário, atribuímos um nome, que

passamos a usar como glosa daqueles sinais, com um índice numérico subscrito, para

indicar que se tratava de uma variação de um sinal dicionarizado. Os sinais manuais

encontrados na gravação que não se encontravam no dicionário (37 sinais em 100, ou 37%)

foram anotados, para posteriormente fazermos sua descrição.12 Na transcrição, os sinais

dicionarizados foram indicados por glosas em maiúsculo, com itálico; os não-

dicionarizados, sem itálico.

De imediato, sentimos a dificuldade de trabalhar com uma transcrição contínua,

sem quebras de linhas que pudessem indicar alguma unidade (sintagma, oração). Sabíamos

que um dos nossos objetivos analíticos seria, ao longo do trabalho, descobrir as marcas

indicativas de segmentação gramatical, e que ainda não tínhamos conhecimento suficiente

da LSB para fazer uma segmentação definitiva. Mesmo assim, decidimos segmentar o

12 O fato de o dicionário ter apresentado descrições corretas de mais de 60% dos sinais produzidos espontaneamente na narrativa atesta seu grande valor como instrumento de pesquisa.

Page 9: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

9

fluxo da narração em blocos, baseando-nos no conceito de unidades ideacionais usado por

Chafe (1980). Uma primeira segmentação intuitiva foi, então, feita pelo primeiro autor

deste artigo, resultando em 80 linhas, que correspondiam a 80 unidades ideacionais. Essa

divisão foi subseqüentemente submetida à análise coletiva, sendo modificada à medida que

apareciam argumentos para tal. Hoje a transcrição consta de 85 linhas (ou seja, 85 unidades

ideacionais), sendo que 63 linhas (74%) correspondem aos segmentos originais.

O próximo passo foi acrescentar, à transcrição dos sinais manuais, os sinais não-

manuais (e seu escopo), e marcar, para os sinais manuais, a mão ou as mãos que foram

usadas em sua produção. Para tal, foi montada uma espécie de "pauta" para cada unidade

ideacional. Essa pauta contava, inicialmente, com duas linhas, uma superior, a dos olhos,

em que, inicialmente, registramos piscadas ([p]), e uma inferior, em que informamos se o

sinal tinha sido realizado com as duas mãos (2m), ou com qual delas, se tivesse sido

realizado com apenas uma (md/me). Essas notações foram acompanhadas de uma

indicação sobre o número de repetições do sinal (1x, 2x, etc.),13 como mostra a figura

abaixo:

[p] 29. OUTR@ HOMEM CRIANÇA JOVEM md(1x) md(3x) md(1x) 2m(2x)

A seguir, aproveitando a linha dos olhos, acrescentamos a direção do olhar,

adotando a seguinte marcação: setas para a direita (>), para a esquerda (<), para cima (^), e

para baixo (V). A ausência de marcação indica que o olhar estava direcionado para o ponto

neutro (em direção ao interlocutor). Nos exemplos abaixo, a linha dos olhos é a que está

diretamente acima da linha da glosa dos sinais manuais14.

13 A questão da relação entre o número de repetições produzidas (e o conseqüente número indicado na descrição do sinal) como parte integrante do sinal ainda está em aberto. 14 Em 17 e 18, a primeira linha de cada pauta é a linha das sobrancelhas, e a última de baixo é a da simultaneidade dos sinais manuais. Essas linhas vão ser descritas adiante.

Page 10: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

10

\/.............. V V [p] V [p] 17. OBJETO-CONTEÚDO CHEI@2 JÁ 2m(1x) md(1x) md(2x) me BASE-OBJETO....................

/\........................................................

V> V> V> [p]

18. OBJETO-CONTEÚDO CHEI@2 JÁ PRONT@

>2m(1x)> >md(1x)> >md(1x)> 2m(1x) >me BASE-OBJETO.....................>

Durante toda a sinalização manual representada na pauta 17, os olhos do narrador

estão voltados para baixo e para o centro do espaço de sinalização, como mostra a marca V.

No início da sinalização da pauta 18, os olhos do narrador se mantêm voltados para baixo,

mas estão, agora, direcionados para a direita. É isso o que significa a marca V>.

Também aproveitando a linha das mãos, que vem imediatamente abaixo da linha da

glosa, acrescentamos a posição da formação dos sinais em relação ao espaço neutro, que é

o espaço que fica bem à frente do sinalizador. Usamos setas à direita (>) e à esquerda (<).

A ausência de qualquer marca significa que o sinal foi feito no espaço neutro. Essas marcas

foram colocadas antes e depois da indicação das mãos usadas para a realização do sinal,

como se observa na pauta 18 acima, para possibilitar o registro de alguma mudança de

posição entre o começo e o fim do sinal. Nos casos em que uma mudança desse tipo tenha

ocorrido, colocamos uma linha vertical (|) para indicar o espaço neutro, como se vê na

pauta 74.

\/.........................

< > 74. DOIS FALTAR1 UM@ md(1x) <2m(2x)| >md(1x)> [tem] duas, falta uma

Progressivamente, foram acrescentadas outras linhas à pauta de transcrição. Uma

linha foi adicionada imediatamente abaixo da linha das mãos, para indicar a realização

simultânea de sinais manuais. Essa realização simultânea acontece quando cada mão

produz um sinal diferente ao mesmo tempo, como ilustrado na pauta 23, ou quando uma

Page 11: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

11

mão permanece em sua posição, enquanto a outra mão parte para formar outros sinais,

como ilustrado nas pautas 17 e 18 acima15.

[p]<V <V <V <V 23. OLHAR PÊRA VONTADE3 PEGAR2 me(1x) 2m(1x) md(1x ) me(1x) md PUXAR2-CORDA

Acima da linha dos olhos, incluímos uma outra linha, para registrar o movimento

das sobrancelhas. Essa linha conta com as seguintes opções: sobrancelhas levantadas (/\);

sobrancelhas levantadas e cenho franzido (/*\); cenho franzido (\/). Notem, nos

exemplos acima, que o narrador franze as sobrancelhas (\/) quando realiza a sinalização de

CHEI@ (pauta 17), mantendo-as assim até sinalizar OBJETO-CONTEÚDO (pauta 18).

Nesse momento, as sobrancelhas deixam de estar franzidas e passam a estar levantadas

(/\). Os pontinhos que aparecem tanto depois do franzimento, quanto depois de

levantamento das sobrancelhas, marcam o tempo em que a sobrancelha se manteve naquela

posição.

Finalmente, foi acrescentada uma linha para a tradução, em português, da unidade

ideacional sinalizada. Essa linha é colocada na pauta como a última de baixo. Na tradução,

são colocadas entre colchetes as palavras em português que não têm correspondentes entre

os sinais manuais, mas que são necessárias à boa formação do português.

..../\.......................................................... < < < < 19. AGORA2 FALTAR1 OBJ-REDOND1 RESTAR VAZI@ 2m(2x) 2m(2x) <2m(1x)< md(1x) <2m(1x)< <me BASE-OBJETO....< agora, falta [o] resto [das pêras] [na] cesta vazia [à esquerda]

Notem que as informações entre colchetes são de vários tipos: às vezes são

palavras exigidas pelo português; às vezes são informações inferidas a partir dos sinais não

15 Na próxima seção, discutimos essa questão em mais detalhes.

Page 12: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

12

manuais ou do contexto. Essa notação ainda está sob estudo. A pauta 19, acima, mostra

todas as linhas preenchidas.

Uma omissão óbvia é uma linha para a representação da formação da boca. Essa

linha não foi incluída por não termos à mão, na época, um sistema de marcação

suficientemente sensível para capturar as múltiplas possibilidades de formação. Essa

questão ainda está sob estudo e será comentada na última parte deste trabalho.16

4. Comentários sobre o sistema de transcrição

É importante ressaltar a natureza eminentemente descritiva do modelo de

transcrição que estamos desenvolvendo. Não sabemos ainda se as piscadas que

registramos na linha dos olhos têm algum estatuto lingüístico, ou se são movimentos

naturais das pálpebras, sem qualquer significação particular17. Mesmo assim, optamos por

registrá-las, mantendo a informação disponível para estudos futuros. Da mesma maneira,

sabemos que a direção do olhar é fundamental para questões de referenciação.

Entendemos, então, que o sinal OBJETO-CONTEÚDO, glosado na pauta 17, tem um

referente diferente do sinal OBJETO-CONTEÚDO glosado em 18. Mas, na glosa

propriamente dita, isso não aparece. Essa informação é obtida apenas com o cruzamento

das informações trazidas pela linha da glosa com as informações trazidas pela linha dos

olhos e das mãos.

16 O leitor deve ter notado que também não mencionamos outras linhas que são de grande importância para a transcrição de línguas de sinais, como as que caracterizam os movimentos do tronco e da cabeça. Atualmente, já estamos fazendo a experiência de transportar a transcrição que estamos descrevendo aqui para sistemas informatizados, e, nessa nova fase, estamos incluindo novas linhas que registram várias outras características da LSB. 17 De maneira geral, a literatura sobre as línguas de sinais não menciona piscadas como um elemento gramatical dessas línguas. Entretanto, Baker & Padden, já em 1978, comentam sobre a possibilidade de piscadas estarem associadas aos limites de unidades gramaticais na ASL. Mais recentemente, Engberg-Pedersen (1999: 33) observa que, na língua de sinais dinamarquesa (DSL), os sinalizadores podem romper o contacto visual com seus interlocutores por meio de piscadas, e que essas piscadas ocorrem nos limites de grandes sintagmas. Kanda et al. (2002a: 187) e Kanda et al. (2002b: 116) também comentam que piscadas que seguem um tipo particular de apontamento ou aceno de cabeça parecem indicar o limite final de uma sentença na língua de sinais japonesa (JSL).

Page 13: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

13

É interessante observar que os contornos de sobrancelha aqui apresentados não

parecem estar relacionados às marcas sintáticas de interrogação, já mais estudadas pela

literatura. Mesmo sem saber se esses contornos têm uma função lingüística e, em caso

afirmativo, qual seria ela, eles estão registrados na transcrição, para serem investigados

posteriormente.

Uma pergunta que poderia ser feita a respeito das linhas das mãos refere-se ao fato

de que, de maneira geral, a informação sobre o número de mãos envolvidas na realização

do sinal é uma informação de caráter lexical. Desse modo, a glosa deveria ser suficiente.

Entretanto, insistimos em registrar essa informação em uma linha separada, por vários

motivos. Primeiramente, essa é uma maneira de marcar qual é a mão dominante do

sinalizador. Como se sabe, surdos destros e canhotos preferem realizar os sinais de uma

mão com a mão direita ou esquerda, respectivamente. Segundo, o exame das narrativas

nos mostrou que um mesmo sinalizador pode realizar um mesmo sinal quer com a mão

direita, quer com a esquerda, dependendo da necessidade que ele tenha de deixar sua mão

dominante livre para a realização de outros sinais. Assim, por exemplo, um sinalizador

destro realizaria, prototipicamente, o sinal ÁRVORE, da seguinte maneira: braço esquerdo

dobrado na horizontal, posicionado junto ao abdomem, palma da mão voltada para baixo;

braço direito dobrado na vertical, mão vertical aberta, palma para frente; cotovelo direito

apoiado no dorso da mão esquerda; palma da mão direita gira para trás. Entretanto, o

sinalizador pode inverter as mãos, ou seja, tornar a direita passiva e a esquerda ativa, para, a

seguir, realizar o sinal DESTREPAR com a mão direita, tomando, como ponto de

articulação, a mão esquerda que permaneceu dobrada na vertical após a realização do sinal

ÁRVORE. Notem as pautas 71 e 72, abaixo. Em 71, a linha das mãos mostra que o sinal

ÁRVORE foi realizado com as duas mãos. Em 72, o sinal DESTREPAR é realizado com

a mão direita, enquanto a esquerda mantém parte do sinal de ÁRVORE feito

anteriormente.

Page 14: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

14

71. HOMEM ÁRVORE md(1x) 2m(1x) [o] homem [na] árvore 72. DESTREPAR <md(4x)< <me ÁRVORE ..........< desceu [a escada]

A manutenção de parte de um sinal por uma das mãos por um período superior ao

da realização do sinal parece ser bastante freqüente. Notem que o mesmo acontece no

trecho transcrito nas pautas 17 e 18. Depois de sinalizar OBJETO-CONTEÚDO com as

duas mãos, o sinalizador mantém a mão esquerda (não-dominante) na mesma posição

(BASE-OBJETO) enquanto faz o sinal de CHEI@ com a mão direita (dominante).

Praticamente, inexistem discussões a respeito de fatos desse tipo na literatura sobre

as línguas de sinais18. Entretanto, esse parece ser um recurso gramatical importante. No

caso do trecho transcrito em 71 e 72, a manutenção de parte do sinal ÁRVORE durante a

realização do sinal DESTREPAR parece estabelecer a relação entre o verbo e seu

argumento locativo. No trecho de discurso transcrito em 17 e 18, parece que a

concomitância dos dois sinais reforça a relação entre CHEI@ e OBJETO-CONTEÚDO.

Notem, ainda, o trecho transcrito entre as pautas 42 e 46, reproduzido a seguir:

\/......................... [p] 42. HOMEM ANDAR-DE-BICICLETA md(1x) 2m(2x) ele [estava] andando [de] bicicleta

/\..... 43. MULHER VIR3 md(2x) md(1x) me BICICLETA2....... [quando viu uma] mulher vindo [de bicicleta]

18 Uma observação de que temos notícia, e que pode ser aproximada a essa característica que estamos apontando, está em Liddell (2003: 154). O autor comenta um trecho de uma narrativa em que o sinalizador está narrando a história com sua mão direita, ao mesmo tempo em que está demonstrando, com seu corpo, a ação que está sendo narrada. Kanda et al. (2002b: 115) também mencionam que a simultaneidade característica das línguas de sinais se verifica não só pela co-ocorrência de sinais não-manuais com sinais manuais, mas também pelo fato de que duas ou mais palavras da língua podem ser articuladas simultaneamente, cada uma com uma mão.

Page 15: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

15

< 44. ANDAR-DE-BICICLETA 2m(2x) [ele continuou] andando [de] bicicleta

< < 45. MULHER BONIT@ md(1x) md(1x) me BICICLETA2.......... [e olhou para ela] mulher bonita!

< 46. ANDAR-DE-BICICLETA(i) 2m(2x) [continuou] andando [de] bicicleta

Nesse trecho, o sinalizador conta que o protagonista da história estava andando de

bicicleta quando cruza com uma mulher vindo em sentido contrário. Ele acha a mulher

bonita. A manutenção da mão esquerda do sinalizador com parte do sinal BICICLETA

parece ser fundamental para o estabelecimento da temporalidade dos eventos. Em 42, o

narrador introduz o sinal ANDAR-DE-BICICLETA com as duas mãos, mantendo a

esquerda em posição durante a sinalização de MULHER VIR, em 43. Em 44, o narrador

volta a sinalizar ANDAR-DE-BICICLETA, indicando a continuidade da ação. Em 45, a

mão esquerda se mantém em parte do sinal BICICLETA, enquanto, com a direita, o

narrador sinaliza MULHER BONIT@. Em 46, ele realiza o sinal ANDAR-DE-

BICICLETA mais uma vez. Na linha de tradução para o português, nós procuramos

capturar a seqüencialidade dos eventos por meio de perífrases aspecto-temporais, como ele

[estava] andando de bicicleta, uma mulher vinha vindo, ele [continuou] andando de bicicleta, etc.19

Com isso, queremos chamar a atenção para a importância que a transcrição tem no

processo inicial de descrição de uma língua. Como já mencionamos, de maneira geral, a

19 Interessantemente, o mesmo acontece com gestualizações que acompanham narrativas feitas em línguas orais. McNeill & Duncan (2005: 519) observam que em muitas narrativas orais baseadas na história da pêra, ocorre um fenômeno semelhante: na gesticulação que acompanha a narrativa, o contador da história faz, inicialmente, um gesto com as duas mãos, mantendo, em seguida, apenas uma delas, liberando a outra para a realização concomitante de um outro gesto, que tem relação com o primeiro.

Page 16: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

16

literatura sobre as línguas de sinais não faz menção à manutenção da mão não-dominante

realizando parte de um sinal, enquanto a mão dominante realiza outras sinalizações. Como

o modelo de transcrição que estamos desenvolvendo tem por objetivo capturar o maior

número possível de detalhes da sinalização, não pudemos deixar de registrar esses fatos.

Os trechos que examinamos mostram que se trata não só de um recurso muito produtivo

na LSB, mas que parece ter uma multiplicidade de funções que precisam ser mais bem

investigadas.

Um outro registro que procuramos fazer no modelo de transcrição que vimos

desenvolvendo é o de uma classe de verbos das línguas de sinais, que Liddell (2003) chama

de verbos depictivos20. Tipicamente, verbos depictivos são aqueles que apresentam uma forma

particular, dependendo ou de quem realiza a ação, ou do objeto sobre o qual recai a ação

do verbo, ou da maneira como a ação do verbo é realizada. Assim, por exemplo, na LSB

existem várias formas para expressar a ação que, em português, é expressa pelo verbo andar,

dependendo de a entidade que está andando ser humana ou animal, dependendo da

maneira como essa entidade está andando, e assim por diante. Para deixar claro que esses

verbos têm uma forma variável, optamos por transcrevê-los, seguidos de uma letra grega,

do seguinte modo: PEGAR-α, PUXAR-α, etc. Se, em um mesmo discurso, aparecerem

diferentes formas de sinais correspondentes ao verbo pegar ou puxar, vamos mudar apenas a

variável que segue o verbo, como em PEGAR-β, PUXAR-β, PEGAR-γ, PUXAR-γ. Essa

letra grega, por sua vez, é seguida de um índice, que aponta para um outro sinal, portador

do mesmo índice. É a forma do referente desse sinal que o verbo vai assumir. Observem

o seguinte trecho de transcrição:

20 De maneira geral, a literatura sobre as línguas de sinais chama esses verbos de verbos classificadores. Entretanto, estudos mais recentes têm mostrado que o estatuto desses verbos enquanto classificadores é bastante discutível. Ver, a esse respeito, os textos em Emmorey (2003). Por isso, optamos por usar a nomenclatura sugerida por Liddell (2003).

Page 17: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

17

[p] v< v< < < 24. OLHAR PÊRA(i) VONTADE1 PEGAR-αi <me(1x)< 2m(1x) md(1x) <me(1x)< >md PUXAR-α > >md VONTADE1>....... [ele] olhou [as] pêras [com] vontade [de] pega[-las]

Notem que o sinal PÊRA vem seguido do índice (i), subscrito. Logo a seguir,

aparece a transcrição PEGAR-αi . A presença de α junto ao verbo indica que se trata de

um verbo cuja forma vai depender do tipo de objeto que se pega. O índice (i), junto a α,

aponta para outro sinal que traz o mesmo índice, nomeadamente PÊRA. Isso significa que

o verbo PEGAR, nesse trecho, tem sua forma determinada pelo referente do sinal PÊRA.

Com isso, conseguimos capturar essa flexibilidade icônica das línguas de sinais, sem

assumir uma posição teórica sobre o estatuto gramatical dessa característica da língua.

5. A informatização e a padronização do corpus

Desde o início do trabalho, foi nossa intenção produzir um corpus da LSB

informatizado, que pudesse 1) ter a transcrição sintonizada com a imagem em vídeo, 2)

permitir buscas e relatórios de vários tipos, 3) ser facilmente disponibilizado para outros

pesquisadores no mundo, e 4) ser comparável com outros corpora internacionais. A busca

de softwares e soluções que atendessem esses critérios foi feita concomitantemente à

primeira fase de experimentação em transcrição descrita nos itens 2 a 4 deste trabalho.

Julgamos conveniente iniciar as transcrições e ganhar experiência com elas, mesmo antes de

ter encontrado as ferramentas para a informatização. Durante essa primeira fase, usamos a

tecnologia de vídeo em VHS para a visualização das narrativas, como já foi dito, e

mantivemos as transcrições atualizadas em versões seqüenciais de documentos em Word

(de onde tiramos os exemplos usados acima).

O desenvolvimento de ferramentas que permitam a visualização e anotação

simultânea de gravações em vídeo tem se beneficiado nos últimos anos de um crescente

interesse pelos aspectos não-verbais da comunicação, dentro de várias áreas de

Page 18: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

18

investigação, além da de descrição das línguas de sinais: aquisição de língua, educação,

estudos da gestualidade, inteligência artificial, animação gráfica, interação homem-

computador. Uma busca por esse tipo de ferramenta levantou vários candidatos, cada um

desenvolvido para fins específicos, e com vantagens e desvantagens em relação a nosso

projeto21. A título de exemplificação, podemos mencionar:

ANVIL (Annotation of video and language data). Desenvolvido por Michael Kipp, do DFKI (Centro Alemão para Pesquisas em Inteligência Artificial) para a anotação de comunicação não-verbal. Permite múltiplas trilhas customizáveis para anotações. Disponível gratuitamente para fins educacionais e de pesquisa. Para plataformas PC, Mac e Unix. Sítio: <http://dfki.de/~kipp/anvil/>.

ELAN (EUDICO Language Annotator). Criado pelo Instituto Max Planck de Psicolingüística especificamente para análise lingüística, está sendo desenvolvido junto a um grupo de pesquisadores de línguas de sinais. Permite múltiplas trilhas customizáveis para anotações e vídeos simultâneos. Distribuído gratuitamente para plataformas PC, Mac e Unix. Sítio: <http://www.mpi.nl/tools/elan.html>.

CLAN (Computerized Language Analysis). Desenvolvido na Universidade Carnegie Mellon para analisar dados transcritos no formato CHILDES. Não é um software específico para transcrição a partir de vídeo, mas permite a interligação de trechos da transcrição com trechos de áudio e vídeo. Compatível com o Berkeley transcription system for sign language research (BTS). Distribuído gratuitamente para plataformas PC, Mac e Unix na base de troca de dados com o projeto CHILDES. Sítio: <http://childes.psy.cmu.edu/>.

SIGNSTREAM. Desenvolvido pelo American Sign Language Linguistic Research Project, da Universidade de Boston, especificamente para pesquisa com línguas sinalizadas. Permite múltiplas trilhas customizáveis para anotações e vídeos simultâneos. Disponível para plataforma Mac, mediante compra de licença por uma quantia simbólica. Sítio: <http://www.bu.edu/asllrp/SignStream/>.

TRANSANA. Ferramenta para transcrição e análise qualitativa de dados em áudio e vídeo desenvolvida no Wisconsin Center for Education Research. Permite interligação de trechos da transcrição com trechos de áudio e vídeo. Transcrição livre, sem pré-definição de trilhas. Disponível gratuitamente para plataforma Windows. Sítio: <http://www.transana.org/>.

Uma ferramenta como o Transana tem a vantagem de ser de uso relativamente

fácil, sendo possível importar as transcrições já preparadas em Word, como mostra a Figura

1.

21 Para análises e comparações de softwares, ver Dybkjaer (2001) e Bigbee et al. (2001).

Page 19: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

19

Figura 1. Transcrição com vídeo em Transana

Uma desvantagem é que a transcrição deve ser interligada ao vídeo em blocos, e

não continuamente.22 Como não há um cursor acompanhando os segmentos transcritos à

medida que o filme vai passando, não se pode estabelecer com precisão a correspondência

entre um elemento da transcrição e um ponto específico do vídeo. Na ilustração, o

sombreado marca a pauta que corresponde ao trecho do vídeo que está passando no

momento. À medida que o vídeo avança, o destaque vai avançando de pauta em pauta

para sinalizar o bloco correspondente. Podem-se demarcar blocos menores (sinais

individuais) ou maiores (uma seqüência de pautas), mas os blocos para visualização do

vídeo devem ser pré-definidos. 23

22 Isso parece ser também o caso do CLAN, que acopla o vídeo a transcrições já feitas. 23 É possível selecionar um trecho aleatório do vídeo para ser visualizado, mas os trechos relevantes da transcrição continuam destacados em bloco.

Page 20: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

20

Outra desvantagem do Transana é a pouca flexibilidade para a visualização da

transcrição. Não há opção de visualizar só algumas linhas das pautas e não outras (por

exemplo, só a das glosas, das mãos e da boca). Para isso, é necessário preparar outro

modelo da transcrição só com as linhas desejadas.

Uma ferramenta específica para transcrição e análise lingüística como o ELAN ou o

SignStream, traz algumas vantagens, apesar de sua maior complexidade. Uma vantagem

que eles apresentam para a transcrição das línguas sinalizadas é a possibilidade de visualizar

duas ou mais tomadas de vídeo simultaneamente, como ilustra a Figura 2, exemplo de

transcrição da língua de sinais holandesa (NGT) disponibilizado pelo Instituto Max

Planck.24

Figura 2. Transcrição no ELAN, com duas tomadas simultâneas de vídeo

24 Agradecimentos a ECHO - European Cultural Heritage Online, University Nijmegan. <http://www.let.kun.nl/sign-lang/echo/>.

Page 21: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

21

Como se vê na figura acima, a transcrição é feita em trilhas separadas, cada uma

relacionada a algum aspecto sendo codificado. As trilhas podem ser ocultadas ou

visualizadas, de acordo com o aspecto sendo estudado, e a ordem das trilhas pode ser

mudada com facilidade. Cada trilha pode ser segmentada e rotulada independentemente,

cada uma sincronizada continuamente com a linha do tempo do vídeo.25 Existem as

opções, também, de vincular uma trilha a outra, para que as demarcações de uma sejam

herdadas pela outra; e de criar glossários de marcações próprios para cada trilha.

Uma desvantagem do sistema do ELAN, relacionada com a natureza contínua da

transcrição, parece ser a impossibilidade de se gravarem relatórios que preservem as pautas

organizadas por unidades ideacionais, como em transcrições convencionais.26

Concomitantemente à busca de ferramentas informatizadas para facilitar a

transcrição, procuramos propostas de sistemas de anotação, principalmente aquelas que

visavam ao registro de marcações não-manuais. Essa preocupação se deve a nosso objetivo

de padronizar, na medida do possível, as nossas transcrições seguindo as normas

internacionais emergentes, e de aproveitar soluções encontradas por outros grupos de

pesquisa. Não é a proposta deste relato fazer uma revisão da literatura produzida na área.

Queremos apontar apenas, como exemplo, algumas das tentativas de resolver um problema

que, para nosso grupo, está, ainda, sem solução: as marcações não-manuais da boca.

Inicialmente, imaginamos que uma possível abordagem seria a de mapear as

configurações da boca com base em dois conjuntos de padrões: um conjunto dos visemas

do português brasileiro (PB), e um conjunto de outras configurações de boca. Visemas são

padrões visualmente contrastáveis de movimentação articulatória dos lábios e da língua

25 Na figura 2, a linha vertical que perpassa as trilhas marca o momento atual dos vídeos. 26 Essa e outras "desvantagens" podem ser sanadas à medida que ganhamos familiaridade com a ferramenta, ou à medida que avança o desenvolvimento do próprio software.

Page 22: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

22

produzidos em conseqüência da fala. Tanto quanto os fonemas, eles têm função distintiva

e identificadora (De Martino & Magalhães, 2004). A preocupação com os visemas

específicos do PB deve-se à freqüente incorporação da oralização do português, mesmo

que parcialmente, na sinalização em LSB, tanto por surdos oralizados quanto por surdos

não-oralizados.27

A literatura recente sobre transcrições de outras línguas de sinais tem mostrado a

mesma preocupação. A distinção entre articulação visêmica e outras configurações da

parte inferior da face tem sido foco de atenção de vários grupos de pesquisa na área. Por

exemplo, o grupo que desenvolve o sistema notacional sIGNDEX, para a descrição da

língua de sinais japonesa (JSL), elabora um conjunto de marcações distribuídas em 14

categorias, entre as quais incluem-se movimentos da boca, dos lábios e outros movimentos

da parte inferior da face, elencadas na Tabela 1 (Kanda at al. 2002a: 183).

1 Mandíbula Direção da mandíbula ou indicação de tensão 07 símbolos 2 Canto da boca Movimento do canto da boca 02 símbolos 3 Bochecha Enchimento da bochecha 02 símbolos 4 Língua Aparecimento da língua 05 símbolos 5 Boca (Mouthing) Abertura da boca ou fala 18 símbolos 6 Lábios Movimento específico dos lábios 05 símbolos 7 Dentes Aparecimento dos dentes 02 símbolos

Tabela 1: Representação de sinais da face inferior em sIGNDEX

Como mostra a tabela, o item 4, correspondente à boca, abrange 18 símbolos, um

dos quais é reservado para indicar a articulação visêmica (chamada por eles de mouth-speech).

Os autores se abstêm de caracterizar detalhadamente esses movimentos, registrando apenas

sua ocorrência. Os outros 17 símbolos são usados para registrar gestos bucais

considerados não-articulatórios.

27 Na época em que demos início à nossa transcrição, não existia catalogação dos visemas do PB. Concordando com o fato de que "não é legítima a simples extrapolação de resultados de uma língua para outra qualquer" (Sá et al. 2003), julgamos necessário adiar essa parte do trabalho. Felizmente, essa barreira já foi superada pela recente tese de doutorado de José Mario De Martino, da Unicamp (2005).

Page 23: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

23

Já o grupo alemão da Universidade de Hamburgo, ao desenvolver o projeto

ViSiCAST, estabelece as categorias relacionadas à face inferior apresentadas na Tabela 2

abaixo (Hanke 2000: 42-69). Na coluna à esquerda da Tabela, colocamos a numeração dos

itens correspondentes ao sIGNDEX, para facilitar a comparação.

Nota-se que no sistema proposto pelo projeto ViSiCAST, todas as categorias

relacionadas à face inferior são subordinadas à categoria 'boca'. Essa categoria, por sua vez,

é subdividida em 'figuras de boca' (em inglês, mouth pictures) e 'gestos bucais' (em inglês,

mouth gestures). A sub-categoria 'figuras de boca' é destinada ao registro da articulação

visêmica, anotada com o alfabeto fonético internacional (IPA). É importante ressaltar que,

enquanto sIGNDEX apenas registra a presença de articulações visêmicas, o sistema de

Hamburgo procura anotá-las. A sub-categoria 'gestos bucais' compreende os símbolos

usados para registrar os demais movimentos da face inferior.

5 Boca (Mouthing) -- Figuras de boca (Mouth pictures) símbolos IPA -- Gestos bucais (Mouth gestures) 7 Dentes 07 símbolos 1 Mandíbula 01 símbolos

2 e 6 Lábios 26 símbolos 3 Bochecha 10 símbolos 4 Língua 15 símbolos

Tabela 2: Representação de sinais da face inferior em ViSiCAST

O grupo da Universidade de Boston, criador do sistema SignStream (Neidle 2002)

também propõe uma distinção entre articulação visêmica (que eles chamam de oral language-

based mouthing) e gestos bucais (mouth gestures). Diferentemente do grupo de Hamburgo, até

2002 eles ainda não tinham anotado as articulações visêmicas pelo fato de que a ferramenta

SignStream não aceitava as fontes do IPA. Além disso, Neidle (2002: 35) ressalta a

dificuldade de distinguir, em muitos casos, gestos bucais de articulações visêmicas. De fato,

nos sistemas descritos tanto por Kanda et al., quanto por Hanke, os gestos bucais parecem

ser de dois tipos: aqueles que são claramente de natureza expressiva (com ou sem função

Page 24: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

24

gramatical), e aqueles que parecem derivar de articulações visêmicas. Por exemplo, entre os

gestos bucais, Kanda et al (2002a: 192) listam [po], [pa], [pi] e [pu], enquanto Hanke (2001:

52-58), por sua vez, inclui [f], [�], [u], [pi] e [l], entre outros. O estabelecimento do estatuto

desses gestos e sua relação com processos de articulação visêmica e lexicalização nos parece

um estudo que ainda está por ser desenvolvido, e que depende de transcrições

adequadamente discriminatórias.

6. Conclusão

Nossa proposta, neste artigo, foi a de iniciar uma discussão sobre questões

relacionadas à documentação de línguas sinalizadas e à transcrição dos dados, relatando

alguns aspectos de nossa experiência inicial na formação de um corpus de LSB. Por

enquanto, esse corpus se constitui basicamente de narrativas produzidas por surdos

fluentes, baseadas em um filme sem palavras, conhecido como “A História da Pêra”,

preparado especialmente para a eliciação de narrativas (Chafe 1980). A opção pelo uso

desse filme teve, entre outros, o objetivo de evitar o uso de histórias baseadas em textos

escritos em português, o que poderia causar alguma interferência de processos gramaticais e

estratégias discursivas dessa língua na narrativa em LSB.

A questão da transcrição de dados de línguas sinalizadas é particularmente

complexa, na medida em que essas línguas não contam com um sistema de escrita

largamente aceito que possa servir de base para sua transcrição. Por isso, há diferentes

propostas de representação das línguas de sinais.

Para transcrever os dados que coletamos, estamos desenvolvendo um sistema de

transcrição de orientação eminentemente descritiva. Nesse sentido, temos procurado criar

um sistema de marcações que capturem o maior número possível de detalhes presentes na

sinalização, mas que estejam desvinculadas de quaisquer análises gramaticais já feitas, ou

que possamos fazer a respeito dos dados com que estamos trabalhando.

Duas outras características que temos procurado imprimir a esse sistema de

transcrição são a padronização e a comparabilidade. Com vistas a isso, no que diz respeito

ao registro dos sinais manuais, optamos por tomar o dicionário de Capovilla & Raphael

(2001) como base para a construção das glosas, uma vez que se trata de um importante e

cuidadoso registro da LSB, largamente difundido no país. No que diz respeito aos sinais

Page 25: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

25

não-manuais, como a direção do olhar, a configuração das sobrancelhas, a configuração da

boca, entre outros, temos procurado avançar, sempre levando em consideração o que vem

sendo feito por outros pesquisadores interessados na transcrição das mais variadas línguas

de sinais, para que, justamente, o sistema que vimos desenvolvendo possa se comparar aos

sistemas que vêm sendo criados em outros países.

Um último ponto que gostaríamos de destacar é que, a nosso ver, a questão da

transcrição das línguas em geral, e das línguas sinalizadas em particular, vai além do aspecto

meramente formal de uma boa documentação lingüística. Sistemas de transcrição bem

elaborados se tornam lentes poderosas que nos ajudam a ver várias características das

línguas que, sem eles, poderiam passar despercebidas.

Referências bibliográficas

BAKER, C.; PADDEN, C.A. (1978). Focusing on the nonmanual components of

American Sign Language. In P. Siple (Ed.), Understanding language through sign

language research. New York: Academic Press, p. 27-57.

BIGBEE, T.; LOEHR, D.; HARPER, L. (2001). Emerging requirements for multi-modal

annotation and analysis tools. Proceedings, Eurospeech 2001 - Scandinavia. Aalborg,

Denmark, September 3-7, 2001. Disponível em:

<http://www.mitre.org/work/tech_papers/tech_papers_01/bigbee_emerging/bigbee_emerging.pdf>.

Acesso em 8.03.2006.

CAPOVILLA, F.C.; RAPHAEL, W.D. (2001). Dicionário enciclopédico ilustrado

trilíngüe da Língua de Sinais Brasileira. - Libras. v. I e II. São Paulo: Editora da

Universidade de São Paulo / Imprensa Oficial do Estado.

CHAFE, W.L. (1980). The pear stories: Cognitive, cultural, and linguistic aspects of

narrative production. Norwood, NJ: Ablex Publishing Corp.

CHAN-VIANNA, A.C. (2003). Aquisição de português por surdos: Estruturas de

posse. Dissertação de mestrado, UnB.

DE MARTINO, J.M. (2005). Animação facial sincronizada com a fala: Visemas

dependentes do contexto fonético para o português do Brasil. Tese de doutorado,

Unicamp.

Page 26: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

26

DE MARTINO, J.M.; MAGALHÃES, L.P. (2004). Um conjunto de visemas para uma

cabeça falante do português do Brasil. Anais do III Congreso Iberdiscap - Tecnologias de

Apoyo para la Discapacidad, v. 1, p. 198-203, San José, Costa Rica, 03/2004.

DYBKJAER, L. et al. (2001). Survey of existing tools, standards and user needs for

annotation of natural interaction and multimodal data. Report D11.2. July 2001. ISLE

Natural Interactivity and Multimodal Working Group. Disponível em:

<http://isle.nis.sdu.dk/reports/wp11/D11.1-14.2.2001.pdf>. Acesso em 14.03.2006.

ENGBERT-PEDERSEN, E. (1999). Eye gaze in Danish Sign Language monologues:

Forms, functions, notation issues. INTERSIGN project papers, v. 3, p.33 - 37.

EMMOREY, K. (Ed.). (2003). Perspectives on classifier constructions in sign

languages. Lawrence Erlbaum Associates.

FELIPE, T. (1988). O signo gestual-visual e sua estrutura frasal na língua dos sinais

dos centros urbanos do Brasil (LSCB). Dissertação de mestrado, UFPE.

FELIPE, T. (1998). A relação sintático-semântica dos verbos na língua brasileira de

sinais - Libras. Tese de doutorado, UFRJ.

FERREIRA BRITO, L. (1995). Por uma gramática de línguas de sinais. Rio de Janeiro:

Tempo Brasileiro.

FINAU, R. (2004). Os sinais de tempo e aspecto na Libras. Tese de doutorado, UFPR.

HANKE, T. (Ed.). (2000). Interface definitions. ViSiCAST Deliverable D5-1. Disponível

em: <http://www.visicast.co.uk/members/milestones/ViSiCASTD5-1.pdf>. Acesso em: 14.03.2006.

HOITING, N.; SLOBIN, D.I. (2002). Transcription as a tool for understanding: The

Berkeley transcription system for sign language research (BTS). In G. Morgan & B. Woll

(Eds.), Directions in sign language acquisition. Amsterdam/Philadelphia: John

Benjamins. p. 55-75.

INTERSIGN Network. (2000). European Science Foundation Network. Disponível em:

<http://www.sign-lang.uni-hamburg.de/Intersign/>. Acesso em: 21.03.2006.

KANDA, K. et al. (2002a). Notation system and statistical analysis of NMS in JSL. In I.

Wachsmuth & T. Sowa (Eds.), Gesture and sign language in human-computer

interaction. International Gesture Workshop, GW 2001, London, UK, April 18-20, 2001.

Revised Papers. Lecture Notes in Computer Science, v. 2298, p. 181-192.

Page 27: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

27

KANDA, K. et al. (2002b). Constraints on co-occurrence of manual and non-manual

operations in JSL. First International Conference on Information Technology and

Applications, Bathurst, Australia. Disponível em: <http://www.ns.kogakuin.ac.jp/~wwc1015/sig-

sile/pdf/ICITA189-17.pdf>. Acesso em: 10.12.2005.

LIDDELL, S. (2003). Grammar, gesture, and meaning in American Sign Language.

Cambridge University Press.

MARTIN, J. (2000). A linguistic comparison. Two notation systems for signed languages:

Stokoe notation & Sutton SignWriting. Disponível em

<http://www.signwriting.org/archive/docs1/sw0032-Stokoe-Sutton.pdf>. Acesso em 15.02.2006.

MacWHINNEY, B. (2006). The CLAN programs. In The CHILDES Project: Tools for

analyzing talk - Electronic edition. v. 2, part 2. Disponível em:

<http://childes.psy.cmu.edu/manuals/CLAN.pdf>. Acesso em 14.03.2006.

McCLEARY, L.E. (2003). Technologies of language and the embodied history of the deaf.

Sign Language Studies, v. 3, n. 2, p. 104-124.

McNeill, D.; DUNCAN, S.D. (2005). Review of S.K. Liddell, Grammar, gesture, and meaning

in American Sign Language. Sign Language Studies, v. 5, n. 4, p. 506-523.

MORGAN, G. (1999). Event packaging in British Sign Language discourse. In E.A.

Winston (Ed.), Storytelling and conversation: Discourse in deaf communities.

Washington, DC: Gallaudet University Press. p. 27-58.

NEIDLE, C. (2002). SignStream™ annotation: Conventions used for the American Sign

Language Linguistic Research Project. Report No. 11. Disponível em:

<http://www.bu.edu/asllrp/asllrpr11.pdf>. Acesso em: 8.03.2006.

OCHS, E. (1979). Transcription as theory. In E. Ochs & B.B. Schieffelin (Eds.),

Developmental pragmatics. New York: Academic Press. p. 43-72.

PEREIRA, M.C.C.; NAKASATO, R.Q. (2002). Construção de narrativas em língua de

sinais brasileira. In: XV Encontro da ANPOLL, 2000, Niterói, RJ. Síntese 2 (CD).

QUADROS, R.M. (1999). Phrase structure of Brazilian Sign Language. Tese de

doutorado, PUC-RS.

RAYMAN, J. (1999). Storytelling in the visual mode: A comparison of ASL and English. In

E.A. Winston (Ed.), Storytelling and conversation: Discourse in deaf communities.

Washington, DC: Gallaudet University Press. p. 59-82.

Page 28: transcrição de dados de LS ELAN

McCLEARY, L; VIOTTI, E. (a sair). Transcrição de dados de uma língua sinalizada.

28

SÁ, F.; AFONSO, P.; FERREIRA, R.; PÊRA, V. (2003). Reconhecimento automático de

fala contínua em português europeu recorrendo a streams audio-visuais. In: Proceedings

of COOPMEDIA'2003: Workshop de Sistemas de Informação Multimédia, Cooperativos

e Distribuídos - 8 de outubro de 2003, Porto, Portugal.

SANTOS, D.V. (2002). Estudos de línguas de sinais: Um contexto para a análise da

língua brasileira de sinais (Libras). Tese de doutorado, UFRJ.

STOKOE, W. (1978 [1960]). Sign language structure. Silver Spring, MD: Linstok Press.

STOKOE, W.; CASTERLINE, D.C.; CRONEBERG, C.G. (1965). A dictionary of

American Sign Language. Washington, DC: Gallaudet College Press.

SUTTON, V. (1996). SignWriting web site. La Jolla, CA.: Deaf Action Committee for

SignWriting. Disponível em: <http://www.signwriting.org>. Acesso em: 15/02/2006.