Sistema Automático de Pronunciação de Verbos

8
28 Anais da III Jornada de Descri¸ ao do Portuguˆ es, p´aginas 28–35, Fortaleza, CE, Brasil, Outubro 21–23, 2013. c 2013 Sociedade Brasileira de Computa¸c˜ao Sistema Automático de Pronunciação de Verbos Sara Candeias 1 , Arlindo Veiga 1,2 , Fernando Perdigão 1,2 1 Instituto de Telecomunicações University of Coimbra, Coimbra - Portugal 2 Dept. of Electrical and Computer Eng. University of Coimbra, Coimbra - Portugal {saracandeias,aveiga,fp}@co.it.pt Resumo. Este artigo apresenta uma análise fonológica da flexão verbal em português e um algoritmo que permite gerar automaticamente a pronúncia das flexões dos verbos.. O método proposto considera a vogal temática enquanto parte integrante dos sufixos verbais. Paradigmas de pronunciação de verbos, assim como tabelas das tipologias de regularidade e da ambiguidade entre a forma pronunciada e os valores de tempo modo pessoa e número que a determinam são igualmente apresentados. O algoritmo foi testado com base nos verbos mais frequentes do CETEMPúblico. Abstract. This paper presents a phonological analysis of the verbs inflected in European Portuguese and an algorithm to generate automatically the pronunciation of verbs. The proposed approach considers the thematic vowel as part of the verbal suffixes. Pronunciation paradigms of the verbs, as well as tables for regularity types and ambiguity between pronunciation and time person and number form are also given. The algorithm was tested based on the most frequent verbs in the CETEMPúblico corpus. 1. Introdução O verso Absurdemos a Vida, de leste a oeste, lançado pelo semi-heterónimo de Fernando Pessoa, Bernardo Soares, no Livro do Desassossego, [Pessoa 1990], contém dois vocábulos, <absurdemos> e <leste>, cuja decisão pela forma de pronunciação está dependente do conhecimento semântico e morfossintático. Sem esse conhecimento prévio, nem o falante nem um sistema automático de conversão de grafemas em fonemas (G2P, do inglês Grapheme-to-Phoneme) sabe decidir por qual altura da vogal tónica escolher (se /e/, se /ɛ/) no ato de pronunciar. A decisão por uma pronúncia quando não se tem qualquer informação prévia representa, assim, um problema de resolução não trivial e é responsável por muitos dos erros nos sistemas de pronunciação, sejam eles automáticos ou não. Pegando no primeiro vocábulo-exemplo, <absurdemos> será pronunciado como /ɐbsuɾdˈemuʃ/ se admitirmos que a forma é verbal, declinada de um possível infinitivo impessoal <absurdar>, da primeira conjugação, conjugada no modo conjuntivo, tempo presente, primeira pessoa do plural. Mas, optando pela pronunciação /ɐbuɾdˈɛmuʃ/, a abertura da vogal tónica formaliza a determinação pelo modo indicativo e pelo tempo pretérito perfeito simples de um possível verbo derivado de <dar> (/dˈɛmuʃ/). Em <leste>, a decisão pela pronunciação /lˈɛʃtə/, ao invés de /lˈeʃtə/, está dependente da informação semântica e morfossintática esclarecida pelo contexto frásico: <o leste> (nome) versus <tu leste> (verbo), respetivamente. Por vezes, a decisão de pronúncia de um vocábulo não conhecido só pode ser tomada com recurso a analogias, mesmo para um falante humano. A pronúncia de <absurdemos> (forma de um possível verbo <absurdar>), tomada por analogia com <aguardar> (exequível como

Transcript of Sistema Automático de Pronunciação de Verbos

Page 1: Sistema Automático de Pronunciação de Verbos

28

Anais da III Jornada de Descricao do Portugues, paginas 28–35, Fortaleza, CE, Brasil, Outubro 21–23, 2013.

c©2013 Sociedade Brasileira de Computacao

Sistema Automático de Pronunciação de Verbos

Sara Candeias1, Arlindo Veiga

1,2, Fernando Perdigão

1,2

1Instituto de Telecomunicações – University of Coimbra, Coimbra - Portugal

2Dept. of Electrical and Computer Eng. – University of Coimbra, Coimbra - Portugal

{saracandeias,aveiga,fp}@co.it.pt

Resumo. Este artigo apresenta uma análise fonológica da flexão verbal em

português e um algoritmo que permite gerar automaticamente a pronúncia

das flexões dos verbos.. O método proposto considera a vogal temática

enquanto parte integrante dos sufixos verbais. Paradigmas de pronunciação

de verbos, assim como tabelas das tipologias de regularidade e da

ambiguidade entre a forma pronunciada e os valores de tempo modo pessoa e

número que a determinam são igualmente apresentados. O algoritmo foi

testado com base nos verbos mais frequentes do CETEMPúblico.

Abstract. This paper presents a phonological analysis of the verbs inflected in

European Portuguese and an algorithm to generate automatically the

pronunciation of verbs. The proposed approach considers the thematic vowel

as part of the verbal suffixes. Pronunciation paradigms of the verbs, as well as

tables for regularity types and ambiguity between pronunciation and time

person and number form are also given. The algorithm was tested based on

the most frequent verbs in the CETEMPúblico corpus.

1. Introdução

O verso “Absurdemos a Vida, de leste a oeste”, lançado pelo semi-heterónimo de

Fernando Pessoa, Bernardo Soares, no Livro do Desassossego, [Pessoa 1990], contém

dois vocábulos, <absurdemos> e <leste>, cuja decisão pela forma de pronunciação está

dependente do conhecimento semântico e morfossintático. Sem esse conhecimento

prévio, nem o falante nem um sistema automático de conversão de grafemas em

fonemas (G2P, do inglês Grapheme-to-Phoneme) sabe decidir por qual altura da vogal

tónica escolher (se /e/, se /ɛ/) no ato de pronunciar. A decisão por uma pronúncia

quando não se tem qualquer informação prévia representa, assim, um problema de

resolução não trivial e é responsável por muitos dos erros nos sistemas de pronunciação,

sejam eles automáticos ou não. Pegando no primeiro vocábulo-exemplo, <absurdemos>

será pronunciado como /ɐbsuɾdˈemuʃ/ se admitirmos que a forma é verbal, declinada de

um possível infinitivo impessoal <absurdar>, da primeira conjugação, conjugada no

modo conjuntivo, tempo presente, primeira pessoa do plural. Mas, optando pela

pronunciação /ɐbuɾdˈɛmuʃ/, a abertura da vogal tónica formaliza a determinação pelo

modo indicativo e pelo tempo pretérito perfeito simples de um possível verbo derivado

de <dar> (/dˈɛmuʃ/). Em <leste>, a decisão pela pronunciação /lˈɛʃtə/, ao invés de

/lˈeʃtə/, está dependente da informação semântica e morfossintática esclarecida pelo

contexto frásico: <o leste> (nome) versus <tu leste> (verbo), respetivamente. Por vezes,

a decisão de pronúncia de um vocábulo não conhecido só pode ser tomada com recurso

a analogias, mesmo para um falante humano. A pronúncia de <absurdemos> (forma de

um possível verbo <absurdar>), tomada por analogia com <aguardar> (exequível como

Page 2: Sistema Automático de Pronunciação de Verbos

29

paradigma), é disso exemplo. Se, por um lado, esta analogia é de fácil implementação

computacional, mais complexa é a escolha da pronúncia entre /e/ e /ɛ/, na medida em

que ela deverá resultar de um tipo de conhecimento linguístico adquirido através de

processos psico-cognitivos muito estruturados. A dificuldade de implementação é ainda

acrescida se se pretender, dada uma forma verbal conjugada ortograficamente, gerar

uma saída com a indicação da respetiva forma infinitiva e sua representação fonológica.

A complexidade inerente ao problema da pronunciação verbal parece explicar a

escassez de estudos desenvolvidos sobre o assunto, no sistema do português europeu

(PE). Num trabalho de referência sobre a análise fonológica da flexão verbal [Mateus

2003], a autora descreve os tempos verbais simples no que diz respeito à incidência do

acento tónico e ao comportamento da vogal temática (como o fenómeno de supressão) e

tendo em atenção os processos ocasionados pela harmonização vocálica e pelo

abaixamento da vogal do radical verbal. Processos de assimilação, dissimilação e de

ditongação da vogal temática são igualmente descritos, tais como os que ocorrem entre

/ˈe/→/ˈi/ em [bɐtˈeɾ]→[bɐtˈi] e [bɐtˈiɐ] e /e+nasal/→/ɐj+nasal/ em [bˈatɐ ],

respetivamente. No âmbito do mesmo quadro teórico de [Mateus 2003], o estudo de

[Villalva 2003] apresenta alternâncias vocálicas regulares que afetam a última vogal do

radical verbal. No quadro teórico do estruturalismo europeu, em [Barbosa 1994],

apresentam-se as alterações de forma da vogal radical que, na flexão verbal, estão

dependentes do contexto fonológico. Em [Cunha e Cintra 2002] as alternâncias

vocálicas são abordadas com bastante detalhe, definindo-se alguns paradigmas de

pronunciação.

No presente trabalho descrevemos um método automático que gera a

pronunciação de formas verbais flexionadas, dada a forma verbal no infinitivo com

respetiva transcrição fonológica. Apresentamos um algoritmo composto, na sua

essência, por um conjunto de regras linguísticas, baseado num método organizado pela

análise da vogal temática e a identificação do paradigma verbal que define os sufixos

verbais e a alternância do timbre da última vogal do radical verbal.

Este artigo está organizado da seguinte forma: a Secção 2 apresenta uma breve

descrição da flexão verbal e a notação usada. Na secção 3, apresentamos tabelas das

tipologias de regularidade da pronunciação dos verbos, e da ambiguidade entre a forma

pronunciada e os valores de tempo modo pessoa e número que a determinam. Na secção

4 são apresentadas as conclusões e traçados alguns trabalhos futuros.

2. Flexão verbal e pronunciação

Os verbos portugueses dividem-se em 3 conjugações, referidas usualmente a partir da

forma infinitiva como 1.ª conjugação (em “ar”), 2.ª conjugação (em “er”) e 3.ª

conjugação (em “ir”). Existe apenas uma exceção, a do verbo pôr, e seus derivados, que

tomamos aqui como uma quarta conjugação. Os verbos flexionam-se em modo, tempo e

pessoa. Identificamos de forma abreviada os tempos e modos com uma sigla e as

pessoas com números de 1 a 6, sendo (1,2,3) as três pessoas do singular (eu, tu e ele/ela)

e (4,5,6) as respetivas pessoas do plural, tal como é sugerido em [Barbosa 1994]. Por

exemplo, pi(3) significa “3.ª pessoa do singular do presente do indicativo”. A Tabela 1

identifica as siglas dos tempos e modos usados neste artigo.

A forma no infinitivo impessoal identifica imediatamente a vogal temática (a

penúltima letra) que ocorre sempre em posição tónica. O radical é constituído pelas

Page 3: Sistema Automático de Pronunciação de Verbos

30

letras (na forma ortográfica) e pelos fonemas (na transcrição fonética) anteriores à vogal

temática. Se existirem vogais no radical, elas estarão, nesta forma do infinitivo, em

posição átona.

Do ponto de vista da flexão, não foi considerado o conceito de defetividade,

assim como se preenchem todas as pessoas do modo imperativo com formas do presente

do modo conjuntivo. Esta opção metodológica, que torna exequível flexionar formas

como as presentes em estruturas <tu dóis-me na alma...> ou <sinta eu a alegria de

viver!>, abecede a uma linha de uso possível da língua em sentido figurado/poético.

Tabela 1. Abreviaturas dos tempos e modos verbais

Abreviatura Tempo/Modo verbal

pi presente do indicativo

pc presente do conjuntivo

pii pretérito imperfeito do indicativo

pic pretérito imperfeito do conjuntivo

ppi pretérito perfeito do indicativo

pmqi pretérito mais que perfeito do indicativo

futi futuro do indicativo

futc futuro do conjuntivo

cond condicional (ou futuro perfeito)

imp imperativo

infp infinitivo pessoal

inf infinitivo impessoal

ger gerúndio

pcp particípio passado

As flexões de grande maioria dos verbos podem ser inferidas a partir do radical e

do tempo/modo/pessoa da flexão, bastando juntar o sufixo correspondente ao radical.

Existem algumas irregularidades neste processo, tanto na grafia como na respetiva

pronunciação. Neste artigo falaremos apenas das irregularidades na pronunciação.

Muitos verbos da língua portuguesa, em especial no português europeu, apresentam

diferenças de timbre na vogal tónica que alterna entre o radical e sufixos. Em [Cunha e

Cintra 2002] estes casos foram já identificados; no entanto, apresentamos aqui, de forma

sistematizada, todas as situações de interesse para definir a pronunciação dos verbos.

2.2 Divisão dos Tempos/Modos/Pessoas Verbais

Em termos de pronunciação das flexões verbais, verifica-se que a vogal tónica está, na

maioria dos casos, nos sufixos verbais. Quando a vogal tónica não está associada aos

sufixos vai recair sobre o radical, mais precisamente, na última vogal do radical, UVR.

Por TMP1 referimo-nos ao conjunto de flexões onde esta alternância ocorre.

Corresponde ao presente do indicativo, presente do conjuntivo e imperativo, nas 3

pessoas do singular e 3.ª pessoa do plural (ver Tabela 2). A título de exemplo, em

Page 4: Sistema Automático de Pronunciação de Verbos

31

<lavar>, [lɐvˈar], a vogal do radical alterna para [a]: <eu lavo, tu lavas, ele lava, eles

lavam>, [ew lˈavu, tu lˈavɐʃ, elə lˈavɐ, eləʃ lˈavɐ ].

Tem interesse subdividir este conjunto de flexões TMP1 em dois: TMP1a

(situação em que a tónica recai no radical, mas apresenta um timbre fechado, [e] ou [o])

e TMP1b (situação em que a tónica recai no radical, mas com timbre aberto [ɛ] ou [ɔ]).

Como exemplo, temos o verbo <beber>, [bəbˈeɾ] , com <bebo, beba, bebas, bebam>,

[bˈebu, bˈebɐ, bˈebɐʃ, bˈebɐ ], e <bebes, bebe, bebem>, [bˈɛbəʃ, bˈɛbə, bˈɛbɐ ]. Outro

exemplo é dado pelo verbo <mover>, [muvˈeɾ], com <movo, mova, movas, movam>,

[mˈovu, mˈovɐ, mˈovɐʃ, mˈovɐ ] e <moves, move, movem>, [mˈɔvəʃ, mˈɔvə, mˈɔvɐ ].

A tabela 2 descreve todos os conjuntos de flexões identificados como pertinentes para a

pronunciação.

Tabela 2. Tempos/Modos/Pessoas relevantes para as flexões verbais

Sigla Descrição tempos/modos/pessoas

TMP1 Vogal tónica passa para o radical com timbre

aberto. Ex.: <lavar>.

pi(1,2,3,6); pc(1,2,3,6);

imp(1,2,3,6)

TMP1a

Vogal tónica passa para o radical com timbre

fechado [e] ou [o]; ou mudança de consoante.

Exs.: <beber>, <mover>, <ouvir>.

pi(1); pc(1,2,3,6);

imp(1,3,6)

TMP1b Vogal tónica passa para o radical com timbre

aberto [ɛ] ou [ɔ]. Ex.: <beber>, <mover>. pi(2,3,6); imp(2)

TMP2 Mudança de vogal, timbre de vogal ou

consoante do radical. Ex: <medir>. pc(4,5); imp(4)

TMP3 Alteração de radical e sufixos de verbos

terminados em <air>. Ex: <trair>.

pi(1,2,3,6);

pc(1,2,3,4,5,6);

imp(1,2,3,4,6)

TMP4

Redução do schwa final em verbos terminados

em <zir> e em alguns verbos em <zer> e

mudança de [z] por [ʃ]. Ex: <traduz>.

pi(3); imp(2)

Em alguns verbos existem pequenas irregularidades e nos quais, associado a

uma mudança de timbre da UVR, apresentam também alternância entre consoantes. É o

caso dos verbos <medir> e <pedir> onde se manifesta a alternância entre [ə] e [ɛ] e

entre [d] e [s], como acontece em <eu peço>, [e pˈɛsu]. Estas situações (TMP2)

ocorrem no presente do conjuntivo, 2.ª e 3.ª pessoa do plural e no imperativo, 1.ª pessoa

do plural.

Os sufixos dos verbos terminados em <air> apresentam pequenas alterações em

TMP3, que correspondem ao presente do indicativo, pessoas (1,2,3,6), presente do

conjuntivo (todas as pessoas) e imperativo (todas as pessoas exceto a 2.ª pessoa do

plural): uma inserção de [j] no radical (por exemplo em <traio>, [tɾˈaju] e não [tɾˈau]), e

a apócope do sch a [ə] quando este manifesta a determinação da 3.ª pessoa do singular

nos sufixos regulares (por exemplo, <trai>, [tɾˈaj] e não [tɾˈaə] se fosse regular).

Page 5: Sistema Automático de Pronunciação de Verbos

32

Existe, por fim, a situação em que as flexões dos verbos terminados em <zir> e

alguns verbos em <zer> suprimem a vogal final (apócope do sch a [ə]). Acontece no

presente do indicativo, 3.ª pessoa do singular e imperativo, 2.ª pessoa do singular

(TMP4). É o caso do verbo <traduzir>: <traduz>, [tɾɐdˈuʃ] em vez de <traduze>,

[tɾɐdˈuzə], embora no imperativo ambas as formas sejam possíveis. Outro exemplo é o

do verbo <jazer>: <jaz>, [ʒˈaʃ].

3. Os Paradigmas Verbais

Com base na análise da pronunciação dos verbos e a comparação com as respetivas

flexões com terminações regulares, é possível enumerar o número de irregularidades na

pronunciação dos verbos bem como caracterizá-los em termos de paradigmas.

Tabela 3. Paradigmas verbais dos verbos regulares e quase regulares quanto à pronunciação, com indicação do número de alterações nas flexões (alt); número de radicais diferentes (rad) e número de sufixos diferentes (suf).

Mudança TMP n Paradigma alt rad suf

- - <amar>,<viver>,<unir>,<pôr> 0 1 0

u → ɔ 1b <dormir> 4 2 0

u → ɔ 1b <cobrir>: pcp irreg. [kubˈɛɾtu] 5 2 1

ɐ → a 1 <lavar>, <debater>, <agir> 12 2 0

ɐ → a 1 <abrir>: pcp irreg. [ɐbˈɛɾtu] 13 2 1

ə|e → ɛ 1 <negar> 12 2 0

ə → e 1 <chegar> 12 2 0

u → o 1 <somar> 12 2 0

u → ɔ 1 <tocar> 12 2 0

ə → ɐ 1 <desenhar> 12 2 0

ə → ɐj 1 <desejar> 12 2 0

i → ɐj 1 <ansiar> 12 2 0

ɛ → i 1a+2 <refletir> 11 2 0

→ 1a+2 <sentir> 11 2 0

v → s 1a+2 <ouvir> 11 2 0

ə → i 1+2 <agredir> 15 2 0

zə → ʃ

zə → ʃ

4

4

<jazer>

<induzir>

2

2

2

2

2

2

ə → i 1b <afluir> 4 2 3

u → ɔj 1b <construir> 4 2 3

u → o | ɔ 1a;1b <mover> 12 3 0

ə|e|ɛ → e | ɛ 1a;1b <beber> 12 3 0

ə → e| ɛ 1a;1b <escrever>: pcp irreg. [əʃkɾˈitu] 13 3 1

ə → ɐj | ɛ 1a+2;1b <requerer> 15 3 0

ə → i | ɛ 1a+2; 1b <ferir> 15 3 0

ɐ → a; l →ʎ 1;1a+2 <valer> 15 4 0

ə → ɛ; d → k 1;1a+2 <perder> 15 4 0

ə → ɛ; d → s 1;1a+2 <medir> 15 4 0

ɐ → aj; ə →i 3 <trair> 15 3 3

Page 6: Sistema Automático de Pronunciação de Verbos

33

Nesta análise não consideremos as formas alternativas irregulares dos verbos

abundantes. O verbo <negociar>, por exemplo, pode conjugar-se de forma regular,

embora as formas irregulares sejam prevalentes: <negoceio> é mais usual que a forma

regular <negocio>. Na enumeração das irregularidades, classificamos os verbos como

irregulares sempre que o número de irregularidades é superior a 15.

A Tabela 3 indica os paradigmas identificados para os verbos regulares e quase

regulares, com a indicação da mudança, onde ocorre, e o verbo paradigma. Indica

também o número de flexões que apresentam alterações no radical e/ou nos sufixos face

à forma regular derivada; o número de radicais (fonológicos) diferentes que é necessário

considerar para conjugar todas as flexões e o número de alterações nos sufixos. Na

contagem de irregularidades foram considerados todos os tempos/modos/pessoas, com a

particularidade de se considerar o imperativo segundo a seguinte regra simples: o

imperativo apenas tem formas autónomas na 2.ª pessoa e todas as outras são derivadas

do presente do conjuntivo.

Tabela 4. Paradigmas dos verbos “irregulares”, com indicação do número de alterações nas flexões (alt); número de radicais diferentes (rad) e número de

sufixos diferentes (suf).

Paradigma alt rad suf

<ler>, <crer> 17 3 5

<rir> 17 2 5

<prover> 17 4 5

<aprazer> 36 4 26

<dar> 34 1 34

<estar> 38 1 38

<caber> 39 4 24

<poder> 39 5 24

<saber> 39 5 25

<querer> 39 5 26

<haver> 39 5 29

<ver> 41 4 29

<ir> 42 5 37

<ter> 47 6 35

<ser> 48 5 38

<vir> 48 4 36

<dizer> 50 5 39

<trazer> 51 6 38

<fazer> 52 8 39

A Tabela 4 indica os paradigmas dos verbos irregulares. A Tabela 5 exemplifica as

flexões do verbo <trair>, onde as alterações relativamente às formas regulares são

indicadas a vermelho. Existem 3 radicais diferentes: [tɾɐ], [tɾˈaj] (em TMP1), [tɾɐi] (em

TMP2) e 15 alterações em relação às formas regulares, três das quais nos sufixos

(apócope do sch a [ə], identificado na tabela com o caráter ‘-’).

Page 7: Sistema Automático de Pronunciação de Verbos

34

3.1 Algoritmo

Dado um verbo na forma infinitiva (nas formas ortográfica e de pronunciação), ele é

primeiramente classificado segundo a tipologia da Tabela 3 ou 4. Para isso o padrão do

radical é analisado de forma a identificar verbos paradigma ou seus derivados. Por

exemplo, <escrever> não é derivado de <ver> nem de <rever>, mas <repor> é derivado

de <pôr>. Assim, também como exemplo, o verbo “absurdar” será considerado regular

com radical [absuɾd] e UVR [u] que não sofre alterações de altura quando alterna entre

posição tónica e átona. O possível verbo <repedir> será classificado com paradigma

<medir>, radical <reped>, [ɾəpəd] com 15 flexões diferentes das regulares em TMP1a e

TMP2 devidas à substituição de [d] por [k] no radical, além da mudança do timbre da

vogal de [ə] para [ɛ] em TMP1. No entanto, não existe nenhuma alteração dos sufixos.

Para cada verbo irregular existe uma tabela completa das pronunciações das

flexões. Para os restantes verbos, foram definidas tabelas de radicais diferentes e de

sufixos para as situações de mudança.

Tabela 5. Pronunciação do verbo trair.

Tempo/ Pessoas

Modo 1 2 3 4 5 6

pi traio

[tɾˈaj u]

trais

[tɾˈaj -ʃ]

trai

[tɾˈaj -]

traimos

[tɾɐ ˈimuʃ]

traís

[tɾɐ ˈiʃ]

traem

[tɾˈaj ɐ ]

pii traía

[tɾɐ ˈiɐ]

traías

[tɾɐ ˈiɐʃ]

traía

[tɾɐ ˈiɐ]

traíamos

[tɾɐ ˈiɐmuʃ]

traíeis

[tɾɐ ˈiɐiʃ]

traíam

[tɾɐ ˈiɐ ]

ppi traí

[tɾɐ ˈi]

traiste

[tɾɐ ˈiʃtə]

traiu

[tɾɐ ˈi ]

traimos

[tɾɐ ˈimuʃ]

traistes

[tɾɐ ˈiʃtəʃ]

trairam

[tɾɐ ˈiɾɐ ]

pmqi traira

[tɾɐ ˈiɾɐ]

trairas

[tɾɐ ˈiɾɐʃ]

traira

[tɾɐ ˈiɾɐ]

traíramos

[tɾɐ ˈiɾɐmuʃ]

traíreis

[tɾɐ ˈiɾɐjʃ]

trairam

[tɾɐ ˈiɾɐ ]

futi trairei

[tɾɐ iɾˈɐj]

trairás

[tɾɐ iɾˈaʃ]

trairá

[tɾɐ iɾˈa]

trairemos

[tɾɐ iɾˈemuʃ]

traireis

[tɾɐ iɾˈɐjʃ]

trairão

[tɾɐ iɾˈɐ ]

cond trairia

[tɾɐ iɾˈiɐ]

trairias

[tɾɐ iɾˈiɐʃ]

trairia

[tɾɐ iɾˈiɐ]

trairíamos

[tɾɐ iɾˈiɐmuʃ]

trairíeis

[tɾɐ iɾˈiɐjʃ]

trairiam

[tɾɐ iɾˈiɐ ]

pc traia

[tɾˈaj ɐ]

traias

[tɾˈaj ɐʃ]

traia

[tɾˈaj ɐ]

traiamos

[tɾɐi ˈɐmuʃ]

traiais

[tɾɐi ˈajʃ]

traiam

[tɾˈaj ɐ ]

pic traisse

[tɾɐ ˈisə]

traisses

[tɾɐ ˈisəʃ]

traisse

[tɾɐ ˈisə]

traíssemos

[tɾɐ ˈisəmuʃ]

traísseis

[tɾɐ ˈisɐjʃ]

traissem

[tɾɐ ˈisɐ ]

futc trair

[tɾɐ ˈiɾ]

traires

[tɾɐ ˈiɾəʃ]

trair

[tɾɐ ˈiɾ]

trairmos

[tɾɐ ˈiɾmuʃ]

trairdes

[tɾɐ ˈiɾdəʃ]

trairem

[tɾɐ ˈiɾɐ ]

imp traia

[tɾˈaj ɐ]

trai

[tɾˈaj -]

traia

[tɾˈaj ɐ]

traiamos

[tɾɐi ˈɐmuʃ]

traí

[tɾɐ ˈi]

traiam

[tɾˈaj ɐ ]

infp trair

[tɾɐ ˈiɾ]

traires

[tɾɐ ˈiɾəʃ]

trair

[tɾɐ ˈiɾ]

trairmos

[tɾɐ ˈiɾmuʃ]

trairdes

[tɾɐ ˈiɾdəʃ]

trairem

[tɾɐ ˈiɾɐ ]

Formas nominais

inf trair

[tɾɐ ˈiɾ] ger

traindo

[tɾɐ ˈ du] pcp

traído

[tɾɐ ˈidu]

Para testar o algoritmo, as flexões em forma ortográfica foram convertidas em

fonemas com o sistema ɡɾɐfɔnə [grafone 2011] e comparadas com as formas derivadas

do algoritmo de pronunciação verbal. As discrepâncias encontradas serviram para

refinar os algoritmos. Os verbos usados neste teste derivaram de uma pesquisa no

CETEMPúblico, [Santos e Rocha 2001], onde se tomaram as frases anotadas. Foram

contados os lemas verbais e respetivos tempos/modos, excluindo o particípio passado,

devido ao seu possível valor como adjetivo.

Page 8: Sistema Automático de Pronunciação de Verbos

35

4. Conclusões e trabalho futuro

Neste trabalho são apresentados, de forma sistemática, os paradigmas de pronunciação

de verbos em português europeu. A metodologia aplicada partiu da consideração de que

a vogal temática, “ponto nevrálgico da estrutura interna das formas verbais” [Mateus

2003], é parte integrante dos sufixos, evitando-se assim a abordagem do conceito de

supressão vocálica ao eliminar a necessidade da “supressão da vogal temática” quando

esta não está presente nas flexões ou apresenta variações no seu timbre. A acompanhar a

descrição deste sistema de pronunciação de verbos, apresentamos tabelas das tipologias

de regularidade da pronunciação dos verbos, bem como da ambiguidade entre a forma

pronunciada e os valores de tempo modo pessoa e número que a determinam. Nos

verbos abundantes apenas foram consideradas as pronunciações regulares, não tendo

sido matéria de análise os particípios passados alternativos e irregulares. Pretende-se

estender este trabalho às conjugações pronominais, reflexas e recíprocas, bem como à

pronunciação do português brasileiro.

7. Referências

[Pessoa 1990] Pessoa, F. (1990) Livro do Desassossego. Organização e fixação de

inéditos de Teresa Sobral Cunha, vol. I: 191. Coimbra: Presença.

[Mateus 2003] Mateus, M.H.M. (2003) “Fonologia”, in Gramática da Língua

Portuguesa. Edited by Mateus, M.H.M. et al., Editorial Caminho.

[Mateus e Andrade 2000] Mateus, M.H.M. and d’Andrade, E. (2000) The phonology of

portuguese. Oxford University Press.

[Andrade 1980/81] Andrade, E. d’ (1980/81) “Sobre a alternância vocálica em

português”, in Boletim de Filologia, XXVI: 69-81.

[Villalva 2003] Villalva, A. (2003) “Estrutura morfológica básica”, in Gramática da

Língua Portuguesa. Edited by Mateus, M.H.M. et al., Editorial Caminho.

[Santos e Rocha 2001] Santos, D. and Rocha, P. (2001) “Evaluating CETEMPúblico, a

free resource for Portuguese”, In Proceedings of the 39th

Annual Meeting of the

Association for Computational Linguistics: 442-449.

[Bonami e Luís 2013] Bonami, O. and Luís, A. (2013) “Sur la morphologie implicative

dans la conjugaison du portugais: une etude quantitative”. (acedido em 30 de abril de

2013)

[Cunha e Cintra 2002] Cunha, Celso, Cintra, Lindley (2002) Nova Gramática do

Português Contemporâneo. Edições João Sá da Costa.

[Barbosa 1994] Barbosa, J. M. (1994) Fonologia e Morfologia do Português, Livraria

Almedina.

[grafone 2011] http://www.co.it.pt/~labfala/g2p/index.html