Pontifícia Universidade Católica de São Paulo PUC-SP Cristina … · 2017-02-22 · Amo muito!...

166
Pontifícia Universidade Católica de São Paulo PUC-SP Cristina Canhetti Alves Efeitos das metáforas no ensino do canto: dados acústicos e de imagem do trato vocal Mestrado em Linguística Aplicada e Estudos da Linguagem São Paulo 2013

Transcript of Pontifícia Universidade Católica de São Paulo PUC-SP Cristina … · 2017-02-22 · Amo muito!...

Pontifícia Universidade Católica de São Paulo PUC-SP

Cristina Canhetti Alves

Efeitos das metáforas no ensino do canto: dados acústicos e de imagem do trato vocal

Mestrado em Linguística Aplicada e Estudos da Linguagem

São Paulo 2013

Cristina Canhetti Alves

Efeitos das metáforas no ensino do canto: dados acústicos e de imagem do trato vocal

MESTRADO EM LINGUÍSTICA APLICADA E ESTUDOS DA LINGUAGEM

Dissertação apresentada à Banca Examinadora da Pontifícia Universidade Católica de São Paulo, como exigência parcial para obtenção do título de MESTRE em Linguística Aplicada e Estudos da Linguagem sob a orientação da Profa. Doutora Zuleica Camargo.

São Paulo 2013

ii

Alves Cristina Canhetti Efeitos das metáforas no ensino do canto: dados acústicos e de imagem do trato vocal/ Alves, Cristina Canhetti - São Paulo, 2013, p.165. Dissertação (mestrado) Pontifícia Universidade Católica de São Paulo. Programa de Estudos Pós-Graduados em Lingüística Aplicada e Estudos da Linguagem. Título em inglês: Effects of metaphors in the teaching of singing: acoustic and vocal tract image data 1. Acústica 2.Canto 3.Fisiologia 4.Metáfora 5.Fonética

iii

Banca Examinadora

------------------------------------------------- ------------------------------------------------- -------------------------------------------------

Data: _____/_____/_____

iv

AUTORIZAÇÃO

Autorizo, exclusivamente para fins acadêmicos e científicos, a reprodução total

ou parcial desta dissertação por processos de fotocopiadoras ou eletrônicos. Cristina Canhetti Alves _________________________________ São Paulo, de de 2013.

v

Dedico este trabalho Aos meus pais, Fátima e José Carlos e á minha avó materna Maria por sempre acreditarem em mim. Ao meu amor, Pedro Henrique, por todo o incentivo e por sonhar comigo que tudo isso seria possível.

vi

Agradecimentos

À minha orientadora Profa Dra Zuleica Camargo, que esteve sempre presente me

incentivando em todas as etapas, que me inspira pela sua dedicação e pela

profissional competente em nossa profissão.

À Profa Dra Sandra Madureira, por todos os ensinamentos, pela paciência, pela

serenidade e que agregou muito durante toda essa jornada.

À minha mãe, Fátima por me incentivar, acreditar tanto em mim e mesmo diante de

todas as dificuldades tornar possível o impossível. Ao meu pai, José Carlos, por

depositar confiança em minhas escolhas. Amo muito!

Ao meu amor, Pedro Henrique, pela paciência por minhas ausências, pelo carinho,

companheirismo, pela ajuda e por se orgulhar tanto de quem eu sou. Amo-te!

A minha vózinha materna, Maria, que com seus 88 anos se interessa pela

fonoaudiologia e está sempre presente e rezando para que tudo corra bem.

À minha família, por estarem ao meu lado em todos os momentos.

Às amigas Andrea e Maria Augusta, duas pessoas mais que queridas, companheiras

e que fizeram meus dias mais divertidos.

À Aline Pessoa, por todas as ajudas, em qualquer hora e por qualquer motivo. Você

é uma pessoa fantástica e teve papel fundamental em todo meu percurso.

À Luciana Oliveira, pela disponibilidade, pelos ensinamentos e por ser essa pessoa

tão serena que em momentos turbulentos consegue ver a luz no fim do túnel.

vii

À Fabiana Gregio, por estar presente e me auxiliando desde minha iniciação

científica. Agradeço muito.

À Roberta Isolan Cury pela ajuda, parceria e por me incentivar a não desistir de

nenhum desafio.

Ao Marcelo Barbosa pelas revisões do inglês e por ser tão divertido e autêntico.

À Mária de Fátima Albuquerque do LIAAC e á Maria Lucia do LAEL, pela simpatia e

pela colaboração em todas as etapas.

Ao Prof Luiz Carlos Rusilo, pelas análises estatísticas. Ao Ronaldo Barbosa e à Janaina Paiva pelos importantes momentos no Laboratório

de Rádio. Obrigada pela ajuda e acima de tudo pelas risadas.

Aos meus colegas do grupo do LIAAC, agradeço o apoio e incentivo.

Ao Prof. Dr. Johan Sundberg e à Dra. Glaucia Salomão por permitirem minha visita à

KTH, pela brilhante discussão dos dados de minha pesquisa e pela experiência

valiosa.

Ao grupo de estudo que tive o prazer em conhecer em Budapeste, agradeço por

todas as descobertas. Especialmente, Lila Pintér, Maria Patona e Diána Varga pelo

carinho e auxílio constante.

Ao técnico da radiologia Vitor pela disponibilidade, auxílio e simpatia.

À Deborah Manguino, pela valorização constante, por acreditar em minha

capacidade e se orgulhar dos resultados. Obrigada por todos os desafios!

viii

À minha querida, Deborah Donda e ao grupo Support, por compreenderem essa

etapa e torcerem tanto por mim. Obrigada pela paciência!

Aos Amigos, pela torcida, por compreender minhas ausências e rirem dos meus

momentos em stand by.

A todos os sujeitos que participaram da minha pesquisa.

À FAPESP, pelo apoio financeiro para execução dessa pesquisa.

ix

Lista de Quadros

Quadro 1. Descrição dos sujeitos participantes da pesquisa.............................. 30

x

Lista de Figuras

Figura 1. Medida de abertura de lábios absoluta (mm) gerada pelo software Osiris 25

Figura 2. Medida de abertura de mandíbula (mm) gerada pelo software Osiris...... 26

Figura 3. Medida de abertura de lábios normalizada (mm) gerada pelo software

Osiris........................................................................................................................

26

Figura 4. Medida da distância de língua-faringe (mm) gerada pelo software Osiris 27

Figura 5. Medida da distância de língua-palato de uma vogal anterior [Ɛ] (mm)

gerada pelo software Osiris....................................................................................

27

Figura 6. Medida da distância de língua-palato de uma vogal [a] posterior (mm)

gerada pelo software Osiris....................................................................................

27

Figura 7. Gráfico boxplot da distribuição das medidas de frequências formânticas

(F3) para três emissões da vogal [a] – a1, a2 e a3.................................................

38

Figura 8. Gráfico boxplot da distribuição das medidas de frequências formânticas(

F1) para três emissões da vogal [a] –a1, a2 e a3..................................................

38

Figura 9. Gráfico boxplot da distribuição das medidas de frequências formânticas

(F2) para três emissões da vogal [a] –a1, a2 e a3..................................................

38

Figura 10. Dados de imagem de trato vocal ilustrativo das medidas (em mm)

extraídas na situação de repouso.............................................................................

40

Figura 11. Dados de imagens de trato vocal ilustrativos das medidas (em mm)

extraídas das emissões em voz cantada produzidas sem intruções baseadas em

metáforas................................................................................................................

41

Figura 12. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de

imagens extraídas das emissões em voz cantada produzidas por meio de

instruções baseadas na metáfora prisma...............................................................

42

Figura 13. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de

imagens extraídas das emissões em voz cantada produzidas por meio de

instruções baseadas na metáfora catedral.............................................................

43

Figura 14. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de

imagens extraídas das emissões em voz cantada produzidas por meio de

instruções baseadas na metáfora disco voador......................................................

45

xi

Figura 15. Gráficos da análise de correlações para medidas de frequências

formânticas e medidas de imagem do trato vocal...................................................

50

Figura 16. Diagrama da análise fatorial de medidas de imagens do trato vocal e

de medidas acústicas de frequências formânticas (F1, F2 e F3)............................

51

Figura 17. Gráficos de análise de regressão linear de medidas de imagens do

trato vocal e de medidas acústicas de frequências formânticas (F1, F2 e F3).......

52

Figura 18. Gráficos de análise Ancova para relação de medidas acústicas das

frequências formânticas (F1, F2 e F3) em relação às metaforas (coluna à

esquerda) e às vogais analisadas (coluna à direita)...............................................

54

Figura 19. Gráfico de centróides da análise discriminante para estimação das

vogais a partir das medidas de frequências formânticas (F1, F2 e F3)...................

56

Figura 20. Gráfico de centróides da análise discriminante para estimação das

metáforas a partir das medidas de imagem do trato vocal......................................

57

Figura 21. Gráfico de centróides da análise discriminante para estimação das

vogais a partir das medidas de imagem do trato vocal............................................

58

Figura 22. Gráfico de centróides da análise discriminante para estimação das

metáforas a partir das medidas de frequências formânticas e de medidas de

imagem do trato vocal.............................................................................................

59

Figura 23. Gráfico radar da distribuição das frequências formânticas nas diversas

emissões estudadas................................................................................................

60

Figura 24. Gráfico radar da distribuição das medidas de imagens do trato vocal

nas diversas emissões estudadas...........................................................................

60

Figura 25. Gráfico de centróides da análise discriminante para estimação das

metáforas a partir das medidas acústicas (script Expression Evaluator e

frequências formânticas) .........................................................................................

66

Figura 26. Gráfico de centróides da análise discriminante para estimação das

metáforas a partir das medidas acústicas (script Expression Evaluator).................

67

xii

Figura 27. Gráfico de centróides da análise discriminante para estimação das

metáforas a partir das medidas (frequências formânticas)......................................

68

Figura 28. Gráfico de centróides da análise discriminante para estimação dos

grupos de cantoras e de não cantoras a partir das medidas acústicas (script

ExpressionEvaluator) .............................................................................................

71

Figura 29. Gráfico de centróides da análise discriminante para estimação dos

grupos de cantoras e de não cantoras a partir das medidas acústicas (frequências

formânticas-F1, F2 e F3) .......................................................................................

72

Figura 30. Gráfico de análise de regressão linear de medidas acústicas do script

ExpressionEvaluator e prontidão.............................................................................

73

Figura 31. Gráfico de análise de regressão linear de medidas acústicas de

frequências formânticas-F1, F2 e F3 para as várias emissões da vogal [a] (a1, a2,

a3) e prontidão.........................................................................................................

74

Figura 32. Gráfico de análise de regressão linear de medidas acústicas do script

ExpressionEvaluator conjugadas às de frequências formânticas (para as várias

emissões da vogal [a] -a1, a2, a3) e prontidão.......................................................

74

Figura 33. Gráfico de análise ANOVA de variáveis qualitativas: grupo (cantoras e

não cantoras), sujeitos, tipo de (emissão-metáforas) em relação à prontidão........

75

Figura 34. Gráfico de análise ANOVA de variáveis qualitativas (sujeitos) e

prontidão.................................................................................................................

76

Figura 35. Localização visual dos itens Meu Computador, Organizar e Opções de

pastas como procedimento para mudança de extensão de arquivo.......................

106

Figura 36. Localização visual dos itens Opções de Pasta, Modo de Exibição e

item que não deve ser selecionado como procedimento para mudança de

extensão de arquivo................................................................................................

106

Figura 37. Mensagem de confirmação para modificação da extensão do arquivo

selecionado.............................................................................................................

107

xiii

Figura 38. Arquivo cópia renomeado com a extensão pap..................................... 107

Figura 39. Localização do arquivo no software Osiris............................................. 108

Figura 40. Instrução de como salvar o arquivo em papyrus................................... 108

Figura 41. Renomear o arquivo que será salvo como papyrus............................... 108

Figura 42. Gerar o arquivo papyrus e iniciar a análise dos dados pelo software

Osiris.......................................................................................................................

108

Figura 43: Medida da distância entre o dente segundo pré-molar superior e o

mento (queixo) na situação de repouso..................................................................

131

Figura 44. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da

distância entre o dente segundo pré-molar superior e o mento extraídas das

emissões em voz cantada produzidas sem intruções baseadas em metáforas.....

131

Figura 45. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da

distância entre o dente segundo pré-molar superior e o mento extraídas das

emissões em voz cantada produzidas por meio de instruções baseadas na

metáfora prisma. ......................................................................................................

132

Figura 46. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da

distância entre o dente segundo pré-molar superior e o mento extraídas das

emissões em voz cantada produzidas por meio de instruções baseadas na

metáfora catedral. .................................................................................................

134

Figura 47. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da

distância entre o dente segundo pré-molar superior e o mento extraídas das

emissões em voz cantada produzidas por meio de instruções baseadas na

metáfora disco voador. ...........................................................................................

135

xiv

Lista de Tabelas

Tabela 1. Medidas de frequências formânticas (Hz) para as emissões em voz

cantada produzidas por meio de instruções baseadas em metáforas e sem

instruções baseadas em metáforas para as emissões de [a] sapo, [Ɛ] é que, [i] rio

e frio e [u] jururu......................................................................................................

46

Tabela 2. Medidas de imagem do trato vocal (mm) para as emissões em voz

cantada produzidas por meio de instruções baseadas em metáforas e sem

instruções baseadas em metáforas para as emissões [a] sapo, [Ɛ] é que, [i] rio e

frio e [u] jururu. ......................................................................................................

47

Tabela 3. Resultados de teste de correlação para medidas de frequências

formânticas e medidas de imagem do trato vocal (p<0,01)...................................

49

Tabela 4. Matriz de confusão para resultados de validação cruzada da análise

discriminante para vogais a partir das medidas acústicas de frequências

formânticas- F1, F2 e F3........................................................................................

55

Tabela 5. Matriz de confusão para resultados de validação cruzada da análise

discriminante para metáforas a partir das medidas de imagem do trato vocal......

56

Tabela 6. Matriz de confusão para resultados de validação cruzada da análise

discriminante para vogais a partir das medidas de imagem do trato vocal...........

58

Tabela 7. Matriz de confusão para resultados de validação cruzada da análise

discriminante para metáforas a partir das medidas acústicas de frequências

formânticas e de imagem do trato vocal................................................................

59

Tabela 8. Valores de médias e desvio padrão de medidas acústicas do script

ExpressonEvaluator para as emissões em voz cantada produzidas por meio de

instruções baseadas em metáforas (catedral, prisma e disco voador) e sem

instruções baseadas em metáforas.......................................................................

62

Tabela 9. Resultados do teste de distâncias de Fisher (p-valores) para as médias

de medidas acústicas do script ExpressionEvaluator para as emissões em voz

cantada produzidas por meio de instruções baseadas em metáforas (catedral,

prisma e disco voador) e sem instruções baseadas em metáforas......................

63

xv

Tabela 10. Valores de média e desvio padrão de medidas acústicas –

frequências formânticas- para as emissões produzidas por meio de instruções

baseadas em metáforas (catedral, prisma e disco voador) e sem instruções

baseadas em metáforas. .......................................................................................

64

Tabela 11. Resultados do teste de distâncias de Fisher (p-valores) para as

médias de medidas acústicas – frequências formânticas- para as emissões em

voz cantada produzidas por meio de instruções baseadas em metáforas

(catedral, prisma e disco voador) e sem instruções baseadas em metáforas........

65

Tabela 12. Matriz de confusão para resultados de validação cruzada da análise

discriminante para metáforas a partir das medidas acústicas (script Expression

Evaluator e frequências formânticas)......................................................................

66

Tabela 13. Matriz de confusão para resultados de validação cruzada da análise

discriminante para metáforas a partir das medidas acústicas (script

ExpressionEvaluator) ..............................................................................................

67

Tabela 14. Matriz de confusão para resultados de validação cruzada da análise

discriminante para metáforas a partir das medidas acústicas (frequências

formânticas) ..........................................................................................................

68

Tabela 15. Valores de médias e desvio padrão de medidas acústicas do script

ExpressionEvaluator para as emissões de cantoras e não cantoras....................

69

Tabela 16. Resultados do teste de distâncias de Fisher (p-valores) para as

médias de medidas acústicas do script ExpressionEvaluator para as emissões de

cantoras e não cantoras..........................................................................................

70

Tabela 17. Valores de média e desvio padrão de frequências formânticas para as

emissões 1, 2 e 3 da vogal [a] em “sapo” para as emissões de cantoras e não

cantoras.................................................................................................................

70

Tabela 18. Resultados do teste de distâncias de Fisher (p-valores) para as

médias de medidas acústicas – frequências formânticas (F1, F2 e F3)- para as

emissões 1, 2 e 3 da vogal [a] em “sapo” para as emissões de cantoras e não

cantoras.................................................................................................................

70

xvi

Tabela 19. Matriz de confusão para resultados de validação cruzada da análise

discriminante para grupo de cantoras e não cantoras a partir das medidas

acústicas (script ExpressionEvaluator)..................................................................

71

Tabela 20. Matriz de confusão para resultados de validação cruzada da análise

discriminante para grupo de cantoras e não cantoras a partir das medidas

acústicas (frequências formânticas-F, F2 e F3).....................................................

72

xvii

RESUMO

Com o objetivo de investigar, em amostras de voz cantada, os efeitos do uso das metáforas, a partir de descrições acústicas e articulatórias (imagens do trato vocal) de ajustes de qualidade vocal em mulheres cantoras e não cantoras, esta pesquisa foi desenvolvida com base em dois experimentos. Experimento 1 referiu-se a estudo de caso (mulher, não cantora, sem alterações vocais), pautado nas análises acústica e de imagem (videofluoroscopia) do trato vocal. Experimento 2 pautou-se em análise acústica das emissões de 10 sujeitos (5 cantoras e 5 não cantoras). Para ambos os experimentos, foram analisadas as gravações da canção infantil “Sapo Jururu” em quatro tarefas: sem instrução e com instruções baseadas nas metáforas prisma, catedral, disco voador. Para a análise das imagens do trato vocal, foram extraídas medidas de abertura de lábios (absoluta e normalizada), abertura de mandíbula, distância dorso de língua-faringe e dorso de língua-palato por meio do software Osiris. Para a análise acústica dos dados, foram extraídas as medidas de frequências formânticas (F1, F2, F3) das vogais ([a], [i], [Ɛ] e [u]) - software Praat no experimento 1. O experimento 2 constou da extração das medidas de F1, F2, F3 da vogal [a] (nas várias repetições de “sapo”) e da análise das três repetições da canção por meio da aplicação do script ExpressionEvaluator ao software Praat para extração de medidas de prontidão, f0 (mediana, semiamplitude entre quartis, quantil 99,5% e assimetria), primeira derivada de f0 (média, desvio padrão e assimetria), intensidade (assimetria), declínio espectral (média, desvio padrão e assimetria) e LTAS (desvio padrão). Os achados dos dois experimentos foram submetidos a tratamento estatístico de natureza multivariada (análises fatorial, aglomerativa hierárquica de cluster, de correlação canônica, discriminante e regressão linear). Em termos de análise de imagens, foi possível observar na metáfora catedral maior abertura de lábios e mandíbula, língua centralizada e expansão faríngea. Para a metáfora prisma maior abertura de lábios e constrição faríngea. Para o disco voador, encontrou-se menor abertura de lábios e mandíbula, língua elevada e expansão faríngea. A análise acústica revelou diferenciações do padrão formântico especialmente para as metáforas catedral e disco voador, complementadas por achados do experimento 2. A análise estatística revelou que mobilizações promovidas pelas metáforas foram melhor definidas pela análise de imagens no experimento 1 e pelas medidas geradas pelo script ExpressionEvaluator no experimento 2, com destaque para f0 (mediana e quantil 99,5%), intensidade (assimetria) e declínio espectral (média e desvio padrão). As diferenciações por grupos no experimento 2 foram reforçadas por medidas do script ExpressionEvaluator e F1, F2 e F3. A prontidão foi índice que revelou diferenças das produções inter-sujeitos. A análise fonética dos dados revelou que as metáforas geraram mobilizações diferenciadas no trato vocal, especialmente para catedral e disco voador, reveladas por descrições articulatórios (medidas de imagens videofluoroscópicas) e acústicas (f0, intensidade e declínio espectral). Tais mobilizações apresentaram diferenças quando comparados aos grupos estudados. As correspondências entre achados acústicos e de imagem do trato vocal foram relevantes ao enfoque da voz cantada e reforçaram as relações entre som e sentido. Descritores: Acústica; Canto; Fisiologia; Metáfora; Fonética

xviii

ABSTRACT

Aiming at investigating the effects of the usage of metaphors in singing voice production from acoustic and articulatory (vocal tract imaging) descriptions among women, singers and non-singers, this research was developed based on two experiments. Experiment 1 referred to a case study (woman, non-singer, without voice disorder) based on acoustic and vocal tract image analysis (videofluoroscopy). Experiment 2 was based on acoustic analysis of utterances from 10 subjects (5 singers and 5 non-singers). For both experiments, the recordings of the folklore song Sapo Jururu in four different tasks: without and with instructions, the latter based on metaphors (prism, cathedral and flying saucer) were analyzed. For vocal tract image data analysis, measures of labial opening (absolute and normalized), jaw opening, distance from the back of tongue-pharynx and back of tongue-palate were extracted by means of Osiris software. For the acoustic analysis of the data, measures of the formant frequencies (F1, F2, F3) of the vowels ([a], [i], [Ɛ] e [u]) were extracted by means of Praat software in experiment 1. Experiment 2 consisted on the extraction of F1, F2, F3 measures of the vowel [a] (in the repetitions of “sapo”) and on the analysis of the three repetitions of the folklore song by ExpressionEvaluator script running into Praat software to extract arousal, f0 (median, interquartile semi-amplitude, quantile 99.5% and skewness), first f0 derivate (mean, standard deviation and skewness), intensity (skewness), spectral slope (mean, standard deviation and skewness) and LTAS (standard deviation) measures. The findings of both experiments were submitted to multivariate statistical treatment (factorial analysis, agglomerative hierarchical clustering, canonical correlation, discriminant analysis and linear regression). The vocal tract image data revealed increased labial and jaw opening, centralized tongue body and pharyngeal expansion in the cathedral metaphor. For the prism metaphor, increased labial opening and pharyngeal constriction were found. For the flying saucer metaphor, decreased labial and jaw opening, raised tongue body, and pharyngeal expansion were found. The acoustic analysis showed differences in the formant pattern, mainly to the cathedral and flying saucer ones, supported by findings of experiment 2. The statistical analysis showed that mobilizations elicited by metaphors were better defined through image analysis in experiment 1 and by the acoustic measures generated by ExpressionEvaluator script in experiment 2, especially for f0 (median and quantile 99.5%), intensity (skewness) and spectral slope (mean and standard deviation). The differentiations among groups in experiment 2 were reinforced by ExpressionEvaluator and F1, F2, and F3 acoustic measures. The arousal was the factor which showed inter-subject differences. The phonetic approach of the data showed that metaphors lead to differentiated vocal tract adjustments, mainly for cathedral and flying saucer methaphors, revealed by articulatory (measures of videofluoroscopic images) and acoustic descriptions (f0, intensity and spectral slope measures). Those adjustments differed when singer and non-singer samples were compared. The acoustic and vocal tract images correspondences were relevant to the study of the singing voice, and reinforced the relation between sound and meaning. Keywords: Acoustics; Singing; Physiology; Metaphor; Phonetics

xix

Sumário

1. INTRODUÇÃO.................................................................................................. 01

2. OBJETIVO.......................................................................................................... 08

3. REVISÃO DE LITERATURA............................................................................ 09

3.1. A voz cantada e as instruções no canto baseadas em metáforas............ 09

3.2. Análise acústica e articulatória da voz cantada........................................ 14

3.3. Análise de imagens do trato vocal............................................................ 16

4. METODOLOGIA............................................................................................... 21

4.1. Experimento 1- Análise integrada de dados acústicos e de imagem do

trato vocal: um estudo de caso.......................................................................

21

4.1.1. Procedimentos de coleta de amostras de imagem do trato vocal e de

áudio durante a emissão em voz cantada produzida por meio de instruções

baseadas em metáforas.................................................................................

22

4.1.2. Procedimentos de edição e análise dos dados de imagem do trato

vocal................................................................................................................

24

4.1.2.1. Medidas de imagens de trato vocal (mm)........................................... 25

4.1.3. Procedimentos de edição e análise dos dados acústicos..................... 28

4.1.4. Análise estatística (software XLStat- Addinsoft)................................... 28

4.2. Experimento 2- Análise acústica de emissões em voz cantada

(produzidas por meio de instruções baseadas em metáforas) por cantoras e

não cantoras....................................................................................................

30

4.2.1. Procedimentos de coleta de amostras de áudio durante a emissão de

voz cantada produzida por meio de instruções baseadas em metáforas por

cantoras e não cantoras...................................................................................

31

4.2.2. Procedimentos de edição e análise dos dados acústicos..................... 34

4.2.3. Análise estatística.................................................................................. 35

5. RESULTADOS................................................................................................... 40

5.1. Experimento 1- Análise integrada de dados acústicos e de imagem do

trato vocal: um estudo de caso........................................................................

40

xx

5.2. Experimento 2- Análise acústica de emissões em voz cantada

(produzidas por meio de instruções baseadas em metáforas) por cantoras e

não cantoras....................................................................................................

61

5.2.1. Medidas acústicas extraídas pelo script ExpressionEvaluator e de

frequências formânticas (F1, F2 e F3)............................................................

61

5.2.2. Dados de prontidão extraídos pelo script ExpressionEvaluator............ 73

6. DISCUSSÃO...................................................................................................... 77

6.1. Experimento 1- Análise integrada de dados acústicos e de imagem do

trato vocal: um estudo de caso ......................................................................

77

6.2. Experimento 2- Análise acústica de emissões em voz cantada

(produzidas por meio de instruções baseadas em metáforas) por cantoras e

não cantoras ..................................................................................................

88

6.3. Abordagem integrada- experimentos 1 e 2.............................................. 95

7. CONCLUSÃO...................................................................................................... 101

8. Anexos............................................................................................................... 102

9. Referências Bibliográficas.................................................................................. 137

1

1. INTRODUÇÃO

Os aspectos da voz cantada fascinam os mais diversos grupos de

pesquisadores, justamente pelo uso altamente diferenciado e refinado de estruturas

dos aparelhos respiratório e digestivo que no dia-a-dia também desempenham as

funções de fala.

Diante deste fascínio, o projeto complementa-se a atividades desenvolvidas

anteriormente em plano de pesquisa de iniciação cientifica, em que abordou questões

da correspondência entre os planos da percepção e da acústica da voz falada (ALVES,

CAMARGO, 2006).

Neste contexto da voz cantada, a qualidade vocal ganha destaque, no momento

em que o cantor ajusta seu aparelho fonador na busca por atingir diferentes qualidades

sonoras. As variadas escolas de canto trabalham com técnicas igualmente distintas, a

fim de propiciar ao cantor a vivência do controle do aparelho fonador em seus níveis

respiratório, fonatório, articulatório e ressonantal. Tal nível de controle permite ao

cantor, inclusive àqueles que iniciam as aulas de canto, alcançar e experienciar as

qualidades sonoras compatíveis com o repertório desejado.

Da mesma forma que se admite que toda manifestação de fala é expressiva

(MADUREIRA, 2005), o mesmo valeria para as manifestações da voz cantada. A

construção da expressividade pauta-se na combinação de elementos prosódicos (ritmo,

entoação, qualidade vocal, entre outros) a elementos segmentais (vogais e

consoantes), mediadas pelas relações entre o som e o sentido (MADUREIRA, 2005).

No que se refere ao enfoque das relações entre som e sentido, podemos

apontar as metáforas como representações simbólicas (HINTON et al, 1994), dotadas

de sensações proprioceptivas, motoras e táteis (FONAGY, 2000). Tais estudos são

2

baseados em modelos de descrição fonética, com base em descrições perceptivas,

acústicas e fisiológicas, no campo das Ciências Fonéticas.

Os estudos de voz cantada apontam que as metáforas, incorporadas

inicialmente pelos professores de canto com sua base na prática de ensino, revelaram-

se, gradativamente, como recursos tanto para facilitar a memorização de sensações

físicas (ROSSBACH, 2011), quanto para auxiliar a criação de correlações entre o

simbólico e o fisiológico (SOUSA et al, 2010).

Dessa forma, no universo do ensino do canto, as metáforas foram incorporadas

enquanto estratégia para levar o aluno/cantor a vivenciar ajustes no trato vocal e

sensações promovidas, uma vez que, para vários destes alunos/cantores as instruções

baseadas somente na ação de grupos musculares, portanto na fisiologia da voz

cantada, seriam de difícil compreensão, bem como de execução (SOUSA et al, 2010).

No caso do canto lírico, cantores experientes e reconhecidos produzem

qualidades sonoras de forma a que possam ser ouvidos em salas de concerto de

dimensões consideráveis, simultaneamente ao som da orquestra, sem o uso de

qualquer sistema de amplificação (SUNDBERG, 1997). Diante desta situação, a

indagação frequente dos pesquisadores reside na origem de tal habilidade: seria

apenas questão de prática da técnica de canto? Ou existiria algo de especial no “órgão

voca1 de tais cantores?

O professor de canto, por sua vez, busca por estratégias que possam

desencadear os ajustes de trato vocal (entendidos do ponto de vista fonético como

tendências musculares recorrentes na produção vocal), os quais envolvem ações da

musculatura respiratória, daquela da região laríngea (ajustes fonatórios) e da região

1 A partir deste ponto do texto, o termo “órgão vocal” referido em textos da voz cantada será referido

como trato vocal. Nas descrições acústicas, o trato vocal engloba a região compreendida no circuito acústico desde pregas vocais até lábios (FANT, 1960), destacando o segmento do “órgão vocal” em que ocorre o processo de produção e modificação/modelagem do som vocal.

3

supraglótica (ajustes articulatórios), além dos níveis gerais de tensão muscular (ajustes

de tensão muscular) na concepção do modelo fonético de descrição da qualidade vocal

(LAVER, 1980).

No que se refere à abordagem do plano dos ajustes articulatórios, é comum a

prática de instrução vocal por meio de metáforas, as quais buscam estimular o aluno a

vivenciar diferenciados mecanismos que resultem em qualidades vocais específicas

(CLEMENTS, 2008; SOUSA et al, 2010).

As Ciências Fonéticas e, particularmente, a Fonética Acústica, têm se dedicado

ao estudo dos variados efeitos sonoros que o aparelho fonador humano pode produzir

ao modular a corrente de ar expiratória, tanto para finalidades de produção da emissão

da voz falada, quanto cantada (KENT, 1993; SUNDBERG, 1997).

Os estudos no campo da voz cantada, de modo geral, descrevem os aspectos

de dinâmicas da voz, todavia, de acordo com a literatura das ciências vocais, a

investigação pormenorizada de correlatos acústicos e fisiológicos da qualidade vocal

no canto é ainda escassa. A produção científica concentra-se em detalhamento de

correspondências entre as esferas perceptiva e acústica (FUKS, 1999; MEDEIROS,

2002; VIEIRA, 2004; BEZERRA et al, 2008; PEREIRA, 2008; REHDER, BEHLAU,

2008; ULLOA, 2009; MOTA et al, 2010), perceptiva e fisiológica (DUPRAT et al 2000)

e finalmente, perceptiva, acústica e fisiológica (MILLER, SCHUTTE, 1990; ZAMPIERI

et al, 2002; HANAYAMA, 2003; SALOMÃO, 2008; HANAYAMA et al, 2009; GUSMÃO

et al, 2010).

Outro aspecto importante neste campo de pesquisas pode ser registrado por

descrições de eventos mais frequentes para a voz feminina: sintonia F1-F0 e

masculina: formante do cantor (SUNDBERG, 1974; SUNDBERG, 1979; VIEIRA, 2004;

GUSMÃO et al, 2010).

4

O presente estudo apresenta como enfoque a técnica das metáforas utilizadas

como instruções para o canto, a fim de se investigar de que forma as instruções

direcionadas pelo professor de canto, enquanto metáforas para se ajustar o ”órgão

vocal” podem influenciar a qualidade sonora final produzida. Para tanto, o estudo

apresenta a proposta de investigação da atividade do trato vocal por meios acústico e

articulatório (imagem do trato vocal, mais especificamente de imagens

videofluoroscópicas), os quais permitem especialmente detalhar os ajustes de

qualidade vocal, bem como alguns elementos de dinâmica vocal.

Segundo Medeiros (2002), existem diferenças entre a fala e o canto,

principalmente no que diz respeito à inteligibilidade durante a produção do texto

cantado e às modificações formânticas. Tais achados reforçam a demanda por enfoque

de estratégias que visem estimular ao aluno/cantor a implementar tais diferenciações

em suas produções de voz cantada.

Do ponto de vista de estudos com imagem do trato vocal, registraram-se,

inicialmente, técnicas aplicadas à produção de fala, como as técnicas radiográficas

(LINDBLOM, SUNDBERG, 1971; MACHADO, 1993), xerorradiografia (PINHO et al,

1988; MASTER et al 1991), tomografia computadorizada (SUNDBERG et al, 1987;

THOMÉ, 1999; PASSEROTTI et al, 2008), ressonância magnética (GREGIO, 2006;

VENTURA et al, 2010), ultrassonagrafia (SVICERO, 2012) e videofluoroscopia

(MANGILLI et al, 2008). Tais técnicas foram gradativamente incorporadas ao estudo do

canto, como radiografia (ROERS et al, 2009), ressonância magnética (ECHTERNACH

et al, 2008; SUNDBERG, 2008) e videofluoroscopia (SOUZA, 2008; TAVANO, 2011;

DRAHAN et al, 2012).

A abordagem da qualidade vocal a partir da motivação fonética (LAVER, 1980)

inspirou a concepção de roteiro para avaliação da qualidade vocal falada- roteiro Vocal

5

Profile Analysis Scheme - VPAS (LAVER et al, 1981; LAVER, 1982; LAVER, 2000;

MACKENZIE-BECK, 2005), entretanto os conceitos de mecanismos intrínsecos e

extrínsecos de qualidade vocal são válidos para as situações de fala e canto, no

sentido de que os efeitos sonoros podem emergir de condições anátomo-fisiológicas do

aparelho vocal (intrínsecas) ou por demandas por variações de seu funcionamento em

termos do contexto e dos efeitos sonoros (extrínsecas ou fonéticas). No canto, a

interação entre tais aspectos não pode ser considerada menos importante e a busca

por entender as mobilizações de longo termo, que se refletem em qualidades sonoras

específicas, é ainda um tópico a ser cuidadosamente estudado.

Diante do exposto, este estudo enfoca a possibilidade de correlação da

caracterização fisiológica (articulatória), propiciada pela análise de imagens

videofluoroscópicas dos ajustes do trato vocal à esfera acústica em emissões de voz

cantada, em atividades que envolvam as instruções baseadas em metáforas fornecidas

com a finalidade de atingir qualidades sonoras decorrentes de mobilizações dos

articuladores nas mulheres de dois grupos: cantoras e não cantoras.

Essa pesquisa foi desenvolvida com base em dois experimentos. O primeiro

refere-se a um estudo de caso, pautado na análise vocal acústica e de imagem do trato

vocal por meio da videofluoroscopia e o segundo baseia-se em um estudo de análise

vocal acústica com base nas emissões de um grupo de cantoras e um grupo de não

cantoras.

A análise acústica foi incorporada como recurso instrumental, principalmente no

que diz respeito à possibilidade de maior detalhamento da relação entre percepção e

da produção dos sons pelo trato vocal (CAMARGO, MADUREIRA, 2004; ALVES,

CAMARGO, 2006; PESSOA et al 2011).

6

Para o canto, utilizam-se as mesmas estruturas do trato vocal durante a fala,

porém com diferentes mobilizações de acordo com as necessidades da produção da

voz cantada (PEDROSO, 1997). A emissão da voz cantada requer adaptações de

pressão subglótica, de ajustes laríngeos e do trato vocal, visando uma produção

estética, agradável e livre de mecanismos que possa gerar esforço vocal (SUNDBERG,

1990).

Os aspectos expressivos da voz cantada podem ser também detalhados por

meio da análise acústica e de parâmetros correlatos, tais como a prontidão (PEREIRA,

2000; BARBOSA, 2009). As diferentes emoções e atitudes expressas na emissão

vocal refletem-se em mudanças na qualidade vocal, bem como modificações nos

contornos de ênfases e entonações (SCHERER, BANZIGER, 2003). Dessa forma, a

inspeção acústica de elementos prosódicos viabiliza a identificação de atitudes e

emoções, tanto para a fala quanto para o canto (JOHNSTONE et al 1995; BARBOSA,

2009).

Neste contexto, os questionamentos que nortearam a proposição da presente

pesquisa referem-se a: o uso das metáforas para o ensino do canto propicia

mobilizações diferenciadas do trato vocal na produção vocal? Tais mobilizações são

detectáveis por meio de descrições fisiológicas e acústicas da qualidade vocal? Tais

mobilizações seriam detectadas em cantores e não cantores? A análise de imagem do

trato vocal permite a associação a medidas acústicas, tais como frequências

formânticas?

Este projeto focaliza a avaliação fisiológica (articulatória) e acústica no campo da

voz cantada, tendo como fundamentação a Fonética Acústica e Articulatória. Estudo

desta natureza permite o detalhamento do refinamento de ações sob as quais o trato

7

vocal é submetido nas situações de canto e pode colaborar para a compreensão de

particularidades do processo de ensino e prática do canto.

Dessa forma, tais achados tornam possível inferir sobre os níveis de mobilização

das estruturas do trato vocal diante do estímulo das metáforas, o que futuramente

poderia auxiliar outras categorias de profissionais da voz que também demandam um

uso altamente refinado do trato vocal, bem como auxiliar a discussão em torno das

relações entre som e sentido e, finalmente, do ensino de canto em nosso meio.

8

2. OBJETIVO

Este trabalho tem por objetivo investigar, em amostras de voz cantada, os

efeitos do uso das metáforas, a partir de descrições acústicas e articulatórias (imagens

do trato vocal) de qualidade vocal em mulheres cantoras e não cantoras.

9

3. REVISÃO DE LITERATURA

A revisão de literatura foi dividida nos seguintes tópicos: a voz cantada e as

instruções no canto baseadas em metáforas; análise acústica e articulatória da voz

cantada e análise de imagens do trato vocal.

3.1 . A voz cantada e as instruções no canto baseadas em metáforas

A origem do canto e da fala se confundem e ambas estão relacionadas à

necessidade de externalizar afeto e, portanto, carregam marcas fortes de emoção

(SALOMÃO, 2008). Durante o canto, quando há harmonia entre os aspectos

explorados, é possível gerar diferentes sensações positivas no ouvinte, bem como

inúmeras emoções durante sua interpretação (ANDRADA E SILVA, DUPRAT, 2004).

Segundo Aguiar (2007), a ópera surgiu no início do século XVI pela idéia de unir

poesia, drama e música, ou seja, os poetas e músicos italianos buscavam reviver a

tragédia grega.

Em seguida, surgiu a escola de canto italiana conhecida como Bel Canto que,

em seu início, era praticado somente por homens e era caracterizada pela “sustentação

e equalização do som na transição de uma frase musical para a frase musical seguinte,

sem qualquer interrupção perceptível”. Portanto, o “Bel Canto tornou-se uma aliança

entre a técnica vocal e a beleza da composição” (AGUIAR, 2007, p.13), todavia, sofreu

mudanças ao longo dos anos.

No canto lírico, existe uma ampla terminologia para a descrição da qualidade

vocal. Muitos dos termos técnicos são utilizados pelos especialistas em voz, enquanto

10

outros são considerados metafóricos ou estéticos (HENRICH et al, 2007). Entretanto, a

terminologia e a forma de cantar não são unânimes (TRAVASSOS, 2008).

Segundo Clements (2008), existem três tipos de métodos utilizados pelos

professores de canto. O primeiro é embasado exclusivamente na anatomia e nos

estudos científicos. O segundo utiliza-se de analogias e de imagens para realizar o

aprendizado, tendo sido bastante utilizado em Portugal em meados do século XX,

como ensino tradicional para o aprendizado (AGUIAR, 2007). Por fim, o método que

combina ambos os métodos supracitados, isto é, alia o ensino tradicional ao ensino

científico (AGUIAR, 2007).

Para Clements (2008), o terceiro método seria o que resultaria em melhores

resultados de aprendizado, enquanto para Aguiar (2007) permitiria utilizar o aparelho

fonador de maneira harmônica e estimularia um aprendizado global e estruturado.

As metáforas também conhecidas como “imagens” no meio musical são

utilizadas pelos professores de canto na abordagem de técnicas vocais (SOUSA et al,

2010). O uso da metáfora no ensino do canto é recomendado enquanto recurso para

memorização de sensações físicas, facilitador da compreensão do aluno em relação à

técnica empregada e aos conceitos tidos como abstratos (CLEMENTS, 2008;

ROSSBACH, 2011).

Pesquisa sobre o uso das metáforas como estratégia pedagógica no ensino do

canto revelou que grande parte dos professores de canto utilizam tais “imagens” com o

objetivo de estimular a propriocepção dos alunos, bem como de tornar palpável o

ensino das técnicas, por considerarem que estratégias fundamentados na fisiologia

seriam de difícil compreensão (SOUSA et al, 2010).

Na mesma pesquisa, algumas das metáforas utilizadas pelos professores de

canto entrevistados foram: “ressonância como uma lâmpada”, “cúpula de uma igreja

11

dentro da boca”, “ressonância como uma bolha de sabão”, “bocejo”, “sentir o perfume

de uma flor”, “ressonância como um capacete”, “cantar em uma caverna”, “voz como

gota de orvalho”, “voz como um sino”, “voz como uma equipe de corredores de

revezamento”, “extensão vocal como um armário com muitas gavetas”, “cantar como se

fala”, “cantar como se diz um texto”, “vogais mais claras ou mais escuras”, “cantar

refazendo o caminho do ar”, “focar a voz”, “postura de admiração”, “risada de bruxa” e

“som frontal”. A metáfora “cantar como se fala” foi a mais citada entre os professores

do canto erudito, por diminuir a tensão durante a articulação do texto (SOUSA et al,

2010).

Grande parte dos professores de canto refere que as metáforas geram efeitos

positivos na “musicalidade do aluno e que podem auxiliar no desenvolvimento da

impostação vocal, variações de timbre, extensão vocal, afinação, inteligibilidade e

homogeneidade da voz, fraseado, dinâmica, flexibilidade da voz e intenção

interpretativa” (SOUSA et al, 2010, p. 323). Além disso, apontam que nem sempre uma

mesma metáfora pode gerar bons resultados, em alguns casos, há necessidade de

modificar ou adaptar o tipo de metáfora para cada aluno.

Rossbach (2011) utilizou as metáforas como instrumento didático tanto para

cantores, quanto para não profissionais, associadas a gestos corporais, em coros

comunitários. Apontou que, muitas vezes, os professores de canto utilizam esse

recurso sem conhecimento aprofundado de seus mecanismos e de seus efeitos.

De acordo com o dicionário Aulete (2007), o termo metáfora refere-se a uma

“figura de linguagem que consiste em estabelecer uma analogia de significados entre

duas palavras ou expressões, empregando uma pela outra”. Pensar na metáfora

somente como substituição torna seu significado muito restrito.

12

Na representação simbólica, um órgão do trato vocal pode representar um outro

órgão do corpo, um objeto ou uma condição de proximidade, distância, entre outras,

dando origem às metáforas sonoras (MADUREIRA, 2005), cujo conceito é fundamental

ao enfoque do simbolismo sonoro (HINTON et al, 1994). As metáforas carregam

sensações proprioceptivas, motoras e táteis (FONAGY, 2000).

As relações entre som e sentido pautam-se em cinco categorias de simbolismo;

(HINTON et al, 1994): corporal (sons que expressam estados físicos e emocionais do

falante, incluindo sons involuntários como tosse, soluço), imitativo (relacionado a

palavras e frases que representam sons ambientais); sinestésico, (vogais, consoantes,

elementos prosódicos e parâmetros acústicos são usados para representar

propriedades visuais, táteis e proprioceptivas de objetos), metalinguístico (abrange

escolhas de segmentos e padrões entoacionais para sinalizar aspectos de estrutura e

função linguística) e convencional (associação entre certas vogais e consoantes a

certos significados).

No campo do simbolismo sonoro, para respaldar as relações entre som e

sentido, também figuram conceitos importantes como o código de frequência (OHALA,

1997), relacionado à frequência fundamental (f0), código de esforço, relacionado à

articulação e o código de produção, relacionado à pressão subglótica

(GUSSENHOVEN, 2004).

A rigidez ou flexibilidade da voz humana são atribuídas, em grande parte, ao

mecanismo de funcionamento das pregas vocais, sendo referidos como mecanismos

laríngeos intrínsecos: alongamento, encurtamento, adução e abdução, aliados a

variados graus de tensão (entre os extremos hiper e hipofuncional) (HIRANO, 1988;

PINHO, 1998). Em alguns casos, cantores inexperientes buscam superar suas

dificuldades em termos de projeção, brilho na voz e suporte respiratório, de maneira

13

que podem acarretar tensões musculares, enquanto que cantores experientes são

capazes de projetar sua voz sem auxílio de microfone, sem realizar ajustes e abusos

vocais que possam prejudicar as estruturas de seu trato vocal, especialmente as

pregas vocais (SUNDBERG, 1970; SUNDBERG, ASKENFELT, 1983; SUNDBERG,

1987; CORDEIRO et al, 2007).

O canto lírico feminino requer sons mais agudos. Na fala feminina, o valor médio

da frequência fundamental (f0) situa-se em torno de 220 Hz. Em emissão cantada, uma

soprano pode atingir f0 de 1024 Hz (VIEIRA, 2004). Muitas vezes, mulheres utilizam

frequências fundamentais mais elevadas durante o canto, quando comparadas ao valor

da frequência do primeiro formante (F1). Tal efeito ocorre especialmente em mulheres

e é conhecido como sintonia F1-F0 (SUNDBERG, 1979; CARLSSON, SUNDBERG,

1992; SUNDBERG, SKOOG, 1997; SUNDBERG, 2003; VIEIRA, 2004).

Diante de tais avanços, na descrição do refinamento dos ajustes de qualidade

vocal no canto, o professor de canto depara-se com a demanda de estimular o aluno a

buscar tanto pelas potencialidades intrínsecas ao trato vocal do aluno, quanto ao

aprimoramento da técnica vocal (condições extrínsecas), uma vez que a prática vocal

pode colaborar para estabilizar ajustes que são reconhecidos nos cantores tidos como

experientes. Há inclusive a indagação quanto ao fato de alguns ajustes, ou

“ornamentos” vocais, serem apenas possíveis com muitos anos de prática vocal e

emergirem como efeitos de vozes experientes e altamente treinadas, tal como o vibrato

vocal (SUNDBERG, 1987; ZAMPIERI et al, 2002; VIEIRA, 2004; BEZERRA et al,

2008).

14

3.2. Análise acústica e articulatória da voz cantada

Esta dissertação pauta-se em estudos da fonética acústica (análise da produção

vocal no canto) e da fonética articulatória (imagens do trato vocal).

Fant (1960) descreveu o modelo fonte-filtro para a produção das vogais, o qual

auxilia na compreensão dos ajustes utilizados em sua produção, com base em

descrições acústico-articulatórias. Neste modelo, a fonte seria caracterizada pelas

consequências acústicas da atividade vibratória das pregas vocais. O filtro estaria

relacionado às consequências acústicas dos ajustes supraglóticos, caracterizadas por

um conjunto de picos de frequência, também conhecidos como formantes. Sendo

assim, as configurações do trato vocal influenciariam as frequências naturais de

ressonância do trato vocal supraglótico (FANT, 1960; SUNDBERG, 1979; KENT, 1993).

No caso das vogais, a extensão total e o diâmetro das cavidades do trato vocal

influenciam, acusticamente, as frequências naturais de ressonância e, portanto, a

qualidade sonora final das vogais (FANT, 1960; SUNDBERG, 1970; LIEBERMAN,

BLUMSTEIN, 1988; KENT, 1993).

Portanto, as vogais podem ser diferenciadas acusticamente pela análise da

frequência dos três primeiros formantes, referidos como F1, F2, F3 ... Fn. Quanto à

identificação fonética das vogais, embora exista quantidade infinita de formantes, os

três primeiros são os mais importantes para conferir a sua identidade fonética,

especialmente a combinação entre F1 e F2 (FANT, 1960; KENT, READ, 1992; KENT,

1993).

Neste contexto, F1 relaciona-se à altura de língua e à abertura de mandíbula,

enquanto F2 relaciona-se a variações da postura de língua no eixo ântero-posterior. F3,

por sua vez, relaciona-se à passagem da constrição (FANT, 1960; KENT, 1993;

15

MEDEIROS, 2002). Portanto, vogais altas apresentam baixos valores de F1 e vogais

baixas altos valores de F1. Para F2, vogais anteriores apresentam maiores valores de

F2 enquanto que vogais posteriores apresentam menores valores (FANT, 1960; KENT,

1993; MEDEIROS, 2002).

As características articulatórias da produção das vogais, por sua vez, referem-se

à vibração periódica de pregas vocais, passagem da corrente de ar livre pelo trato (sem

obstrução imposta pelos articuladores), posicionamento do dorso da língua nos planos

vertical (alta, média-alta, média-baixa e baixa) e horizontal (anterior, central ou

posterior), arredondamento labial (arredondada ou não arredondada) e posição do

palato mole (oral ou nasal) (LAVER, 1994).

A frequência fundamental (f0), por sua vez, é determinada pelo número de ciclos

que as pregas vocais realizam num intervalo de tempo, por exemplo, por segundo. Os

fatores que determinam a frequência habitual e sua variação (extensão vocal e gama

tonal) são representados por: comprimento natural das pregas vocais, alongamento,

massa em vibração e tensão envolvida (HIRANO, 1988; PINHO, 1998; MCALLISTER

et al, 2000; ARAÚJO et al, 2002; FELIPPE et al, 2006; JOTZ et al, 2006).

De acordo com o estudo comparativo da voz falada e cantada, Medeiros (2002)

aponta que há prolongamento das vogais durante a emissão da voz cantada e que a

manutenção de sua frequência fundamental está relacionada a manobras articulatórias

(abaixamento de mandíbula e menor volume de língua). A autora ainda relata a

aproximação dos valores de F1 com a frequência fundamental; à semelhança de dados

de Sundberg (1979), Carlsson e Sundberg (1992) e Sundberg e Skoog (1997).

O espectro de longo termo (LTAS) é considerado eficiente para análise vocal,

com ele é possível observar atividade laríngea e características formânticas

16

(NORDENBERG, SUNDBERG, 2004). Além disso, é possível diferenciar gênero, idade

tanto em voz falada quanto na voz cantada (MASTER et al, 2006).

Zampieri et al (2002), na continuidade de estudos comparativos entre fala e

canto, pesquisaram, em cantores populares durante a produção/ imitação do canto

lírico, os ajustes laríngeos por meio da técnica de nasofibrolaringoscopia e realizaram

as análises perceptivo-auditiva e acústica das emissões. Quanto à análise perceptivo-

auditiva, relataram que durante a imitação do canto lírico houve modificação de

qualidade vocal, aumento de loudness, maior projeção vocal e sobrearticulação das

palavras. Em relação à análise acústica, houve redução dos valores de jitter e shimmer

nas vogais na produção cantada comparada à emissão falada. O ajuste laríngeo mais

evidente foi a constrição laríngea, em padrões ântero-posterior e mediano.

Salomão (2008) apontou que os aspectos acústicos, fisiológicos

(eletroglotografia) e aerodinâmicos interferem na diferenciação perceptiva dos registros

vocais. Durante a produção dos registros modal e falsete, encontrou maiores valores

do quociente fechado e menores valores de quociente da amplitude normalizada e de

H1-H2, sugerindo que a interação entre eles propicia diferentes características dos

ajustes laríngeos e, por sua vez, conferem as características perceptivas aos registros

produzidos.

3.3. Análise de imagens do trato vocal

Os estudos de imagens do trato vocal durante a produção vocal são ainda

escassos, apesar de permitirem uma detalhada descrição complementar dos vários

níveis de atividade do trato vocal durante a emissão vocal.

17

Alguns estudos têm utilizado as imagens videofluoroscópicas para descrever

mudanças fisiológicas durante as situações de fala ou canto (GONÇALVES, 2002;

NUÑES, 2006; SOUZA, 2008; DRAHAN et al, 2012).

Enquanto técnica de diagnóstico por imagem, a videofluoroscopia é um método

que registra os eventos biológicos dinâmicos, gerados pela exposição de pacientes a

baixos índices de radiação como fonte de imagens. Além disso, tais registros podem

ser gravados e permitem traçar estimativas em tempo, dimensão e velocidade reais

dos eventos observados, tais como a dinâmica da deglutição, da fala e canto (FIRMAN

et al, 2000; COSTA et al, 2003).

Segundo Lopasso (2000), a videofluoroscopia agrega a medidas bidimensionais,

modelos em que a densidade serve de parâmetro para a estimativa da avaliação por

imagem em terceira dimensão. Tal modelagem permite a obtenção de valores

volumétricos em áreas de interesse de estudo. A videofluoroscopia pode proporcionar

subsídios importantes para a avaliação detalhada dos articuladores (lábios, língua,

palato duro, palato mole) e cavidades ressoadoras (labial, oral, faríngea e nasal)

durante a emissão da voz cantada.

A radiação liberada pela videofluoroscopia pode ser 80% menor que o exame de

raio-X convencional, pois esta quantidade de exposição está vinculada ao tempo de

exposição do sujeito à radiação, que determina a qualidade final da imagem resultante

(MOSCA, MOSCA, 1971).

A técnica possibilita a análise das estruturas do trato vocal por meio de gravação

de imagens dinâmicas, de forma a permitir, rever e discutir seus dados e resultados

com outros profissionais/especialistas utilizando recursos tecnológicos e sem a

necessidade de manter o sujeito ou paciente exposto à radiação por mais tempo

(BILTON, LEDERMAN, 1998).

18

De modo geral, a videofluoroscopia é rotineiramente um exame utilizado nas

avaliações dos distúrbios da deglutição (disfagia), em que se busca correlacionar os

achados das avaliações clínicas aos dados obtidos a partir do estudo dinâmico da

deglutição, com detalhamento das ações em cavidade oral, orofaringe, hipofaringe e

esôfago superior (LEVY et al, 2004). Com exceção da última, as demais áreas

descritas, e envolvidas no processo de deglutição, participam da ação do trato vocal

supraglótico na definição dos ajustes articulatórios da qualidade vocal falada e cantada.

Gonçalves (2002) pesquisou as sílabas [pa] e [sa] por meio da videofluoroscopia

e realizou análise perceptivo-auditiva nas emissões de sujeitos com e sem fissuras

labiopalatinas. Apontou que mesmo profissionais experientes podem apresentar

dificuldades para identificar quais são os distúrbios articulatórios compensatórios

realizados pelos sujeitos e que não houve registro de deslocamento posterior da língua

nas sílabas estudadas (conforme apontaria a literatura), mesmo com a presença de

fístula no palato ou alterações de oclusão dentária.

Drahan et al (2012) apresentou como objetivo estudar a posição da laringe

durante o repouso e no canto de cantoras profissionais e não profissionais com

utilização da técnica de videofluoroscopia. A medida utilizada refere-se à distância

longitudinal entre pregas vocais e palato duro e tais medidas foram extraídas em

milímetros com o auxilio de um software de análise de imagens. Concluiu que as

cantoras profissionais apresentam maior distância entre pregas vocais e palato duro

durante o canto em comparação ao repouso, mostrando maior domínio dos ajustes da

musculatura extrínseca da laringe, quando comparadas aos dados das cantoras não

profissionais, para as quais não foram detectadas mobilizações dessa natureza.

Em estudo da configuração do trato vocal por meio da videofluoroscopia de

emissões do canto popular, Nuñes (2006) destacou que os ajustes do canto

19

diferenciaram-se daqueles da fala em termos da manutenção da estabilidade de laringe

e à conformação da cavidade faríngea (expansão), à movimentação de véu palatino

(lentificada) e à mandíbula (maior movimento vertical).

Souza (2008) investigou ajustes do trato vocal e do músculo diafragma no canto

lírico por meio da análise videofluoroscópica, laringológica e perceptivo-auditiva.

Concluiu que no apoio abdominal expandido há predomínio de ajustes de laringe baixa,

expansão faríngea (maior distância entre raiz de língua e parede posterior de faringe) e

maior movimentação vertical da mandíbula. Para a emissão com apoio abdominal, a

laringe situou-se próxima à posição de repouso, a cavidade faríngea apresentou menor

área e as pregas vocais econtraram-se em adução completa. O estudo reforçou a

validade de estudos de imagem para identificar e mensurar modificações de respiração

e trato vocal durante o canto.

Softwares para medição de imagens foram aplicados a estudos de imagens de

radiografia e ressonância magnética de canto (ERICSDOTTER et al, 1998;

ECHTERNACH et al, 2008; SUNDBERG, 2008). Atualmente, encontra-se disponível

software de livre acesso para análise de imagens do corpo humano (imagens médicas)

(Osíris- http://www.sim.hvuge.ch/osiris/01_Osiris_Presentation_EN.htm).

Em relação ao estudo de Sundberg (2008) com o uso da técnica de ressonância

magnética, e utilização do software de análise de imagem Osiris, foi possível observar

modificações no trato vocal em relação à abertura de lábios e mandíbula e diferentes

posturas de língua.

Echternach et al (2008) também estudou o trato vocal de uma cantora por meio

da análise de imagem pela técnica de ressonância magnética. Os achados indicam que

durante a produção de voz cantada há abertura de lábios e de mandíbula, elevação do

dorso da língua e expansão faríngea.

20

Ericsdotter et al (1998) realizou um estudo para testar a viabilidade da utilização

de um software desenvolvido em sua própria Universidade (KTH- Royal Institute of

Technology) em um cantor (sexo masculino) submetido a técnica de imagens

radiográficas. Foi possível extrair as medidas do trato vocal (em emissões baseadas

em interpretações articulatórias das variantes do Sueco), bem como possibilitou suas

correspondências e extrair as medidas acústicas de frequências formânticas.

Atualmente, vale ressaltar que a técnica da ultrassonografia também tem sido

utilizada para estudos de imagem do trato vocal, principalmente em relação aos

contornos de dorso de língua (SVICERO, 2012).

21

4. METODOLOGIA

Este tópico está estruturado em dois experimentos, denominados experimentos

1 e 2, respectivamente relativos à análise integrada de imagem do trato vocal e de

dados acústicos (estudo de caso) e à análise acústica de emissões por cantoras e não

cantoras. Em ambos os experimentos, as emissões estudadas referiram-se à voz

cantada produzida por meio de intruções baseadas em metáforas.

Conforme preceitos éticos, os sujeitos participantes da pesquisa foram

informados sobre os procedimentos e objetivos da pesquisa, de modo a expressarem

consentimento no uso das informações obtidas para fins científicos e inclusão dos

dados em banco de dados para pesquisa. O Termo de Consentimento Livre e

Esclarecido- TCLE para cada um dos experimentos é apresentado nos anexos 1 e 2.

Este estudo foi submetido ao Comitê de Ética e Pesquisa da PUCSP e aprovado sob o

número 459/2011 (Anexo 3).

4.1. Experimento 1- Análise integrada de dados acústicos e de imagem do

trato vocal: um estudo de caso

Neste experimento, são relatados os procedimentos relativos à coleta e à análise

de dados realizada com a participação de um sujeito do sexo femininio, de 26 anos de

idade, não cantora. Os critérios de inclusão para seleção referiram-se ao sexo e à faixa

etária, bem como à manifestação de interesse em colaborar com a sessão de coleta de

imagens. Os critérios de exclusão compreenderam a auto-referência de queixas vocais

e de quadros inflamatórios/ infecciosos de vias aéreas no momento da coleta, bem

como de diagnóstico otorrinolaringológico e fonoaudiológico de alteração vocal no

período. Além disso, foram considerados critérios de exclusão aqueles referentes às

22

contraindicações para a realização de exames de imagem desta natureza: ter realizado

esse exame recentemente, mais especificamente, no período de seis meses; e, no

caso de mulheres, encontrar-se em período gestacional2.

4.1.1. Procedimentos de coleta de amostras de imagem do trato vocal e de

áudio durante a emissão em voz cantada produzida por meio de instruções

baseadas em metáforas

A coleta de dados foi realizada em uma sessão, no serviço de Radiologia de um

hospital privado da cidade de São Paulo.

Durante a sessão de coleta, o sujeito permaneceu sentado em sala do Serviço

de Radiologia em que se utilizou equipamento Philips, Tele Diagnost-Optimus; LG

monitor, LG DVD-HDD, monitor Philips com sistema de gravador/monitor para registro

em DVD. Antes de se iniciar o procedimento de registro de imagens, foi apresentado ao

sujeito o registro em áudio de um trecho da canção infantil “Sapo Jururu” gravado por

uma professora de canto como referência. Segue a canção abaixo:

Sapo Jururu, da beira do rio,

quando o sapo canta: ó, maninha

é que está com frio.

A mulher do sapo deve estar lá dentro,

fazendo rendinhas, maninha,

para o casamento.

2 Dado o fato de as coletas ocorrerem em ambiente externo ao Laboratório Integrado de Análise Acústica

e Cognição (LIAAC) e a grade horária ser restrita em função da alta demanda do serviço, não foi possível compatibilizar a agenda da informante cantora com aquela disponibilizada para coletas da pesquisa.

23

Para a composição do corpus foram concebidas quatro tarefas:

Tarefa 1: cantar o trecho da canção “Sapo Jururu, da beira do rio. Quando

o sapo canta, ó maninha, é que está com frio” sem o uso de metáfora;

Tarefa 2: cantar o trecho da canção “Sapo Jururu, da beira do rio. Quando

o sapo canta, ó maninha, é que está com frio” com o uso de metáfora

prisma;

Tarefa 3: cantar o trecho da canção “Sapo Jururu, da beira do rio. Quando

o sapo canta, ó maninha, é que está com frio” com o uso de metáfora

catedral;

Tarefa 4: cantar o trecho da canção “Sapo Jururu, da beira do rio. Quando

o sapo canta, ó maninha, é que está com frio” com o uso de metáfora

disco voador.

Para as tarefas 2, 3 e 4 foram utilizadas ilustrações para facilitar a compreensão

das metáforas, de forma a auxiliar o sujeito para a emissão em voz cantada (Anexo 4).

Tais metáforas são comumente utilizadas em pesquisas do grupo de estudos sobre a

fala- LIAAC (CANHETTI, MENEGON, 2012). Todavia, podem ser encontrados ou

podem apresentar as mesmas funções com nomes similares em outros trabalhos que

estudam a metáfora e o canto (SOUSA et al, 2010).

Nos estudos de Sousa et al (2008) encontramos a metáfora “cúpula de uma

igreja dentro da boca”, utilizada nesse estudo como “catedral”; “ressonância como uma

lâmpada”, utilizada nesse estudo como o “prisma” uma vez que existe uma lâmpada

que ao acender ilumina o ambiente ou em relação ao prisma espelha a voz como uma

luz refletida, por fim, “ressonância como uma bolha de sabão”, utilizada nesse estudo

como o “disco voador”, já que ambas rementem a algo que flutua com leveza.

24

O tempo total de exposição à radiação foi de 1 minuto e 46 segundos. Vale

reforçar que durante os intervalos, entre uma emissão e outra, e durante as instruções,

não houve exposição à radiação. Para que o tempo de exposição fosse breve, não

houve solicitação de repetição de tarefas de emissão em voz cantada.

A partir do software de livre acesso Vídeo Converter (versão 2.3 02) os

estímulos em áudio dos vídeos registrados na videofluoroscopia foram extraídos em

formato .wav

4.1.2. Procedimentos de edição e análise dos dados de imagem do trato vocal3

Do ponto de vista de imagens de trato vocal, os registros videofluoroscópicos

foram submetidos a processo de decupagem para análise das mobilizações com o

auxílio do software de livre acesso VirtualDub. Após esse processo, foi possível efetuar

a inspeção prévia do conjunto de movimentos de lábios, língua, palato mole, paredes

de faringe e laringe. Para tanto, as imagens em formato pap foram analisadas por meio

do software Osiris e as medidas de deslocamento de articuladores (lábios, mandíbula e

língua) foram extraídas em milímetros (mm).

O software Osiris aceita somente arquivos com extensão .pap para a utilização

das ferramentas disponibilizadas. A conversão para essa formato será descrita no

anexo 5.

3 Os dados de investigação preliminar deste experimento resultaram em trabalho apresentado no Central

European Conference in Linguistics for Graduate Students (CECILS)– “Acoustic Analysis and vocal tract images”. A partir da apresentação dos dados no evento e em visita a Universidade KTH- Royal Institute of Technology- Departament of Speech, Music and Hearing, foram efetuadas adequações ao projeto, especialmente quanto ao tratamento e extração de medidas de imagens do trato vocal e de medidas acústicas.

25

4.1.2.1.Medidas de imagens de trato vocal (mm)

O conjunto de medidas definido para esta etapa de coleta de dados constou de:

abertura de lábios absoluta; abertura de lábios normalizada; abertura de mandíbula;

distância dorso de língua-faringe; distância dorso de língua-palato. Além disso, foi

definido um elemento qualificador intitulado deslocamento ântero-posterior de língua.

As medidas foram definidas a partir de estudos que utilizaram a técnica de ressonância

magnética para investigações da voz cantada (SUNDBERG, 2008) pelo software Osiris

e outro pela técnica de radiografia (ERICSDOTTER et al, 1998) com o uso do software

APEX-model e são apresentadas abaixo:

o Abertura de lábios absoluta (figura 1): o padrão utilizado para a extração referiu-se à distância demarcada entre dente incisivo central superior e o dente incisivo central inferior

Figura 1. Medida de abertura de lábios

absoluta (mm) gerada pelo software

Osiris

o Abertura de mandíbula (figura 2): o padrão utilizado para extração referiu-se à distância entre o centro da Glabela do osso frontal (parte óssea acima da órbita ocular – na testa) até o mento (queixo).

26

Figura 2. Medida de abertura de

mandíbula (mm) gerada pelo software

Osiris

o Abertura de lábios normalizada (figura 3): o padrão utilizado para extração referiu-se à medida de abertura de mandíbula (figura 2) subtraída do valor da distância entre o dente segundo pré-molar superior e o queixo. Após o resultado dessa subtração, o valor gerado é subtraído do valor de abertura de lábios absoluta (figura 1) (SUNDBERG, 2008).

Figura 3. Medida de abertura de lábios

normalizada (mm) gerada pelo software

Osiris

o Distância dorso de língua-faringe (figura 4): o padrão utilizado para extração referiu-se à distância entre o início de base de língua até a segunda vertebra cervical (ECHTERNACH et al, 2008; SUNDBERG, 2008).

27

Figura 4. Medida da distância de

língua-faringe (mm) gerada pelo

software Osiris

o Distância dorso de língua-palato: o padrão utilizado para extração referiu-se à localização do ponto mais alto de corpo de língua em relação ao palato duro. Em caso de vogais anteriores (figura 5), a medida era realizada no centro do palato duro. Para vogais posteriores (figura 6), a medida apontava o final do palato duro como referência.

Figura 5. Medida da distância de

língua-palato de uma vogal anterior

[Ɛ] (mm) gerada pelo software Osiris

Figura 6. Medida da distância de

língua-palato de uma vogal [a]

posterior (mm) gerada pelo software

Osiris

Elemento qualificador

o Deslocamento ântero-posterior de língua: parâmetro de classificação de julgamento

de deslocamento de dorso de língua em relação a região central do palato duro

(1=anterior) ou região posterior do palato duro (2= posterior).

28

4.1.3. Procedimentos de edição e análise dos dados acústicos

Os estímulos em áudio (extensão .wav) extraídos dos vídeos registrados na

coleta por meio de videofluoroscopia foram submetidos à análise acústica por meio do

software de livre acesso PRAAT- versão 5.1.34.

Tal procedimento garantiu que as amostras em áudio analisadas acusticamente

correspondessem às mesmas emissões das imagens analisadas. As amostras foram

devidamente etiquetadas, destacando-se as vogais /a/ (sApo), /u/ (jurUru), /Ɛ/ (É que),

/i/ (rIo) e /i/ (frIo). Para as vogais selecionadas, foram extraídas as medidas de

frequências formânticas (F1, F2 e F3 em Hz),

Os procedimentos de extração das medidas de frequências formânticas

seguiram as indicações do estudo de Svicero (2012).

O conjunto de dados de imagem do trato vocal e de medidas acústicas foram

inseridos em planilha de dados, especificando-se todas as medidas de imagem do trato

vocal, bem como as medidas acústicas de frequências formânticas (F1, F2 e F3) das

vogais /a/ (sApo), /u/ (jurUru), /Ɛ/ (É que), /i/ (rIo) e /i/ (frIo) inseridas em cada trecho de

emissão com metáfora (prisma, catedral e disco voador) e sem metáfora.

4.1.4. Análise estatística (software XLStat- Addinsoft)

Os achados da análise de imagem do trato vocal e de análise acústica

(frequências formânticas) foram submetidos a tratamento estatístico por meio de

análise multivariada, que permitiu estimar como os ajustes articulatórios do trato vocal,

produzidos por meio de instruções baseadas nas metáforas, refletem-se na qualidade

29

acústica correspondente a tal produção em voz cantada. Os testes realizados e o

conjunto de variáveis analisadas referiram-se a:

o Medidas de imagens do trato vocal e Medidas acústicas (F1, F2 e F3)

Teste de Correlação de Pearson (α= 0,005)

Análise fatorial

Análise aglomerativa hierárquica de cluster

Análise de correlação canônica

Análise de regressão linear

Ancova

Análise discriminante

Medidas de frequências formânticas- metáforas

Medidas de frequências formânticas- vogais

Medidas de imagem do trato vocal- metáforas

Medidas de imagem do trato vocal- vogais

Medidas de frequências formânticas e de imagem do trato

vocal– metáforas

O detalhadamento de cada um dos procedimentos de análise estatística

aplicados encontra-se no Anexo 6.

Os resultados foram analisados quanto à correspondência de dados de imagem

do trato vocal e acústicos para as emissões com e sem metáforas e discutidos com

base na literatura das Ciências Vocais e das Ciências Fonéticas.

30

4.2. Experimento 2- Análise acústica de emissões em voz cantada (produzidas

por meio de instruções baseadas em metáforas) por cantoras e não cantoras

Neste experimento, são relatados os procedimentos relativos à coleta e análise

de dados realizada com a participação de dez (10) sujeitos do sexo femininio, de 19 a

44 anos de idade, divididas igualmente no grupo cantoras e não cantoras (Quadro 1).

Quadro 1. Descrição dos sujeitos participantes da pesquisa

Sujeito Idade Tipo Classificação Vocal

S1 25 Cantora Mezzo-soprano

S2 29 Cantora Soprano

S3 31 Cantora Soprano

S4 44 Cantora Soprano

S5 43 Cantora Mezzo-soprano

S6 28 Não cantora ------

S7 33 Não cantora ------

S8 35 Não cantora ------

S9 19 Não cantora ------

S10 22 Não cantora ------

As particularidades das vozes cantadas masculinas e femininas levaram-nos a

optar pela exploração inicial de um grupo de cantores, uma vez que a inclusão de

sujeitos de ambos os sexos levaria a uma proposta de estudo comparativo, dadas as

particularidades de cada grupo. Além disso, estudos com dados perceptivos e

acústicos de qualidade vocal revelaram a influência do sexo como variável

discriminante para a qualidade vocal estudada pela metodologia acústica adotada no

presente estudo (CAMARGO et al, 2012). Finalmente, a opção pelo sexo feminino

31

também residiu no fato de que o experimento 1 esteve baseado em coleta de amostras

de voz feminina.

De forma geral, os critérios de inclusão referiram-se ao sexo (feminino) e faixa

etária (entre 19 e 45 anos) bem como à manifestação de interesse em colaborar com a

sessão de coleta de audiogravações. Segundo a Organização das Nações Unidas

(ONU) consideram-se adultos jovens sujeitos com até 24 anos e segundo o autor

Eisenstein (2005) considera-se adulto sujeitos com a faixa etária entre 25 a 64 anos.

Os critérios de exclusão centraram-se na auto-referência de queixas vocais e de

quadros inflamatórios/ infecciosos de vias aéreas no momento da coleta, bem como de

diagnóstico otorrinolaringológico e fonoaudiológico de alteração vocal no período.

4.2.1. Procedimentos de coleta de amostras de áudio durante a emissão de

voz cantada produzida por meio de instruções baseadas em metáforas por

cantoras e não cantoras

A coleta de dados foi realizada no Laboratório de Rádio da Faculdade de

Filosofia, Comunicação, Letras e Artes (Faficla) da Pontifícia Universidade Católica de

São Paulo. As instalações do referido laboratório constam com salas com isolamento

acústico, instrumental e suporte técnico para coleta de dados de áudio.

Durante a sessão de coleta, cada sujeito participante permaneceu em pé, com o

uso de microfone de modelo de acoplagem em cabeça Shure WH20, unidirecional.

Antes de se iniciar o procedimento de registro de áudio foi realizado o

procedimento de calibragem da gravação e a instrução sobre a sessão de coleta de

dados.

32

Para o procedimento de calibração foi utilizada uma distância de 15 cm da boca

do sujeito avaliado. O sinal acústico foi identificado pela opção VU meter do software

Soundforge, o ganho da mesa de som foi ajustado para um limite de variação do sinal

acústico de -3 dB a -9 dB. Para registro de amostras foi utilizada a placa de som

Mackie Microseries 1202 VLZ (12 canais), na frequência de amostragem de 22050 Hz,

16 bits de quantização e em formato .wav.

Após esse procedimento, foi posicionado o microfone e o medidor de pressão

sonora (Radio Shack Sound Level Meter catálogo número 33-2055; Radio Shack

Corporation, Forth Worth, TX) a uma distância de 15 cm de um sinal de 1kHz, gerado

pelo software Praat (versão 5.1.34. www.praat.org). O volume desse tom foi

manipulado pela pesquisadora até atingir o nível de 100 dB NPS (ou valor próximo a

esse).

O microfone headset acima referido foi acoplado tanto ao equipamento utilizado

para calibração (decibelímetro) quanto à mesa de som referida.

Para a primeira etapa, foi apresentado ao sujeito participante o registro em áudio

de um trecho da canção infantil “Sapo Jururu” (“Sapo Jururu, da beira do rio, quando o

sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que está lá dentro,

fazendo rendinhas, maninha, para o casamento”) gravado por uma professora de canto

como referência e reproduzido três vezes no sistema de autofalantes da sala de

gravação. Além disso, cada participante recebeu uma versão impressa da letra da

canção.

A gravação teve início com emissão de fala semi-espontânea (nome, data e

breve relato sobre a cidade em que nasceu), permitindo o monitoramento dos níveis de

gravação e a adequação do instrumental. Em seguida, solicitou-se a gravação da vogal

[a] sustentada em níveis de intensidade habitual, forte e fraco.

33

Após estas etapas prévias, deu-se início à coleta de dados de emissões em voz

cantada, de forma a se proceder ao registro das três repetições das tarefas abaixo.

Não foi priorizada a gravação em ordem aleatorizada para que não ocorresse confusão

das instruções baseadas em metáforas por parte do sujeito participante. Dessa forma,

as repetições de cada instrução foram realizadas na sequência:

Tarefa 1: cantar o trecho da canção “Sapo Jururu, da beira do rio, quando

o sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que

está lá dentro, fazendo rendinhas, maninha, para o casamento” sem o uso

de metáfora; Foi solicitado ao sujeito participante que cantasse a canção

da forma mais confortável.

Tarefa 2: cantar o trecho da canção “Sapo Jururu, da beira do rio, quando

o sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que

está lá dentro, fazendo rendinhas, maninha, para o casamento” com o

uso de metáfora prisma. O participante foi instruído “a cantar pensando

em um ponto, um pequeno feixe de luz que se abre e ganha espaço, ou

seja, espalhar a voz como a luz refletida em um prisma”.

Tarefa 3: cantar o trecho da canção “Sapo Jururu, da beira do rio, quando

o sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que

está lá dentro, fazendo rendinhas, maninha, para o casamento” com o

uso de metáfora catedral; O participante foi instruído a cantar “pensando

em projetar sua voz como em uma cúpula de catedral e que deveria

preencher todo esse espaço”.

Tarefa 4: cantar o trecho da canção “Sapo Jururu, da beira do rio, quando

o sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que

está lá dentro, fazendo rendinhas, maninha, para o casamento” com o

34

uso de metáfora disco voador. O participante foi instruído a cantar

“pensando em deixar sua voz flutuar”.

Para as tarefas 2, 3 e 4 foram utilizadas ilustrações para auxiliar a compreensão

das metáforas, de forma a oferecer uma referência ao sujeito para a emissão em voz

cantada (Anexo 4).

O sujeito participante foi instruído quanto ao fato de que poderia interromper e

retomar as emissões, de forma a contemplar a qualidade sonora desejada.

4.2.2. Procedimentos de edição e análise dos dados acústicos

As amostras de áudio registradas em formato estéreo, extensão .wav, 22050 Hz

de frequência de amostragem, foram editadas em estímulo mono e inspecionadas para

checagem do nível de intensidade das emissões. Em seguida, foram etiquetadas em

duas camadas, segundo dois sistemas:

Metáforas- trechos: demarcação de trechos referentes às emissões com

metáforas (prisma, catedral e disco voador) e sem metáforas;

Metáforas- vogais: demarcação da vogal [a] na sílaba tônica da emissão

de sapo (com três ocorrências para cada trecho-metáfora emitido).

Para as edições Metáforas-trechos, os estímulos foram submetidos ao script

ExpressionEvaluator (BARBOSA, 2009), para extração automática de medidas de

prontidão, f0 (mediana, semiamplitude entre quartis, quantil 99,5% e assimetria), de

primeira derivada de f0 (média, desvio padrão e assimetria), intensidade (assimetria),

declínio espectral (média, desvio padrão e assimetria) e LTAS (desvio padrão). Nesta

etapa, todo o enunciado demarcado foi selecionado para extração das medidas

35

acústicas, tomando-se como referência os parâmetros de voz feminina. A descrição de

cada medida encontra-se no anexo 7.

O termo de consentimento para uso do script ExpressionEvaluator encontra-se

no Anexo 8.

Das edições Metáforas-vogais, foram extraídas as medidas de frequências

formânticas (F1, F2 e F3- Hz) das vogais [a] etiquetadas, seguindo-se os

procedimentos relatados no estudo de Svicero (2012). Para cada emissão de metáfora

– trecho, foram extraídas medidas de 3 vogais, nomeadas a1 ([a] da palavra sApo da

emissão “sApo jururu”), a2 ([a] da palavra sApo da emissão “quando o sApo canta”), e

a3 ([a] da palavra sApo da emissão “mulher do sApo”), enquanto três vogais distintas

no mesmo trecho de extração de medidas do script ExpressionEvaluator. Para cada

emissão vocálica (a1, a2 e a3) de cada falante, foram registradas 3 repetições

O conjunto de dados acústicos foi inserido em planilha de dados, especificando-

se todas as medidas acústicas extraídas a partir do script ExpressionEvaluator, bem

como as medidas acústicas de frequências formânticas (F1, F2 e F3) das três vogais

de cada trecho a1, a2 e a3. Diante das modalidades de análises acústicas empregadas

(análise de longo termo para as edições metáforas-trecho e de curto termo para as

edições metáfora- vogal), foi realizado teste estatístico para se definir a forma de

apresentação dos dados referentes à vogal [a], cujos resultados serão apresentados ao

final do item 4.2.3. da metodologia.

4.2.3. Análise estatística

Os achados da análise de prontidão e de medidas acústicas (extraídas por meio

do Script ExpressionEvaluator) e de frequências formânticas foram submetidos a

36

tratamento estatístico por meio de análise multivariada, que permitiu estimar como as

emissões em voz cantada produzidas a partir de instruções baseadas em metáforas

refletem-se na qualidade acústica correspondente à emissão de mulheres com e sem

experiência em canto. Os testes realizados e o conjunto de variáveis analisadas

referiram-se a:

o Medidas acústicas (extraídas por meio do script ExpressionEvaluator e

medidas de frequências formânticas: F1, F2 e F3)

Análise aglomerativa hierárquica de cluster

o Medidas acústicas (medidas de frequências formânticas: F1, F2 e F3)

Teste ANOVA (comparação dos valores de F1, F2 e F3) para as 3

emissões vocálicas representativas de uma mesma metáfora- a1,

a2 e a3

o Elemento prontidão - extraído por meio do script ExpressionEvaluator

Regressão linear

Medidas acústicas (extraídas por meio do script

ExpressionEvaluator e frequências formânticas: F1, F2 e F3)

Medidas acústicas (extraídas por meio do script Expression

Evaluator)

Medidas acústicas (frequências formânticas: F1, F2 e F3)

Variáveis qualitativas (tipo de emissão (metáforas), grupo

(cantoras e não cantoras) e sujeitos)

Anova

Variáveis qualitativas: tipo de emissão (metáforas), grupo

(cantoras e não cantoras) e sujeitos;

Variáveis qualitativas: tipo de emissão (metáforas)

37

Variáveis qualitativas: grupo (cantoras e não cantoras)

Variáveis qualitativas: sujeitos

o Medidas acústicas (extraídas por meio do script ExpressionEvaluator e

frequências formânticas)- metáforas

Análise discriminante

o Medidas acústicas (extraídas por meio do script ExpressionEvaluator)-

metáforas

Análise discriminante

o Medidas acústicas (frequências formânticas: F1, F2 e F3)- metáforas

Análise discriminante

o Medidas acústicas (extraídas por meio do script ExpressionEvaluator)-

grupo (cantoras/não cantoras)

Análise discriminante

o Medidas acústicas (frequências formânticas)- (cantoras/não cantoras)

Análise discriminante

O detalhadamento dos métodos de análise estatística encontra-se no Anexo 6.

Conforme anteriormente referido, o teste ANOVA (para comparação dos valores

de F1, F2 e F3) para as 3 emissões vocálicas representativas de uma mesma

metáfora- a1, a2 e a3 revelou diferenças estatísticas para as medidas de F3 (p=0,001;

F=6,339, Fcrítico=3,021) das 3 vogais contidas numa mesma emissão produzida a

partir da instrução baseada em metáfora (a1, a2 e a3- referentes à vogal tônica da

produção “sApo” que ocorreu 3 vezes em cada trecho cantado representativo de cada

38

uma das emissões das três metáforas e naquelas sem metáforas). Quando realizadas

análises comparativas entre produções vocálicas para F3, diferenças foram

encontradas para vogais a1 e a2 (p=0,007; F=7,216, Fcrítico=3,880) e vogais a1 e a3

(p=0,0002; F=13,516, Fcrítico=3,880). Tais informações são ilustradas nas Figuras 7 a

9.

Figura 7. Gráfico boxplot da distribuição das medidas de frequências formânticas (F3) para três emissões da vogal [a] – a1, a2 e a3

Figura 8. Gráfico boxplot da distribuição das medidas de frequências formânticas (F1) para três emissões da vogal [a] – a1, a2 e a3

Figura 9. Gráfico boxplot da distribuição das

medidas de frequências formânticas (F2) para três

emissões da vogal [a] – a1, a2 e a3

39

Diante de tais achados, optou-se por analisar as frequências formânticas das

três emissões de forma diferenciada, sem traçar médias que poderiam ocultar as

diferenças por produções específicas de vogais.

Os dados foram analisados quanto à correspondência de dados de prontidão e

de medidas acústicas (extraídas por meio do script ExpressionEvaluator e de

frequências formânticas: F1, F2 e F3) para as emissões com e sem metáforas e

também nos grupos de cantoras e não cantoras e discutidos com base na literatura das

Ciências Vocais e das Ciências Fonéticas.

40

5. RESULTADOS

Os resultados são apresentados em tópicos relativos aos experimentos 1 e 2,

respectivamente nos itens 5.1 e 5.2.

5.1. Experimento 1- Análise integrada de dados acústicos e de imagem do trato

vocal: um estudo de caso

Os dados das imagens do trato vocal em situação de repouso, durante a

emissão de voz cantada produzida sem instrução baseada em metáforas e durante a

emissão em voz cantada produzida por meio de instruções baseadas em metáforas

(prisma, catedral e disco voador) são apresentados nas Figuras 10 a 14.

Vale ressaltar que o traçado referente ao cálculo da distância entre o dente

segundo pré-molar superior e o mento (queixo)- medida necessária ao cálculo de abertura

lábios normalizada- foi efetuado separadamente, pois, caso contrário, haveria

sobreposição na imagem e excesso de informações na mesma figura, dificultando a

observação da base de cálculos utilizada na presente pesquisa. A imagem com os valores

correspondentes a tais medidas encontram-se no anexo 9.

Figura 10. Dados de imagem de trato

vocal ilustrativos das medidas (em mm)

extraídas na situação de repouso

41

Emissão de [a] (sApo) – voz cantada sem

instrução baseada em metáfora

Emissão de [u] (jurUru) – voz cantada sem

instrução baseada em metáfora

Emissão de [i] (rIo) – voz cantada sem

instrução baseada em metáfora

Emissão de [i] (frIo) – voz cantada sem

instrução baseada em metáfora

Emissão de [Ɛ] (é que) – voz cantada sem

instrução baseada em metáfora

42

Figura 11. Dados de imagens de trato vocal ilustrativos das medidas (em mm) extraídas das

emissões em voz cantada produzidas sem intruções baseadas em metáforas

Emissão de [a] (sApo) – voz cantada

produzida por meio de instrução baseada

na metáfora prisma

Emissão de [u] (jurUru) – voz cantada

produzida por meio de instrução baseada

na metáfora prisma

Emissão de [i] (rIo) – voz cantada

produzida por meio de instrução baseada

na metáfora prisma

Emissão de [i] (frIo) – voz cantada

produzida por meio de instrução baseada

na metáfora prisma

43

Emissão de [Ɛ] (é que) – voz cantada

produzida por meio de instrução baseada

na metáfora prisma

Figura 12. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de imagens

extraídas das emissões em voz cantada produzidas por meio de instruções baseadas na

metáfora prisma.

Emissão de [a] (sApo) – voz cantada

produzida por meio de instrução baseada

na metáfora catedral

Emissão de [u] (jurUru) – voz cantada

produzida por meio de instrução

baseada na metáfora catedral

44

Emissão de [i] (rIo) – voz cantada

produzida por meio de instrução baseada

na metáfora catedral

Emissão de [i] (frIo) – voz cantada

produzida por meio de instrução

baseada na metáfora catedral

Emissão de [Ɛ] (é que) – voz cantada

produzida por meio de instrução baseada

na metáfora catedral

Figura 13. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de imagens

extraídas das emissões em voz cantada produzidas por meio de instruções baseadas na

metáfora catedral.

45

Emissão de [a] (sApo) – voz cantada

produzida por meio de instrução

baseada na metáfora disco voador

Emissão de [u] (jurUru) – voz cantada

produzida por meio de instrução

baseada na metáfora disco voador

Emissão de [i] (rIo) – voz cantada

produzida por meio de instrução

baseada na metáfora disco voador

Emissão de [i] (frIo) – voz cantada

produzida por meio de instrução

baseada na metáfora disco voador

Emissão de [Ɛ] (é que) – voz cantada

produzida por meio de instrução baseada

na metáfora disco voador

46

Figura 14. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de imagens

extraídas das emissões em voz cantada produzidas por meio de instruções baseadas na

metáfora disco voador

Os resultados de medidas de frequências formânticas (F1, F2 e F3) e de

medidas de imagem do trato vocal são apresentados nas Tabelas 1 e 2

respectivamente para cada uma das vogais estudadas nas emissões de [a] sapo, [Ɛ] é

que, [i] rio e frio e [u] jururu.

Tabela 1. Medidas de frequências formânticas (Hz) para as emissões em voz cantada

produzidas por meio de instruções baseadas em metáforas e sem instruções baseadas em

metáforas para as emissões de [a] sapo, [Ɛ] é que, [i] rio e frio e [u] jururu

Vogal Emissão/Medidas F1 (Hz) F2 (Hz) F3 (Hz)

[a] sApo Prisma 888 1571 3009

[a] sApo Catedral 826 1687 3143

[a] sApo Disco Voador 933 1619 3120

[a] sApo Sem metáfora 903 1547 3054

Média 887,50 1606,00 3081,50

Desvio Padrão 45,07 61,74 61,31

[ɛ] é que Prisma 793 2141 3110

[ɛ] é que Catedral 708 2035 3256

[ɛ] é que Disco Voador 738 2081 3223

[ɛ] é que Sem metáfora 801 2266 3024

Média 760,00 2130,75 3153,25

Desvio Padrão 44,56 100,07 106,46

[i] rIo Prisma –rio 403 2543 2940

[i] frIo Prisma –frio 417 2599 3175

[i] rIo Catedral- rio 391 2597 3101

47

[i] frIo Catedral-frio 408 2453 3062

[i] rIo Disco Voador-rio 343 2397 3230

[i] frIo Disco Voador-frio 337 2530 3036

[i] rIo Sem metáfora-rio 428 2565 3027

[i] frIo Sem metáfora-frio 390 2591 3040

Média 389,63 2534,38 3076,38

Desvio Padrão 33,13 73,51 91,13

[u] jururu Prisma 457 2088 3578

[u] jururu Catedral 386 1090 2413

[u] jururu Disco Voador 295 1186 2581

[u] jururu Sem metáfora 516 2075 3555

Média 413,50 1609,75 3031,75

Desvio Padrão 95,21 546,16 621,34

Tabela 2. Medidas de imagem do trato vocal (mm) para as emissões em voz cantada

produzidas por meio de instruções baseadas em metáforas e sem instruções baseadas em

metáforas para as emissões [a] sapo, [Ɛ] é que, [i] rio e frio e [u] jururu.

Vogal Emissão/

Medidas

Abertura de lábios absoluta (mm)

Abertura de Mandíbula

(mm)

Abertura lábios Normalizada

(mm)

Distância

língua-

faringe

(mm)

Distância

língua-

palato

(mm)

[a] sApo Prisma 8 34,9 7,6 3,8 5,3

[a] sApo Catedral 8,4 36,2 7,4 4,2 5,1

[a] sApo Disco Voador 5,1 34 10,5 4,1 4,2

[a] sApo Sem metáfora 5,3 34,6 10,3 3,9 5,3

Média 6,70 34,93 8,95 4,00 4,98

Desvio Padrão 1,74 0,93 1,68 0,18 0,53

48

[ɛ] é que Prisma 6,8 41,8 11,7 7,3 4,8

[ɛ] é que Catedral 11,4 44,6 7,9 7,6 6,6

[ɛ] é que Disco Voador 5,7 41,6 13,8 8,1 5,2

[ɛ] é que Sem metáfora 8,9 43,1 10,7 8,1 6,7

Média 8,20 42,78 11,03 7,78 5,83

Desvio Padrão 2,51 1,39 2,45 0,39 0,97

[i] rIo Prisma -rio 2,4 39 16,7 8,6 1

[i] frIo Prisma -frio 2,4 37,8 17,1 8,8 1,2

[i] rIo Catedral- rio 2,9 38,7 16,7 8,1 1,2

[i] frIo Catedral-frio 5,8 41,4 13,7 8,7 1,5

[i] rIo Disco Voador-rio 1,3 37,4 18,4 8,2 1

[i] frIo Disco Voador-frio 1,6 37,1 18,1 9,2 1,3

[i] rIo Sem metáfora-rio 3,1 38,7 16,5 8,6 1,4

[i] frIo Sem metáfora-frio 4,1 38,4 15,5 8,2 1,3

Média 2,95 38,56 16,74 8,55 1,24

Desvio Padrão 1,45 1,33 1,53 0,37 0,18

[u] jurUru Prisma 1,2 30,9 14,1 4,4 2,5

[u] jurUru Catedral 2,5 31,5 13,3 5,1 1,2

[u] jurUru Disco Voador 1,2 31 15,4 4,8 2,2

[u] jurUru Sem metáfora 1,2 30,8 14,1 5 2,2

Média 1,53 31,05 14,23 4,83 2,03

Desvio Padrão 0,65 0,31 0,87 0,31 0,57

Para todas as emissões, as vogais [Ɛ] e [i] foram identificadas como qualificador

“anterior” em termos de deslocamento ântero-posterior de língua. Para todas as

emissões, as vogais [a] e [u] foram identificadas como qualificador “posterior” em

termos de deslocamento ântero-posterior de língua.

49

Os resultados de teste de correlação para medidas de frequências formânticas e

medidas de imagem do trato vocal são apresentados na Tabela 3 e na Figura 15 com

respeito às correlações encontradas para medidas de F1 e F2.

Tabela 3. Resultados de teste de correlação para medidas de frequências formânticas e

medidas de imagem do trato vocal (p<0,01)

F1 F2

Abertura de lábios absoluta (p=0,00)

Abertura de lábios normalizada (p<0,0001)

Distância dorso de língua- faringe (p=0,031)

Distância dorso de língua-palato (p<0,0001)

Abertura de mandíbula (p=0,01)

Abertura de lábios normalizada (p<0,015)

Distância dorso de língua- faringe (p<0,0001)

50

Figura 15. Gráficos da análise de correlações para medidas de frequências formânticas e

medidas de imagem do trato vocal

A análise fatorial revelou que os dois conjuntos de fatores, nomeados fatores 1 e

2, reponderam por 81,20% da distribuição das variáveis estudadas (Figura 16).

Congregadas no fator 1 (47,70%) situaram-se as seguintes variáveis (e respectivos

fatores de influência): Formante 1 – F1 (80,2%), medida de distância língua-faringe

(82,2%), medida de distância língua-palato (78,8%), Formante 2 – F2 (77,6%) e

elemento qualificador de deslocamento ântero-posterior da língua. Para o fator 2

(34,19%), congregaram-se as seguintes variáveis (e respectivos fatores de influência):

51

medida de abertura mandibular (92,5%) e medida de abertura de lábios absoluta

(62,5%).

Figura 16. Diagrama da análise fatorial de medidas de imagens do trato vocal e de medidas

acústicas de frequências formânticas (F1, F2 e F3)

A análise aglomerativa hierárquica de cluster revelou o agrupamento de três

classes, nas quais a concentração das variáveis esteve relacionada às vogais

estudadas. Na classe 1, estiveram congregadas as emissões das vogais [a] e [Ɛ] para

todas as emissões produzidas por meio de instruções baseadas em metáforas e sem

instruções baseadas em metáforas, além das emissões de vogal [u] na metáfora

prisma e sem instruções baseadas em metáforas. Na classe 2 congregaram-se as

emissões da vogal [i] produzidas por meio de instruções baseadas nas três metáforas

estudadas. Finalmente, na classe 3 estiveram agrupadas as emissões da vogal [u] para

as metáforas catedral e disco voador.

52

A análise de correlação canônica revelou correlação de formante 1-F1 com as

seguintes medidas de imagens de trato vocal: distância língua-palato (88,5%), abertura

de lábios normalizada (84,9%), abertura de lábios absoluta (75,1%). Para formante 2-

F2, as correlações foram evidenciadas para medida de distância língua-faringe

(83,5%), elemento qualificador de deslocamento ântero-posterior (81,9%), abertura

mandibular (56,3%) e abertura de lábios normalizada (54,6%).

A análise de regressão linear revelou fator de correlação de 98,7% para medida

de F1, 93,6% para F2 e 71,3% para F3 em relação às medidas de imagens do trato

vocal (Figura 17).

53

Figura 17. Gráficos de análise de regressão linear de medidas de imagens do trato vocal e de

medidas acústicas de frequências formânticas (F1, F2 e F3).

Os gráficos da análise Ancova, com o detalhamento da influência de cada um

dos formantes para as variáveis metáforas e vogais, são apresentados na Figura 18.

As siglas MC, MDV, MP e SM encontradas na parte inferior da figura referem-se

respectivamente às metáforas catedral, disco voador, prisma e sem metáfora.

54

55

Figura 18. Gráficos de análise Ancova para relação de medidas acústicas das frequências

formânticas (F1, F2 e F3) em relação às metaforas (coluna à esquerda) e às vogais analisadas

(coluna à direita)

A análise discriminante aplicada às frequências formânticas para detecção das

emissões estudadas (produzidas por meio de instruções baseadas em metáforas e

sem instruções baseadas em metáforas) não revelou possibilidade de segregação das

emissões. Quando aplicada a análise para as medidas de frequências formânticas para

detecção das vogais, o poder de estimação foi de 100% das emissões (Tabela 4 e

Figura 19).

Tabela 4. Matriz de confusão para resultados de validação cruzada da análise discriminante

para vogais a partir das medidas acústicas de frequências formânticas- F1, F2 e F3

de \ a [a] [i ] [u] [ɛ] Total % correto

[a] 4 0 0 0 4 100,00%

[i ] 0 8 0 0 8 100,00%

[u] 0 0 4 0 4 100,00%

[ɛ] 0 0 0 4 4 100,00%

Total 4 8 4 4 20 100,00%

Os dados da distribuição de centróides para estimação das vogais a partir das

medidas de frequências formânticas (F1, F2 e F3) são apresentados na Figura 19.

56

Figura 19. Gráfico de centróides da análise discriminante para estimação das vogais a partir

das medidas de frequências formânticas (F1, F2 e F3)

Os fatores que influenciaram a segregação das vogais referiram-se às medidas

de F1 (90,4%) e de F2 (72,3%).

No caso da análise discriminante aplicada às medidas de imagem do trato vocal

para detecção de metáforas, o melhor índice (60%) foi alcançado para a emissão

produzida por meio de instrução baseada na metáfora catedral (Tabela 5 e Figura 20).

Tabela 5. Matriz de confusão para resultados de validação cruzada da análise discriminante

para metáforas a partir das medidas de imagem do trato vocal

de \ a Catedral Disco

voador Prisma Metáfora Total %

correto

Catedral 3 1 1 0 5 60,00% Disco voador 0 1 2 2 5 20,00%

Prisma 2 0 1 2 5 20,00% Sem

Metáfora 1 2 1 0 4 0,00%

Total 6 4 5 4 19 26,32%

57

Os dados da distribuição de centróides para estimação das vogais a partir das

medidas de imagem do trato vocal são apresentados na Figura 20.

Figura 20. Gráfico de centróides da análise discriminante para estimação das metáforas a partir

das medidas de imagem do trato vocal

Os fatores que influenciaram a segregação referiram-se às medidas de abertura

de lábios normalizada (51,1%), abertura de lábios absoluta (42,9%) e de distância

língua-palato (53,3%).

No caso da análise discriminante aplicada às medidas de imagem do trato

vocal para detecção de vogais, o poder segregatório foi total (Tabela 6 e Figura 21).

Tabela 6. Matriz de confusão para resultados de validação cruzada da análise discriminante

para vogais a partir das medidas de imagem do trato vocal

58

de \ a [a] [i] [u] [ɛ] Total

%

correto

[a] 4 0 0 0 4 100,00%

[i] 0 7 0 0 7 100,00%

[u] 0 0 4 0 4 100,00%

[ɛ] 0 0 0 4 4 100,00%

Total 4 7 4 4 19 100,00%

Figura 21. Gráfico de centróides da análise discriminante para estimação das vogais a partir

das medidas de imagem do trato vocal

Os fatores que influenciaram a segregação referiram-se à qualificação de

deslocamento ântero-posterior (99,3%), medidas de distância língua-faringe (98,3%),

de distância língua-palato (97%), abertura de lábios absoluta (87,5%) e abertura de

mandíbula (81%).

No caso da análise discriminante aplicada às medidas acústicas de frequências

formânticas e de imagem do trato vocal para detecção de metáforas, o poder

segregatório foi parcial (20 a 60%), sendo, a mais elevada, para a metáfora catedral

(Tabela 7 e Figura 22).

59

Tabela 7. Matriz de confusão para resultados de validação cruzada da análise discriminante

para metáforas a partir das medidas acústicas de frequências formânticas e de imagem do trato

vocal

de \ a Catedral Disco

Voador Prisma Sem

Metáfora Total % correto

Catedral 3 1 1 0 5 60,00%

Disco Voador 1 2 0 2 5 40,00%

Prisma 2 1 1 1 5 20,00%

Sem Metáfora 0 1 2 1 4 25,00%

Total 6 5 4 4 19 36,84%

Figura 22. Gráfico de centróides da análise discriminante para estimação das metáforas a partir

das medidas de frequências formânticas e de medidas de imagem do trato vocal

Os fatores que influenciaram a segregação referiram-se à abertura de lábios

absoluta (37,2%), abertura de lábios normalizada (35,9%), distância língua-palato

(36,8%) e F3 (34,6%).

As informações referentes à distribuição das medidas acústicas de frequências

formânticas (F1, F2 e F3 tabelas 1 e 2) e de medidas de imagem do trato vocal são

apresentadas graficamente nas figuras 23 e 24.

60

Figura 23. Gráfico radar da distribuição das frequências formânticas nas diversas emissões

estudadas

Figura 24. Gráfico radar da distribuição das medidas de imagens do trato vocal nas diversas

emissões estudadas

61

5.2. Experimento 2- Análise acústica de emissões em voz cantada (produzidas

por meio de instruções baseadas em metáforas) por cantoras e não cantoras

Os resultados desta etapa de estudos são apresentados enquanto dados

acústicos (medidas extraídas pelo script ExpressionEvaluator e medidas de

frequências formânticas - F1, F2 e F3), além de dados de prontidão extraídos pelo

script ExpressionEvaluator para as emissões em voz cantada produzidas por meio de

instruções baseadas em metáforas por cantoras e não cantoras.

5.2.1. Medidas acústicas extraídas pelo script ExpressionEvaluator e de

frequências formânticas (F1, F2 e F3)

As informações referentes às medidas acústicas extraídas por meio do script

ExpressionEvaluator para as emissões em voz cantada produzidas por meio de

instruções baseadas em metáforas (prisma, catedral e disco voador) e sem instruções

baseadas em metáforas são apresentados nas Tabelas 8 e 9.

Tabela 8. Valores de médias e desvio padrão de medidas acústicas do script

ExpressonEvaluator para as emissões em voz cantada produzidas por meio de instruções

baseadas em metáforas (catedral, prisma e disco voador) e sem instruções baseadas em

metáforas

62

Metáfora

\ Medida

acústica

Mediana

de f0

Semi-

amplitude

entre

quartis de

f0

Quantil

99,5%

de f0

Assimetria

de f0

Média

de 1a.

derivada

de f0

Desvio

padrão

de 1a.

derivada

de f0

Assimetria

de 1a.

derivada

de f0

Assimetria

de

intensidade

Média

de

declínio

espectral

Desvio

padrão

de

declínio

espectral

Assimetria

de

declínio

espectral

Desvio

Padrão

LTAS

Catedral 351,320 121,858 1,049 -0,105 0,068 0,011 -1,703 3,167 1,987 2,430 1,452 0,920

Disco

Voador 326,800 121,795 0,972 -0,043 0,053 0,011 -1,483 2,913 2,477 2,920 1,391 1,119

Prisma 324,200 121,745 0,933 -0,058 0,067 0,010 -2,830 2,897 2,117 2,580 1,445 0,970

Sem

metáfora 310,512 121,665 0,858 -0,074 0,055 0,010 -2,560 2,277 2,377 2,820 1,402 1,151

Média 330,92 121,76 0,95 -0,09 0,06 0,01 -2,13 2,72 2,18 2,63 1,43 1,04

Desvio

Padrão 16,98 0,08 0,08 0,03 0,01 0,00 0,65 0,38 0,23 0,22 0,03 0,11

63

Tabela 9. Resultados do teste de distâncias de Fisher (p-valores) para as médias de

medidas acústicas do script ExpressionEvaluator para as emissões em voz cantada

produzidas por meio de instruções baseadas em metáforas (catedral, prisma e disco

voador) e sem instruções baseadas em metáforas

Catedral Disco Voador Prisma Sem Metáfora

Catedral 1 < 0,0001* 0,343 < 0,0001*

Disco Voador < 0,0001* 1 0,065 0,115

Prisma 0,343 0,065 1 0,053

Sem metáfora < 0,0001* 0,115 0,053 1

*p<0,01

As informações referentes às medidas acústicas de frequências

formânticas (F1, F2 e F3) para as emissões produzidas por meio de instruções

baseadas em metáforas (prisma, catedral e disco voador) e sem instruções

baseadas em metáforas são apresentadas nas tabelas 10 e 11.

Tabela 10. Valores de média e desvio padrão de medidas acústicas – frequências

formânticas- para as emissões produzidas por meio de instruções baseadas em

metáforas (catedral, prisma e disco voador) e sem instruções baseadas em metáforas.

64

Metáfora \ Medida

acústica (emissão)

F 1

(a1)

F2

(a1)

F3

(a1)

F1

(a2)

F2

(a2)

F3

(a2)

F1

(a3)

F2

(a3)

F3

(a3)

Catedral 869,133 1420,100 2804,300 885,400 1508,733 2773,867 874,367 1461,600 2715,533

Disco Voador 838,933 1471,267 2948,833 854,067 1496,067 2851,467 824,767 1429,367 2729,333

Prisma 869,900 1497,033 2851,300 862,033 1522,567 2769,467 901,967 1475,933 2687,267

Sem metáfora 861,267 1529,233 2878,400 898,500 1520,233 2663,567 847,833 1486,667 2740,300

Média 859,81 1479,41 2870,71 875,00 1511,90 2764,59 862,23 1463,39 2718,11

Desvio Padrão 14,45 46,10 60,41 20,55 12,16 77,16 33,35 24,90 22,92

65

Tabela 11. Resultados do teste de distâncias de Fisher (p-valores) para as médias de

medidas acústicas – frequências formânticas- para as emissões em voz cantada

produzidas por meio de instruções baseadas em metáforas (catedral, prisma e disco

voador) e sem instruções baseadas em metáforas

Catedral

Disco

Voador Prisma

Sem

metáfora

Catedral 1 0,161 0,211 0,044

Disco Voador 0,161 1 0,110 0,297

Prisma 0,211 0,110 1 0,017

Sem metáfora 0,044 0,297 0,017 1

*p<0,01

A análise aglomerativa hierárquica de cluster revelou 3 agrupamentos

em termos das medidas acústicas abordadas: classe 1 (todas as medidas

acústicas geradas pelo script ExressionEvaluator), classe 2 (medidas de

frequências formânticas- F1 e F2) e Classe 3 (medida de frequência

formântica- F3). Tais achados reforçam a demanda por abordagem

diferenciada dos grupos de medidas acústicas (extraídas pelo script

ExpressionEvaluator e de frequências formânticas-F1, F2 e F3).

A análise discriminante aplicada ao conjunto de medidas acústicas

(script ExpressionEvaluator e frequências formânticas) para detecção das

metáforas estudadas revelou possibilidade parcial de segregação das

metáforas (40 a 66,67%) Tabela 12 e Figura 25.

Tabela 12. Matriz de confusão para resultados de validação cruzada da análise

discriminante para metáforas a partir das medidas acústicas (script Expression

Evaluator e frequências formânticas)

66

de \ a Catedral

Disco

Voador Prisma

sem

metáfora Total

%

correto

Catedral 20 2 5 3 30 66,67%

Disco Voador 4 13 6 7 30 43,33%

Prisma 7 6 12 5 30 40,00%

Sem metáfora 2 9 5 14 30 46,67%

Total 33 30 28 29 120 49,17%

Figura 25. Gráfico de centróides da análise discriminante para estimação das

metáforas a partir das medidas acústicas (script Expression Evaluator e frequências

formânticas)

Os fatores que influenciaram a segregação referiram-se às medidas de

declínio espectral (39,7%), assimetria de intensidade (30,9%), formante 1-F1

(35,2%) e assimetria de f0 (26,9%).

A análise discriminante aplicada ao conjunto de medidas acústicas

(script ExpressionEvaluator) para detecção das metáforas estudadas revelou

possibilidade parcial de segregação das emissões (26,67% para a metáfora

prisma ao máximo de 60% para a metáfora catedral) Tabela 13 e Figura 26.

67

Tabela 13. Matriz de confusão para resultados de validação cruzada da análise

discriminante para metáforas a partir das medidas acústicas (script

ExpressionEvaluator)

de \ a Catedral

Disco

Voador Prisma

Sem

metáfora Total

%

correto

Catedral 18 5 6 1 30 60,00%

Disco Voador 4 11 6 9 30 36,67%

Prisma 10 7 8 5 30 26,67%

Sem metáfora 3 5 10 12 30 40,00%

Total 35 28 30 27 120 40,83%

Figura 26. Gráfico de centróides da análise discriminante para estimação das

metáforas a partir das medidas acústicas (script Expression Evaluator)

Os fatores que influenciaram a segregação referiram-se às medidas de

declínio espectral (desvio padrão: 62,4%; média: 77%), assimetria de f0

(53,9%) e assimetria de intensidade (50,7%).

A análise discriminante aplicada ao conjunto de medidas acústicas

(frequências formânticas) para detecção das metáforas estudadas revelou

possibilidade parcial de segregação das emissões (26,67% para a metáfora

68

disco voador ao máximo de 46,67% para as emissões sem metáfora) - Tabela

14 e Figura 27.

Tabela 14. Matriz de confusão para resultados de validação cruzada da análise

discriminante para metáforas a partir das medidas acústicas (frequências formânticas)

de \ a Catedral

Disco

Voador Prisma

sem

metáfora Total % correto

Catedral 8 6 9 7 30 26,67%

Disco Voador 7 7 6 10 30 23,33%

Prisma 10 5 11 4 30 36,67%

Sem metáfora 2 8 6 14 30 46,67%

Total 27 26 32 35 120 33,33%

Figura 27. Gráfico de centróides da análise discriminante para estimação das

metáforas a partir das medidas (frequências formânticas)

Os fatores que influenciaram a segregação referiram-se à medida de

frequência formântica- F1 (43,9%).

As informações referentes às medidas acústicas extraídas por meio do

script ExpressionEvaluator para as emissões de cantoras e não cantoras são

apresentadas nas Tabelas 15 e 16.

69

Tabela 15. Valores de médias e desvio padrão de medidas acústicas do script ExpressionEvaluator para as emissões de cantoras e não

cantoras

Experiência canto\

Medidas acústicas

Mediana

de f0

Semi-

amplitude

entre

quartis

de f0

Quantil

99,5%

de f0

Assimetria

de f0

Média

de 1a.

derivada

de f0

Desvio

padrão

de 1a.

derivada

de f0

Assimetria

de 1a.

derivada

de f0

Assimetria

de

intensidade

Média

de

declínio

espectral

Desvio

padrão

de

declínio

espectral

Assimetria

de

declínio

espectral

Desvio

Padrão

LTAS

Cantora 368,360 122,008 1,181 -0,085 0,067 0,012 -0,128 3,092 2,207 2,667 1,429 1,010

Não Cantora 288,056 121,523 0,725 -0,056 0,055 0,010 -4,160 2,535 2,272 2,708 1,416 1,070

Média 328,21 121,77 0,95 -0,07 0,06 0,01 -2,14 2,81 2,24 2,69 1,42 1,04

Desvio Padrão 56,78 0,34 0,32 0,02 0,01 0,00 2,85 0,39 0,05 0,03 0,01 0,04

70

Tabela 16. Resultados do teste de distâncias de Fisher (p-valores) para as médias de

medidas acústicas do script ExpressionEvaluator para as emissões de cantoras e não

cantoras

Cantoras Não Cantoras

Cantoras 1 < 0,0001*

Não Cantoras < 0,0001* 1

*p<0,01

As informações referentes às medidas acústicas de frequências

formânticas para as emissões de cantoras e não cantoras são apresentadas

nas Tabelas 17 e 18.

Tabela 17. Valores de média e desvio padrão de frequências formânticas para as

emissões 1, 2 e 3 da vogal [a] em “sapo” para as emissões de cantoras e não cantoras

Tabela 18. Resultados do teste de distâncias de Fisher (p-valores) para as médias de

medidas acústicas – frequências formânticas (F1, F2 e F3)- para as emissões 1, 2 e 3

da vogal [a] em “sapo” para as emissões de cantoras e não cantoras

Cantoras Não Cantoras

Cantoras 1 < 0,0001*

Não Cantoras < 0,0001* 1

*p<0,01

Experiência

canto \

Medida

acústicas

F1

(a1)

F2

(a1)

F3

(a1)

F1

(a2)

F2

(a2)

F3

(a2)

F1

(a3)

F2

(a3)

F3

(a3)

Cantora 818,817 1385,267 2821,450 859,517 1442,800 2636,400 828,950 1348,183 2595,800

Não

Cantora 900,800 1573,550 2919,967 890,483 1581,000 2892,783 895,517 1578,600 2840,417

Média 859,81 1479,41 2870,71 875,00 1511,90 2764,59 862,23 1463,39 2718,11

Desvio

Padrão 57,97 133,14 69,66 21,90 97,72 181,29 47,07 162,93 172,97

71

A análise discriminante aplicada ao conjunto de medidas acústicas

(script ExpressionEvaluator) para detecção dos grupos de cantoras e não

cantoras estudadas revelou possibilidade de segregação das emissões (85%

não cantoras e 90% cantoras) Tabela 19 e Figura 28.

Tabela 19. Matriz de confusão para resultados de validação cruzada da análise

discriminante para grupo de cantoras e não cantoras a partir das medidas acústicas

(script ExpressionEvaluator)

de \ a Cantoras

Não

Cantoras Total

%

correto

Cantoras 54 6 60 90,00%

Não Cantoras 9 51 60 85,00%

Total 63 57 120 87,50%

Figura 28. Gráfico de centróides da análise discriminante para estimação dos grupos

de cantoras e de não cantoras a partir das medidas acústicas (script

ExpressionEvaluator)

Os fatores que influenciaram a segregação referiram-se às medidas de

f0 (quantil 99,5%: 86,6%; semiamplitude entre quartis: 85,8% e mediana:

84,1%) e assimetria de intensidade (55,1%).

72

A análise discriminante aplicada ao conjunto de medidas acústicas

(frequências formânticas-F1, F2 e F3) para detecção dos grupos de cantoras e

não cantoras estudadas revelou possibilidade de segregação das emissões

(78,33% para não cantoras e 75% para cantoras)- Tabela 20 e Figura 29.

Tabela 20. Matriz de confusão para resultados de validação cruzada da análise

discriminante para grupo de cantoras e não cantoras a partir das medidas acústicas

(frequências formânticas-F, F2 e F3)

de \ a Cantoras

Não

Cantoras Total % correto

Cantoras 45 15 60 75,00%

Não Cantoras 13 47 60 78,33%

Total 58 62 120 76,67%

Figura 29. Gráfico de centróides da análise discriminante para estimação dos grupos

de cantoras e de não cantoras a partir das medidas acústicas (frequências

formânticas-F1, F2 e F3)

Os fatores que influenciaram a segregação referiram-se basicamente às

medidas de F2 em suas três repetições (82,4% a 52,10%).

73

5.2.2. Dados de prontidão extraídos pelo script ExpressionEvaluator

Quanto ao aspecto prontidão, a análise de regressão linear detectou

98,8% de correlação às medidas do script ExpressionEvaluator (Figura 30):

Figura 30. Gráfico de análise de regressão linear de medidas acústicas do script

ExpressionEvaluator e prontidão

Os fatores que influenciaram a segregação referiram-se basicamente às

medidas de declínio espectral (assimetria: 95,4%, média: 90,3%, desvio

padrão: 77,2 %) e LTAS- desvio padrão (90,07%).

Quanto ao mesmo aspecto de prontidão, a análise de regressão linear

detectou 68,2% de correlação às medidas de frequências formânticas (Figura

31):

74

Figura 31. Gráfico de análise de regressão linear de medidas acústicas de frequências

formânticas- F1, F2 e F3 para as várias emissões da vogal [a] (a1, a2, a3) e prontidão

Os fatores que influenciaram a segregação referiram-se basicamente às

medidas de formante - F1 em suas várias repetições (61% a 55,1%).

Quanto ao aspecto prontidão, a análise de regressão linear detectou

99% de correlação ao conjunto de medidas do script ExpressionEvaluator e de

frequências formânticas (Figura 32):

75

Figura 32. Gráfico de análise de regressão linear de medidas acústicas do script

ExpressionEvaluator conjugadas às de frequências formânticas (para as várias

emissões da vogal [a] - a1, a2, a3) e prontidão

Os fatores que influenciaram a segregação referiram-se basicamente às

medidas de declínio espectral (assimetria: 95,4% e média: 90,3%) e LTAS-

desvio padrão (90,7%).

A análise de regressão linear da prontidão em relação às variáveis

qualitativas (tipo de emissão- metáforas, grupo (cantoras e não cantoras) e

sujeitos) revelou 86,5% de correlação (Figura 33):

76

Figura 33. Gráfico de análise de variáveis qualitativas: grupo (cantoras e não

cantoras), sujeitos, tipo de emissão (metáforas) em relação à prontidão

Análise Anova de relação prontidão e grupo (cantoras e não cantoras)

revelou baixa correlação (0,5%).

Análise Anova de relação prontidão e sujeitos revelou correlação de

75,6%- Figura 34.

Figura 34. Gráfico de análise ANOVA de variáveis qualitativas (sujeitos) e prontidão

Análise Anova de relação prontidão e instrução (metáforas) revelou

baixa correlação (5,2%).

77

6. DISCUSSÃO

Diante da proposta de investigação da atividade do trato vocal por meios

acústico e articulatório (imagem do trato vocal, mais especificamente, imagens

videofluoroscópicas), especialmente no que se refere às metáforas utilizadas

como instruções para o canto, este tópico visa articular os achados dos dois

experimentos apresentados. Para tanto, num primeiro momento, são discutidos

os dados de cada experimento de forma separada, e, ao final, de forma

integrada.

O primeiro experimento contemplou um estudo de caso que envolveu

análise acústica e de imagem do trato vocal por meio da técnica de

videofluoroscopia por uma informante não cantora. O segundo experimento

explorou dados acústicos de dois grupos: cantoras e não cantoras.

6.1. Experimento 1- Análise integrada de dados acústicos e de imagem do trato vocal: um estudo de caso

No experimento 1, o enfoque recaiu na descrição preliminar dos achados

acústicos e articulatórios gerados por registros de emissões em voz cantada

produzidos por meio de instruções baseadas em metáforas, a partir da técnica

da videofluoroscopia.

A inspeção visual dos registros de imagem do trato vocal revelou, num

primeiro momento, a maior tendência à abertura mandibular na metáfora

catedral, especialmente para as vogais aberta [a] e semiaberta [Ɛ] estudadas.

78

Quando consideradas as medidas acústicas (frequências formânticas),

as metáforas catedral e disco voador revelaram similaridade de achados,

sendo que na vogal [u] todas as frequências formânticas estiveram rebaixadas

quando comparadas à emissão sem instrução baseada em metáforas. Tal

achado revela a tendência de alongamento do trato vocal e a possibilidade de

implementação de ajuste de laringe abaixada (KENT, READ, 1992;

MEDEIROS, 2002). Para as demais emissões vocálicas, houve tendência a

rebaixamento de frequências de F1 e F2 e padrão variável de valores de F3.

Para a metáfora disco voador, F1 revelou tendência a rebaixamento de

frequência para a maioria das vogais, enquanto F2 apresentou-se rebaixado

em frequência em todas as vogais e apresentou padrão variável de valores de

F3. As medidas acústicas representativas de emissões produzidas por meio de

instrução baseada na metáfora prisma foram similares às emissões produzidas

sem instruções baseadas em metáforas.

As interações de f0 com as frequências formânticas têm sido exploradas

no universo do canto há algumas décadas (SUNDBERG,1990; SUNDBERG,

SKOOG, 1997), com destaque para a sintonia de frequências de formantes

mais graves (especialmente F1 e F2) com os primeiros harmônicos,

especialmente nas vozes femininas mais agudas, que geralmente são

produzidas em tratos vocais de menor extensão, como aqueles de sopranos

(SUNDBERG, 1975; CARLSSON, SUNDBERG, 1992; SUNDBERG, SKOOG,

1997). Tal efeito confere uma sensação de facilidade, suavidade ao cantar em

tons agudos, mas não pode ser encarado com um princípio geral no canto,

especialmente por questões relativas à própria qualidade da emissão produzida

(CARLSSON, SUNDBERG, 1992). A sintonia é alcançada por meio de abertura

79

mandibular, que permite manter os níveis da frequência de F1 elevados

(SUNDBERG, SKOOG, 1997), destacando-se que a abertura mandibular é

importante no canto, mas não o único recurso para projeção vocal e não

restrita a sopranos.

Do ponto de vista das medidas de mobilizações de articuladores

extraídas das imagens videofluoroscópicas do trato vocal durante a produção

de voz cantada, algumas tendências foram reveladas para cada emissão

produzida por meio de instruções baseadas em metáforas: catedral (maior grau

de abertura de lábios e mandíbula, além de expansão faríngea), prisma (maior

grau de abertura de lábios, sem correspondente em termos da abertura de

mandíbula, língua elevada e menor amplitude de faringe) e disco voador

(menor grau de abertura de lábios e mandíbula, língua elevada e expansão

faríngea). Desta exposição, depreende-se que as instruções baseadas na

metáfora catedral promoveram, no sujeito estudado, maiores efeitos sobre os

ajustes de mandíbula e de faringe; as instruções baseadas na metáfora prisma

promoveram ajustes de lábios, enquanto as instruções baseadas na metáfora

disco voador centraram-se no estímulo à implementação de ajustes de língua e

de mandíbula.

Destas observações, destacamos que o estudo de imagens do trato

vocal permitiu revelar refinamentos e detalhes dos efeitos das mobilizações do

trato vocal em resposta ao uso de instruções baseadas em metáforas.

Conforme salientado, para algumas emissões, houve sugestões, reforçadas

por dados acústicos, de que haveria um alongamento do trato vocal,

possivelmente por abaixamento da laringe. Estudo de Sundberg (1970) já

80

destacava que o rebaixamento de F2 sofria influências de abaixamento

laríngeo no canto.

Dados de mobilização laríngea não foram mensurados tanto pela

ausência de referências de uso do software Osiris para tal medida, quanto pela

dificuldade para delimitar a borda inferior da cartilagem cricóide (WILIAMS,

ECCLES, 1990), especialmente diante da área delimitada nas imagens

videofluoroscópicas coletadas.

De acordo com Sousa et al (2010), após análise de questionários

aplicados a professores de canto, nota-se que há correspondências de ações

musculares vinculadas às metáforas. No caso das metáforas “voz como uma

lâmpada” e “bolha de sabão” estimam-se atividade fonatória e pressão

subglótica equilibradas, além disso, sugerem maior atenção e percepção

auditiva. Na metáfora “cúpula de uma igreja dentro da boca” há

correspondências com a elevação da região do palato. Em comparação aos

dados do experimento 1, a metáfora catedral apresentou a similaridade em

termos de atividade muscular, uma vez que há efeitos de ajustes de mandíbula

e de dimensão faríngea em sua produção.

Dessa maneira, há indícios de que as instruções baseadas em

metáforas tenham levado o sujeito estudado a promover ajustes diferenciados

de trato vocal em função da exposição ao estímulo de instruções baseadas em

metáforas para a produção de emissões em voz cantada (CLEMENTS, 2008;

SOUSA et al, 2010; ROSSBACH, 2011).

Sundberg (1970) conduziu estudo comparativo entre fala e canto, com

experimento baseado em coleta de dados radiográficos e acústicos. Na

descrição de esquemas de imagens referentes ao canto, com a ressalva de

81

que estudou apenas informantes do gênero masculino, a descrição

assemelhou-se a dados de algumas das metáforas estudadas, especialmente

catedral e disco voador, quanto à ampliação de faringe e ao abaixamento de

laringe. Tais indicações reforçam que as metáforas colaboraram para

implementação de ajustes de qualidade vocal característicos de emissões em

voz cantada e essas representações simbólicas são capazes de gerar

diferentes sensações proprioceptivas, motoras e táteis (FONAGY, 2000).

Desta forma, a análise conjugada de dados acústicos e de medidas de

imagens do trato vocal mostrou-se promissora para o enfoque das

mobilizações desenvolvidas para a emissão em voz cantada. Os dados de

outros sujeitos poderiam agregar maiores informações sobre a questão do uso

das metáforas como elementos de instrução para que o cantor (e o aprendiz de

canto) possa atingir ajustes no trato vocal que contemplem os esfeitos estéticos

desejáveis (CLEMENTS, 2008; SOUSA et al, 2010; ROSSBACH, 2011).

Retomando os dados do experimento, a análise discriminante de todas

as medidas de frequências formânticas para estimação das metáforas revelou

que não houve diferenciação das emissões, ou seja, as medidas acústicas

(frequências formânticas) não permitiram diferenciar as emissões produzidas

por meio de instruções baseadas em metáforas, mas, em contrapartida,

segregaram as diferentes vogais estudadas. Tais achados podem estar

relacionados ao fato de que todas as vogais foram analisadas de forma

conjugada. Não houve condições de análise diferenciada por vogais, uma vez

que não havia repetições, em função das razões de biossegurança

anteriormente expostas no capítulo de metodologia (tempo de exposição à

radiação).

82

Neste tocante, os achados de análise aglomerativa hierárquica de

cluster reforçaram tal tendência, uma vez que as três classes geradas

agruparam as vogais, de forma mais consistente que as metáforas, ou seja, os

agrupamentos revelaram a segregação predominante das classes em função

das vogais estudadas.

Refletindo sobre esse aspecto, sugerimos que outras técnicas já

utilizadas em pesquisas de atividade do trato vocal na fala e no canto, tais

como a ressonância magnética (GREGIO, 2006; SUNDBERG, 2008;

VENTURA et al, 2010) ou ultrassonografia para imagens de língua (SVICERO,

2012), as quais permitem o registro de maiores números de repetições de

emissões, sejam futuramente empregadas.

Para análise de vogais e o poder segregatório das medidas formânticas,

detectou-se a influência de medidas de F1 e F2, em concordância com a

literatura fonética, no sentido de que a identidade fonética das vogais é

garantida pela combinação das medidas de F1 e F2 (FANT, 1960; KENT,

READ, 1992; MEDEIROS, 2002) e que situações específicas do canto levam a

padrões peculiares de distribuição de frequências formânticas (SUNDBERG,

1970; SUNDBERG,1982; SUNDBERG, 1990; MEDEIROS, 2002; VIEIRA,

2004; HANAYAMA et al, 2009).

Outro aspecto interessante, relatado em estudo com dados acústicos e

articulatórios- tomografia computadorizada, refere-se à dificuldade em se

estimar a área da faringe, apesar de sua importante contribuição na ação de

filtro de trato vocal (SUNDBERG et al, 1987). O estudo, com base em registros

vocálicos de dois falantes (um homem e uma mulher), revelou a possibilidade

de que as diferenças entre homens e mulheres em termos de dimensões

83

faríngeas estariam concentradas nas porções superior e inferior e não na

porção média. Dados de qualidades diferenciadas de efeitos na qualidade

vocal a partir da contração de músculos constritores superior, médio e inferior

da faringe também foram descritos em publicações que enfocam a fisiologia da

voz (PINHO, PONTES, 2008; HANAYAMA et al, 2009).

Do ponto de vista dos dados de análise de imagem do trato vocal, a

análise discriminante revelou poder segregatório parcial para estimação das

metáforas estudadas (máximo de 60% para catedral), com infuência das

medidas de abertura de lábios (absoluta e normalizada) e distância língua-

palato. Por outro lado, a análise discriminante de medidas de imagem de trato

vocal para segregação das vogais, revelou a taxa de segregação total (100%),

com maior influência do elemento qualificador de deslocamento ântero-

posterior de língua, medidas de distância língua-faringe, língua-palato, abertura

de lábios e de mandíbula.

Do ponto de vista das correlações acústico-articulatórias, a análise

fatorial revelou agrupamento das medidas acústicas de F1 com medidas de

distância língua-faringe e língua-palato, enquanto F2 agrupou-se a elemento

qualificador de deslocamento ântero-posterior de língua, além de abertura de

lábios e mandibula. Complementar à análise de agupamentos, quando

aplicados os testes estatísticos de correlações, a análise de correlação

canônica revelou correlações de medidas acústicas de F1 a medidas de

distância dorso de língua-palato, que expressa o grau de altura da língua, de

abertura de lábios (absoluta e normalizada); enquanto medidas acústicas de F2

correlacionaram-se a medida de distância língua-faringe, que expressa o

deslocamento ântero-posterior, e elemento qualificador de deslocamento

84

ântero-posterior de língua e medida de abertura mandibular. Tais dados são

compatíveis com os fundamentos da teoria acústica da produção da fala,

conforme abaixo exposto, exceto pela associação de medidas de F2 a abertura

mandibular.

Quanto a estes achados, o diâmetro das cavidades e a extensão total do

trato vocal influenciam a descrição e a caracterização acústica das vogais

(LIEBERMAN, BLUMSTEIN, 1988). Tal caracterização fonética é propiciada

pela análise dos formantes (FANT, 1960), destacando-se que as medidas de

frequências de F1 e F2 são influenciadas pelos movimentos de língua, sendo

F1 pela movimentação no eixo vertical (movimentação de mandíbula) e F2 no

eixo horizontal (movimentação ântero-posterior), enquanto as medidas F3

estão relacionadas ao grau de passagem da constrição (FANT, 1960; KENT,

READ, 1992).

Neste ponto da discussão, cabe retomar as referências de Sundberg

(1970, 1982, 1990, 1992) a particularidades da emissão em voz cantada em

relação à fala, destacando justamente a influência do ajuste de abertura

mandibular, cujos efeitos acústicos seriam inicialmente esperados sobre F1:

parece poder ser atribuída a uma compensação do efeito de abaixamento de

laringe, sendo que, em estudo de estimação de efeitos acústicos em função de

dados articulatórios, Sundberg (1970) destacou que F2 também sofreria

influências mais acentuadas do ajuste de laringe abaixada na situação de

canto.

Retomando estudos da voz cantada feminina, de acordo com Vieira

(2004), pela iniciativa de projetar sua voz tais cantoras realizam o abaixamento

de mandíbula e tal ajuste faz coincidir os valores de F1 com os da frequência

85

fundamental, permitindo maior audibilidade vocal. Todavia, o que também se

pode notar nesse pareamento de valores é pouca inteligibilidade do texto (DI

CARLO, 1994) o qual era visto anteriormente somente como problema de má

articulação das vogais e consoantes durante o canto (MEDEIROS, 2002).

Finalmente, a análise de regressão linear revelou correlações entre as

imagens do trato vocal com as medidas acústicas de F1 e F2, novamente

reforçando o aspecto da identidade fonética das vogais, garantida pela

combinação das informações acústicas de F1 e F2 (FANT, 1960; KENT, READ,

1992).

Além disso, a participante do estudo de caso, não era, de fato, cantora e,

portanto, os ajustes implementados podem ser mais próximos àqueles usados

na fala. Tais dados podem representar a demanda com que o professor de

canto poderá se deparar ao iniciar o trabalho de instrução por meio de

metáforas.

Existem estudos na literatura sobre análise de formantes durante a

produção de fala (MENDES, 2003; OLIVEIRA, 2011), durante a produção de

fala e canto (MEDEIROS, 2002) e de fala com análise associada de imagem de

ultrassonografia (SVICERO, 2012).

Medeiros (2002) aponta que as vogais produzidas durante o canto

revelam ajustes de abaixamento da mandibula (SUNDBERG, 1970;

SUNDBERG, 1977) e de menor avultamento da língua (com exceção da vogal

[a]) para manter afinação de f0, portanto, compatíveis com achados do

presente estudo, especialmente para a metáfora catedral, a qual revelou o

maior grau de abertura mandibular, especialmente nas vogais [a] e [Ɛ].

86

Sundberg (1970) também relatou efeitos acústicos e articulatórios

diferenciados no canto em função das vogais. No caso das anteriores, maiores

diferenças seriam encontradas na dimensão da cavidade faríngea e na

abertura labial, efeitos estes que poderiam estar relacionados aos ajustes de

abaixamento laríngeo e, portanto, a associação de tais mobilizações teria uma

base fisiológica, uma vez que ajuste de laringe elevada pode levar a efeitos

negativos na dinâmica de pregas vocais. Além disso, reforçou o cuidado em se

considerar a dependência dos achados à classificação vocal, pitch habitual no

canto e o formato do trato vocal do cantor estudado.

Retomando os dados de análise estatística do presente estudo, a

análise discriminante de medidas acústicas e de imagem do trato vocal com

metáfora revelou novamente poder segregatório parcial, com máximo de 60%

de poder discriminante para metáfora catedral e mínimo de 20% para disco

metáfora voador. Os fatores que influenciaram tal segregação referiram-se a

medidas de imagem do trato vocal: abertura de lábios (absoluta e normalizada),

distância língua-palato e medida acústica de F3. Em termos de F3, tem-se a

indicação de que a medida estaria mais relacionada a ajustes específicos de

qualidade vocal (portanto mais individuais) e não diretamente à identidade

fonética da vogal, quando considerados os preceitos de produção da fala

(KENT, READ, 1992; MEDEIROS, 2002).

A esta altura da discussão, cabe, finalmente, pontuar algumas limitações

experimentais em função dos procedimentos de coleta de dados, tais como: o

contexto das emissões vocálicas (não controlado para extração de medidas

formânticas); o tempo de exposição à radiação, limitando o tempo de coleta

(não foram registradas repetições de emissões, o que poderia permitir estudar

87

uma mesma vogal em diferentes repetições- como ocorreu no experimento 2);

a representatividade das vogais orais do português brasileiro (não foi possível o

registro de todas as vogais orais e, ainda, contamos com encontro vocálico,

como nos casos de rio e frio) e a qualidade da gravação do estímulo de áudio

para realização da análise acústica (dadas as condições do ambiente de

coleta, optamos por extrair a pista de áudio do próprio vídeo das imagens de

videofluoroscopia, cuja coleta ocorre em ambiente não tratado acusticamente).

Finalmente, não houve oportunidade de registro de outro sujeito de grupo de

cantores, o que poderia facilitar a comparação aos dados do experimento 2. O

experimento 2 foi concebido justamente para propiciar as condições

experimentais compatíveis com os procedimentos da Fonética Experimental

(BOIX, 1991), no enfoque dos efeitos o uso de metáforas como elementos de

instrução no ensino da voz cantada.

Diante das questões de pesquisa elencadas na introdução do presente

estudo, podemos destacar que os achados do experimento 1 sinalizam que

algumas das metáforas estudadas propiciaram mobilizações diferenciadas do

trato vocal, especialmente catedral e disco voador, que foram melhor

detalhadas por meio de descrições fisiológicas (imagens videofluoroscópicas

do trato vocal) das emissões de um sujeito não cantor. A análise de imagem

do trato vocal, a partir do conjunto de medidas elencado (abertura de lábios-

absoluta e normalizada, abertura de mandíbula, distância língua-faringe,

distância língua-palato e elemento qualificador de deslocamento ântero-

posterior de língua), permitiu a associação a medidas acústicas de frequências

formânticas (F1, F2 e F3), em correspondência aos preceitos do modelo fonte-

filtro para a produção das vogais (FANT, 1960; SUNDBERG, 1979;

88

SUNDBERG, 2003), e às particularidades do canto (SUNDBERG, 1970;

SUNDBERG, 1990; MEDEIROS, 2002). Neste aspecto, os achados reforçam a

viabilidade da metodologia adotada para o aprofundamento das correlações

acústico-articulatórias no estudo da voz cantada (SUNDBERG, 1970;

SUNDBERG et al, 1987; ERICSDOTTER et al, 1998; MEDEIROS 2002;

ECHTERNACH et al, 2008; SALOMÃO, 2008; SUNDBERG, 2008; DRAHAN et

al, 2012).

6.2. Experimento 2- Análise acústica de emissões em voz cantada

(produzidas por meio de instruções baseadas em metáforas) por cantoras

e não cantoras

Este experimento concentrou-se no detalhamento dos achados

acústicos gerados por registros de emissões em voz cantada, produzidos por

meio de instruções baseadas em metáforas por cantoras e não cantoras.

Do ponto de vista dos procedimentos de análise de dados adotados, a

análise aglomerativa hierárquica de cluster aplicada ao conjunto de medidas

acústicas revelou a segregação das medidas do script ExpressionEvaluator

(f0, primeira derivada de f0, intensidade, declínio espectral e espectro de longo

termo - LTAS) numa única classe, enquanto as medidas de frequências

formânticas segregaram-se em duas outras classes, agrupando-se F1 e F2 e

separando F3 numa classe distinta. Tais achados indicaram a demanda por

abordagem diferenciada dos dados do script ExpressionEvaluator e das

medidas de formantes na interpretação dos achados, sendo tal segregação

adotada na sequência desta discussão.

89

Do ponto de vista do conjunto de medidas acústicas adotado para este

experimento, as medidas do script ExpressionEvaluator, especialmente

aquelas relativas a frequência fundamental (f0), intensidade e declínio

espectral, mostraram algum grau de diferenciação na emissão em voz cantada

produzida por meio de instruções baseadas em metáforas, quando

comparadas às emissões produzidas sem metáforas. Para o caso das medidas

de frequências formânticas das várias emissões da vogal [a], os achados do

experimento revelaram apenas variações suaves entre as diferentes metáforas.

Para o caso das medidas acústicas do script ExpressionEvaluator, as

emissões que revelaram maior diferenciação em relação às emissões sem

metáforas foram aquelas referentes à metáfora catedral, seguida da metáfora

disco voador, dados estes confirmados pela análise estatística. As medidas

que revelaram maior diferenciação entre as metáforas referiram-se àquelas

relativas à f0 (mediana e quantil 99,5%), intensidade (assimetria) e declínio

espectral (média e desvio padrão). No caso da metáfora catedral, os valores de

mediana e de quantil 99,5% de f0 foram superiores aos demais, denotando

tendência a valores habituais de f0 elevados, bem como de limite superior de

frequência atingido nas emissões. Tais dados reforçam aspectos discutidos no

experimento 1 sobre a importância do mecanismo de controle de f0 no canto

(SUNDBERG, 1970; SUNDBERG, 1982; SUNDBERG, 1990; MEDEIROS,

2002).

Para as medidas de intensidade (assimetria), os valores aumentaram

gradativamente de emissões com instruções baseadas na metáfora prisma,

para disco voador e, finalmente, catedral. Para o caso das medidas de declínio

espectral, os valores revelaram-se menores para as emissões produzidas por

90

meio da instrução baseada em metáfora catedral (portanto maior nível de

adução glótica), sendo os maiores valores detectados para as emissões sob a

instrução da metáfora disco voador (portanto, com menor força de adução

glótica). Tais aspectos também reforçam as questões de independência dos

mecanismos de pitch e loudness no canto e o fato de que o nível de loudness

total da emissão pode não corresponder diretamente ao nível de pressão

sonora da emissão, devido à importância dos ajustes de trato vocal, traduzidos

na resposta acústica de formantes (SUNDBERG, 1970; SUNDBERG, 1982;

SUNDBERG, 1990).

A análise discriminante aplicada ao conjunto de medidas acústicas

(script ExpressionEvaluator e frequências formânticas) para estimação da

possibilidade de segregação das emissões produzidas por meio de instruções

baseadas em metáforas, revelou poder segregatório parcial (40 a 66,67%)

para a metáfora catedral – o maior índice, e o menor para prisma, em que

exerceram influência, em ordem descrescente, as medidas de declínio

espectral, de intensidade, de frequência formântica - F1 e de f0.

Quando consideradas somente as medidas geradas pelo script

ExpressionEvaluator, o poder segregatório foi, novamente, similar, entre 26%

a 60%, sendo o maior valor para a metáfora catedral, com influência, em

ordem descrescente, de medidas de declínio espectral , f0 e de intensidade.

Consideradas de forma isolada, as medidas de frequências formânticas

revelaram menor poder segregatório para estimação das metáforas (entre 26%

para disco voador e 46,6% para emissões sem metáfora), revelando que foram

menos sensíveis para detectar diferenças entre as várias emissões produzidas.

91

A partir da análise acústica das emissões estudadas no experimento 2,

foi possivel assinalar que as medidas de declínio espectral, intensidade e f0

foram mais sensíveis para a descrição das emissões em voz cantada

estudadas.

A partir destes achados, consideramos relevante ao estudo investigar as

particularidades dos grupos de informantes cantoras e não cantoras, a fim de

se estimar se a experiência em canto afetaria o uso do trato vocal para a

solicitacão específica da emissão em voz cantada.

Desta maneira, foram detectadas diferenças estatisticamente relevantes

tanto para as medidas do script ExpressionEvaluator, quanto de frequências

formânticas quando comparados os grupos de cantoras e não cantoras.

Quanto ao script ExpressionEvaluator, as cantoras apresentaram emissões em

voz cantada cujos valores de f0 (mediana, quantil 99,5% e assimetria) e de

intensidade (assimetria) revelaram-se elevados em relação às não cantoras.

Os valores de primeira derivada de f0 revelaram-se mais deslocados para

valores negativos no caso das não cantoras. Neste aspecto, há indícios de

variações menos suaves de f0, portanto mais abruptas (BARBOSA, 2009) para

as não cantoras. Tais dados sinalizam a demanda por controle de f0 e revelam

que se trata de um mecanismo complexo, em que interagem aspectos

fonatórios e de dinâmica respiratória (SUNDBERG, 1990). A demanda por

controle de f0 é muito refinada no canto, sendo que Sundberg (1975, 1989) e

Sundberg et al (1989) relataram que o efeito da pressão subglótica, pelo efeito

denominado tracheal pull (descida da laringe que ocorre em sincronia com o

movimento da respiração-inspiração) afeta f0 e que, no canto este controle é

decisivo, inclusive para se atingir os picos de f0.

92

Tais dados foram confirmados em série de estudos posteriores sobre os

efeitos do tracheal pull e reforçam a demanda por indepedência de f0 e

intensidade no plano acústico (SUNDBERG et al, 1989; SUNDBERG, 1992;

VILKMAN et al, 1996; IWARSSON et al, 1998; IWARSSON, 2001). Na fala, tal

indepedência não é necessária. Os dados das não cantoras deste estudo

revelam que tal dependência ainda parece não ocorrer, especialmente pela

congruência de medidas de f0, intensidade e declínio espectral.

Quanto aos valores de frequências formânticas, as não cantoras

revelaram valores elevados de F1, F2 e F3 quando comparados às cantoras.

Tais achados sinalizam tendência a encurtamento do trato vocal. Somados aos

dados de f0, estes dados sinalizam tendências à elevação de laringe e

aumento de tensão glótica (SUNDBERG, 1990).

Da mesma forma, a análise discriminante de medidas acústicas, tanto do

script ExpressionEvaluator, quanto de frequências formânticas, revelou poder

segregatório das emissões dos grupos cantoras e de não cantoras. Quando

consideradas as medidas do script ExpressionEvaluator, o poder segregatório

de emissões de cantoras atingiu 90% contra 85% das não cantoras. Foram

relevantes, em ordem descrescente de influência, as medidas de f0 (quantil

99,5%, semiamplitude entre quartis e mediana) e de intensidade (assimetria).

Quando analisadas as medidas de frequências formânticas, os valores foram

ligeiramente inferiores, com 75% de identificação das emissões de cantoras e

78,33% de não cantoras, com influência dos valores de frequências

formânticas- F2. Tais achados sinalizam que o controle de f0 e de intensidade

influenciam de forma considerável a diferenciação da voz de cantoras e não

cantoras.

93

A prontidão é definida como o estado do que está pronto ou a agilidade/

rapidez de compreensão/ execução de alguma atividade (AULETE, 2007). O

índice é gerado por meio do script ExpressionEvaluator, com base na variação

de f0 e de ênfase espectral (BARBOSA, 2009). A prontidão tende a aumentar

de forma proporcional à quantidade de declínios de f0 detectados no trecho

analisado, e de forma inversamente proporcional à média de ênfase espectral.

Em relação à analise do parâmetro de prontidão pelo script

ExpressionEvaluator, foram detectadas correlações especialmente aos valores

de medidas acústicas de declínio espectral (média, desvio padrão e

assimetria).

De forma mais detalhada, destacamos que a análise de regressão linear

aplicada aos dados de prontidão revelou 98% de correlação aos dados das

medidas acústicas do script ExpressionEvaluator, com destaque para aquelas

de declínio espectral (média, desvio padrão e assimetria) e de LTAS (desvio

padrão). Tais dados estão em conformidade com as diretrizes do script

ExpressionEvaluator (BARBOSA, 2009), em que a ênfase espectral é tida

como um dos parâmetros de relevância à determinação do grau de prontidão.

Quando aplicado aos dados de frequências formânticas, o grau de

correlação foi menor (68,2%) para prontidão, destacando-se a relevância de

F1. Quando consideradas em conjunto (script ExpressionEvaluator e

frequências formânticas), a correlação atingiu 99% com maior influência das

medidas de declínio espectral e de LTAS.

Para finalizar a discussão dos dados de prontidão, a análise de

regressão linear de prontidão e de variáveis qualitativas, como grupo de

informantes (cantoras e não cantoras), sujeito e instrução por metáforas,

94

revelou maior valor de correlação para sujeito estudado (75,6%), enquanto

para instrução o valor foi de 5,2% e de apenas 0,5% para grupo (cantoras e

não cantoras). Tais dados reforçam que a prontidão pode ser um parâmetro

para se estimar os efeitos indivualizados do uso de metáforas na situação de

ensino de canto.

O índice de prontidão integra o tripé tridimensional da veiculação de

afeto na fala, juntamente a prazer e poder, destacando-se, como correlatos

acústicos, valores médios de f0 e intensidade, além de extensão de f0

(PEREIRA, 2000). As referências às correlações de f0 e de intensidade

também são sustentadas por Johnstone e Scherer (1999).

Além disso, Johnstone e Scherer (1999) referiram efeitos de outras

medidas acústicas na análise de aspectos acústicos da prontidão e reforçam

que as correlações à medida de extensão de f0 seriam, ainda, controversas.

Outros índices referidos são o coeficiente de fechamento glótico (no plano

fisiológico- eletroglotografia), sendo que o aumento de f0 e de intensidade

seriam proporcionais ao índice de esforço vocal, dados concordantes com

nossos achados em termos de correlação de prontidão a medidas de declínio

espectral.

Diante das questões de pesquisa elencadas na introdução do presente

estudo, podemos destacar que os achados do experimento 2 sinalizam que o

uso das metáforas para o ensino do canto propicia mobilizações diferenciadas

do trato vocal na produção vocal, passíveis de detecção por meio de

descrições acústicas, especialmente pelas medidas de f0, intensidade e

declínio espectral. Tais mobilizações foram detectadas em cantoras e não

95

cantoras, sendo que algumas medidas acústicas revelaram diferenças entre os

dois grupos, tais como f0, intensidade e frequências formânticas.

6.3. Abordagem integrada- experimentos 1 e 2

Neste ponto do trabalho, cabe a retomada da abordagem dos efeitos do

uso das metáforas na voz cantada que possam permitir a finalização da

discussão, com base na integração de dados dos dois experimentos.

Diante dos dados de experimentos de natureza acústica e articulatória,

foi possível estimar algumas ações sob as quais o trato vocal dos indivíduos

avaliados foi submetido nas situações de instruções baseadas em metáforas

para a emissão de voz cantada. Os dados apresentados permitem discutir

aspectos que permeiam os estudos do simbolismo sonoro (HINTON et al,

1994; FONAGY, 2000; MADUREIRA, 2005) e do aprendizado do canto, no

sentido de colaborar para a compreensão de particularidades do processo de

ensino e prática do canto.

Dessa forma, os achados detalhadamente expostos e discutidos tornam

possível inferir os níveis de mobilização das estruturas do trato vocal diante do

estímulo das metáforas. Destacamos que as medidas de imagem do trato

vocal, bem como as medidas acústicas de frequências formânticas foram

relevantes no experimento 1, enquanto as medidas acústicas relativas a f0,

intensidade e declínio espectral foram relevantes para a discussão dos dados

do experimento 2.

Da combinação dos dois experimentos, foi possível destacar o esboço

das configurações do trato vocal diante de emissões produzidas por meio de

96

instruções baseadas em metáforas nos experimentos 1 (análise articulatória e

acústica) e 2 (análise acústica).

Conforme salientou Sundberg (1990), aprender a cantar significa

estabelecer novos padrões para respiração, articulação e fonação e, para

tanto, o aconselhamento de profissional, professor de canto, habilidoso e

conhecedor do campo é fundamental. Neste ponto, as metáforas são

amplamente utilizadas como estratégia na pedagogia vocal (AGUIAR, 2007;

CLEMENTS, 2008; SOUSA et al, 2010; ROSSBACH, 2011).

A retomada da importância do aconselhamento dos cantores, aliada aos

aspectos das relações som e sentido levou-nos a estimar alguns efeitos no

trato vocal a partir das metáforas utilizadas como instruções neste estudo,

baseando-nos, inclusive, nas figuras utilizadas nas instruções (anexo 4):

Metáfora catedral (metáfora que mais se diferenciou das demais

emissões)

o Imagem videofluoroscópica do trato vocal- maior grau de

abertura de lábios e de mandíbula, expansão faríngea,

língua em posição centralizada (posteriorizada nas vogais

anteriores e anteriorizada para vogais posteriores);

o Dados acústicos: rebaixamento de frequências formânticas

(F1 e F2) e padrão variável de valores de F3. Script

ExpressionEvaluator: valores de mediana e de quantil

99,5% de f0 superiores às demais metáforas, assim como

de intensidade (assimetria). Os valores de declínio

espectral apresentaram-se rebaixados (maior nível de

adução glótica);

97

o Associação à ilustração da metáfora: ângulo de visão-

interior do trato vocal- a entrada de luz na parte superior

guarda relação com a abertura na extremidade do trato

vocal- mandíbula e lábios (por onde entra luz na cavidade-

à semelhança do efeito de abertura de boca para

cavidades oral e orofaríngea). O diâmetro da cúpula

remete à amplitude da cavidade faríngea- tendência à

expansão.

Metáfora Prisma

o Imagem videofluoroscópica do trato vocal - maior grau de

abertura de lábios, sem correspondente em termos da

abertura de mandíbula, postura de língua elevada, menor

amplitude de faringe;

o Dados acústicos: frequências formânticas similares às

emissões produzidas sem instruções baseadas em

metáforas; Script ExpressionEvaluator: valores

intermediários de f0, menores medidas de intensidade

(assimetria), com valores intermediários de declínio

espectral;

o Associação à ilustração da metáfora - vista anterior do trato

vocal: progressivamente mais fechado na porção superior,

com menor grau de abertura de mandíbula-constrição

faríngea. Esta metáfora revelou mais efeitos de ação de

lábios, o que poderia ser relativo ao efeito de radiação dos

98

lábios na teoria acústica (SUNDBERG, 1997), que

combinaria com o feixe de cores presente no desenho.

Metáfora disco voador

o Imagem videofluoroscópica do trato vocal - menor grau de

abertura de lábios e de mandíbula, língua elevada e

expansão faríngea;

o Dados acústicos- F1 e F2 revelaram tendência a

rebaixamento de frequência para a maioria das vogais, e

padrão variável de valores de F3. Script

ExpressionEvaluator: valores intermediários de f0 e de

intensidade (assimetria); valores elevados de declínio

espectral (menor nível de adução glótica);

o Associação à ilustração da metáfora - vista anterior do trato

vocal, com maior dimensão em termos de diâmetro

(compatível com expansão faríngea) e menor em termos

de comprimento (lábios e mandíbula).

Tais achados remetem a Fonagy (1976), que relatou associação de

padrões de movimentação de língua e de abertura de boca a diferentes

estados emocionais e atitudes na fala. Pautou tais descrições em investigações

fisiológicas dos planos articulatório e fonatório.

Sundberg (1982), ao discutir aspectos da voz, canto e emoção, retomou

fundamentos de Fonagy (1976) assumindo a língua como uma “seta (flecha)”

entre pontos articulatórios, o que sinalizaria a ação do articulador – a língua-

99

com uma possível relação para o comportamento simbólico. Destacou que a

linguagem corporal geral das emoções poderia explicar a influência das

emoções sobre a ação dos órgãos vocais.

Além disso, pensando em efeitos figurativos, é possível trazer à tona, as

figuras utilizadas para a composição dessa pesquisa (anexo 4). Todas elas

apresentam uma imagem/significado pré-estabelecido, todavia, durante a

produção de voz cantada as figuras apresentam um papel corporal, ou seja,

propiciam diferentes ajustes de trato vocal. Portanto, criou-se uma nova

representação simbólica que impactou a produção vocal do sujeito informante,

visto que encontramos diferentes ajustes de lábios, mandíbula, postura de

língua e constrição/expanão faríngea para cada tipo de imagem visualizada

(diferentes sensações corporais, sinestésicas e metalinguísticas) (HINTON et

al, 1994; FONAGY, 2000)

Os dados aqui relatados reforçam que cada participante (cantora e não

cantora) mobilizou o trato vocal para diferenciar ações que revelam o elo

indissociável entre som e sentido e reforçam as questões de base dos estudos

do simbolismo sonoro (HINTON et al, 1994), na busca por produzir emissões

em voz cantada a partir de diferentes instruções.

O conceito da metáfora sonora (FONAGY, 1983) remete justamente às

relações entre som e sentido. Tais relações pautam-se em cinco categorias de

simbolismo; corporal, imitativo; sinestésico, metalinguístico e convencional

(HINTON et al, 1994), sendo que para o uso das instruções para o canto,

destacou-se o simbolismo sinestésico, quando consideramos o detalhamento

de cada metáfora acima esboçado, em que as propriedades sonoras são

100

empregadas para representar propriedades visuais, táteis e proprioceptivas de

objetos.

As metáforas podem ajudar na implementação de ajustes do trato vocal

do cantor, e do estudante de canto, levando-se em conta vários fatores que

envolvem e permeiam a pedagogia vocal nesta situação particular e fascinante

do canto.

101

7. CONCLUSÃO

A análise fonética dos dados revelou que as metáforas geraram

mobilizações diferenciadas no trato vocal, especialmente para “catedral” e

“disco voador”, reveladas por meio de descrições articulatórias- imagens

videofluoroscópicas (medidas de abertura de lábios, abertura de mandíbula,

distância língua-faringe, distância língua-palato e elemento qualificador de

deslocamento ântero-posterior de língua) e acústicas (f0, intensidade e declínio

espectral).

Tais mobilizações revelaram diferenças quando comparados os grupos

de cantoras e não cantoras, especialmente em termos das medidas acústicas

de f0, intensidade e frequências formânticas (F1, F2 e F3).

As correspondências entre achados acústicos e de imagem do trato

vocal foram relevantes à investigação da produção de voz cantada e

reforçaram a importância do enfoque das relações entre som e sentido,

especialmente mediadas pelas questões do simbolismo sonoro sinestésico.

102

8. Anexos

Anexo 1

Termo de Consetimento Livre e Esclarecido (experimento 1)

Nome do(a) Participante: ___________________________________Data:_______________ Endereço: ___________________ ___________________________Cidade:_____________ Estado:____________CEP:________________Telefone: ( )___________R.G.:___________ CPF:___________________E-mail: ______________________________________________ Nome da Pesquisadora Principal: Cristina Canhetti Alves Instituição: LIAAC-PUCSP Título do estudo: Ajustes articulatórios no ensino do canto lírico: dados acústicos e de imagem do trato vocal Propósito do estudo: Análise do trato vocal supraglótico por meio de imagens videofluoroscópicas e análise acústica de amostras de voz cantada. Procedimentos: Participarei de uma gravação de amostras de voz cantada, por meio da técnica de videofluoroscopia. Serei previamente orientado pelo pesquisador que efetuará a coleta. Cantarei trecho de música que me será previamente apresentado, de acordo com instruções específicas para modificações da voz, tais como “projetar a voz como numa catedral”, “deixar a voz flutuar”, “espalhar a voz como a luz refletida num prisma”.

1- Riscos e desconfortos: Avisar imediatamente o pesquisador em caso estar no período gestacional ou qualquer dúvida a respeito. Em caso de gravidez ou suspeita, não será realizada a gravação, devido a exposição à radiação.

2- Benefícios: Minha participação é voluntária e não trará qualquer benefício direto, mas proporcionará um melhor conhecimento sobre os ajustes do trato supraglótico durante o canto pelo uso de metáforas sonoras, como também para futuros estudos na área de canto.

3- Direitos do participante: Eu posso me retirar desse estudo a qualquer momento, sem sofrer nenhum prejuízo e tenho direito de acesso, em qualquer etapa do estudo, sobre qualquer esclarecimentos de eventuais dúvidas.

4- Compensação financeira: Não existirão despesas ou compensações financeiras relacionadas à minha participação no estudo.

5- Incorporação ao banco de dados do LIAAC: Os dados obtidos com minha participação, na forma de gravação de imagens serão incorporados ao banco de dados do LIAAC, cujos responsáveis zelarão pelo uso e aplicabilidade das amostras exclusivamente para fins científicos, apenas consentindo o seu uso futuro em projetos que atestem pelo cumprimento dos preceitos éticos em pesquisa envolvendo seres humanos. Algumas amostras poderão ser usadas em publicação referente ao modelo, sem que haja identificação do falante e sem que seus direitos sejam atingidos.

6- Em caso de dúvida quanto ao item 8, posso entrar em contato com os responsáveis pelo banco de dados do LIAAC ( Profa. Dra. Sandra Madureira, Profa. Dra. Zuleica Camargo, e Prof. Mário Fontes no telefone (11)3670-8333.

7- Confidencialidade: Compreendo que os resultados deste estudo poderão ser publicados em jornais profissionais ou apresentados em congressos profissionais, sem que minha identidade seja revelada.

8- Se tiver dúvida quanto a pesquisa descrita posso telefonar para a pesquisadora Zuleica Camargo no número (11)3670-8333 a qualquer momento.

Eu compreendo meus direitos como um sujeito de pesquisa e voluntariamente consisto em participar deste estudo e em ceder meus dados para o banco de dados do LIAAC. Compreendo sobre o que, como e porque este estudo está sendo feito. Receberei uma cópia assinada deste formulário de consentimento. ___________________________________ Data: ________________ Assinatura do sujeito participante ___________________________________ Assinatura do pesquisador

103

Anexo 2

Termo de Consetimento Livre e Esclarecido (experimento 2)

Nome do(a) Participante: ____________________________________Data:_______________

Endereço: ________________________________________________Cidade:_____________

Estado:____________CEP:_____________Telefone: ( )_____________R.G.:___________

CPF:___________________E-mail: ______________________________________________

Nome da Pesquisadora Principal: Cristina Canhetti Alves

Instituição: LIAAC-PUCSP

Título do estudo: Ajustes articulatórios no ensino do canto lírico: dados acústicos e de imagem do

trato vocal

Propósito do estudo: Análise do trato vocal supraglótico por meio de imagens videofluoroscópicas e

análise acústica de amostras de voz cantada.

Procedimentos: Participarei de uma gravação de amostras de voz cantada, no Laboratório de Rádio

da PUC-SP. Serei previamente orientado pelo pesquisador que efetuará a coleta. Cantarei trecho de

música que me será previamente apresentado, de acordo com instruções específicas para

modificações da voz, tais como “projetar a voz como numa catedral”, “deixar a voz flutuar”, “espalhar

a voz como a luz refletida num prisma”.

1- Riscos e desconfortos: nenhum

2- Benefícios: Minha participação é voluntária e não trará qualquer benefício direto, mas

proporcionará um melhor conhecimento sobre os ajustes do trato supraglótico durante o

canto pelo uso de metáforas sonoras, como também para futuros estudos na área de canto.

3- Direitos do participante: Eu posso me retirar desse estudo a qualquer momento, sem sofrer

nenhum prejuízo e tenho direito de acesso, em qualquer etapa do estudo, sobre qualquer

esclarecimentos de eventuais dúvidas.

4- Compensação financeira: Não existirão despesas ou compensações financeiras

relacionadas à minha participação no estudo.

5- Incorporação ao banco de dados do LIAAC: Os dados obtidos com minha participação, na

forma de gravação de imagens serão incorporados ao banco de dados do LIAAC, cujos

responsáveis zelarão pelo uso e aplicabilidade das amostras exclusivamente para fins

científicos, apenas consentindo o seu uso futuro em projetos que atestem pelo cumprimento

dos preceitos éticos em pesquisa envolvendo seres humanos. Algumas amostras poderão

ser usadas em publicação referente ao modelo, sem que haja identificação do falante e sem

que seus direitos sejam atingidos.

6- Em caso de dúvida quanto ao item 8, posso entrar em contato com os responsáveis pelo

banco de dados do LIAAC ( Profa. Dra. Sandra Madureira, Profa. Dra. Zuleica Camargo, e

Prof. Mário Fontes no telefone (11)3670-8333.

7- Confidencialidade: Compreendo que os resultados deste estudo poderão ser publicados em

jornais profissionais ou apresentados em congressos profissionais, sem que minha

identidade seja revelada.

8- Se tiver dúvida quanto a pesquisa descrita posso telefonar para a pesquisadora Zuleica

Camargo no número (11)3670-8333 a qualquer momento.

Eu compreendo meus direitos como um sujeito de pesquisa e voluntariamente consisto em

participar deste estudo e em ceder meus dados para o banco de dados do LIAAC. Compreendo

sobre o que, como e porque este estudo está sendo feito. Receberei uma cópia assinada deste

formulário de consentimento.

___________________________________ Data: ________________

Assinatura do sujeito participante

___________________________________

Assinatura do pesquisador

104

Anexo 3

105

Anexo 4

Figuras ilustrativas das metáforas utilizadas como base das instruções

para emissões em voz cantada

Metáfora Prisma:

Metáfora Catedral:

Metáfora Disco Voador:

106

Anexo 5

Tutorial para Conversão de um arquivo para o formato. pap

1- Abra o item Meu Computador. Em seguida, clique no item Organizar e

por fim clicar em Opções de pastas e pesquisa (figura 35). Após esse

procedimento abrirá uma nova janela, clique na aba Modo de Exibição e

não deixe selecionada a opção Ocultar as extensões dos tipos de

arquivos conhecidos (figura 36).

Figura 35. Localização

visual dos itens Meu

Computador, Organizar e

Opções de pastas como

procedimento para

mudança de extensão de

arquivo

Figura 36. Localização visual dos itens

Opções de Pasta, Modo de Exibição e

item que não deve ser selecionado

como procedimento para mudança de

extensão de arquivo

2- A partir dessa seleção, todos arquivos existentes no computador

aparecerão com a extensão do arquivo em evidência. Crie uma cópia do

arquivo para impedir que haja perda após a alteração de sua extensão.

Após tal procedimento, clique no arquivo cópia com o botão direito do

107

mouse, selecione renomear. Em seguida, renomeie cópia do arquivo e

troque a extensão original pela extensão pap. Nesse momento,

aparecerá uma mensagem confirmando a alteração que será realizada,

clique no botão “sim” (figura 37) e será gerado o arquivo com a extensão

pap, que ficará em branco (figura 38).

Figura 37. Mensagem de confirmação para

modificação da extensão do arquivo

selecionado

Figura 38. Arquivo cópia

renomeado com a extensão

pap

3- Após esse procedimento, transfira o arquivo com a extensão pap para a

pasta de imagens do software Osiris. Abra o programa Osiris e abra o

arquivo que será utilizado para a análise de imagens (figura 39). Assim

que a imagem for aberta, clique no item “File” e na opção “Save as

Papyrus” (figura 40). Abrirá uma janela para que a imagem seja salva.

Sugerimos colocar o mesmo nome, porém acrescente a palavra Osiris,

para que fique fácil identificar o arquivo transformado na extensão

papyrus (figura 41). Ao final, aparecerá uma mensagem para abrir o

arquivo gerado (figura 42). Nesse momento, será possível utilizar todas

as ferramentas no software Osiris.

108

Figura 39. Localização do

arquivo no software Osiris

Figura 40. Instrução de como salvar o

arquivo em papyrus

Figura 41. Renomear o arquivo

que será salvo como papyrus

Figura 42. Gerar o arquivo papyrus e

iniciar a análise dos dados pelo

software Osiris

109

Anexo 6

INFORMAÇÕES SOBRE PROCEDIMENTOS DE ANÁLISE

ESTATÍSTICA ADOTADOS NA PESQUISA:

Descrição sobre software utilizado: XLSTAT (2012 por Addinsoft SARL, Paris,

França), compatível com todas as versões do software Microsoft Excel. Versão

funcional encontra-se no site www.xlstat.com, com acesso livre por 30 dias.

Procedimentos de análise:

As informações foram consultadas em manual de instruções do software

XLSTAT.

1. TESTE DE CORRELAÇÃO DE PEARSON

Teste de coeficiente de correlação proposto para calcular a correlação

entre um conjunto de variáveis quantitativas, contínuas, discretas ou ordinais

(neste último caso, as classes devem ser representadas por valores que

respeitam a ordem).

Alguns dos possíveis resultados:

Coeficiente de correlação de Pearson: corresponde ao coeficiente

de correlação linear clássico. Este coeficiente é bem adequado

para os dados contínuos. O seu valor varia entre -1 e 1 e mede o

grau de correlação linear entre duas variáveis.

Nota: o coeficiente de correlação de Pearson ao quadrado dá uma idéia de como parte da variabilidade de uma variável é explicada pela outra variável. Os valores de p que são computados para cada coeficiente permitem testar a hipótese nula, ou seja, hipótese de que os coeficientes não são significativamente diferentes de 0. No entanto, é preciso ter cuidados na

110

interpretação dos resultados, pois, como duas variáveis são independentes, seu coeficiente de correlação é zero, mas o inverso não é verdadeiro.

A matriz de correlação e a tabela dos valores de p são exibidos nos

resultados. Os mapas de correlações, que permitem identificar potenciais

estruturas de matriz, são capazes de identificar rapidamente as correlações

mais interessantes.

Bibliografia:

BEST, D.J.; ROBERTS, D.E. Algorithm AS 89: The upper tail probabilities of

Spearman's rho. Applied Statistics, 1975, n.24, p.377–379.

BEST, D.J.; GIPPS, P.G. Algorithm AS 71, Upper tail probabilities of Kendall's tau.

Applied Statistics, 1974, n.23, p.98-100.

HOLLANDER, M.; WOLFE, D.A. Nonparametric Statistical Inference. John Wiley &

Sons, New York, 1973.

KENDALL, M. Rank Correlation Methods. Charles Griffin and Company, London, 2nd

ed, 1955.

LEHMANN, E.L. Nonparametrics: Statistical Methods Based on Ranks. Holden-Day,

San Francisco, 1975.

2. ANÁLISE FATORIAL

Realizada sempre que se deseja investigar a existência de fatores

subjacentes comuns às variáveis quantitativas medidas em um conjunto de

observações. Atualmente, existem dois tipos principais de análise fatorial:

análise fatorial exploratória e análise fatorial confirmatória, sendo a primeira

utilizada pelo software XLSTAT e descrita a seguir.

A análise fatorial é um método que revela a possível existência de

fatores subjacentes que dão uma visão geral da informação contida numa

grande quantidade de variáveis investigadas. A estrutura que liga os fatores às

variáveis é inicialmente desconhecia e apenas o número de fatores pode ser

111

assumido. Os possíveis resultados encontrados a partir dessa análise referem-

se a:

Estatística descritiva: apresenta as estatísticas simples para todas as

variáveis selecionadas, incluindo o número de observações, o número

de valores faltantes, o número de valores não ausentes, a média e o

desvio padrão;

Matriz de correlação/Covariância: apresenta os dados que serão

posteriormente utilizados nos cálculos. O tipo de correlação depende da

opção escolhida na guia "Geral" na caixa de diálogo.

Medida da adequabilidade da amostra por Kaiser-Meyer-Olkin (KMO):

apresenta o valor da medida de KMO para cada variável individual e a

medida KMO global. A medida KMO varia entre 0 e 1. Um valor baixo

corresponde ao caso em que não é possível extrair fatores sintéticos (ou

variáveis latentes). Em outras palavras, a amostra seria "insuficiente".

Kaiser (1974) recomenda não aceitar um modelo se o fator de KMO for

inferior a 0,5. Se a KMO situar-se entre 0,5 e 0,7, a qualidade da

amostra é ainda precária. A qualidade da amostra passa a ser boa para

um KMO entre 0,7 e 0,8, muito boa entre 0,8 e 0,9 e, acima, é tida como

excelente;

Alfa de Cronbach: se esta opção for ativada, o valor de Alfa de Cronbach

é exibido;

Variação da máxima comunalidade em cada iteração: apresenta a

variação máxima da comunalidade das últimas 10 interações. Para o

método de máxima verossimilhança, a evolução do critério, que é

proporcional ao inverso do máximo da probabilidade, também é exibida;

112

Bondade de teste de ajuste: a bondade de teste de ajuste só é exibida

quando o método de máxima verossimilhança for escolhido;

Matriz de correlação reproduzida: produto da matriz das cargas fatoriais

pela sua transposta;

Matriz de correlação residual: calculada como a diferença entre a matriz

de correlações variáveis e a matriz de correlação reproduzida;

Autovalores: apresenta os autovalores associados aos vários fatores em

conjunto com as porcentagens correspondentes e porcentagens

cumulativas;

Autovetores: apresenta os autovetores;

Fator padrão: apresenta as cargas fatoriais (coordenadas de variáveis

no espaço vetorial, também chamados de fator padrão). O gráfico

correspondente é exibido;

Correlações Fator / Variável: apresenta as correlações entre os fatores e

variáveis;

Coeficientes fatoriais padronizados: apresenta os coeficientes fatoriais

padronizados a exibir. Multiplicando as coordenadas (padronizadas) das

observações no espaço inicial por esses coeficientes, são obtidas as

coordenadas das observações no espaço de fatores;

Estrutura de fatores: apresenta as correlações entre os fatores e

variáveis após a rotação no espaço dos fatores

Bibliografia:

CATTELL, R.B. The scree test for the number of factors. Multivariate Behavioral

Research, 1966, n.1, p. 245-276.

CRAWFORD, C.B.; FERGUSON, G.A. A general rotation criterion and its use in

orthogonal rotation. Psychometrika, 1970, vol.35, n.3, p.321-332.

113

CURETON, E.E.; MULAIK, S.A. The weighted Varimax rotation and the Promax

rotation. Psychometrika, 1975, vol.40, n.2, p.183-195.

KAISER, H.F. An index of factorial simplicity. Psychometrika, 1974, vol.39, n.1, p.31-

36.

JENNRICH, R.I.; ROBINSON, S.M. A Newton-Raphson algorithm for maximum

likelihood factor analysis. Psychometrika, 1969, vol.34, n.1, p.111-123.

JÖRESKOG, K.G. Some Contributions to Maximum Likelihood Factor Analysis.

Psychometrika, 1967, vol.32, n.4, p.443-481.

JÖRESKOG, K.G. Factor Analysis by Least-Squares and Maximum Likelihood

Methods, in Statistical Methods for Digital Computers, eds. ENSLEIN, K.; RALSTON,

A.; WILF, H.S. John Wiley & Sons, New York, 1977.

LAWLEY, D.N. The estimation of factor loadings by the Method of maximum likelihood.

Proceedings of the Royal Society of Edinburgh. 1940, 60, 64-82.

LOEHLIN, J.C.Latent Variable Models: an introduction to factor, path, and structural

analysis. LEA, Mahwah, 1998.

MARDIA, K.V; KENT, J.T.; BIBBY, J.M. Multivariate Analysis. Academic Press,

London, 1979.

SPEARMAN, C. General intelligence, objectively determined and measured. American

Journal of Psychology, 1904, vol.15, p.201-293.

3. ANÁLISE AGLOMERATIVA HIERÁRQUICA DE CLUSTER

Utiliza-se a análise aglomerativa hierárquica de cluster para descrever

grupos homogêneos de objetos (classes) com base em um conjunto de

variáveis, ou a partir de uma matriz que descreve a semelhança ou

dissemelhança entre os objetos.

Esse método de classificação trabalha a partir das diferenças entre os

objetos a serem agrupados. Um tipo de dissimilaridade pode ser escolhido, que

é adequado para o objeto estudado e a natureza dos dados.

Um dos resultados desse método é o dendrograma, que mostra o

agrupamento progressivo dos dados. Por meio do dendrograma é possível

114

estimar um número apropriado de classes em que os dados podem ser

agrupados. Sua desvantagem refere-se ao processamento demorado e, além

disso, o dendrograma pode se tornar ilegível se forem utilizados muitos dados.

Princípio do Agrupamento Hierárquico Aglomerativo (AHC):

É um método interativo de classificação cujo princípio é simples: o

processo começa com o cálculo da dissimilaridade entre os “n” objetos. Em

seguida, dois objetos são agrupados de forma a minimizar o critério de

aglomeração adotado. Estando agrupados, cria-se uma classe que inclui esses

dois objetos. Em seguida, a dissimilaridade entre esta classe e os objetos é

calculada usando o critério de aglomeração. Os dois objetos ou classes de

objetos, cujo agrupamento minimiza o critério de aglomeração, são então

agrupados. Este processo continua até que todos os objetos sejam agrupados.

Estas operações sucessivas de agrupamento produzem uma árvore de

agrupamento binário (dendrograma), cuja raiz é a classe que contém todas as

observações. Isto representa um dendrograma hierárquico de clusters.

Em seguida, é possível escolher uma partição truncando a árvore em um

determinado nível. Tal nível depende tanto das restrições definidas pelo

usuário como de critérios mais objetivos.

Os resultados encontrados para esta análise são:

Resumo de parâmetros estatísticos: apresenta, para os

descritores dos objetos, o número de observações, o número de

valores faltantes, o número de valores não faltantes, a média e o

desvio padrão;

115

Estatísticas de nós: mostra os dados para os nós sucessivos no

dendrograma. O primeiro nó tem um índice que é o aumento do

número de objetos. Por isso, é fácil de observar, a qualquer

momento, se um objeto ou grupo de objetos é agrupado com

outro objeto ou grupo de objetos no nível de um novo nó no

dendrograma;

Gráfico de barras de níveis: apresenta as estatísticas para os nós

do dendrograma;

Dendrogramas: o dendrograma completo exibe o agrupamento

progressivo de objetos. Se o truncamento foi solicitado, uma linha

tracejada representa o nível do truncamento que foi realizado.

Dessa forma, o dendrograma truncado mostra as classes após o

truncamento;

Classe de Centróides: mostra os centróides de classe para os

diferentes descritores;

Distância entre as classes de centróides: mostra as distâncias

euclidianas entre os centróides de classe para os diferentes

descritores;

Objetos centrais: mostra as coordenadas do objeto mais próximo

ao centróide para cada classe;

Distância entre os objetos centrais: mostra as distâncias

euclidianas entre os objetos de classe centrais para os diferentes

descritores;

116

Resultados por classe: as estatísticas descritivas para as classes

(número de objetos, soma dos pesos dentro da classe de

variância, distância mínima para a distância, centróide máximo

para o baricentro, distância média para o centróide) são exibidos

na primeira parte da tabela.

Resultados por objeto: mostra a classe de atribuição para cada

objeto em sua ordem inicial.

Bibliografia:

ARABIE, P.; HUBERT, L.J.; DE SOETE, G. Clustering and Classification. Wold

Scientific, Singapore, 1996.

EVERITT, B.S.; LANDAU, S.; LEESE, M. Cluster analysis. Arnold, 4th ed, London,

2001.

JOBSON, J.D.; Applied Multivariate Data Analysis in Categorical and Multivariate

Methods. Springer-Verlag, New York, 1992, vol.2, p. 483-568.

LEGENDRE, P.; LEGENDRE, L. Numerical Ecology. Elsevier, 2nd ed, Amsterdam,

1998, p.403-406.

SAPORTA, G. Probabilités, Analyse des Données et Statistique. Technip, Paris, 1990,

p.251-260.

WARD, J.H. Hierarchical grouping to optimize an objective function. Journal of the

American Statistical Association, 1963, vol.58, p.238-244.

4. ANÁLISE DE CORRELAÇÃO CANÔNICA

A análise de correlação canônica é um dos muitos métodos que

permitem estudar a relação entre dois conjuntos de variáveis. Desenvolvido por

Hotelling (1936), este método é muito usado em ecologia.

Utiliza-se a análise de correlação canônica para estudar a correlação

entre dois conjuntos de variáveis e para extrair dessas tabelas um conjunto de

117

variáveis canônicas que estão, tanto quanto possível, correlacionadas com

ambas as tabelas, ortogonais entre si.

Assume-se que Y1 e Y2 são duas tabelas, com, respectivamente, p e q

sendo suas variáveis. A análise de correlação canônica visa à obtenção de dois

vetores a(i) e b(i) tal que seja maximizada a relação. Devem ser introduzidas

restrições de modo que a solução para a(i) e b(i) seja única. À medida que se

tentam maximizar a covariância entre Y1A (i) e Y2b (i) e minimizar a sua

respectiva variação, pode-se obter os componentes que são melhor

correlacionados entre si. Uma vez que a solução tenha sido obtida para i = 1,

procura-se pela solução para i = 2, onde a (2) e b (2) deve ser,

respectivamente, ortogonal a um (1) e b (2), e assim por diante. O número

máximo de vetores que pode ser extraído é igual a min(p, q).

A análise de Tucker (1958) é uma alternativa em que se pretende

maximizar a covariância entre os componentes Y1a(i) e Y2b(i).

Em relação aos resultados, é possível observar:

Resumo das Estatísticas: apresenta as estatísticas descritivas

para os objetos e as variáveis explicativas;

Matriz de similaridade: matriz que corresponde ao "tipo de

análise" escolhido na caixa de diálogo;

Autovalores e porcentagens de inércia: apresenta os auto-valores,

a inércia correspondente, e as percentagens correspondentes;

Nota: em alguns softwares, os auto-valores que são exibidos são igual a L / (1-

L), onde L é o autovalor dado pelo XLSTAT.

118

Lambda de Wilks: permite determinar se os dois grupos Y1 e Y2

estão significativamente relacionados com cada variável

canônica;

Correlações canônicas: delimitadas por 0 e 1, são mais elevadas

quando a correlação entre Y1 e Y2 é alta. No entanto, não

revelam em que medida as variáveis canônicas estão

relacionadas com Y1 e Y2. As correlações canônicas quadráticas

são iguais aos auto-valores e, de fato, correspondem à

percentagem de variabilidade estimado pela variável canônica. Os

resultados indicados são calculados separadamente para cada

um dos dois grupos de variáveis de entrada;

Coeficientes de redundância: permitem medir para cada conjunto

de variáveis de entrada, a proporção da variabilidade das

variáveis de entrada pelas variáveis canônicas;

Coeficientes canônicos (também chamados de pesos canônicos,

ou coeficientes de função canônica): indicam como as variáveis

canônicas foram construídas, uma vez que correspondem aos

coeficientes da combinação linear que geraram as variáveis

canônicas a partir das variáveis de entrada. Eles são

padronizados, se as variáveis de entrada forem normalizadas.

Neste caso, os pesos relativos de variáveis de entrada podem ser

comparados. Correlações entre as variáveis de entrada e

variáveis canônicas (são coeficientes de estrutura também

chamados de correlação, ou carga fatorial canônica) permitem

entender como as variáveis canônicas estão relacionadas com as

119

variáveis de entrada. Os coeficientes de adequação de variáveis

canônicas correspondem, para uma dada variável canônica, à

soma dos quadrados das correlações entre as variáveis de

entrada e as variáveis canônicas, dividido pelo número de

variáveis de entrada. É dada a percentagem de variabilidade tida

a partir da variável canônica de interesse.

Cossenos quadráticos: cossenos ao quadrado das variáveis de

entrada no espaço de variáveis canônicas, que permitem saber se

uma variável de entrada é bem representada no espaço das

variáveis canônicas. Os cossenos ao quadrado para uma dada

variável de entrada somam o valor 1. A soma de um número

reduzido de eixos canônicos gera a comunalidade;

Escores: correspondem às coordenadas das observações no

espaço das variáveis canônicas.

Bibliografia:

HOTELLING, H. Relations between two sets of variables. Biometrika, 1936, vol.28,

p.321-327.

JOBSON, J.D. Applied Multivariate Data Analysis. Categorical and Multivariate

Methods. Springer-Verlag, New York, 2nd ed, 1992.

LEGENDRE, P.; LEGENDRE, L. Numerical Ecology. Second English Edition. Elsevier,

Amsterdam, 1998.

TUCKER, L.R. An inter-battery method of factor analysis. Psychometrika, 1958, vol.23,

n.2, p.111-136.

5. ANÁLISE DE REGRESSÃO LINEAR

Regressão linear é o método mais utilizado nas análises estatísticas.

Uma distinção é feita geralmente entre a regressão simples (com apenas uma

120

variável explicativa, ou “variável de saída”) e de regressão múltipla (várias

variáveis explicativas), embora o conceito global e métodos de cálculo sejam

idênticos.

Em relação aos resultados, é possível observar:

Resumo de parâmetros estatísticos: as tabelas de estatísticas

descritivas mostram as estatísticas simples para todas as

variáveis selecionadas.apresenta, para os descritores dos

objetos, o número de observações, Resumo das estatísticas: O

número de observações, o número de valores faltantes, o número

de valores não faltantes, a média e o desvio-padrão são exibidos

para as variáveis dependentes (em azul) e as variáveis

quantitativas explicativas. Para variáveis qualitativas explicativas,

os nomes das diversas categorias são exibidos junto com suas

respectivas frequências;

Matriz de correlação: esta tabela é exibida para oferecer uma

visão das correlações entre as diversas variáveis selecionadas;

Resumo da seleção de variáveis: quando um método de seleção

foi escolhido, exibe o resumo de seleção. Para uma seleção

gradual, as estatísticas correspondentes são exibidas para as

diferentes etapas. O melhor modelo para uma série de números

ou variáveis selecionadas será exibido com as estatísticas

correspondente.

Bibliografia:

AKAIKE, H. Information Theory and the Extension of the Maximum Likelihood

Principle. In: Second International Symposium on Information Theory. (Eds: V.N.

Petrov and F. Csaki). Academiai Kiadó, Budapest, 1973, p. 267-281.

121

AMEMIYA, T. Selection of regressors. International Economic Review, 1980, vol.21,

p.331-354.

DEMPSTER, A.P. Elements of Continuous Multivariate Analysis. Addison-Wesley,

Reading, 1969.

JOBSON, J.D. Applied Multivariate Data Analysis: Regression and Experimental

Design. Springer Verlag, New York, 1999, vol1.

MALLOWS, C.L. Some comments on Cp. Technometrics, 1973, vol.15, p.661-675.

TOMASSONE, R.; AUDRAIN, S.; LESQUOY, E.T.; MILLER, C. La Régression,

Nouveaux Regards sur une Ancienne Méthode Statistique. INRA et MASSON, Paris,

1992.

6. ANCOVA

Método que permite modelar uma variável dependente quantitativa

utilizando variáveis quantitativas e qualitativas dependentes, como parte de um

modelo linear.

A ANCOVA (análise de covariância) pode ser vista como uma mistura de

regressão linear e ANOVA como variável dependente e do mesmo tipo. O

modelo é linear e as hipóteses são idênticas.

Na realidade, é mais correto considerar ANOVA e regressão linear como

casos especiais de ANCOVA.

Se p é o número de variáveis quantitativas, e q o número de fatores (as

variáveis qualitativas, incluindo as interações entre as variáveis qualitativas), o

modelo ANCOVA é escrito da seguinte forma:

(1) assumindo-se yi como valor observado para a variável dependente,

para observação i, xij é o valor tomado como j variável quantitativa para a

observação i, k(i, j) é o índice da categoria de j fator de observação i, e i é a

erro do modelo.

122

As hipóteses utilizadas em ANOVA são idênticas às utilizadas na

regressão linear e ANOVA (os erros também são independentes).

Uma das características da análise ANCOVA é permitir interações entre

variáveis quantitativas e os fatores a serem levados em conta. A principal

aplicação é testar se o nível de um fator (uma variável qualitativa) tem uma

influência sobre o coeficiente (muitas vezes chamado “declive” neste contexto)

de uma variável quantitativa. São usados testes de comparação para estimar

se os “declives” que correspondem aos diversos níveis de um fator diferem

significativamente ou não.

Alguns dos possíveis resultados:

Resumo de parâmetros estatísticos: apresenta estatísticas

simples para todas as variáveis selecionadas. O número de

observações, o número de valores faltantes, o número de valores

não faltantes, a média e o desvio padrão são exibidos para as

variáveis dependentes e as variáveis quantitativas explicativas.

Para as variáveis qualitativas explicativas os nomes das diversas

categorias são exibidos junto com suas respectivas frequências.

Matriz de correlação: exibida para oferecer uma visão das

correlações entre as diversas variáveis selecionadas;

Resumo da seleção de variáveis: quando um método de seleção

foi escolhido, o software exibe o resumo de seleção. Para uma

seleção gradual, as estatísticas correspondentes são exibidas

para as diferentes etapas. O melhor modelo para uma série de

123

números ou variáveis selecionadas será exibido com as

estatísticas correspondentes.

Bibliografia:

AKAIKE, H. Information Theory and the Extension of the Maximum Likelihood

Principle. In: Second International Symposium on Information Theory. (Eds: V.N.

Petrov and F. Csaki). Academiai Kiadó, Budapest, 1973, p.267-281.

AMEMIYA, T. Selection of regressors. International Economic Review, 1980, vol.21,

p.331-354.

DEMPSTER, A.P. Elements of Continuous Multivariate Analysis. Addison-Wesley,

Reading, 1969.

HSU, J.C. Multiple Comparisons: Theory and Methods, CRC Press, Boca Raton, 1996.

JOBSON, J.D. Applied Multivariate Data Analysis: Regression and Experimental

Design. Springer Verlag, New York, vol.1, 1999.

LEA, P.; NAES, T.; ROBOTTEN, M. Analysis of Variance for Sensory Data, John

Wiley & Sons, London, 1997.

MALLOWS, C.L. Some comments on Cp. Technometrics, 1973, vol.15, p.661-675.

SAHAI, H.; AGEEL, M.I. The Analysis of Variance. Birkhaüser, Boston, 2000.

TOMASSONE, R.; AUDRAIN, S.; LESQUOY, E.T.; MILLER, C. La Régression,

Nouveaux Regards sur une Ancienne Méthode Statistique. Inra et Masson, Paris,

1992.

7. ANÁLISE DISCRIMINANTE

A análise discriminante é um método antigo (Fisher, 1936), que mudou

pouco nas útimas décadas em sua forma clássica e que é, ao mesmo tempo

um método explicativo e preditivo. Pode ser usado para:

Verificar em um gráfico de duas ou três dimensões, se os grupos aos

quais pertencem as observações são distintos;

Ver as propriedades dos grupos utilizando variáveis explicativas;

Prever se um grupo de observação pode ser utilizado em numerosas

aplicações (exemplo: análise de créditos ou ecologia).

124

Os resultados do modelo como relação de previsão pode ser muito

otimista, pois está efetivamente tentando-se verificar se uma observação é

bem classificada, enquanto a observação em si está sendo usada nos

próprios cálculos do modelo. Por esta razão, a validação cruzada foi

desenvolvida para determinar a probabilidade de uma observação pertencer

aos vários grupos, sendo que neste caso, é removida da amostra de

aprendizagem e em seguida, o modelo e as previsões são calculados. Esta

operação é repetida para todas as observações na amostra de

aprendizagem. Os resultados assim obtidos serão mais representativos da

qualidade do modelo.

O software oferece a opção de cálculo das várias estatísticas associadas

a cada uma das observações em validação cruzada, juntamente com a

tabela de classificação e a curva ROC, caso existam apenas duas classes.

Guia de saídas:

Estatística descritiva: exibe estatísticas descritivas para as

variáveis selecionadas;

Correlações: exibe a matriz de correlação;

Estatísticas de multicolinearidade: exibe a tabela de estatísticas

de multicolinearidade;

Covariâncias: exibe matrizes inter-classe, intra-classe, total intra-

classe, e matrizes de covariância total;

Matrizes SSCP: exibe matrizes inter-classe, total intra-classe, e

SSCP total (soma dos quadrados e produtos da Cruz);

Matrizes de distância: exibe as matrizes de distâncias entre os

grupos;

125

Correlações canônicas e funções: exibe as correlações canônicas

e funções;

Funções de classificação: exibe as funções de classificação;

Autovalores: exibe a tabela e gráfico (scree plot) dos auto-valores;

Autovetores: exibe a tabela autovetor;

Fatores de correlação de variáveis: exibe correlações entre os

fatores e as variáveis;

Escores fatoriais: exibe as coordenadas das observações no

espaço de fatores. As classes anteriores e posteriores para cada

observação, as probabilidades de atribuição para cada classe e

as distâncias das observações de sua centróide também são

apresentados nesta tabela;

Matriz de confusão: exibe a tabela que mostra os coeficientes que

exprimem se as observações são bem ou mal classificadas, para

cada uma das classes;

Matriz de validação cruzada: exibe os resultados de validação

cruzada (probabilidades para observações e matriz de confusão).

Bibliografia:

FISHER, R.A. The use of multiple measurements in taxonomic problems. Annals of

Eugenics, 1936, vol.7, p.179 -188.

HUBERTY, C.J. Applied Discriminant Analysis. Wiley-Interscience, New York, 1994.

JOBSON, J.D. Applied Multivariate Data Analysis: Categorical and Multivariate

Methods. Springer-Verlag, New York, 1992, vol. 2.

LACHENBRUCH, P.A. Discriminant Analysis. Hafner, New York, 1975.

TOMASSONE, R.; DANZART, M.; DAUDIN, J.J.; MASSON, J.P. Discrimination et

Classement. Masson, Paris, 1988.

126

8. ANOVA

Opção de análise a ser utilizada para realizar ANOVA (análise de

variância) de um ou mais fatores balanceados ou não. As opções avançadas

permitem que se escolham as restrições sobre o modelo e as interações entre

os fatores. Pode-se calcular testes de comparação múltipla.

Análise de variância (ANOVA) usa a mesma estrutura conceitual da

regressão linear. A principal diferença está na natureza das variáveis

explanatórias: em lugar de quantitativas, aqui são de base qualitativa. Na

análise ANOVA, as variáveis explicativas são freqüentemente chamados de

fatores. As hipóteses utilizadas em ANOVA são idênticas às utilizadas na

regressão linear.

Alguns dos possíveis resultados:

Resumo da estatística: exibe as estatísticas simples para todas as

variáveis selecionadas. O número de observações, valores

perdidos, o número de não ausentes valores, a média e o desvio

padrão são exibidos para as variáveis dependentes e as variáveis

quantitativas explicativas. Para variáveis qualitativas explicativas,

os nomes das diversas categorias são exibidos junto com suas

respectivas frequências;

Matriz de correlação: exibe as correlações entre as diversas

variáveis selecionadas;

Resumo da seleção de variáveis: quando um método de seleção

for escolhido, é exibido o resumo de seleção. Para uma seleção

gradual, são exibidas as estatísticas correspondentes para as

127

diferentes etapas. Onde o melhor modelo para uma série de

variáveis, que varia de p para q, tenha sido selecionado, o melhor

modelo para cada número ou variáveis é exibido com as

estatísticas correspondentes.

Bibliografia:

AKAIKE, H. Information Theory and the Extension of the Maximum Likelihood

Principle. I Second International Symposium on Information Theory. (Eds: V.N. Petrov

and F. Csaki). Academiai Kiadó, Budapest, 1973, p.267-281.

AMEMIYA, T. Selection of regressors. International Economic Review, 1980, vol.21,

p.331-354.

DEMPSTER, A.P. Elements of Continuous Multivariate Analysis. Addison-Wesley,

1969

HSU, J.C. Multiple Comparisons: Theory and Methods, CRC Press, Boca Raton, 1996.

JOBSON, J.D. Applied Multivariate Data Analysis: Regression and Experimental

Design. Springer Verlag, New York, 1999, vol.1.

LEA, P.; NAES, T.; ROBOTTEN, M. Analysis of Variance for Sensory Data, John Wiley

& Sons, London, 1997.

MALLOWS, C.L. Some comments on Cp. Technometrics, 1973, vol.15, p.661-675.

SAHAI, H.; AGEEL, M.I. The Analysis of Variance. Birkhaüser, Boston, 2000.

TOMASSONE, R.; AUDRAIN, S.; LESQUOY, E.T.; MILLER, C. La Régression,

Nouveaux Regards sur une Ancienne Méthode Statistique. Inra et Masson, Paris,

1992.

128

Anexo 7

Medidas acústicas- descrição das medidas extraídas pelo script

ExpressionEvaluator (BARBOSA, 2009) aplicável ao software de livre

acesso PRAAT

- Prontidão: medida fundamentada na variação de f0 e de ênfase

espectral, sendo diretamente proporcional à quantidade de declínios de f0 e

inversamente proporcional à média da ênfase espectral.

- Mediana de f0 (frequência fundamental): medida que pode ser

considerada como a f0 habitual do falante. Sua extração prevê a

suavização de valores. Trata -se de uma medida que evita erros de

detecção do valor de f0 que podem ser frequentes, sobretudo os que

mudam o valor para uma oitava abaixo ou acima;

- Semi-amplitude entre quartis de f0: medida de variação dos valores

de f0, excluindo-se valores espúrios (por motivos de normalização, foi

dividida pela metade, justificando a atribuição do termo “semi-amplitude”). O

termo amplitude refere-se à variação da medida;

- Quantil 99,5% de f0: valores de frequência fundamental normalizados

por meio do cálculo de Z-Score da mediana (dobro), acrescido do valor de

desvio padrão. Esta medida busca, sem valores espúrios, detectar o limite

superior de f0 do falante;

- Média de primeira derivada de f0: representa a taxa de variação de

uma função. Medida que considera não somente a variação, mas a

“velocidade” dessa alteração/variação;

129

- Assimetria de f0: medida da assimetria de distribuição de f0, baseada

na razão entre diferença entre média e mediana/semi-amplitude entre quartis

de f0. Esta medida busca estimar a tendência em ter valores à esquerda

(negativos) ou à direita da média (positivos);

- Desvio padrão de primeira derivada de f0: medida que infere a

dispersão estatística conforme a variância de f0 contida na amostra;

- Assimetria de primeira derivada de f0: infere relações de como

aconteceram as mudanças de taxa de variação de f0 na função;

- Assimetria de intensidade: medida de intensidade normalizada,

baseada na proporção de intensidade no intervalo de frequências de 0,0-1250

Hz/1250-4000 Hz. Permite que as amostras possam ter suas intensidades

estimadas, mesmo aquelas que não tenham sido captadas com fixação da

distância entre boca e microfone;

- Média de declínio espectral: média de valores da proporção de

intensidade nos intervalos de 0-1,0 kHz/1,0-4,0 kHz. Considerada como

importante medida do nível de tensão laríngea do estímulo aferido;

- Desvio padrão de declínio espectral: medida do desvio padrão de

declínio espectral (acima explanada);

- Assimetria de declínio espectral: medida de assimetria de

distribuição das medidas de declínio espectral (acima explanada);

- Desvio-padrão de espectro de longo termo (LTAS): desvio padrão

das medidas normalizadas de intensidade ao longo de intervalos de

frequências do espectro sonoro.

130

Anexo 8

Termo de Consentimento para uso do Script ExpressionEvaluator

131

Anexo 9

Medida da distância entre o dente segundo pré-molar superior e o

mento (queixo) extraídas por meio do software Osiris relacionado ao

experimento 1.

Figura 43: Medida da distância entre o dente

segundo pré-molar superior e o mento (queixo)

na situação de repouso

Emissão de [a] (sApo) – voz cantada

sem instrução baseada em metáfora

Emissão de [u] (jurUru) – voz cantada

sem instrução baseada em metáfora

Emissão de [i] (rIo) – voz cantada sem Emissão de [i] (frIo) – voz cantada sem

132

instrução baseada em metáfora instrução baseada em metáfora

Emissão de [Ɛ] (é que) – voz cantada

sem instrução baseada em metáfora

Figura 44. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da

distância entre o dente segundo pré-molar superior e o mento extraídas das emissões

em voz cantada produzidas sem intruções baseadas em metáforas

Emissão de [a] (sApo) – voz

cantada produzida por meio de

instrução baseada na metáfora

prisma

Emissão de [u] (jurUru) – voz cantada

produzida por meio de instrução

baseada na metáfora prisma

133

Emissão de [i] (rIo) – voz cantada

produzida por meio de instrução

baseada na metáfora prisma

Emissão de [i] (frIo) – voz cantada

produzida por meio de instrução

baseada na metáfora prisma

Emissão de [Ɛ] (é que) – voz

cantada produzida por meio de

instrução baseada na metáfora

prisma

Figura 45. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da

distância entre o dente segundo pré-molar superior e o mento extraídas das emissões

em voz cantada produzidas por meio de instruções baseadas na metáfora prisma.

134

Emissão de [a] (sApo) – voz

cantada produzida por meio de

instrução baseada na metáfora

catedral

Emissão de [u] (jurUru) – voz

cantada produzida por meio de

instrução baseada na metáfora

catedral

Emissão de [i] (rIo) – voz cantada

produzida por meio de instrução

baseada na metáfora catedral

Emissão de [i] (frIo) – voz cantada

produzida por meio de instrução

baseada na metáfora catedral

Emissão de [Ɛ] (é que) – voz

cantada produzida por meio de

instrução baseada na metáfora

catedral

135

Figura 46. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da

distância entre o dente segundo pré-molar superior e o mento extraídas das emissões

em voz cantada produzidas por meio de instruções baseadas na metáfora catedral.

Emissão de [a] (sApo) – voz cantada

produzida por meio de instrução

baseada na metáfora disco voador

Emissão de [u] (jurUru) – voz cantada

produzida por meio de instrução

baseada na metáfora disco voador

Emissão de [i] (rIo) – voz cantada

produzida por meio de instrução

baseada na metáfora disco voador

Emissão de [i] (frIo) – voz cantada

produzida por meio de instrução

baseada na metáfora disco voador

Emissão de [Ɛ] (é que) – voz cantada

produzida por meio de instrução

baseada na metáfora disco voador

136

Figura 47. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da

distância entre o dente segundo pré-molar superior e o mento extraídas das emissões

em voz cantada produzidas por meio de instruções baseadas na metáfora disco

voador.

137

9. REFERÊNCIAS BIBLIOGRÁFICAS

AGUIAR, M.C.P. O Ensino de Canto em Portugal: uma perspectiva analítico-

reflexiva a partir de meados do Século XX. Dissertação (Mestrado em

Comunicação e Arte). Universidade de Aveiro, Portugal, 2007.

ALVES, C.C.; CAMARGO, Z. Índices acústicos e perceptivo-auditivos da voz

disfônica: correlações entre mecanismos vibratórios e articulatórios. Iniciação

Científica (Departamento de Lingüística). Pontifícia Universidade Católica de

São Paulo, Cnpq, São Paulo, 2006.

ANDRADA e SILVA, M. A.; DUPRAT, A. C. Voz Cantada. In: FERREIRA, L. P.;

BEFI-LOPES, D.M.; LIMONGI, S.C. Tratado de Fonoaudiologia, ed. Roca, 1ed,

São Paulo, 2004.

ARAÚJO, S.A.; GRELLET, M.; PEREIRA, J.C. Normatização de medidas

acústicas da voz normal. Revista Brasileira de Otorrinolaringologia, 2002, v.68,

n.4, p.-540-544.

AULETE, C. Dicionário Aulete Digital. Lexicon editora digital, 2007.

BARBOSA, P.A. Detecting changes in speech expressiveness in participants of

a radio program In: Proc. of Interspeech, Brighton, Reino Unido, 2009, v.1,

p.2155-2158.

BEZERRA, A.A.; CUKIER-BLAJ, S.; DUPRAT, A.; CAMARGO, Z.; GRANATO,

L. The characterization of the vibrato in lyric and sertanejo singing styles:

acoustic and perceptual auditory aspects. Journal of Voice, 2008, v.26. n.6.

p.666-670.

BILTON, T.L; LEDERNMAN, H.M. Videodeglutuesofagograma: principais

aspectos por imagem. Revista Imagem, 1998, v.20, n. 1, p. 27-28.

BOIX, J.L. Introduccion a la fonetica: el metodo experimental. Ed Anthropos,

1991.

CAMARGO, Z.; MADUREIRA, S. Análise Acústica: revisão crítica de estudos

no campo das disfonias. In: FERREIRA, L. P.; BEFI-LOPES, D.M.; LIMONGI,

S.C. Tratado de Fonoaudiologia, ed Roca, 1ed, São Paulo, 2004, p.25-33.

CAMARGO, Z.; MADUREIRA, S.; CROCHIQUIA, A. Voice qualities and

metaphorical analogies: the soundmetaphors. Conference: Metaphor in Mind

and Society. Book of Abstracts.Cambridge Scholar Publishing, Lancaster

University, UK, 2012, p.109.

CANHETTI, C.; MENEGON, P. Effects of voice quality based on metaphors.

138

Second Cebtral European Conference in Linguistics for postgraduate students-

CECILS 2, Pázmany Peter Catholic University, Budapeste, 2012.

CARLSSON, G.; SUNDBERG, J. Formant frequency tuning in singing. Journal

of Voice, 1992, v.6, n.3, p.256-260.

CLEMENTS, J.F. The use of imagery in teaching voice to the twenty-first

century student. Dissertation, Florida State University College of Music, 2008.

CORDEIRO, G.F.; PINHO, S.; CAMARGO, Z.A. Formante do cantor – um

enfoque fisiológico. In: PINHO, S. Temas em voz profissional, ed Revinter, São

Paulo, 2007, p.23-30.

COSTA, M.M.B.; CANEVARO, L.V.; AZEVEDO, A.C.P.; MARINHA, M.D.S.

Valores típicos do “produto dose-área” (DAP) obtido durante o estudo

videofluoroscópico da deglutição. Revista Radiologia Brasileira, 2003, v.36, n.1,

p.17-20.

DI CARLO, N.S. L’intelligibilité de la voix chantée. Medicine des Art 10, 1994,

pp. 2-15.

DUPRAT, A.; COSTA, H. O.; ECKLEY, C.; ANDRADA E SILVA, M.A.

Caracterização do profissional da voz para o laringologista. Revista Brasileira

de Otorrinolaringologia, 2000, v.66, n.2, p.129-134.

DRAHAN, S.H.; RICZ, M.A.; MONARETTI, T.K.T.; RICZ, L.N.A. Dimensão do

trato vocal de cantoras profissionais e não profissionais durante o repouso e o

canto. Arquivos internacionais de otorrinolaringologia, 11º Congresso da

Fundação Otorrinolaringologia, 2012, v.16, n.1.

ECHTERNACH, M.; SUNDBERG, J.; ARNDT, S.; MARKL, M.; SCHUMACHER,

M.; RICHTER, B. Vocal Tract in Female Registers- A Dynamic Real-Time MRI

Study. Journal of Voice, 2008, v.24, n.2,p.133-139.

EISENSTEIN, E. Adolescência: definições, conceitos e critérios. Adolesc.

Saude, 2005, v.2, n.2, p.6-7.

ERICSDOTTER, C.; SUNDBERG, J.; LINDBLOM, B.; STARK, J. The apex

model - From articulatory position to sound. Acoustical Society of America,

1998, v.104, n.3, p.1820-1820.

FANT, G. Acoustic theory of speech production. Mouton The Hague, 1960.

FELIPPE, A.C.N.; GRILLO, N.H.M.M.; GRENCHI, T.H. Normatização das

medidas acústicas para vozes normais. Revista Brasileira de

Otorrinolaringologia, 2006, v.72, n.5, p.659-664.

139

FIRMAN, C.M.G.; COSTA, M.M.B.; COSTA, M.L.; LEMME, E. Avaliação

quantitativa e qualitativa dos esvaziamento gástrico através do método

videofluoroscópico. Rev Arquivos de Gastroenterologia, São Paulo, 2000, v.37,

n.2.

FONAGY, I. La mimique buccale. Phonetica, 1976, v.33, n,1, p.31-44.

FONAGY, I. La Vive Voix. ed Payot, Paris 1983.

FONAGY, I. Languages within languages: an evolutive approach. John

Benjamins Publishing Company, Amsterdam, 2000.

FUKS, L. Um apito no samba: aspectos acústicos e perceptivos. São Paulo,

1999.

GONÇALVES, C.G.A.B. Análise perceptivo-auditiva da fala e avaliação

videofluoroscópica da posição da língua em fissurados de palato. Dissertação

(Mestrado em Distúrbios da Comunicação Humana). Universidade de São

Paulo- USP, São Paulo, 2002.

GUSMÃO, C.S.; CAMPOS, P.H.; MAIA, M.E.O. O formante do cantor e os

ajustes laríngeos utilizados para realizá-los: uma revisão descritiva. Revista

Acadêmica de Música, 2010, n.21, p.43-50.

GUSSENHOVEN, C. The Phonology of Tone and Intonation. Cambridge

University Press, Cambridge, 2004.

GREGIO, F.N. Configuração do trato vocal supraglótico na produção das

vogais do português brasileiro: dados de imagem de ressonância magnética.

Dissertação (Mestrado em Lingüística Aplicada). Pontifícia Universidade

Católica de São Paulo, São Paulo, 2006.

HANAYAMA, E.M. Voz metálica: estudo das características fisiológicas e

acústicas. Dissertação (Mestrado em Fisiopatologia Experimental),

Universidade de São Paulo-USP, São Paulo, 2003.

HANAYAMA, E.M.; CAMARGO, Z.; TSUJI, D.H.; PINHO, S.M.R. Metallic Voice:

Physiological and Acoustic Features. Journal of Voice, 2009, v.23, p.62-70.

HENRICH, N.; BEZARD, P.; EXPERT, R.; GARNIER, M.; GUERIN, C.;

PILLOT, C.; QUATTROCCHI, S.; ROUBEAU, B.; TERK, B. Perception and

verbalisation of voice quality in western lyrical singing: Contribution of a

multidisciplinary research group. Hyper Articles on Ligne, 3rd Conference on

Interdisciplinary Musicology, Estonie, 2007.

140

HINTON, L.; NICHOLS, J.; OHALA, J. J. Sound Symbolism. Cambridge

University Press, Cambridge, 1994.

HIRANO, M. Vocal mechanisms in singing. Laryngological and phoniatric

aspects. Journal of Voice, 1988, v.2, n.1, p.51-69.

IWARSSON, J.; SUNDBERG, J. Effects of lung volume on vertical larynx

position during phonation. Journal of Voice, 1998, v.12, n.2, p.159-165.

IWARSSON, J. Effects of Inhalatory Abdominal Wall Movement on Vertical

Laryngeal Position During Phonation. Journal of Voice, 2001, v.15, n.3, p.384-

394.

JOHNSTONE, T.; BANSE, R.; SCHERER, K.R. Acoustic profiles in prototypical

vocal expressions of emotion, ICPhS, 1995, v.4, n.2, p.2-5.

JOHNSTONE, T.; SCHERER, K.R. The effects of emotions on voice quality.

XIVth International Congress of Phonetic, Citeseer, 1999.

JOTZ, G.P.; CERVANTES, O.; SETTANI, F.A.P.; ANGELIS, E.C. Acoustic

measures for the detection of hoarseness in children. Arquivos Internacionais

Otorrinolaringologista, 2006, v.10, n.1, p.14-20.

KENT, R. D.; READ, C. The acoustic analysis of speech. Singular Publishing

Group, Califórnia, 1992.

KENT, R.D. Speech Sciences. Ed Revinter, Rio de Janeiro, 1993.

LAVER, J. The phonetic description of voice quality. Cambridge textbook in

linguistics, Cambridge University Press, Cambridge, 1980.

LAVER, J.; WIRS, S.; MACKENZIE, J.; HILLER, S.M. A perceptual protocol for

the analysis of vocal profiles. Edinburg University Department of Linguistics

Work in Progress, 1981, v.14, p.139-155.

LAVER, J.; HILLER, S.; HANSON, R. Comparative performance of pitch

detection algorithms on dysphonic voices. In: International Conference on

Acoustics, Speech and Signal Processing, Paris, 1982, v.5.

LAVER, J. Principles of Phonetics. Cambridge textbook in linguistics,

Cambridge University Press, 1994.

LAVER, J. Phonetic evaluation of voice quality. In: KENT, R.D.; BALL, M.J.

Voice quality measurement, Singular Publishing Group, San Diego, 2000, p.37-

48.

141

LEVY, D.S.; CRISTOVÃO, P.W.; GABBI, S. Protocolo do Estudo Dinâmico da

Deglutição por Videofluoroscopia. In: Disfagia: Avaliação e Tratamento, Rio de

Janeiro, ed Revinter, 2004, p.134-140.

LIEBERMAN, P.; BLUMSTEIN, S.E. Speech physiology, speech perception and

acoustic phonetics. Cambridge Studies in Speech Science and

Communication, Cambridge University Press, 1988.

LINDBLOM, B.E.F.; SUNDBERG, J. Acoustical Consequences of Lip, Tongue,

Jaw and Larynx Movement. Journal of Acoust. Soc. Am., 1971, v.50, n.4, p.

1166-1179.

LOPASSO, C. A videofluoroscopia e quantificação virtual do esvaziamento

gástrico. Revista Arquivos de Gastroenterologia, 2000, v.37, n.2.

MACHADO, M.M. Fenômeno de nasalização vocálica em português: estudo

cine-radiográfico. Cad. Est. Ling., 1993, v.25, p.113-128.

MACKENZIE-BECK, J. Perceptual analysis of voice quality: the place of vocal

profile analysis. In: HARDCASTLE, W.J.; MACKENZIE-BECK, J. A figure of

speech: a festschrift for John, 2005.

MADUREIRA, S. Sobre a expressividade da fala. In: KYRILLOS, L.

Expressividade: da teoria à prática. Ed. Revinter, Rio de Janeiro, 2005.

MANGILLI, L.D.; AMOROSO, M.R.M.; NISHIMOTO, I.N.; BARROS, A.P.B.;

CARRARA-DE-ANGELIS, E. Voz, deglutição e qualidade de vida de pacientes

com alteração de mobilidade de prega vocal unilateral pré e pós-fonoterapia.

Revista Sociedade Brasileira de Fonoaudiologia, 2008, v.13, n.2, p.103-112.

MASTER, S.; PONTES, P.; PAULO, A.L.; BEHLAU, M. Configuraçöes do trato

vocal nas vogais nasais do português brasileiro. Acta Awho, 1991, v.10, n.2,

p.67-70.

MASTER, S.; BIASE, N.; PEDROSA, V.; CHIARI, B.M. O espectro médio de

longo termo na pesquisa e na clínica fonoaudiológica. Revista Pró-Fono, 2006,

v.18, n.1, p.111-120.

MEDEIROS, B.R. Descrição comparativa de aspectos fonético-acústicos

selecionados da fala e do canto em português brasileiro. Tese (Doutorado em

Linguística), Universidade Estadual de Campinas- UNICAMP, Campinas, 2002.

MENDES, B.C.A. Estudo fonético-acústico das vogais do português brasileiro:

dados da produção e percepção da fala de um sujeito deficiente auditivo. Tese

(Doutorado em lingüística aplicada e estudos da Linguagem), Pontifícia

Universidade Católica de São Paulo, São Paulo, 2003.

142

MILLER, D.G.; SCHUTTE, H.K. Formant tuning in a professional baritone.

1990, v.4, n.3, p.231-237.

MOSCA, L.G.; MOSCA, L.E. Tecnica radiologica: teoria y practica. Ed López

Libreros, Buenos Aires, 1971, p.141–145.

MOTA, L.A.A.; SANTOS, C.M.B.; BARBOSA, K.M.F.; NETO, J.R.N. Disfonia

em cantores: revisão de literatura. Revista Acta Otorrinolaringologia, 2010,

v.28, n.1, p.27-31.

MCALLISTER, A.; SEDERHOLM, E.; SUNDBERG, J. Perceptual and acoustic

analysis of vocal registers in 10-year-old children. Logoped Phoniatr Vocol,

2000, v.25, n.2, p.63-71.

NORDENBERG, M.; SUNDBERG, J. Effect on LTAS of vocal loudness

variation. Logopedics Phoniatrics Vocology, 2004, v.29, n.4, p.183-191.

NUÑES, K.L. Configuração do trato vocal na fonação habitual e no canto

popular. Dissertação (Mestrado em Fonoaudiologia). Universidade Tuiuti do

Paraná, Curitiba, 2006.

OHALA, J.J. Sound Symbolism. Proceedings of the 4th Seoul International,

University of California, 1997.

OLIVEIRA, L.R. Análise acústica comparativa das vogais orais

entrerespiradores orais e nasais. Dissertação (Mestrado em Linguística

Aplicada e Estudos da Linguagem), Pontifícia Universidade Católica de São

Paulo, São Paulo, 2011.

PASSAROTTI, G.H.; CANIELLO, M.; HACHIYA, A.; SANTORO, P.P.;

IMAMURA, R.; TSUJI, D.H. Amiloidose com múltiplos focos em trato aéreo-

digestivo superior: relato de caso e revisão de literatura. Revista Brasileira de

Otorrinolaringologia, 2008, v.74, n.3, p.462-466.

PEDROSO, M.I.L. Técnicas vocais para os profissionais da voz. Monografia

(Especialização em Voz), CEFAC, São Paulo, 1997.

PEREIRA, C. Dimensions of emotional meaning in speech. SpeechEmotion,

2000, p.25-28.

PEREIRA, A.L.S. As cores da voz – expressão das emoções no timbre da voz

cantada. Revista Cadernos de Saúde. Instituto de Ciências da Saúde

Universidade Católica Portuguesa, 2008, v.1. n.2.

PESSOA, A. N.; NOVAES, B.C.A.C.; PEREIRA, L.K.; CAMARGO, Z.A. Dados

de dinâmica e qualidade vocal: correlatos acústicos e perceptivo-auditivos da

143

fala em crianças usuárias de implante coclear. Journal of Speech Sciences,

2011, v.1, n.2, p.17-33.

PINHO, S.M.R. Avaliação e tratamento da voz. In: PINHO, S.M.R.

Fundamentos em fonoaudiologia: tratando os distúrbios da voz, ed Guanabara

Koogan, Rio de Janeiro, 1998.

PINHO, S.; PONTES, P. Desvendando os segredos da voz: músculos

intrínsecos da laringe e dinâmica vocal. Ed Revinter, v.1, Rio de Janeiro, 2008.

REHDER, M.I.B.C.; BEHLAU, M.S. Perfil vocal de regentes de coral do estado

de São Paulo. Revista CEFAC, 2008, v.10, n.2, p.206-217.

ROERS, F.; MÜRBE, D.; SUNDBERG, J. Predicted singers vocal fold lengths

and voice classification - a study of x-ray morphological measures. Journal of

Voice, 2009, v.23, n.4, p.408-13.

ROSSBACH, R.F. Aplicando metáforas físicas no repertório coral. Revista de

Letras, Artes e Comunicação, 2011, v.5, n.2, p.153-166.

SALOMÃO, G.L. Registros vocais no canto: aspectos perceptivos, acústicos,

aerodinâmicos e fisiológicos da voz modal e da voz de falsete. Tese

(Doutorado em Lingüística Aplicada e Estudos da Linguagem). Pontifícia

Universidade Católica de São Paulo, São Paulo, 2008.

SOUSA, J.M.; ANDRADA E SILVA, M.A.; FERREIRA, L.P. O uso de metáforas

como recurso didático no ensino do canto: diferentes abordagens. Revista

Sociedade Brasileira de Fonoaudiologia, São Paulo, 2010, v.15, n.3, p.317-328.

SOUZA, D.P.D. Estudo da fonação e de respiração, com apoio abdominal

expandido e contraído, em cantores líricos. Dissertação (Mestrado em

Distúrbios da Comunicação), Universidade Tuiti do Paraná, Curtitiba, 2008.

SUNDBERG, J. Formant structure and articulation of spoken and sung vowels.

Folia Phoniat, 1970, v.22, p.28-48.

SUNDBERG, J. Articulatory interpretation of the “singing formant”. Journal

Acoust. Soc. Am, 1974, v.55, n.4, p.838-844.

SUNDBERG, J. Formant technique in a professional female singer. Acustica,

1975, v.32, p.89-96.

SUNDBERG, J. The acoustic of singing voice, 1977, p.104-116.

SUNDBERG, J. Perception of singing. Speech Transmission Laboratory

Quarterly Progress and Status Report 1, Royal Institute of Technology-KTH,

1979, p.1-48.

144

SUNDBERG, J. Speech, sound and emotions. In: CLYNES, M. Music, mind,

and brain- the neuropsychology of music. Plenum Publishing Corporation, New

York, 1982, p.137- 149.

SUNDBERG, J.; ASKENFELT, A. Larynx height and voice source: a

relationship?. Vocal Folds Physiology, College-Hill Press, San Diego, Califórnia,

1983, p.307-316.

SUNDBERG, J. The Science of the Singing Voice. Dekalb, Illinois, 1987.

SUNBERG, J.; JOHANSSON, C.; WILBRAND, H.; YTTERBERGH, C. From

sagittal distance to area. Phonetica, 1987, v.44, p.76-90.

SUNDBERG, J.; LEANDERSON, R.; EULER, C. Activity relationship between

diaphragm and cricothyroid muscles. Journal of Voice, 1989, v.3, n.1, p.225-

232.

SUNDBERG, J. What´s so special about singers? Journal of Voice, 1990, v.4,

n.2, p.107-119.

SUNDBERG, J. Breathing behavior during singing. Journal STL-QPSR, 1992,

v.33, n.1,p.49-64.

SUNDBERG, J. Human singing voice. In: CROCKER, M.J. Encyclopedia of

acoustics, John Wiley & Sons, Nova Jersey, 1997, p.1687-1695.

SUNDBERG, J.; SKOOG, J. Dependence of jaw opening on pitch and vowel in

singers. Journal of Voice, Filadélfia, 1997, v.11, n.3, p.301-306.

SUNDBERG, J. Research on the singing voice in retrospect. Journal TMH-

QPSR, 2003, v.45, n.1, p.11-22.

SUNDBERG, J. Articulatory configuration and pitch in a classically trained

soprano singer. Journal of Voice, 2008, v.23, n.5. p.546-551.

SCHERER, K.R.; BANZIGER, T. Emotional expression in prosody: a review

and an agenda for future research. Departament of psychology, University of

Geneva, Switzerland, 2003.

SVICERO, M.A.F. Caracterização acústica e de imagens de ultrassonografia

das vogais orais do Português Brasileiro. Dissertação (Mestrado em Linguistica

Aplicada e Estudos da Linguagem), Pontifícia Universidade Católica de São

Paulo, 2012.

145

TAVANO, K.C.A. Análise acústica e imagem da emissão de vogais em

cantoras líricas e populares. Dissertação (Mestrado em Distúrbios da

Comunicação), Universidade Tuiti do Paraná, Curitiba, 2011.

TRAVASSOS, E. Um objeto fugidio: voz e “musicologias”. Revista Música em

Perspectiva. 2008, v.1, n.1, p.14-42.

THOMÉ, R.C. A doença de Parkinson: perspectivas sobre o tratamento

fonoterápico. Monografia (Especialização em Fonoaudiologia), CEFAC, Bahia,

1999.

ULLOA, J.M. El gesto instrumental y la voz cantada em la significación musical.

Revista Musical Chilena, 2009, v.63, n.211, p.54-65.

WILIAMS, R.G.; ECCLES, R. A new clinical measure of external laryngeal size

which predicts the fundamental frequency of the larynx. Acta Otolaryngol,

(Stockh), 1990, v.110, p.141-148.

VENTURA, S.M.R.; FREITAS, D.R.S.; RAMOS, I.M.A.P.; TAVARES, J.M.R.S.

Utilização da Imagem por Ressonância Magnética nos Estudos sobre a

Produção da Fala. Revista Científica Nacional, 2010, p.1-15.

VIEIRA, M.N. Uma introdução à acústica da voz cantada. Anais do I Seminário

Música Ciência Tecnologia, São Paulo, 2004.

VILKMAN, E.; SONNINEM, A.; HURME, P.; KORKKO, P. External laryngeal

frame function in voice production revisited: A review. Journal of Voice, 1996,

v.10, n.1, p.78-92.

ZAMPIERI, S.A.; BEHLAU, M.; BRASIL, O.O.C. Análise de cantores de baile

em estilo de canto popular e lírico: perceptivo-auditiva, acústica e da

configuração laríngea. Revista Brasileira de Otorrinolaringologia, 2002, v.68,

n.3, p.378-386.