AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de...

18
AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS Bianca Pasqualini Doutoranda PPGLet/UFRGS Orientadora: Profa. Dra. Maria José B. Finatto

Transcript of AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de...

Page 1: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS

Bianca Pasqualini Doutoranda PPGLet/UFRGS

Orientadora: Profa. Dra. Maria José B. Finatto

Page 2: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

PRIMEIRO ESTUDO:

2

ANÁLISE DE ÍNDICES DE COMPLEXIDADE TEXTUAL EM DOIS TEXTOS DE PEDIATRIA E SUAS TRADUÇÕES PARA

O INGLÊS: UM ESTUDO EXPLORATÓRIO

Artigo publicado em: http://www.pgletras.uerj.br/palimpsesto/num13/estudos/palimpsesto13estudos01.pdf

Page 3: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Textos de Pediatria: textos com termos

Complexidade textual: textos especializados

Terminologia Geral: foco conceitual

Terminologia variacionista

Terminologia Comunicativa

Terminologia com ênfase textual: o texto com termos

Terminologia

A complexidade textual de textos “com termos”

Page 4: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

4

MÉTRICAS/ÍNDICES COMPARÁVEIS

TEXTOS PTG (FONTE)

COH-METRIX COH-METRIX-

PORT

TEXTOS ING (TRADUÇÕES)

Preparação dos textos

Análise dos resultados

Etapa 1: Coleta dos textos

Etapa 2: Seleção das ferramentas

Etapa 3: Resultados

ETAPAS DA PESQUISA

Conclusões

Page 5: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 1: Preparação dos textos Materiais – corpus

• 2 artigos do JPed (Jornal de Pediatria) em português

• Traduções dos 2 artigos do JPed para o inglês

• 2 contos literários brasileiros

• Traduções dos 2 contos para o inglês

• Total: 8 textos

5

Grupo 1: textos de Pediatria

Grupo 2: textos para comparação

Page 6: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 2: Materiais – ferramentas: Coh-Metrix

O Coh-Metrix é uma

ferramenta que calcula métricas e índices de

coesão e coerência de textos num amplo espectro

de medidas. Baseia-se em pesquisas de Linguística Computacional e Psicolinguística. A versão on-line oferece 60 métricas

para uso livre.

http://tool.cohmetrix.com/

Page 7: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 2: Materiais – ferramentas: Coh-Metrix-Port

• Adaptação do Coh-Metrix para o português, contando com 48 métricas.

http://www.nilc.icmc.usp.br:3000/

Ligado ao Projeto PorSimples – NILC, USP, UFSCar, UNESP, 2009

Page 8: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 2: Métricas/índices comparáveis

8

MÉTRICAS COH-METRIX-PORT

EQUIVALÊNCIA DAS

MÉTRICAS

COH-METRIX-ING

Métricas

Lexicais

Índice Flesch EQUIVALENTE Flesch Reading Ease

Número de palavras EQUIVALENTE Number of words

Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words

Frequências TALVEZ Raw frequency

Mínimo frequências TALVEZ Min. Raw frequency

Métricas

Sintáticas

Operadores lógicos EQUIVALENTE Logic Operators

Palavras antes de verbos principais EQUIVALENTE Words before main verb

Types/tokens EQUIVALENTE Types/token

Incidência de Sintagmas Nominais EQUIVALENTE NP incidence

Incidência de conectivos EQUIVALENTE All conectives

Métricas

Referenciais e

Semânticas

Anáforas EQUIVALENTE Anaphor reference

Sobreposição de argumentos adjacentes EQUIVALENTE Adjacent argument overlap

Sobreposição de argumentos EQUIVALENTE Argument overlap

Legenda: azul = métricas e índices analisados; laranja = métricas e índices não comparáveis

Page 9: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 3: Análise dos resultados

9

Métrica

Jped – Texto 1 Jped – Texto 2 A promessa/ Light of

my life

Cantiga de esponsais/

Wedding song

Português Inglês Português Inglês Português Inglês Português Inglês

Types/tokens 0,63 0,64 0,62 0,619 0,79478 0,762 0,61385 0,576

Types/tokens ratio (variação do vocabulário) • JPed: variação entre os textos-fonte e traduções

bastante baixa ou quase nula. • Textos literários: diferença mais expressiva, com

variação menor nas traduções para o inglês, ou seja, o vocabulário foi mais repetido.

Page 10: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 3: Análise dos resultados

10

Métrica

Jped – Texto 1 Jped – Texto 2 A promessa/ Light of

my life

Cantiga de esponsais/

Wedding song

Português Inglês Português Inglês Português Inglês Português Inglês

Número de

palavras 1068 1044 1171 1277 1108 1183 1435 1653

Número de palavras: • JPed: não mostra um padrão, pois um deles é

traduzido com um maior número de palavras e o outro com menos.

• Textos literários: apresentam ambas maior número de palavras.

• Observação: 3 das 4 traduções apresentam mais palavras

que os textos-fonte.

Page 11: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 3: Análise dos resultados

11

Métrica

Jped – Texto 1 Jped – Texto 2 A promessa/ Light of

my life

Cantiga de esponsais/

Wedding song

Português Inglês Português Inglês Português Inglês Português Inglês

Operadores

lógicos 45,88 63,218 37,57 43,853 37,9061 49,028 55,0523 37,508

Operadores lógicos: • JPed: número expressivamente maior nas

traduções. • Textos literários: uma das traduções dos textos

literários mostra número maior de operadores lógicos e a outra, menor.

Page 12: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 3: Análise dos resultados

12

Métrica

Jped – Texto 1 Jped – Texto 2 A promessa/ Light of

my life

Cantiga de esponsais/

Wedding song

Português Inglês Português Inglês Português Inglês Português Inglês

Incidência de

sintagmas

nominais

304,307 283,525 298,035 245,106 284,2960 285,714 230,62 300,06

Incidência de sintagmas nominais: • JPed: incidência menor nas traduções. • Textos literários: uma das traduções mostra

incidência maior.

Page 13: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 3: Análise dos resultados

13

Métrica

Jped – Texto 1 Jped – Texto 2 A promessa/ Light of

my life

Cantiga de esponsais/

Wedding song

Português Inglês Português Inglês Português Inglês Português Inglês

Incidência de

conectivos 71,16 86,207 59,77 67,345 74,0072 79,459 86,4111 61,101

Incidência de conectivos: • JPed: as traduções apresentam incidência maior

dos que os textos-fonte em ambas as traduções.. • Textos literários: as traduções apresentam

incidência maior no caso do texto 1 e menor no caso do texto 2.

Page 14: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 3: Análise dos resultados

14

Métrica

Jped – Texto 1 Jped – Texto 2 A promessa/ Light of my

life

Cantiga de esponsais/

Wedding song

Português Inglês Português Inglês Português Inglês Português Inglês

Anáforas 0,0 0,046 0,0 0,063 0,1333 0,224 0,391304 0,219

Anáforas: • JPed: as traduções apresentam incidência maior

dos que os textos-fonte em ambas as traduções. • Textos literários: as traduções apresentam

incidência maior.

Page 15: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 3: Análise dos resultados

15

Métrica

Jped – Texto 1 Jped – Texto 2 A promessa/ Light of

my life

Cantiga de esponsais/

Wedding song

Português Inglês Português Inglês Português Inglês Português Inglês

Índice

Flesh 15,48 30,391 17,48 27,722 49,0490 65,06 66,87 78,623

Índice Flesch (quanto mais alto, mais fácil): • JPed: as traduções apresentam menor

complexidade dos que os textos-fonte. • Textos literários: as traduções apresentam

menor complexidade dos que os textos-fonte.

Page 16: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

ÍNDICE FLESCH

• Rudolf Flesch – década de 50.

• Fórmula para avaliação de complexidade textual.

• Adaptada para o PT-BR – Nilc/USP, 1996.

• Pouco conhecida entre linguistas.

16

Índices entre 75 - 100 Muito fáceis

Textos adequados para leitores com nível de escolaridade até a quarta série do ensino fundamental

Índices entre 50 - 75

Fáceis Textos adequados a alunos com escolaridade até a oitava

série do ensino fundamental

Índices entre 25 - 50

Difíceis Textos adequados para alunos cursando o ensino médio ou

universitário

Índices entre 0 – 25

Muitos difíceis Textos adequados apenas para áreas acadêmicas

específicas

Page 17: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Etapa 3: Conclusões

• É possível fazer um levantamento estatístico de elementos coesivos (indicativos do nível de complexidade). – Exemplo: a proporção types/tokens, a incidência

de sintagmas nominais e a incidência de anáforas consideradas em relação umas com as outras num texto especializado: • uma variação pequena de vocabulário (uma proporção

types/tokens baixa), uma grande incidência de sintagmas e uma baixa presença de anáforas indica um elevado grau de repetição vocabular, o que, para um texto técnico-científico, talvez seja um indício de legibilidade e de densidade terminológica.

17

Page 18: AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words ... texto técnico-científico,

Observe os slides 15 e 16, sobre o índice Flesch.

• Seria possível afirmar que há uma diminuição do nível de complexidade nos textos traduzidos com base apenas nos resultados do índice Flesch?

• Que outro(s) elemento(s) complementaria(m) a afirmativa de que os textos traduzidos são mais ou menos complexos quando comparados aos seus textos-fonte?

18

Exercício