avancos psicologicos 2

AvAnços em AvAliAção PsicológicA e

neuroPsicológicA de criAnçAs e Adolescentes ii

Avanços em avaliação psicológica II 1a edição_04_05_2012.indd 1 4/5/2012 16:58:43

Claudio Simon Hutz(Organizador)

AvAnços em AvAliAção PsicológicA e

neuroPsicológicA de criAnçAs e Adolescentes ii


© 2012 Casapsi Livraria e Editora Ltda.É proibida a reprodução total ou parcial desta publicação, para qualquer finalidade,

sem autorização por escrito dos editores.

1ª Edição 2012

Diretor GeralIngo Bernd Güntert

Editora-chefeJuliana de Villemor A. Güntert

Gerente Editorial

Marcio Coelho

Coordenadora EditorialLuciana Vaz Cameira

Assistente EditorialMaria Fernanda Moraes

Diagramação e Produção GráficaCarla Vogel

Capa

Carla Vogel

Ilustração de CapaLenLis

Coordenador de RevisãoLucas Torrisi Gomediano

Dados Internacionais de Catalogação na Publicação (CIP)

Angélica Ilacqua CRB-8/7057Avanços em avaliação psicológica e neuropsicológica de crianças e adoles-centes II / Cláudio Simon Hutz (organizador). São Paulo : Casa do Psicólogo, 2012.

Vários autoresBibliografiaISBN 987-85-8040-095-3

1. Avaliação neuropsicológica 2. Linguagem 3. Memória 4. Comportamento 5. Personalidade 6. Adolescentes 7. Crianças I. Título

12-0076 CDD 155

Índices para catálogo sistemático:1. Avaliação psicológica e neuropsicológica – crianças e adolescentes 155

Impresso no BrasilPrinted in Brazil

As opiniões expressas neste livro, bem como seu conteúdo, são de responsabilidade de seus autores, não necessariamente correspondendo ao ponto de vista da editora.

Reservados todos os direitos de publicação em língua portuguesa à

Casapsi Livraria e Editora Ltda.Rua Simão Álvares, 1020 Pinheiros • CEP 05417-020São Paulo/SP – BrasilTel. Fax: (11) 3034-3600 www.casadopsicologo.com.br


SUMÁRIO

1. Métodos atuais de estatística aplicada e psicometria .......................7Felipe Valentini & Jacob Arie Laros

2. Avaliação neuropsicológica ...........................................................41Alessandra Gotuzo Seabra, Elizeu Coutinho de Macedo & Fernando César Capovilla

3. Avaliação da Atenção ...................................................................57Luiz Renato Rodrigues Carreiro & Maria Cristina Triguero Veloz Teixeira

4. Linguagem Oral ...........................................................................93Caroline Tozzi Reppold, Léia Gonçalves Gurgel, Ana Cristina Pedron & Maria Cristina Rodrigues Azevedo Joly

5. Avaliação Neuropsicológica da Leitura .......................................121Alessandra Gotuzo Seabra, Maria Cristina Rodrigues Azevedo Joly, Carla Alexandra Moita Minervino & Monilly Ramos Araujo Melo

6. Regendo a Orquestra: Funções Executivas .................................143Caroline Tozzi Reppold, Clarissa Marceli Trentini &Ana Cristina Pedron

7. Avaliação das Habilidades Visoespaciais .....................................169Maria Cristina Rodrigues Azevedo Joly, Diego Vinícius da Silva &Alessandra Gotuzo Seabra

8. Avaliação Neuropsicológica da Memória ....................................187Simone Freitas Fuso & Camila Cruz-Rodrigues

9. A Avaliação da Capacidade de Adaptação na Infância e na Adolescência .......................................................................215

Juliane Callegaro Borsa, Maycoln Teodoro, Adriana de Andrade Gaião e Barbosa & Luciana Karine de Souza


10. Avaliação das Relações Familiares e do Comportamento Interpessoal de Crianças e de Adolescentes .................................237

Janaína Thaís Barbosa Pacheco, Luciana Karine Souza & Maycoln Teodoro

11. Avaliação da Personalidade em Crianças e Adolescentes: Possibilidades no Contexto Brasileiro .........................................253

Maiana Farias Oliveira Nunes, Juliane Callegaro Borsa, Carlos Henrique Sancineto da Silva Nunes & Adriana de Andrade Gaião e Barbosa

12. Superdotação: Modelos Teóricos e Avaliação ............................277Tatiana de Cássia Nakano & Luciana Gurgel Guida Siqueira

13. Estudos brasileiros com a Escala de Inteligência Wechsler para Crianças, 4a Edição (WISC-IV) ...........................................313

Ana Paula Porto Noronha, Acácia Aparecida Angeli dos SantosFabián Javier Marín Rueda & Fermino Fernandes Sisto

14. Criatividade: Definições, Modelos e Formas de Avaliação ..........327Tatiana de Cássia Nakano & Solange Muglia Wechsler

15. As Relações de Afetos Positivos e Negativos com Personalidade, Otimismo, Esperança, Autoestima e Satisfação de Vida ..............363

Cristian Zanon & Claudio Simon Hutz

16. Teste Não-Verbal de Raciocínio Infantil (TNVRI) .......................389Luiz Pasquali & Cristiane Faiad

17. Aplicações da Escala de Inteligência Wechsler Abreviada (WASI) para a realidade brasileira ...........................................................399

Clarissa Marceli Trentini, Denise Balem Yates & Vanessa Stumpf Heck

18. Teste de Criatividade Figural Infantil ..........................................425Tatiana de Cássia Nakano

19. Teste de desempenho escolar ......................................................453Talita Fernanda da Silva, Carolina Rosa Campos & Tatiana de Cássia Nakano

Sobre os autores .................................................................................481


1

MÉTODOS ATUAIS DE ESTATÍSTICA APLICADA E PSICOMETRIA

Felipe ValentiniJacob Arie Laros

Universidade de Brasília

A psicometria e a estatística aplicada são ferramentas muito úteis na pesquisa e na prática da avaliação psicológica. Neste con-texto, é perceptível o aumento do uso destas ferramentas pela psicologia. Este capítulo tem como objetivo apresentar algumas dessas ferramentas, utilizando exemplos de pesquisas e de instru-mentos de avaliação psicológica. Espera-se também que este texto possa ser útil como um guia de consulta rápida sobre os temas abordados.

CONCEITOS BÁSICOS

Antes de apresentarmos as análises estatísticas multivariadas utilizadas na avaliação psicológica é necessário esclarecer alguns conceitos básicos. Não temos a pretensão de abordá-los exaustiva-mente, mas discutir a sua aplicação na avaliação psicológica, bem como os equívocos cometidos com relativa frequência.

Um dos conceitos básicos mais importantes em estatística infe-rencial é o de significância estatística ou, simplesmente, “p”. Ao realizar uma pesquisa, considerando o modelo científico hipotético


8

AVANÇOS EM AVALIAÇÃO PSICOLÓGICA E NEUROPSICOLÓGICA DE CRIANÇAS E ADOLESCENTES II

dedutivo, parte-se de uma indicação teórica (hipótese de pesquisa). Um estudo pode, por exemplo, embasar-se na hipótese que as dimensões de personalidade da Bateria Fatorial de Personalidade (BFP) (Nunes, Hutz, & Nunes, 2010) estão fortemente relacio-nadas às dimensões do Inventário Fatorial de Personalidade (IFP)(Pasquali, Azevedo, & Ghesti, 1997). Outro estudo, que as crian-ças de baixa renda familiar apresentam diferenças daquelas de alta renda no que se refere à inteligência avaliada pelo teste não-ver-bal de inteligência SON-R 2½-7 (Laros, Tellegen, Jesus, & Karino, 2011). Estas hipóteses, em estatística, são denominadas hipóteses alternativas (H1). De maneira contrária, as hipóteses nulas (H0) supõem que não existem relações entre as variáveis (Field, 2009; Hair, Anderson, Tatham, & Black, 2005). No exemplo, a hipótese nula diz respeito a possibilidade da BFP não estar relacionada ao IFP ou dos grupos de baixa e de alta renda terem o mesmo desem-penho no SON-R 2½-7.

De maneira geral, a significância estatística está relacionada ao controle da hipótese nula. Em outras palavras, o valor de p indica a probabilidade de erro ao se rejeitar a hipótese nula. Por exem-plo, Bandeira, Costa, Del Prette, Del Prette e Gerk-Carneiro (2000) investigaram a relação entre o Inventário de Habilidades Sociais (IHS) e a Escala de Assertividade de Rathus (EAR). A hipótese nula, neste caso, supõe que ambos os testes não estão relacionados. Entre-tanto, a pesquisa indicou um valor de p igual a 0,01. Neste caso, existe apenas 1% de chance de rejeitar equivocadamente a hipótese nula. Na prática, este valor indica que é possível assumir (com uma pequena possibilidade de erro) que existe relação entre a IHS e a EAR na população de referência do estudo. Em ciências humanas e sociais utiliza-se, normalmente, como ponto de corte o valor de p < 0,05 (Field, 2009; Hair et al., 2009). Em outras palavras, assume--se a possibilidade de, no máximo, 5% de erro ao rejeitar a hipótese nula. Ressalta-se, no entanto, que este corte é arbitrário, e valores


Métodos atuais de estatística aplicada e psicometria

9

de p igual a 0,06 ou 0,07 não devem ser, necessariamente, ignora-dos (Dancey & Reidy, 2006).

O valor de p tende a ser menor, e portanto a análise é menos suscetível a erro, à medida em que: (a) aumenta-se o tamanho da amostra do estudo; (b) aumenta-se a “força da relação” (tamanho do efeito) entre as variáveis estudadas; (c) aumenta-se o poder do teste estatístico em detectar as relações entre as variáveis. Ademais, é importante ressaltar que o valor de p indica apenas probabili-dade de erro estatístico e não diz respeito à força da relação. No estudo com o Inventário de Estilos Parentais (IEP), por exemplo, Gomide (2006) comparou os adolescentes do sexo masculino e feminino quanto às práticas educativas maternas e paternas. Para a prática da disciplina materna o valor de p indicado é de 0,005, enquanto que o da disciplina paterna é de 0,12. Desca-se que estes valores indicam apenas se os grupos diferem entre si, e não a importância prática destas diferentas. Ou seja, as únicas inter-pretações possíveis, neste caso, são que para a disciplina materna os grupos masculino e feminino apresentam diferenças, enquanto não é seguro afirmar que tais diferenças ocorrem para a disciplina paterna. Entretanto seria um equívoco (que, infelizmente, ocorre com bastane frequência) afirmar, considerando apenas o valor de p, que as diferenças da escala materna são maiores do que as da escala paterna. Lembre-se que significância estatística (p) refere-se apenas à probabilidade de erro estatístico e não à força da relação entre variáveis ou diferenças entre os grupos (Field, 2009; Hair et al., 2005).

Para avaliar a força da relação entre variáveis deve-se con-siderar o tamanho do efeito, que é definido como uma medida padronizada da magnitude do efeito observado. Em outras palavras o tamanho do efeito fornece uma medida objetiva e padronizada da importância ou da força da relação entre variáveis ou diferenças entre os grupos (Cohen, 1994; Thompson, 1998; Vacha-Haase & Thompson, 2004). Destaca-se que é possível avaliar o tamanho do


10


efeito tanto das correlações entre variáveis, quanto das diferenças entre grupos. Diversas medidas foram propostas para avaliar esse aspecto, as mais comuns são o d de Cohen e o r de Pearson. O d de Cohen é útil para indicar a força da diferença entre grupos, sendo calculado por meio da seguinte equação:

d =Média G1 – Média G2

DP pooled

O DP pooled é uma estimativa de desvio padrão da população. Neste sentido, o d representa as diferenças entre os grupos em uni-dades de desvios padrão.

O coeficiente r é mais fácil de ser interpretado uma vez que assume valores entre 0 e 1 (positivos ou negativos). Quanto mais próximo de 1, maior é o tamanho do efeito. Valores até 0,30 indi-cam um tamanho de efeito pequeno; de 0,30 à 0,50, moderado; de 0,50 a 0,80, forte; e maiores do que 0,8, muito forte (Field, 2009; Gouveia, Santos, & Milfont, 2009). Ressalta-se ainda que o d de Cohen pode ser convertido em r. Para tanto, sugerimos a leitura de Grubisic, Stankov e Zitko (1998) e Vacha-Haase e Thompson (2004).

Para o cálculo do tamanho do efeito, diversos softwares estão dis-poníveis. Destacamos o ViSta – The Visual Statistics System –, por ser um programa informatizado, gratuíto e de fácil manuseio*. O ViSta cal-cula o d de Cohen, fornecendo, inclusive, um intervalo de confiança para este valor. Além disso, ele oferece o output da transformação do valor de d para r (Ledesma, Macbeth, & Kohan, 2009; Young, Valero--Mora, & Friendly, 2006).

Ainda que os softwares para cálculo do tamanho do efeito sejam relativamente simples, muitas pesquisas em psicologia, ainda hoje, rela-tam apenas a significância estatística do teste, gerando uma espécie de

* Para realizar o download, acesse www.uv.es/visualstats/book



11

“ditadura do p” (Dancey & Reidy, 2006). O problema desta abordagem é que muitas vezes as relações ou as diferenças são estatisticamente significativas, mas apresentam pouca importância prática. Além disso, o valor de p é influenciado pelo tamanho da amostra. Neste sentido, amostras grandes permitem, quase sempre, rejeitar a hipótese nula, mesmo que a relação entre as variáveis seja pequena (Field, 2009). Sendo assim, a informação do tamanho do efeito, pode ajudar a solucio-nar o problema ao fornecer uma medida de relevância da relação. Esta discussão é de tamanha relevância, que algumas revistas internacionais, por exemplo, tendem fortemente a rejeitar artigos que não informam o tamanho do efeito.

Felizmente, esse problema tem diminuído nos últimos anos. Por exemplo, no estudo de validação e padronização da Escala Fatorial de Extroversão (EFEx), Nunes e Hutz (2007) relatam as diferenças entre sexo e região para os quatro fatores que compõem a escala, bem como para a escala geral. Embora tenham encontrado diferenças estatisti-camente significativas entre homens e mulheres, o tamanho do efeito evidenciado é bastante pequeno (d = 0,11). Este é um exemplo no qual as diferenças estatisticamente significativas possuem baixíssima rele-vância prática e teórica.

Outro conceito importante é o de poder estatística. Este refere--se ao poder que um teste estatístico possui em detectar um fenômeno sistemático que realmente existe na população de referência. O valor do poder estatístico também pode variar de 0 a 1 e indica a probabili-dade da pesquisa encontrar um efeito sistemático (quando, de fato, ele existe). Quanto mais alto, maior é a probablidade do teste estatístico encontrar algum efeito. O poder estatístico é influenciado positivamente pelo tamanho da amostra, pelo ponto de corte do p adotado, pelo tama-nho do efeito e pela fidedignidade dos instrumentos. Ademais o poder é maior para testes uni-caudais, se comparado aos bi-caudais (Bacon, 2004; Hair et al., 2005; VanVoorhis & Morgan, 2007).

Neste sentido, comete-se um equívoco ao concluir que a ausência de significância estatística (p > 0,05, por exemplo) indica, necessariamente,


12


que as variáveis não estão relacionadas: é possível que a ausência de significância seja apenas um reflexo do baixo poder estatístico. Ou seja, na realidade, os efeitos sistemáticos existem, mas o teste estatístico não foi poderoso o suficiente para detectá-los. Portanto, é importante apre-sentar e discutir o poder estatístico quando as diferenças ou relações entre variáveis não são encontradas. Ressalta-se, ainda, que o cálculo do poder estatístico é mais relevante no planejamento da pesquisa. Nesta etapa da pesquisa, ao detectar previamente um poder estatístico baixo, ainda é possível planejar o aumento do tamanho da amostra, a utiliza-ção instrumentos mais fidedignos, o aumento do tamanho do efeito ou a utilização de um ponto de corte de p menos rigoroso (Van Voorhis & Morgan, 2007).

Ressalta-se que as técnicas estatísticas são apenas ferramentas utilizadas pela psicologia. Como ressalta Kreft (2000), é uma ilusão esperar que os números, por si mesmos, possam revelar a verdade. Sendo assim, é fundamental que o psicólogo interprete os resultados estatísticos à luz de alguma teoria psicológica. Um valor de significân-cia estatística baixo pode não ser importante do ponto de vista teórico (o contrário também é verdadeiro). Uma correlação, hipotética, entre o desempenho em matemática e o tamanho do sapato, mesmo que apre-sente r = 0,35 e p = 0,01, não indica muita coisa do ponto de vista teórico. A seguir, discute-se algumas das técnicas mais utilizadas na avalição psicológica e psicometria.

ANÁLISE DE REGRESSÃO

A análise de regressão é um conjunto de técnicas que per-mitem a avaliar a relação entre uma única variável critério (ou dependente) e uma ou mais variáveis preditoras (ou independente). Em outras palavras, a análise de regressão é uma forma de pre-ver algum tipo de resultado por meio de uma ou mais variáveis preditoras (Miles & Shevlin, 2001; Tabachnick & Fidell, 2007).



13

Tecnicamente a análise de regressão busca ajustar um modelo – contendo as variáveis preditoras indicadas pelo autor da pesquisa – aos dados observados. Na prática, o modelo dificilmente ajustar--se-á 100 por cento aos dados. Portanto, restará sempre um resíduo ou erro. Sendo assim, para a regressão:

Dados = Modelo + Resíduo

Essa é uma equação que resume os modelos de regressão. Se o modelo se ajustar perfeitamente aos dados, então deriva-se da equação que o resíduo será zero (Miles & Shevlin, 2001).

A despeito da existência de alguns tipos de regressão, este capí-tulo está focado na regressão linear, uma vez que é a técnica mais utilizada na avaliação psicológica. As principais características da regressão linear são: 1) a variável de critério deve ser, no mínimo, intervalar; 2) o modelo ajustado deve ser linear. Ou seja, após o ajuste do modelo, a mudança em alguma variável preditora deverá produzir uma mudança na variável critério (Hair et al., 2005; Miles & Shev-lin, 2001). Sendo assim, os valores do modelo de regressão podem ser representados por uma reta, conforme a Figura 1.

v

X – Estilos parentais maternos

Y –

Afe

tivid

ade m

ãe-f

ilho

0

2

4

6

8

10

2 4 6 8 10

Figura 1. Reta de regressão da Afetividade entre mãe e filho.


14


A Figura 1 representa a relação entre os estilos parentais maternos (de estabilidade emocional e rejeição) e a avaliação da afetividade entre mãe e filho. Note que a afetividade (variável de critério) aumenta proporcionalmente com o aumento das variá-veis de estilos parentais (variáveis preditoras). Note também que a reta pontilhada, representando o modelo, intercepta o eixo Y no valor aproximado de 2,5. Este valor representa uma constante no modelo, denominada intercepto e simbolizada, normalmente, pela letra “c”. A reta também possui uma inclinação positiva. Ou seja, a afetividade varia concomitantemente à variabilidade dos esco-res dos estilos parentais. Tecnicamente, a inclinação da reta é dada pelos coeficientes de regressão, simbolizados pela letra “b”. Na Figura 1 também é possível visualizar os escores observados dos participantes (representados pelos círculos). Perceba que, na maio-ria dos casos, existe uma distância entre estes escores observados e a reta de regressão (com os valores previstos). A diferença entre a reta de regressão e os escores observados é o valor residual, simbo-lizado pela letra “e” (Miles & Shevlin, 2001). Portanto, os modelos de regressão linear, exemplificado na Figura 1, podem ser repre-sentados pela seguinte equação:

Y = c + b1 X1 + e

Onde, Y é a variável critério;c é o intercepto (constante);b1X1 é o produto do escore na variável X e o coeficiente

de regressão (b1) para esta variável;e é o resíduo.

Esta equação representa um modelo de regressão simples, com uma única variável preditora (X1). Modelos com duas ou



15

mais variáveis preditoras (X1, X2, ... Xn) fazem parte do escopo da regressão linear múltipla. Para cada variável inserida no modelo de regressão múltipla, deve-se acrescentar à equação um coeficiente de regressão (b), além do escore na variável inserida (b2X2, b3X3, ... bnXn) (Miles & Shevlin, 2001; Tabachnick & Fidell, 2007). A seguir, algumas tabelas frequentemente utilizadas em regressões. Os pacotes estatísticos oferecem, normalmente, outputs semelhan-tes às Tabelas 1, 2 e 3, embora elas não tenham sido retiradas de nenhum software específico. O modelo apresentado foi retirado do estudo de Valentini (2009).

O modelo de regressão é apresentado na Tabela 1. Primei-ramente, a constante é interpretada como o valor da variável de critério se todas as demais variáveis preditoras fossem iguais a 0. No exemplo da tabela, se os escores nas variáveis estabilidade emo-cional, rejeição e super-proteção forem igual a 0, então a variável afetividade terá valor igual ao da constante (20,39).

Uma das partes mais importantes da regressão diz respeito aos coeficientes de regressão. Na Tabela 1 são apresentados os coe-ficientes b e β. Ambos são considerados medidas do quanto as variáveis contribuem, individualmente, para a explicação da variá-vel de critério. A diferença entre eles reside na padronização: o b mantém a unidade original da variável, portanto é um coeficiente não padronizado; enquanto o β é padronizado em unidades de des-vio-padrão. O coeficiente não padronizado b indica que a mudança de uma unidade na variável preditora acarretará a mudança média de b unidades na variável de critério (desde que as demais variáveis sejam mantidas constantes). Por exemplo, o aumento de um ponto na variável estabilidade emocional resultará na mudança de 0,78 pontos na variável afetividade filho-mãe. Destaca-se, no entanto, que não é possível comparar os coeficientes de regressão b entre si, pois as variáveis podem ter (e normalmente têm) médias e variân-cias distintas. Para compará-los é necessário utilizar o coeficiente β, visto que este considera as variáveis padronizadas em uma métrica


16


comum. Tal padronização permite avaliar qual variável preditora contribui mais para o modelo (Field, 2009; Miles & Shevlin, 2001). No exemplo da Tabela 1, a variável estabilidade emocional con-tribui mais para a predição do afeto (β = 0,78), se comparada à variável rejeição (β = -0,13). Além disso, a variável super-proteção contribui muito pouco com o modelo (β = 0,02) se comparada às demais variáveis.

Tabela 1. Modelo de regressão (n = 913).

Variável de Critério

Modelo Explicativo

Coeficientes não Padronizados

CoeficientesPadronizados

t pb Erro

padrão β

Afetividade de mãe-filho

(Constante) 20,39 3,36 - - -Estabilidade emocional 0,78 0,07 0,67 11,14 0,001

Rejeição -0,13 0,05 -0,14 -2,60 0,05

Super-proteção* 0,02 0,07 0,01 0,29 0,75

Nota: * Esta variável não é apresentada no modelo original. Sua inserção na tabela cumpre unicamente um papel didático.

Os dados apresentados na Tabela 1 podem, ainda, auxiliar o pesquisador na decisão de quais variáveis preditoras permane-cerão no modelo final. Para tanto, é possível analisar a razão do coeficiente de regressão não padronizado b pelo seu erro padrão. Quando o valor da divisão do b pelo seu erro padrão for maior do 1,96, o intervalo de confiança (95%) não contém o valor 0. Por-tanto, o b será significativamente diferente de 0. Utiliza-se o valor de 1,96, pois se trata do valor de erro padrão que engloba 95% dos casos de uma distribuição normal (Miles & Shevlin, 2001; Tabachnick & Fidell, 2007). Considerando o exemplo da variá-vel estabilidade emocional, 0,78/0,07 = 11,14, portanto maior do



17

que 1,96. Neste mesmo exemplo, para o cálculo do intervalo de confiança, 0,78 ± (0,07*1,96) = 0,78 ± 0,14. Ou seja, o inter-valo de confiança (95%) para o coeficiente b apresenta valores entre 0,64 e 0,92. Em outras palavras, o intervalo de confiança não contém o valor 0, portanto é indicado preservar a variável estabilidade emocional no modelo. Para a variável super-prote-ção, o cálculo do intervalo de confiança é como segue: 0,02 ± (0,07*1,96) = 0,02 ± 0,14. Neste caso, o intervalo de confiança apresenta valores entre – 0,12 e + 0,16. Em outras palavras, o intervalo de confiança contém o valor 0, portanto é indicado excluir a variável do modelo.

Alguns softwares também oferecem uma saída com o teste t para os coeficientes de regressão. Por um lado, a análise do teste t é redundante com o cálculo anteriormente apresentado. Note que na Tabela 1, para o exemplo da variável estabilidade emocional, o valor de t (11,14) é exatamente igual ao valor calculado para a divisão entre b e o erro padrão (0,78 / 0,07 = 11,14). Por outro lado, o teste t é de rápida e fácil interpretação. Neste caso, a rejeição da hipótese nula (p < 0,01) indica que a variável em questão contribui signifi-cativamente para a modelo (Miles & Shevlin, 2001; Tabachnick & Fidell, 2007). No exemplo da Tabela 1, o teste t, também indica que o coeficiente de regressão da variável estabilidade emocional é sig-nificativamente diferente de 0 (p <0,01), o que indica a pertinência deste variável preditora no modelo.

Além de analisar as variáveis separadamente, é importante considerar a adequação do modelo completo. As Tabelas 2 e 3 podem auxiliar o pesquisador na realização desta tarefa.

Tabela 2. Resumo do modelo (n = 913).

R R2 R2 Ajustado

Modelo 0,76 0,58 0,56


18


Na Tabela 2 é apresentado o valor de R. Você pode consultar algum capítulo de conceitos básicos para lembrar que o r repre-senta o tamanho de efeito da análise. Para a regressão, o R também é considerado uma espécie de tamanho do efeito, mas neste caso indica o efeito do modelo sobre a variável critério. O R também pode variar de 0 a 1. Quanto mais próximo de 1, maior é o efeito do modelo sobre a variável critério (Hair et al., 2005; Tabachnick & Fidell, 2007). Nesse exemplo, o R de 0,76 indica um efeito forte do modelo de estilos parentais na previsão da variável de critério afetividade entre mãe e filho. Na Tabela 2 também é apresentado o R2. Neste exemplo, R2 = (0,76)2 = 0,58. O valor de R2 indica a por-centagem da variância da variável criétrio explicada pelo modelo. Sendo assim, no exemplo, é correto afirmar que 58% da variân-cia da variável afetividade entre mãe e filho pode ser explicada pelo modelo. Entretanto, o R2 é calculado em função da amos-tra de pesquisa. Visando uma estimativa de variância explicada para a população, alguns programas estatísticos também oferecem o resultado do R2 ajustado. Note que o valor de R2 ajustado é um pouco inferior ao R2.

Tabela 3. ANOVA para o modelo de regressão da variável afetividade mãe e filho (n = 913)

F gl p

Modelo 132,55 2 0,001

A Tabela 3 é um exemplo de output da análise da variância (ANOVA) realizada nas regressões lineares. Supondo que o pes-quisador não dispõe de um estudo que aponte quais variáveis são eficazes na predição da variável afetividade. Neste caso a única estimativa possível é a própria média da afetividade. Ao adicionar variáveis preditoras no modelo, espera-se que as variáveis inseridas



19

ofereçam uma melhor estimativa da variável critério do que a sim-ples média. A ANOVA, neste caso, testa a hipótese nula que as estimativas do modelo não são melhores do que a média da variá-vel de saída. Neste sentido, ao se rejeitar a hipótese nula (p < 0,05) é possível concluir que o modelo é minimamente adequado na predição da variável critério (Field, 2009; Hair et al., 2005). No exemplo da Tabela 3, o modelo explicativo contendo as variáveis estabilidade emocional e rejeição prevê melhor o valor da variável afetividade entre mãe e filho do que a própria média da variável afetividade (p = 0,001).

ANÁLISE FATORIAL EXPLORATÓRIA E CONFIRMATÓRIA

A análise fatorial exploratória tornou-se uma das principais ferramentas utilizadas para avaliar a validade de construto dos ins-trumentos psicológicos. Provavelmente este fato está relacionado à possibilidade de mensuração de variáveis latentes. Ou seja, em Psicologia geralmente busca-se avaliar características do indiví-duo que não são diretamente observáveis, tais como inteligência, personalidade e atitudes. Embora não seja possível mensurar dire-tamente estes construtos ou variáveis latentes, é viável medir os itens, que podem ser considerados amostras de comportamentos. Por exemplo, no que se refere à personalidade, é possível perguntar ao examinando o quanto ele gosta de viajar para lugares diferen-tes ou o quanto ele aprecia conhecer novos restaurantes da cidade. Embora estes dois itens sejam de fácil aplicação, o psicólogo nor-malmente está mais interessado no fator de personalidade abertura à experiência que embasa tais itens.

A análise fatorial é um conjunto de técnicas estatísticas que buscam definir uma estrutura subjacente às variáveis observadas – itens de um teste, por exemplo (Hair et al., 2005; Thompson, 2004). O pesquisador utiliza a análise fatorial exploratória (AFE)


20


quando ele não possui uma estrutura subjacente definida à priori. Neste caso, as técnicas buscam encontrar a melhor estrutura que se ajuste aos dados. Na análise fatorial confirmatória (AFC), o pesquisador já possui uma estrutura a priori (a partir da teoria ou de estudos empíricos anteriores) e busca verificar se tal estru-tura ajusta-se aos dados coletados (Laros, 2005; Thompson, 2004; Gouveia et al., 2009).

Após mensurar diversos itens é possível estabelecer as corre-lações entre eles. Tais correlações podem, ainda, ser organizadas em uma tabela contendo todos os itens, tanto na horizontal quanto na vertical. Esta tabela é denominada matriz de correlações. Coe-ficientes de correlação altos podem indicar que os itens estão avaliando basicamente a mesma dimensão. Neste sentido, a aná-lise fatorial busca organizar os itens no menor número de fatores, observando o máximo possível de variância explicada pelos fatores (Field, 2009; Hair et al., 2005).

A AFE possui duas aplicações principais: (a) Reduzir um con-junto de dados a um tamanho que seja mais fácil de interpretar. Por exemplo, reduzir um check-list com mais de cem itens sobre com-portamentos psicopatológicos para cinco ou seis conjuntos de itens pode facilitar a tarefa de realizar um diagnóstico. Esta aplicação é denominada análise dos componentes principais. (b) A segunda aplicação refere-se à busca de uma estrutura de variáveis laten-tes subjacente aos itens – denominada análise fatorial comum. A diferença técnica entre componentes principais e análise fatorial comum é que a primeira utiliza a variância total e a segunda apenas a variância compartilhada (Hair et al., 2005; Laros, 2005; Thomp-son, 2004). A seguir, na Tabela 4 os dados mais relevantes de uma análise fatorial comum são exemplificados.



21

Tabela 4. Exemplo de cargas fatoriais, comunalidade, eigenvalue e porcentagem

da variância explicada para uma solução fatorial não rotacionada (n = 913).

Item

Cargas Fatoriais Cargas Fatoriais ao quadrado Comunalidade (h2)I II I II

1 -0,41 0,57 0,17% 0,32% 0,49%

2 -0,49 0,53 0,24% 0,28% 0,52%

3 -0,46 0,52 0,21% 0,27% 0,48%

4 -0,44 0,61 0,19% 0,37% 0,57%

5 -0,48 0,52 0,23% 0,27% 0,50%

6 0,57 0,54 0,32% 0,29% 0,62%

7 0,69 0,41 0,48% 0,17% 0,64%

8 0,70 0,36 0,49% 0,13% 0,62%

9 0,49 0,45 0,24% 0,20% 0,44%

10 0,48 0,39 0,23% 0,15% 0,38%

Eigenvalue 2,82 2,45

Variância explicada 28,20% 24,50%

Um dos conceitos mais importantes na análise fatorial diz res-peito à carga fatorial. Ela indica a relação entre os itens e os fatores. Em outras palavras, as cargas fatoriais representam o grau de per-tencimento de um item no construto (fator). Este valor pode variar de 0 a 1, além de positiva ou negativa. Para itens bons é esperado que sua carga fatorial seja maior do que 0,30 em apenas um dos fatores, bem como seja menor do 0,30 nos demais. Neste sentido, esse item teria boa saturação (carga fatorial alta) em um único fator (Hair et al., 2005; Pasquali, 2005; Thompson, 2004). As cargas fatoriais são bastante úteis para a separação dos fatores. No exem-plo da Tabela 4, as maiores cargas para o Fator I são as dos últimos cinco itens (em itálico). Portanto, é possível afirmar que esses cinco itens compõem o Fator I. Todavia, note que esses mesmos itens


22


também apresentam cargas fatoriais altas no Fator II. Isso pode indicar itens complexos, que pertencem tanto a um fator quanto ao outro. Todavia pedimos calma ao leitor, pois esta análise ainda precisa sofrer alguns ajustes (rotação, por exemplo) para melhorar a interpretação dos fatores.

Na Tabela 4 também é apresentada a comunalidade. Esse valor indica a proporção da variância dos itens que os fatores extraídos podem reproduzir. Em outras palavras, a comunalidade refere-se à quantidade de variância que o item em questão tem em comum com os demais itens. Ao considerar apenas os casos em que os fato-res não são correlacionados, a comunalidade representa a soma dos quadrados das cargas fatoriais do item em questão. Para o item 1, por exemplo, (-0,41)2 + (0,57)2 = 0,17 + 0,32 = 0,49 (Tabach-nick & Fidell, 2007; Thompson, 2004).

Ademais, são apresentados os eigenvalues de ambos os fatores. Esse valor indica a quantidade de informação representada em aná-lises multivariadas. Ao considerar apenas os casos em que os fatores não são correlacionados, o eigenvalue representa a soma dos qua-drados das cargas fatoriais no fator em questão. Para o fator I, por exemplo, (-0,41)2 + (-0,49)2 + (-0,46)2 + ... = 2,82. Finalmente, a divisão do eigenvalue pelo número de itens no fator em questão, indica a proporção da variância dos dados explicada pelo fator. Ainda para o fator I, 2,82 / 10 = 0,282. Ou seja, 28,2% (0,282 * 100) da variância dos itens pode ser explicada por meio do pri-meiro fator (Hair et al., 2005; Laros, 2005; Thompson, 2004).

Espera-se, ainda, que uma análise fatorial adequada expli-que, ao menos, 40% da variância total (Hair et al.,2005; Pasquali, 2005; Thompson, 2004). Esse valor pode ser calculado pela sim-ples soma da explicação fornecida pelos fatores individualmente. No exemplo, a soma de ambos os fatores indica que a solução fato-rial consegue explicar 52,70% (28,20% + 24,50%) da variância total dos itens.



23

Como havíamos comentado, após a realização de uma pri-meira análise fatorial, é possível realizar uma rotação nos fatores. Esta técnica consiste em alterar os eixos dos fatores, de maneira que os construtos analisados se tornem mais óbvios ao pesquisa-dor. Ou seja, a rotação dos fatores facilita a sua interpretação, uma vez que tende a concentrar as cargas de cada item em um único fator. Nesta etapa, os eixos dos fatores são rotacionados até atin-girem um melhor ajuste aos dados observados. Para tanto existem dois conjuntos de métodos: As rotações ortogonais e as rotações oblíquas. Na ortogonalidade, os eixos são rotacionados mantendo a perpendicularidade entre eles. Na Figura 2, as linhas contínuas representam os fatores originais e as linhas pontilhadas, os fatores rotacionados. Na parte esquerda, tanto os eixos originais, quanto os rotacionados mantêm ângulos iguais. Note também que o Fator 2 se ajustou bem aos dados, mas o Fator 1, não. Neste caso, a rotação oblíqua pode ser mais adequada. Na rotação oblíqua é per-mitido que os eixos sejam rotacionados livremente até se ajustarem melhor aos dados. Ou seja, os eixos não são mantidos, necessaria-mente, em perpendicular. Na parte direita da Figura 2, o eixo do Fator 2 sofre maior alteração do que o eixo do Fator 1. Na prática, normalmente, a principal razão para utilizar rotação ortogonal ou oblíqua diz respeito à correlação entre os fatores. Caso exista cor-relação moderada entre os fatores, normalmente, é mais adequado utilizar as rotações oblíquas, pois respeitam tais correlações. No caso de correlações muito pequenas entre os fatores, o mais indi-cado é uma rotação ortogonal. As principais rotações ortogonais são a varimax e a quartimax; e as principais rotações oblíquas são a direct oblimin e a promax (Laros, 2005; Tabachnick & Fidell, 2007; Thompson, 2004).


24


Fator 1

Fator 2

Ortogonal Oblíqua

Fator 1

90 graus

Fator 2

Figura 2. Rotação de fatores.

Após a explanação da rotação dos fatores, o leitor deve per-ceber que as cargas fatoriais apresentadas na Tabela 2 podem melhorar ao realizar algum tipo de rotação. Estes resultados são ilustrados na Tabela 5.

Tabela 5. Exemplo de cargas fatoriais após as rotações ortogonal e oblíqua dos fatores (n = 913).

Rotação Ortogonal Varimax Rotação oblíqua Oblimin

Item I II I II

1 0,03 0,70 0,01 0,70

2 -0,06 0,72 -0,08 0,72

3 -0,04 0,69 -0,06 0,69

4 0,03 0,75 0,01 0,75

5 -0,05 0,70 -0,07 0,70

6 0,79 0,07 0,78 0,05

7 0,80 -0,11 0,80 -0,13

Cont.



25

Cont.

8 0,77 -0,15 0,78 -0,18

9 0,66 0,05 0,66 0,03

10 0,62 0,01 0,62 -0,01

Após a rotação dos fatores a distribuição das cargas fatoriais melhora consideravelmente, conforme a Tabela 5. Em ambos os tipos de rotação, aumentou-se a saturação em um único fator, e diminui-se o valor da carga fatorial no outro. Em outras palavras, as rotações facilitaram a interpretação dos resultados, separando os itens de maneira mais clara. Nesse exemplo, a correlação entre os fatores é de r = 0,03. Ou seja, muito pequena, indicando que seria mais adequado apresentar a rotação ortogonal.

Uma das principais decisões do pesquisador ao realizar a aná-lise fatorial diz respeito ao número de fatores a serem extraídos. Uma possibilidade é decidir quantos fatores devem ser extraídos tendo como base alguma teoria prévia. Por exemplo, ao elaborar um inventário para avaliar os cinco grandes fatores de persona-lidade, o pesquisador já sabe quantos fatores deve extrair antes de empreender a análise fatorial. Neste caso, é necessário sim-plesmente informar ao programa estatístico o número de fatores a serem extraídos. Outra possibilidade é a utilização do crité-rio Guttman-Kaiser (Guttman, 1954; Kaiser, 1960), no qual são extraídos os fatores com eigenvalues maiores do que um. Outra possibilidade, ainda, é análise gráfica do scree plot (Field, 2009; Hair et al., 2005; Laros, 2005). Um exemplo é apresentado na Figura 3.


26


Número de Fatores

Eigenvalues

Figura 3. Scree plot.

No scree plot os autovalores de cada fator são anotados num gráfico em forma de curva ou “cotovelo”. A decisão do número de fatores a serem extraídos é realizada por meio de uma inspeção visual deste gráfico: Deve-se extrair os fatores que estão acima da “estabilização da curva”. Note que a partir do terceiro fator, abaixo da linha pontilhada, a curva deixa de ser acentuada. Estes fatores abaixo da linha pontilhada tendem a não ser robustos. Portanto, conforme a Figura 3, o mais indicado seria extrair dois fatores. O problema deste critério é sua razoável subjetividade. Diferentes pessoas podem avaliar a estabilização da curva em diferentes pon-tos. Tanto o critério de scree plot quanto o de Guttman-Kaiser têm recebido diversas críticas em função das decisões equivocadas que os pesquisadores podem cometer ao extrair os fatores com base nesses critérios. Finalmente, o critério da análise paralela de extra-ção de fatores parece mais robusto do que os anteriores (Hayton, Allen, & Scarpello 2004). Na análise paralela são geradas diversas análises fatoriais com dados aleatórios. Destas análises aleatórias é



27

retirada a média dos eigenvalues aleatórios. Estes, então, são com-parados com os eigenvalues da análise fatorial empírica (realizada com os dados coletados). A lógica é que os eigenvalues empíricos devem ser maiores do que os aleatórios. Sendo assim, é indicada a extração dos fatores antes que eigenvalues aleatórios se tornam maiores do que os empíricos (Hair et al., 2005; Laros, 2005). Na Tabela 6 é apresentado um exemplo da análise paralela.

Tabela 6. Análise paralela para extração de fatores.

Eigenvalues

Fator Empírico Aleatório

I 2,82 1,17

II 2,45 1,12

III 0,91 1,08

IV 0,74 1,04

V 0,66 1,01

No exemplo da Tabela 6 os eigenvalues empíricos foram ana-lisados a partir dos mesmos dados apresentados nas Tabelas 4 e 5 (dez itens e 913 participantes). Os eigenvalues aleatórios foram retirados de 2000 análises fatoriais com dados aleatórios. Note na Tabela 6 que para os dois primeiros fatores, os eigenvalues empíricos são maiores do que os aleatórios. Entretanto, para o ter-ceiro fator em diante os dados aleatórios produziram eigenvalues maiores do que os empíricos. Isso indica que, a partir da linha pontilhada, os fatores aleatórios explicam mais variância do que os fatores empíricos. Em outras palavras, “qualquer coisa” seria melhor do que o terceiro fator. Sendo assim, a opção mais indicada seria a extração de dois fatores.

Estas técnicas apresentadas são mais adequadas à exploração de fatores. Quando o pesquisador já possui uma estrutura teórica


28


para os seus dados o mais indicado é a utilização da análise fato-rial confirmatória (AFC). A AFC é uma das diversas aplicações da Modelagem por Equações Estruturais (MEE). De maneira geral, a MEE é entendida como uma mistura da análise de regressão e da análise fatorial. Tecnicamente, a MEE parte da matriz de covariân-cias (é possível também optar pela matriz de correlações) e estima os parâmetros das relações estipuladas a priori pelo autor. Se o modelo destas relações for plausível a diferença entre a matriz esti-mada e a matriz original é pequena (Byrne, 2010; Pilati & Laros, 2007; Thompson, 2004).

Neste procedimento, é necessário que o pesquisador, pri-meiramente, especifique o modelo. Neste sentido, tendo como base a teoria e os estudos anteriores, as relações entre as variáveis que devem ser testadas são informadas ao computador. Então, o modelo é estimado por algum método escolhido pelo pesquisador (por exemplo, Máxima Verossimilhança). Neste ponto, é impor-tante avaliar os parâmetros estimados. Indicadores (ou itens) ruins, por exemplo, tendem a gerar coeficientes (ou cargas fato-riais) baixos e alta variância residual. Neste caso deve-se avaliar a possibilidade de excluí-los (Byrne, 2010; Kline, 2011; Thomp-son, 2004).

Os programas estatísticos também oferecem alguns indicado-res de ajuste do modelo. Caso o modelo proposto pelo pesquisador não se ajuste bem aos dados coletados é importante pensar em alternativas para melhorá-lo. Um dos indicadores de ajuste mais utilizados é o qui-quadrado - c2 (Byrne, 2010; Hox & Bechger, 1998). Neste caso, testa-se a diferença entre a matriz original e a matriz estimada pelo modelo. Se não houver diferença estatis-ticamente significativa o modelo é bem ajustado. Todavia o c2 é sensível ao tamanho da amostra. Ou seja, em amostras grandes, tende-se a encontrar diferenças significativas mesmo que o modelo seja razoavelmente adequado. Para superar esta dificuldade, foram



29

propostos outros indicadores de ajuste. Os mais utilizados são o Normed Fit Index (NFI), o Comparative Fit Index (CFI), o Good-ness of Fit Index (GFI), o Adjusted Goodness of Fit Index (AGFI) e o Tucker Lewis Index (TLI). Esses indicadores podem assumir valores entre 0 e 1, sendo que acima de 0,90 o modelo pode ser considerado aceitável, e acima de 0,95, ajustado. Além desses, são utilizados frequentemente o Root Mean Square Residual (RMR), o Standardized Root Mean Square Residual (SRMR) e o Root Mean Square Error of Approximation (RMSEA). Quanto maior for o valor do RMR, SRMR ou RMSEA, mais desajustado é o modelo. Por este motivo, eles são considerados indicadores de desajuste do modelo. Para modelos bons é esperado que seus valores não sejam maiores do que 0,06 (Byrne, 2010; Pilati & Laros, 2007; Tabach-nick & Fidell, 2007; Thompson, 2004).

TEORIA DE RESPOSTA AO ITEM – TRI1

A presente discussão sobre TRI é introdutória, para maiores detalhes consulte (Valentini & Laros, 2011). A TRI é um conjunto de modelos que procuram representar a probabilidade de uma pes-soa apresentar uma determinada resposta a um item, considerando os parâmetros do item e o nível de habilidade desta pessoa avaliada (Andrade, Tavares, & Valle, 2000). A TRI também é conhecida como a Teoria do Traço Latente, pois considera que as respos-tas observadas de um teste estão embasadas em traços latentes ou habilidades não observáveis, representadas pelo q - theta (Ham-bleton & Swaminathan, 1985; Pasquali, 2007). Neste modelo téorico adota-se uma escala padronizada para mensuração do q , podendo assumir valores entre - ¥ (infinito) a + ¥ (Hambleton &

1 O conteúdo de TRI foi adaptado, em parte, do capítulo Valentini & Laros (2011). Os autores e a editora autorizaram essa reprodução.


30


Swaminathan, 1985; Pasquali, 2007). Todavia, na maior parte das vezes, o q varia entre -3 e +3.

A TRI possui dois postulados gerais. O primeiro indica que o desempenho (ou escore) de uma pessoa num determinado item pode ser explicado pelo traço latente da pessoa e pelas características do item. Ou seja, a partir do q do participante e das características do item é possível estimar a probabilidade dele acertar o item (ou endossá-lo, em escalas de preferência). O segundo postulado indica que é possível expressar a probabilidade do desempenho em fun-ção do q por meio de uma curva ascendente, denominada Curva Característica do Item (CCI) (Andrade, Laros, & Gouveia, 2011; Baker, 2001; Hambleton & Swaminathan, 1985). A CCI especifica que a probalidade de resposta correta é maior conforme o aumento da habilidade. Ressalta-se que esta relação não é linear, conforme a Figura 4 (Andrade, Tavares, & Valle, 2000; Baker, 2001; Hamble-ton & Swaminathan, 1985).

Figura 4. Curva Característica do Item.



31

Na CCI também são identificados os parâmetros de dificul-dade (b), discriminação (a) e acerto ao acaso (c) dos itens. O valor do parâmetro b representa o tamanho de q necessário para que o item seja respondido corretamente ou endossado. Mais espe-cificamente, o b representa a habilidade q necessária para uma probabilidade de acerto igual a (1 + c)/2. No exemplo da Figura 4, c = 1, portanto (1+0,1)/2 = 0,55. Sendo assim, um q de apro-ximadamente 0 é suficiente para que a probabilidade de acerto seja de 0,55. Neste sentido, quando maior o valor de b, mais difícil é o item. Na escala q, itens com b inferiores a -2 podem ser conside-rados fáceis e itens com b superiores a +2, dificeis (Hambleton & Swaminathan, 1985; Rasch, 1960; Wright & Stone, 1979).

Para a discriminação do item (parâmetro a) considera-se a inclinação da curva. Mais especificamente, o parâmetro a repre-senta a inclinação da derivada da tangente (linha pontilhada e inclinada na Figura 4) da CCI no momento em que ela incide sobre o parâmetro b, isto é, o ponto de inflexão. Quanto maior a inclina-ção, maior a discriminação do item. Teoricamente o parâmetro a pode assumir valores entre -¥ e +¥. Entretanto, itens com discri-minação menor do que 0 devem ser excluídos, pois algo deve estar errado com este item. Portanto, na prática, a discriminação varia de 0 a 2. Baker (2001) afirma que os valores de b entre 0,65 e 1,34 indicam um poder discriminativo moderado do item; entre 1,35 e 1,69, alto; e acima de 1,70, muito alto (Andrade, Tavares, & Valle., 2000; Hambleton & Swaminathan, 1985).

O parâmetro c indica a probabilidade de acerto ao acaso. Em outras palavras, ele indica a probabilidade de um aluno com baixa habilidade responder corretamente ao item. Na CCI o parâmetro c corresponde ao valor no qual a curva intercepta o eixo das orde-nadas “Y” (eixo da probabilidade de acerto, neste caso). Na Figura 4, o item apresenta c = 0,10. Ou seja, uma pessoa mesmo com uma habilidade muito baixa possui cerca de 10% de chances de


32


responder corretamente ao item devido ao acaso. Espera-se que, para itens bons com cinco alternativas, o parâmetro c não ultra-passe 0,20 (1/5 alternativas = 0,2); para quatro alternativas, o valor máximo seria de 0,25 (Andrade, Laros, & Gouveia, 2011). Para itens problemáticos, o parâmetro c aumenta com a presença de alternativas não atraentes ou que estejam obviamente incorre-tas. Ou seja, para os itens nos quais é bastante fácil detectar uma ou duas alternativas incorretas, restarão apenas outras duas ou três alternativas para o “chute”, o que aumenta a probabilidade de acerto ao acaso (Andrade, Laros, & Gouveia, 2011; Hambleton, Swaminathan, & Rogers, 1991).

Outro conceito básico importante para a TRI é o da curva de informação (CI). Existem dois tipos de CI: Uma para o item (CII - curva de informação do item) e uma para o teste (CIT - curva de informação do teste). Ambas são definidas como a quantidade de informação fornecida pelo item (ou teste) para avaliação de uma habilidade q (Andrade, Laros, & Gouveia, 2011; Pasquali, 2007). Por meio dela é possível avaliar para quais intervalos de habilidade o item é mais útil, considerando a maior quantidade de informa-ção; bem como para qual faixa eles agregam mais erro do que informação. A Figura 5 contém uma CIT ilustrativa de um teste. A curva de linha contínua indica a informação do teste para os dife-rentes níveis de q, enquanto a curva de linha pontilhada indica o erro padrão de medida. Neste exemplo, a maior quantidade de informação é relativa às habilidades entre -1 e 0. Para os níveis de q inferiores a -2 e superiores a +1 o teste produz mais erro do que informação legítima. Em suma, é possível avaliar que o teste, neste exemplo, seria mais indicado para pessoas com habilidades médias.



33

Figura 5. Curva de informação do teste (CIT).

Ressalta-se que para a estimação dos parâmetros dos itens e das habilidades do participantes a TRI apresenta alguns modelos. O número de parâmetros estimados e o tipo de resposta ao item (dicotômico e escala Likert, por exemplo) são as principais carac-terísticas que diferenciam os modelos. De maneira geral, os mais utilizados são os modelos logísticos de um, dois e três parâmetros para itens dicotômicos, bem como os modelos para itens politômi-cos (Andrade, Laros, & Gouveia, 2011).

Os modelos logísticos para itens dicotômicos diferem-se, principalmente, pelo número de parâmetros avaliados. O modelo de um parâmetro avalia apenas a dificuldade do item; o de dois, a dificuldade e a discriminação; e o de três, a dificuldade, a discri-minação e o acerto ao acaso (Andrade, Tavares, & Valle, 2000; Hambleton & Swaminathan, 1985).

Nos modelos de TRI para itens politômicos são estimadas as probalidades de um participante dar a resposta da categoria x ao item i. Sendo assim, passa-se a avaliar a probabilidade de endosso da categoria x, em vez da resposta certa. O tipo de escala utilizada pelo item é a diferença básica entre os dois principais modelos.


34


O modelo de resposta gradual de Samejima (1974) assume que as categorias do item podem ser ordenadas entre si. Enquanto o modelo de escala gradual proposto por Andrich (1978) assume que, além da possibilidade de ordenar as categorias, os escores das categorias são igualmente espaçados.

Da mesma forma que outros modelos de estimação, a TRI possui alguns pressupostos. Um deles diz respeito à unidimen-sionalidade. Ou seja, para estimação dos parâmetros é condição necessária que o conjunto de itens avalie apenas um único traço latente. As respostas a um teste de matemática, por exemplo, não podem sofrer influência da compreensão de língua portuguesa dos participantes. O problema deste pressuposto é que ele dificilmente pode ser plenamente satisfeito. Para resolver este paradoxo, alguns autores têm ressaltado que a presença de um traço latente domi-nante é o suficiente para satisfazer este pressuposto (Hambleton et al., 1991; Condé & Laros, 2007; Laros, Pasquali, & Rodri-gues, 2000; Vitória, Almeida, & Primi, 2006). Outro pressuposto importante é o da independência local. Ele visa a garantir que os itens sejam respondidos exclusivamente em função da habilidade q dominante. Em outras palavras, a resposta de um examinando a um item x não afeta sua resposta aos demais itens (Andrade, Laros, & Gouveia, 2011; Hambleton & Swaminathan, 1985; Lord, 1980).

A TRI tem sido aplicada principalmente na construção de instrumentos, equalização das habilidades em diferentes provas e testagem adaptativa computadorizada. Na construção da Bate-ria Fatorial de Personalidade (BFP), por exemplo, são relatados os resultados de algumas análises por meio da TRI (Nunes, Hutz, & Nunes, 2010). Os autores analisaram os parâmetros b dos itens utilizando o modelo de um parâmetro. Considerando a baixa dis-persão das estimativas, observaram que nenhum item era muito difícil (b muito alto) ou muito fácil (b muito baixo) de ser respon-dido. Ademais, no manual foram apresentadas as estimativas dos q



35

(traço latente) dos respondentes, separando-as pelas escalas da BFP. A média mais alta foi obtida na escala Socialização (0,51) e a mais baixa na escala Neuroticismo (- 0,26). Os autores ainda disponibi-lizaram tabelas para conversão dos escores brutos para escores q.

CONSIDERAÇÕES FINAIS

As disciplinas de estatística aplicada e de psicometria nem sem-pre estão entre as mais “amadas” pelos estudantes e profissionais. Todavia, elas são importantes para diversos contextos da psicolo-gia. Os conceitos da estatística são utilizados por grande parte dos bons artigos científicos, cuja leitura é essencial para atualização dos profissionais e pesquisadores. Acrescenta-se que a tarefa de ponde-rar a utilização de um teste, por exemplo, não está desvinculada da avaliação dos aspectos psicrométricos. Espera-se que este capítulo tenha esclarecido alguns dos conceitos e técnicas mais utilizados na avaliação psicológica. Por tratar-se de uma introdução, espera--se também que o texto tenha despertado o interesse do leitor para aprofundar tais assuntos.


36


REFERÊNCIAS

Andrade, D. F., Tavares, H. R., & Valle, R. D. (2000). Teoria de resposta ao item: conceitos e aplicações. São Paulo: Associação Brasileira de Estatística.

Andrade, J. M., Laros, J. A., & Gouveia, V. V. (2011). O uso da Teoria de Resposta ao Item em avaliações educacionais: Diretrizes para Pesqui-sadores. Avaliação Psicológica, 9, pp. 421-435.

Andrich, D. (1978). A rating formulation for ordered response categories. Psychometrika , 43, 561-573.

Bacon, D. (2004). The contributions of reliability and pretests to effective assessment. [on line]. Practical Assessment, Research & Eva-luation, 9 , acessado em abril, 2011 de http://PAREonline.net/getvn.asp?v=9&n=3 .

Baker, F. B. (2001). The basics of item response theory (2 ed.). New York: Eric Clearinghouse on Assessment and Evaluation.

Bandeira, M., Costa, M. N., Del-Prette, Z. A., Del-Prette, A., & Gerk--Carneiro, E. (2000). Qualidades psicométricas do Inventário de Habilidades Sociais (IHS): Estudo sobre a estabilidade temporal e a validade concomitante. Estudos de Psicologia , 5, 401-419.

Byrne, B. M. (2010). Structural equation modeling with AMOS: Basic con-cepts, applications, and programming (2 ed.). New York: Routledge.

Cohen, J. (1994). The earth is round (p < .05). American Psychologist, 49, pp. 997–1003.

Condé, F. N., & Laros, J. A. (2007). Unidimensionalidade e propriedade de invariância das estimativas da habilidade pela TRI. Avaliação Psico-lógica , 6, 205-215.

Dancey, C. P., & Reidy, J. (2006). Estatística sem matemática para psicolo-gia: Usando o SPSS para Windows (3 ed.). Porto Alegre: Artmed.

Field, A. (2009). Descobrindo a estatística usando o SPSS. Porto Alegre: Artmed.

Gomide, P. I. (2006). Inventário de Estilos Parentais - IEP: Modelo teó-rico, manual de aplicação, apuração e interpretação. Petrópolis: Vozes.



37

Gouveia, V. V., Santos, W. S., & Milfont, T. L. (2009). O Uso da Estatís-tica na Avaliação Psicológica: Comentários e Considerações Práticas. In: C. S. (Org.), Avanços e polêmicas em Avaliação Psicológica: Em homenagem a Jurema Alcides Cunha (pp. 127-155). São Paulo: Casa do Psicólogo.

Grubisic, A., Stankov, S., & Zitko, B. (1998). Experiment Replication and Meta-Analysis in Evaluation of Intelligent Tutoring System’s Effective-ness. Wseas Transactions on Computers (4), pp. 304-315.

Guttman, L. (1954). Some necessary conditions for common factor analy-sis. Psychometrika, 19, 149-162.

Hair, J. F., Anderson, R. E., Tatham, R. L., & Black, W. C. (2005). Análise Multivariada de dados (5a. ed.). Porto Alegre: BookMan.

Hambleton, R. K., & Swaminathan, H. (1985). Item Response Theory: Principles and Applications. Boston: Kluwer Nijhoff Publishing.

Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamen-tals of Item Response Theory. London: Sage.

Hayton, J. C., Allen, D. G., & Scarpello, V. (2004). Factor retention deci-sions in exploratory factor analysis: A tutorial on Parallel Analysis. Organizational Research Methods, 7, 191-205.

Hox, J. J., & Bechger, T. M. (1998). An introduction to structural equa-tion modeling. Family Science Review , 11, 354-373.

Kaiser, H. F. (1960). The application of eletronic computers to factor analysis. Educational and Psychological Measurement , 20, 141-151.

Kline, R. (2011). Principles and Practice of Structural Equation Modelign (3 ed.). New York: Guilford

Kreft, I. G. G. (2000). Using random coefficient linear models for the analysis of hierarchically nested data. In H. E. A. Tinsley & S. D. Brown (Eds.), Handbook of Applied Multivariate Statistics and Mathe-matical Modeling (pp. 613-634). San Diego, CA: Academic Press.

Laros, J. A. (2005). O uso da análise fatorial: Algumas diretrizes para pes-quisadores. In: L. Pasquali, Análise fatorial para pesquisadores (Org.) (pp. 163-184). Brasília: LabPam.

Laros, J. A., Pasquali, L., & Rodrigues, M. M. (2000). Análise da unidimen-sionalidade das provas do SAEB. Relatório Técnico. Brasília: Centro de Pesquisa em Avaliação Educacional - Universidade de Brasília.


38


Laros, J. A., Tellegen, P. J., Jesus, G. R., & Karino, C. A. (2011). SON-R 2½-7[a]: Teste não-verbal de inteligência. Manual com validação e nor-matização brasileira. São Paulo: Casa do Psicólogo.

Ledesma, R. D., McBeath, G., & Kohan, N. C. (2009). Computing effect size measures with ViSta – The visual statistcs system. Tutorials in Quantitative Methods for Psychology, 5, 25-34.

Lord, F. M. (1980). Applications of item response theory to practical tes-ting problems. Hillsdale: Lawrence Eribaum.

Miles, J., & Shevlin, M. (2001). Applying regression & correlation: A guide for students and researchers. London: Sage.

Nunes, C. H., & Hutz, C. S. (2007). Escala Fatorial de Extroversão - EFEx: Manual de aplicação. São Paulo: Casa do Psicólogo.

Nunes, C. H., Hutz, C. S., & Nunes, M. F. (2010). Bateria Fatorial de Per-sonalidade (BFP): Manual técnico. Itatiba: Casa do Psicólogo.

Pasquali, L. (2005). Análise fatorial para pesquisadores. Brasília: LabPam.

Pasquali, L. (2007). TRI - Teoria de Resposta ao Item: Teoria, Procedimen-tos e Aplicações. Brasília: LabPAM.

Pasquali, L., Azevedo, M. M., & Ghesti, I. (1997). Inventário Fatorial de Personalidade - IFP: Manual técnico de aplicação. São Paulo: Casa do Psicólogo.

Pilati, R., & Laros, J. A. (2007). Modelos de Equações Estruturais em Psicologia: Conceitos e aplicações. Psicologia: Teoria e Pesquisa , 23, 205-216.

Rasch, G. (1960). Probabilistic models for some intelligence and attain-ment tests. Chicago: Mesa Press.

Samejima, F. (1974). Normal ogive model on the continuous response level in the multi-dimensional latent space. Psychometrika , 39, 111-121.

Tabachnick, B. G., & Fidell, L. S. (2007). Using Multivariate Statistics (5 ed.). Boston: Pearson.

Thompson, B. (2004). Exploratory and confirmatory factor analysis: Understanding concepts and applications. Washington: American Psychological Association.

Thompson, B. (1998). Statistical Significance and Effect Size Reporting: Portrait of a Possible Future. Research in the schools, 5, pp. 33-38.



39

Vacha-Haase, T., & Thompson, B. (2004). How to Estimate and Inter-pret Various Effect Sizes. Journal of Counseling Psychology (51), pp. 473-481.

Valentini, F. (2009). Estudo das propriedades psicométricas do Inventário de Estilos Parentais de Young para o Brasil. Dissertação de Mestrado. Natal: Universidade Federal do Rio Grande do Norte.

Valentini, F., & Laros, J. A. (2011). Teoria de Resposta ao Item na Avaliação Psicológica. In: R. A. Ambiel, I. S. Rabelo, S. V. Pacanaro, G. A. Alves, & I. F.-L. (Orgs.), Avaliação psicológica: guia de consulta para estudantes e profissionais de psicologia. São Paulo: Casa do Psicólogo.

Van Voorhis, C. R., & Morgan, B. L. (2007). Understanding Power and Rules of Thumb for Determining Sample Sizes. Tutorials in Quantitative Methods for Psychology , 3, 43-50.

Vitória, F., Almeida, L. S., & Primi, R. (2006). Unidimensionalidade em testes psicológicos: conceito, estratégias e dificuldades na avaliação. Revista de Psicologia da Vetor, 7, 1-7.

Young, F. W., Valero-Mora, P. M., & Friendly, M. (2006). Visual Statistic: Seeing Data With Dynamic Interactive Graphics. Hoboken: John Wiley & Sons.

Wright, B. D., & Stone, M. H. (1979). Best test design. Chicago: Mesa Press.


avancos psicologicos 2

Documents

Transcript of avancos psicologicos 2