Crítica aos testes de inteligência

download Crítica aos testes de inteligência

of 20

Transcript of Crítica aos testes de inteligência

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 17

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    A CRTICA DESINFORMADA AOSTESTES DE INTELIGNCIA

    THE UNSUPPORTED CRITICISM TOTHE INTELLIGENCE TESTS

    Carmen E. FLORES-MENDOZA1Elizabeth do NASCIMENTOAdail Victorino CASTILHO

    RESUMO

    Prestes a comemorar um sculo da criao dos testes psicolgicos e,com ela, a sofisticao da avaliao psicolgica, o presente artigopretende apresentar alguns dos pontos polmicos que acompanham aproduo e aplicao dos instrumentos psicolgicos, principalmenteaqueles relacionados medio da capacidade intelectual. Discute-seque o desprestgio dos testes de inteligncia no pas deve-se, em primeirolugar, ao desconhecimento dos princpios bsicos sobre construo detestes, o que permite freqentemente que se exija dos testes o que nopode ser esperado (ex. predio perfeita) e, em segundo lugar, aexacerbao de crenas polticas pretensamente cientficas. Conclui-seque os testes que, inicialmente, indicaram a existncia de grandesdiferenas intelectuais entre grupos humanos conforme a etnia, faixaetria e gnero sexual so os mesmos que atualmente indicam queessas diferenas esto diminuindo. Os testes continuam sendo osmesmos, porm mudaram as condies sociais. Portanto, os testes nocriam diferenas intelectuais, apenas as retratam.

    Palavras-chave: Testes psicolgicos, medio do comportamento, crticada medio.

    ABSTRACT

    Now, when psychologists can celebrate a century since the creation ofpsychological tests and the sophistication of psychological measurements,

    (1) Dra. da Universidade Federal de Minas Gerais. Endereo para correspondncia: Av. Antnio Carlos, 6627.Departamento de Psicologia Sala 4042 Universidade Federal de Minas Gerais - Belo Horizonte/MGTels. (031) 3499-6277 (Sala) (031) 3492-1077 (Res.) - E-mail: [email protected]

  • 18 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    this paper presents some polemical viewpoints that comes along with theuses and applications of psychological tests, mainly those concernedwith assessment intellectual ability. It says the discre about tests, inour country, at first because of lack of acquaintance with its basicconstruction principles that often allows unreal expectations as forexample perfect predictions and, at second, because political andideological beliefs intended as scientific itselves. The psychologicaltests that years ago pointed to the existence of large intellectualdifferences among human groups concerning ethnical, age and gendervariables are the same that, currently tell us these differences areshowing diminution. Psychological tests continue to be the same,notwithstanding social conditions changed. So, psychological tests donot create intellectual differences, they just show it.

    Keywords: Psychological tests, behavior measurement, measurementcriticism.

    INTRODUO

    Em 2005, a rea de avaliao psicolgicaestar comemorando um sculo da criao detestes desde que o psiclogo francs AlfredBinet, no incio do sculo XX, criou o primeiroteste de avaliao da inteligncia.

    No decorrer dos anos, muitos testespsicolgicos foram criados e hoje em diapode-se encontrar desde aqueles quepretendem avaliar comportamentos especficoscomo ansiedade, crenas irracionais, lideranae outros, at aqueles que pretendem avaliaraspectos mais gerais do comportamento,como inteligncia ou personalidade; tambmos modelos estatsticos aplicados mediopsicolgica foram aperfeioados e diversi-ficados. A psicometria aliou-se psicologiacognitiva e, assim, a tcnica correlacionaljuntou-se ao mtodo experimental. Tambm,consoante com a era da informao, amedio psicolgica pouco a pouco deixade se apresentar apenas em mdia impressae cada vez mais utiliza a mdia eletrnica(software).

    Tal produo permitiu um acmulo deinformaes val iosas a respeito do

    comportamento humano, particularmente, noque se refere inteligncia humana e seuscorrelatos sociais. No entanto, muitas dasinformaes produzidas, principalmente nametade do sculo passado, criaram certomal-estar em alguns segmentos acadmicose no sem razo. Houve no passado algunsfatos, no mnimo suspeitos, de prtica cientficafraudulenta e crenas polticas antipopularesde alguns pioneiros da psicometria; o quecontribuiu para reforar uma atitude dedescrena em relao aos testes psicolgicosem geral. Lamentavelmente, a descrenageneralizada propiciou o surgimento de crticassem fundamento cientfico, opinies baseadasna desinformao, atitudes emotivas e crenasirracionais, apesar dos testes terem permitidoum melhor conhecimento da inteligncia doque outros construtos psicolgicos (Wechsler,1971).

    A atitude de repdio aos testes agrava-sequando se veiculam em revistas acadmicasalguns artigos que se posicionam contra ostestes. Se bem fundamentados, os artigosdeveriam servir de reflexo para aqueles quese preocupam com a medio psicolgica,

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 19

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    porm o que se l, em geral, um conjunto deafirmaes baseadas no terreno poltico-ideolgico e no na anlise do conhecimentoterico e tcnico, que so as fontes daconstruo dos testes. Tais artigos, absorvidospor profissionais, alunos e leigos em avaliaopsicolgica, fazem ecoar as vozes contrrias medio da conduta humana. Pretende-seaqui, portanto, discutir algumas dessas crticase levantar os alcances e limites da prtica demedio psicolgica, especificamente no quese refere inteligncia humana.

    Crtica 1: Os testes reforam ainferioridade dos segmentos sociaisdesfavorecidos e das minorias tnicas.

    O argumento um dos preferidos dacrtica aos testes. Um dos fatos histricosmais lembrados o estudo de Henry Goddardefetuado nos Estados Unidos, no incio dosculo passado, com imigrantes do sul e doleste da Europa. Em nota, Roazzi, Spinillo eAlmeida (1991) comentam que o estudo deGoddard, realizado com 178 imigrantes, teriamostrado que 83% dos hngaros, 79% dositalianos e 87% dos russos apresentavamresultados muitos baixos, o que reforaria acrena do baixo nvel intelectual dos imigrantes.Segundo os autores as pesquisas de Goddardt iveram um impacto signif icat ivo naimplementao de leis de restrio imigraonos anos 20 (pg. 31). Esse mesmo episdiofoi enfaticamente descrito nas obras de Kamin(1974) e Gould (1996), dois autoresamericanos, um psiclogo social e o outropaleontobilogo, fartamente evocado peloscrticos dos testes psicolgicos.

    A respeito desse fato, Colom (2000) afirmaque os sujeitos estudados por Goddard eramsujeitos pr-selecionados da Ilha de Ellis deNova York e vistos pela comunidade comoportadores de retardo mental. O objetivo deGoddard era apenas verificar a sensibilidadeda escala mtrica de Binet para identificarpessoas com retardo mental tanto dentro dapopulao norte-americana quanto da dos

    imigrantes. Segundo Colom (2000), em nenhummomento Goddard teria dito que 80% dosimigrantes eram retardados mentais ou que asamostras por ele estudadas eramrepresentativas dos imigrantes que desembar-cavam na Ilha. Portanto, a totalidade dosimigrantes nunca fora estudada utilizando ostestes psicolgicos. Tampouco o Congressodos Estados Unidos soubera dos resultadosdessas avaliaes e nem Goddard forachamado a depor sobre seus resultados.Segundo Rushton (1994), a responsabilidadede Goddard na lei de restrio imigrao de1924 parece ser mais um mito do que um fatohistrico.

    Quando se reproduz o mito de que ostestes psicolgicos teriam fornecido as basespara a lei de restrio imigrao, no perodoentre 1910 e 1930, pouco se diz do climapoltico que se respirava na Universidade deHarvard quando tal crena se disseminou nomundo acadmico na dcada de 70.

    Um retrato dessa poca foi oferecidopelo professor Edward Wilson, um pesquisadorda sociobiologia, no seu artigo autobiogrficointitulado Cincia e Ideologia, apresentadooriginalmente em 1994 na reunio daAssociao Nacional de Acadmicos naUniversidade de Cambridge. Ele descreve oambiente acadmico da Universidade deHarvard nos anos 70 e 80, no qual era freqenteassistir a calorosos debates polticos entrecientistas que se autodenominavam esquerdae os que eram apelidados de direita. Como oprofessor Wilson pesquisava as basesbiolgicas da conduta social, ele foi classificadocomo de direita pelo Grupo de Estudo sobrea Sociobiologia - um grupo presidido porRichard Lewontin, ento diretor do programano qual Wilson trabalhava. Lewontin, juntocom Steven Rose e Leon Kamin, liderava o queeles mesmos chamaram de filosofia da cinciaradical. Essa filosofia teria como objetivofazer oposio a uma parte da cincia que,interessada em preservar uma classedominante, no estaria permitindo a construo

  • 20 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    de uma sociedade igualitria e socialista.Supostamente Wilson ao afirmar que algunscomportamentos sociais teriam sua basebiolgica, ele faria parte desse tipo de cincia.Nesse sentido, uma das medidas adotadaspelo Grupo de Estudo sobre a Sociobiologiafoi a condenao da obra principal de Wilson(Sociobiologia: a nova sntese), por meio deuma carta enviada e publicada no New YorkReview of Books, em 13 de novembro de 1975.Na carta vinculava-se Wilson a teoriaseugenicistas e polticas nazistas. Foi nessacarta que se afirmou que teorias quemostrassem uma justificao gentica dosprivilgios existentes em uma determinadaclasse ou raa teriam permitido a aprovao,no incio do sculo XX, da famosa lei derestrio imigrao nos Estados Unidos.Seguiram-se a essa carta numerososmanifestos contra a sociobiologia humana. E,como ocorrera com Arthur Jensen (citado mais frente), as aulas de Wilson foraminterrompidas, palestras foram palco deagresso fsica e, numa determinadaconferncia, um contingente policial teve queser acionado para preservar a integridade fsicado professor. Passados 20 anos, 90% dasobras, dentre as 200 que se seguiram obrade Edward Wilson, aceitaram os pressupostoscontidos no livro Sociobiologia: a nova sntese(Wilson, 1995).

    Outra prova considerada crucial peloscrticos dos testes psicolgicos o efeitopigmaleo. Trata-se do efeito das expectativasdos pesquisadores sobre suas investigaes.Sem querer, os pesquisadores trabalhariaminconscientemente para que os resultados deexperimentos se apresentassem na direoesperada por eles. Essas evidncias foramtranspostas ao ensino. Se as expectativasdos professores forem boas ento os alunostero bom desempenho; se, pelo contrrio,elas forem ms, os alunos apresentaro baixorendimento. como se os professorestrabalhassem inconscientemente para que aprofecia se cumprisse. Chamou-se esse

    fenmeno de efeito pigmaleo e foiapresentado pela primeira vez ao pblico porRosenthal e Jacobson por meio do artigoTeachers expectancies: Determinants ofpupils IQ gains (Rosenthal & Jacobson, 1966)e depois com a obra Pygmalion in theclassroom: Teacher expectation and pupilsintellectual development (Rosenthal &Jacobson, 1968).

    As observaes de Rosenthal e Jacobsoninteressavam muito, posto que, se a intelignciadas crianas fosse to malevel a ponto de asopinies dos professores determinarem oaumento ou diminuio dos seus nveisintelectuais, ento as reivindicaes dosambientalistas radicais estariam corretas. Oestudo consistiu em fornecer aos professoresde 18 classes, da primeira sexta srie, trsclasses por srie, uma lista de alunos (grupoexperimental) que supostamente teriam altopotencial para as atividades acadmicas, secomparados ao restante da classe (grupocontrole), segundo resultados do TOGA, umteste de inteligncia no verbal, desenvolvidopela Universidade de Harvard. Meses maistarde, novas testagens dos alunos (trs aotodo) apontaram um QI mais elevado do grupoexperimental do que dos alunos do grupo decontrole. Os professores, portanto, tinhamaumentado o QI dos alunos trabalhandosegundo suas expectativas. O efeito pigmaleoteve grande repercusso na mdia e nasociedade americana, a ponto de influenciardecises judiciais relacionadas ao ensino,como o caso da deciso do Estado daCalifrnia que proibiu o uso dos testes deinteligncia para encaminhamento de crianassuspeitas de retardo mental leve. A alegaoera que as situaes de testagem sofriam oefeito pigmaleo.

    A reedio americana de 1992 doPygmalion in the Classroom, sem nenhumamudana no texto ou informao sobre asfortes crticas metodologia usada, motivouSpitz (1999) a realizar um levantamento dosaspectos frgeis do estudo de Rosenthal e

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 21

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    Jacobson, primeiramente observados porrenomados estudiosos como Thorndike eSnow. Entre esses podem ser citados:

    - O aumento de QI observado no grupoexperimental referia-se apenas s sriesiniciais (1 e 2), sendo insignificante naterceira e quarta srie. Na quinta esexta srie, o QI do grupo controle foiligeiramente maior que o do grupoexperimental. Na escala verbal do TOGA,o grupo experimental (considerandosempre a 1 e 2 srie) teria ganho 14,5pontos e o grupo controle teria ganho4,5 pontos de QI. Surpreendentemente,na escala de raciocnio do TOGA, ogrupo experimental teria ganho nadamenos do que 40 pontos de QI e o grupode controle teria ganho apenas 27pontos (quase dois desvios padro). Avariabilidade interescalar e a extensode ganhos em pontos de QIevidenciavam que o TOGA noapresentava normas adequadas paraaplicao em crianas muito pequenas.

    - Resultados individuais mostravamcasos de crianas que depois de 8meses teriam ganhos de QI, no mnimo,suspeitos: de 133 a 202, de 61 a 106,de 88 a 128, de 60 a 97. Tais resultadossignif icavam que cr ianas compontuao tpica de deficientes mentais(QI 61) teriam alcanado, em oitomeses, pontuaes normais (QI 106),assim como crianas de intelignciasuperior (QI 133) teriam alcanadopontuaes tpicas de genialidade (QI202).

    - Parte da amostra era composta de 63crianas que recentemente tinhamentrado na escola. O QI mdio deraciocnio dessa amostra era de 58, ouseja, todas apresentavam deficinciamental. Para obter resultado to baixoas crianas teriam que ter acertadoapenas duas questes do teste deinteligncia, ou seja, menos do

    necessrio para obter um escore poracaso.

    - Houve exagerada variabilidade de QIs:uma criana de QI 17 no pr-testeobteve nas retestagens QIs de 148, 110e 112; assim como uma outra com QIde 18 obteve nos ps-testes QIs de 44,122 e 98. E houve uma terceira queobteve QI Verbal de 183 e depois QIs de166, 221 e 168. Os dados caticosficam mais absurdos quando se sabeque as normas do TOGA iam de QI 60a QI 160, sendo que o manual do testerecomendava no extrapolar talamplitude. Portanto, alguns dadossimplesmente parecem no ter validade.

    - De 18 estudos produzidos entre 1969 e1974, tentando replicar o estudo doefeito pigmaleo, apenas um estudomostrou um ganho de cerca de cincopontos de QI no grupo experimental.

    Surpreende, pois, que um estudo comsrios problemas metodolgicos possa terrecebido tanta ateno.

    Enquanto se discutia o efeito pigmaleo,em 1969 surgia um dos artigos mais polmicos.Trata-se do artigo produzido por Jensenintitulado How Much Can We Boost IQ andScholastic Achievement? (Jensen, 1969),publicado pela Harvard Educational Review.Trata-se de um documento de 125 pginas,que foi reproduzido e comentado, parcialmente,nas principais publicaes jornalsticasamericanas, assim como na televiso e nordio. A repercusso do artigo provocou umaonda de protestos que iam desde a agressoverbal at a ameaa fsica; pedia-se inclusivea cabea de Jensen. Devido a essas ameaas,tanto na escola quanto na sua residncia,Jensen (1998b) narrou a necessidade, naquelapoca, de estar revisando correspondnciassuspeitas de conterem explosivos. Dois anosmais tarde, em 1971, o psiclogo alemo,naturalizado ingls, Hans Eysenck publicou

  • 22 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    Race, Intelligence, and Education, no qualreforava as afirmaes de Jensen. Em visita London School of Economics em 1973,Eysenck receberia um ataque fsico deestudantes maostas (Rushton, 1998). Anosmais tarde, a polmica ainda continuava e, em1977, um contingente de 50 policiais teve queresguardar Jensen de uma multido irada quetinha ido Universidade de Melbourne paraagredi-lo. Que informaes continha o artigoque provocou tamanha reao social? Naspalavras do prprio Jensen (1998b):

    ...foram as poucas pginas sobrediferenas de QI e alcance acadmicoentre as raas (cerca de 5% do artigo)que causaram tanto barulho e fria... .Eis o que escrevi a respeito dasdiferenas de QI entre brancos e negros:a preponderncia da evidncia , naminha opinio, menos consistente com ahiptese estritamente ambiental do quecom a hiptese gentica, a qual por certono exclui a influncia do ambiente ou desua interao com os fatoresgenticos... (pg. 197).

    Durante anos Jensen tentou explicar queo que tinha afirmado na poca era a necessidadede verificar uma hiptese, no caso, a influnciagentica nas diferenas individuais e no queas pessoas da raa negra nasciamintelectualmente inferiores. Jensen (1998b)afirmou que seria tolice transpor as evidnciasgenticas observadas nas diferenasintelectuais dentro de uma raa para explicaras diferenas entre as raas.

    A invest igao das causas quedeterminam as diferenas individuais de umadeterminada populao no fator g considera avarincia gentica e a varincia ambiental.Porm, a varincia ambiental pode advir deduas fontes: o ambiente compartilhado(ambiente que compartilham os membros deuma famlia) e o ambiente no compartilhado(ambientes especficos, por exemplo, escola,nos quais interagem pessoas de outrasfamlias).

    O estudo de gmeos univitelinos criadosdentro e fora de seus lares de origem permiteest imar a inf luncia do ambientecompartilhado. Convencionou-se que o graude hereditariedade fosse representado pelosmbolo h. Um h igual ou prximo de zerosignifica que a contribuio dos fatoresgenticos quase nula. Por outro lado, um higual ou prximo de 1,00 significa que acontribuio gentica quase total. Pois bem, um consenso cientfico que dentro dapopulao branca americana o h para medidascomo o QI oscila entre 0,40 e 0,80 (Neisser,1998). Esses valores indicam que a influnciagentica bastante forte (a oscilao dosvalores devida ao fator idade; em geral,quanto maior a idade maior a influncia genticano QI), mas indicam tambm uma participaoconsidervel do ambiente (1-h) nas diferenasindividuais com relao inteligncia.Especificamente, quais fatores do ambienteso responsveis pelas diferenas intelectuaisna populao branca? Ningum sabe ao certo.Agora imagine realizar um estudo parainvestigar as diferenas intelectuais entre asraas. As diferenas de fatores ambientaisentre os grupos no so apenas de naturezaquantitativa, mas tambm qualitativa. Oambiente da raa branca no semelhante aoda raa negra. sabido que este ltimo grupotem enfrentado maiores obstculos sociaisque o primeiro. Portanto, no faz sentido pensarque as mesmas influncias genticas eambientais responsveis pelas diferenasintelectuais dentro de um grupo sejam asmesmas responsveis pelas diferenas entreos grupos.

    A obra The Bell Curve (1994) talvezrepresente a retomada das discusses emtorno da medida psicolgica. Seus autores, ospsiclogos americanos Herrnstein e Murray (oprimeiro falecido no mesmo ano da publicao),apresentaram numerosas evidncias doscorrelatos fsicos e sociais da inteligncia. Aobra contm duas partes: a primeira, na qualanalisam numerosos trabalhos psicomtricos

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 23

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    e a segunda, na qual os autores apresentamsuas posies sociais e polticas. Uma dasconcluses foi a de que a sociedade modernaest se mobilizando em funo das diferenasintelectuais e no mais do status ou da classesocial de origem. Assim sendo, estaria emformao uma elite intelectual e uma subclassecognitiva, sendo que a primeira, na previsodos autores, impor normas segunda. Porm,a parte mais polmica, e pela qual a obra setornou a mais conhecida e debatida tanto nosmeios acadmicos quanto nos governamentais,foi a apresentao de dados que mostramnovamente a questo das diferenas dedesempenho cognitivo entre as raas branca enegra. Os crticos acadmicos e da imprensaem geral se dividiram, uns afirmando que setrata da obra mais antidemocrtica de que seteve notcia e outros afirmando que a obramerece respeito, haja vista que os autores noinventaram os dados, apenas os compilaram(Colom, 1995).

    Devido extrema polmica que a obrasuscitou na sociedade americana, graas sua difuso nos meios de comunicao, oWall Street Journal, em 13 de dezembro de1994, resolveu publicar um relatrio de 25pontos, assinado por 52 renomados cientistase pesquisadores da rea da inteligncia. Poucotempo depois, a American PsychologicalAssociation-APA tomou a iniciativa de publicarum informe mais detalhado a respeito do quea psicologia, enquanto cincia, conhece sobreo construto chamado inteligncia. Um grupode seletos investigadores da rea da cogniohumana, como Sternberg, Brody, Bouchard,Ceci, Loehlin e outros, redigiram e assinaramum relatrio, em nome da APA, que foipublicado na revista American Psychologist(Neisser et al., 1996). O informe bastanteprudente nas suas concluses, mas nadadiferente do que j foi apresentado at omomento. No que diz respeito s diferenasintelectuais, considerando os diversos grupostnicos, diz-se que, de fato, h diferenas deQIs entre os grupos tnicos, porm no que se

    refere a brancos e negros americanos, asdiferenas esto diminuindo. As diferenasno se devem a um possvel vis dos testescontra determinados grupos tnicos etampouco refletem diferenas socioeco-nmicas.Na realidade, se desconhece a causadessas diferenas.

    Neisser (1998) organizou uma obraintitulada The Raising Curve-Long-Term Gainsin IQ and Related Measures, na qual escrevemreconhecidos pesquisadores como JamesFlynn, Richard Lynn, Stephen Ceci. A obradiscute as duas boas notcias que esto sendocomentadas hoje em dia: 1) no mundoindustrializado os escores nos testes deinteligncia esto aumentando e no caindo e2) a disparidade de alcance acadmico entrecrianas negras e brancas tem diminudo nosltimos anos. Essas notcias tm importanterepercusso social e se contrapem dosepessimista de Herrstein e Murray (1994).

    A discusso sobre o aumento do QI nomundo teve incio a partir da meta-anlise deestudos provenientes de 14 naes, realizadapor Flynn (1987). O estudo apontava um ganho,em apenas uma gerao, entre 5 e 25 pontosde QI em testes de inteligncia fluida (Gf). Emmdia, o ganho teria sido de 15 pontos, ouseja, o correspondente a um desvio padro.Contudo, o ganho obtido no est muito claroem 10 pases, mas sim em apenas quatro(Blgica, Noruega, Nova Zelndia e Holanda)dos 14 pases estudados. Pouco mais de umadcada depois, Flynn (1998) continuaafirmando o que dizia em 1987: dado que improvvel que os habitantes dos quatro pases,onde os ganhos de QI parecem sercontundentes (ganhos de 15 pontos em mdia),tivessem em 1896, portanto duas geraesatrs, um QI de 70, seria pouco provvel que ostestes meam exatamente inteligncia.

    Na Espanha, Colom, Andrs-Pueyo eJuan-Espinosa (1998) analisaram, utilizando ametodologia de Flynn, os dados brutos dasduas normatizaes do teste Raven (EscalaGeral e Avanada), a primeira feita entre 1963

  • 24 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    e 1968, e a segunda entre 1991 e 1996. Osresultados apontaram um ganho de 19,2 pontosde QI na Escala Geral e 6,75 pontos de QI naEscala Avanada. O ganho, portanto, pareceser maior na populao heterognea (EscalaGeral) do que naquela mais homognea (EscalaAvanada). Um outro estudo realizado porAbad et al. (2001), com base nos dados daadaptao e padronizao para a populaoespanhola do WISC-III, mostrou que o fator gexplica menos a varincia dos grupos maisinstrudos do que dos menos instrudos.1 Poroutro lado, fatores de grupo explicam mais avarincia de desempenho dos grupos commaior educao do que a variao dedesempenho dos grupos menos instrudos.Essa hiptese, em realidade, j havia sidolevantada por Detterman e Daniel (1989). Osautores afirmam que quanto maior for o nvelintelectual da pessoa, menos relevante ainteligncia geral (fator g), pois a intelignciase especializa. o caso dos resultados deAbad et al. (2001). A varincia de desempenhodos grupos mais instrudos, que explica osfatores de grupo, foi maior. No caso dos ganhosde QI nos pases industrializados, deve-seconsiderar que os estudos utilizaram amostrasheterogneas. Os ganhos, portanto, devemser mesmo de inteligncia geral (fator g). Mascomo ento explicar os ganhos de intelignciageral? Uma possvel resposta que, se aspessoas nos ltimos 50 anos ficaram maisaltas, melhor alimentadas, passaram afreqentar em maior nmero as universidadese passaram a ter maior acesso tecnologia, de se esperar, portanto, uma melhora tantodas capacidades fluidas (Gf), aquelas quedependem pouco da educao formal, quantodas cristalizadas (Gc), aquelas que dependemem maior extenso da educao formal.Contudo, os ganhos observados foram maioresnas capacidades fluidas (Gf), isto , naquelascapacidades que so mais vulnerveis acomponentes biolgicos (e, portanto, mais

    prximas do fator g) do que nas capacidadesrelacionadas aprendizagem.

    Embora ainda no esteja claro porque osfatores ambientais (educao, estimulao) eos fatores biolgicos (nutrio) afetam mais acapacidade fluida do que a cristalizada, o caso que os instrumentos, que no passado foramto criticados por apontar as diferenas daspessoas, so os mesmos que, atualmente,apontam para um aumento das capacidadesintelectuais entre as pessoas. Trata-se, semdvida, de uma boa notcia.

    Por outro lado, os testes podem auxiliarna verificao do efeito de polticas governa-mentais para reduo das desigualdadessociais entre etnias, como a poltica americanade ao afirmativa. Recentemente, Nyborg eJensen (2001) apresentaram dados sobre ofator g (extrados de 19 testes cognitivos),renda econmica e status ocupacional,coletados entre 1985 e 1986, de veteranos dasforas armadas americanas nos ltimos 30anos. A comparao entre pessoas negras ebrancas de igual g revela que as primeirasapresentam maior renda econmica e posioocupacional do que as segundas desde que og se encontre acima do percentil mdio.

    Crtica 2: Houve prtica fraudulenta naproduo psicomtrica

    As crenas polticas dos pesquisadores,em qualquer rea de estudo, podem, afinal decontas, ser apoiadas ou no pelos resultadosde pesquisas que possuem um rigor cientfico.No entanto, um estudo que descreva o rigorcientfico utilizado no garante a probidadedos dados. Em outras palavras, no podemosser ingnuos em acreditar que todo trabalhocientfico verdadeiro ou correto. As razesvariam: h estudos que escondem falhasmetodolgicas e h outros que no percebema inadequao metodolgica. Os primeiros

    (1) Um fator g pode ser extrado como o primeiro fator principal no rotado de uma anlise de componentesprincipais. O famoso estudo de Detterman & Daniel (1989) sobre a hiptese de diferenciao do fator g foirealizado utilizando os dados da padronizao americana do WISC_R.

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 25

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    mostram que seus responsveis adotaramuma atitude incorreta e no tica, enquanto ossegundos mostram que seus responsveisainda no adquiriram maturidade cientfica.Contudo, a atitude mais condenvel que umpesquisador pode adotar a fraude cientfica.No caso das diferenas individuais, o episdiomais citado o de Cyril Burt, um psiclogoescolar ingls de meados do sculo passado.Os dados mostrados por Burt, com efeito,sugerem a prtica fraudulenta em algunsestudos relacionados s bases biolgicas dainteligncia. O descobridor foi o psiclogosocial Leon Kamin.

    Kamin (Eysenck & Kamin, 1982)descreveu a estranheza que provocou nele airregularidade dos valores das correlaesapresentados por Burt em estudos de gmeoscriados em separado. Segundo Burt, acorrelao positiva entre QIs de gmeos seriauma evidncia de que a inteligncia fundamentalmente influenciada pela gentica.Em 1943, Burt teria comunicado que acorrelao entre QIs de gmeos idnticos erade 0,77. Em 1955, quando a amostra aumentoude 15 para 21 pares, o valor da correlao erade 0,771. Em 1958, a amostra teria aumentadopara 30 pares e o valor manteve-se em 0,771.No final de 1958, aumentou a amostra para 42pares e a correlao se modificou muito pouco(0,778). Em 1966, quando a amostra era de 53pares, a correlao era a mesma de 1955, isto, de 0,771. H, pois pouca dvida de que osestudos relatados por Burt, no mnimo, eramirregulares e suspeitos. Kamin descreveuoutros estudos efetuados em gmeos criadosjuntos e separados e tentou mostrar diversasfalhas metodolgicas.

    A suspeita de fraude por parte de Burt(que at ento era considerado um dosmelhores pesquisadores da intelignciahumana) reforou a posio da cincia radicale provavelmente obscureceu os avanos daspesquisas na rea das diferenas individuaisdurante alguns anos.

    Uma das melhores armas da cinciapara mostrar equvocos (ex. falhasmetodolgicas) ou comportamentos suspeitos(ex. fraude) a replicabilidade dos estudos. Esurpreendentemente um deles, iniciado em1979, apresentou um valor correlacionalprximo do apregoado por Burt. Trata-se doestudo de Minnesota (Bouchard, et al., 1990).Foram reunidos mais de 100 pares e trios degmeos, monozigticos e dizigticos, criadosjuntos e separados. Os gmeos eramprocedentes da Inglaterra, Estados Unidos,Austrlia, Canad, China, Nova Zelndia,Sucia e Alemanha. Os participantes foramsubmetidos a mais de 50 horas de avaliaomdica e psicolgica. No que diz respeito avaliao psicolgica, foram aplicados quatroquestionrios de personalidade, trs inventriosde interesses e duas baterias de capacidadecognitiva. Os resultados do estudo deMinnesota apresentaram um valor correlacionalde 0,70 entre QIs de gmeos monozigticosadultos. Bouchard et al. (1990) concluramque seus resultados esto bastante prximosde outros, nos quais se obteve valores oscilandoentre 0,64 e 0,74.

    Embora ainda seja comprometedora airregularidade dos dados de Burt, a semelhanaentre os valores supostamente obtidos poraquele e os de Minnesota causa surpresa nomeio acadmico. No entender de vrios autores(Colom, 2000; Fletcher, 1990; Rushton, 1994),o Burt Affair ainda no foi bem esclarecido.

    Crtica 3: Os testes no medem aquiloque pretendem medir

    a expresso mais ouvida daqueles quese posicionam contrr ios aos testespsicolgicos. Trata-se da questo da validadedos instrumentos, isto , como podemos saber,por exemplo, se os testes de intelignciamedem, de fato, a capacidade cognitiva de umindivduo e em que medida eles o fazem? Pararesponder a essa questo cabe remontar psicometria, particularmente, s tcnicas daanlise fatorial (validade do construto) e s

  • 26 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    teorias sobre o construto investigado, aspectosesses freqentemente no considerados oudesconhecidos pelos crticos dos testespsicolgicos (Colom, 1998).

    A anlise fatorial, como outras tcnicas,tem sido aperfeioada com o passar dos anos,permitindo o desenvolvimento de formas deanl ise cada vez mais poderosas.Tecnicamente, a anlise fatorial se propeverificar todas as relaes possveis entre asvariveis de uma matriz de dados e as reduz aum conjunto de dimenses chamadas fatores(Hair, Anderson, Tatham & Black, 1995).Assim, por exemplo, se o objetivo descobriras variveis subjacentes ao sucesso de vendade um determinado produto, muito provvelque se apontem diversas delas, tais como aimagem do fabricante, o preo do produto, aquantidade, a embalagem, a tradio da marcano mercado, a durabilidade do produto, seucheiro e a cor, as informaes contidas noproduto, etc. Uma anlise fatorial poder reduzirtodas essas variveis a trs dimenses quepodem receber o nome de qualidade(durabilidade, cheiro, textura, cor), custo(preo, quantidade do produto) e publicidade(imagem do fabricante, embalagem do produto,tradio do produto, informao do produto).Essas dimenses podem ser chamadas defatores e o peso de cada uma na venda doproduto determinar a atuao do fabricante(ex. reforar a qualidade e manter a publicidadeou manter o preo e a qualidade e aumentar apublicidade).

    No caso do construto chamadointeligncia aplica-se tambm a anlisefatorial. E, antes de aplic-la, deve-se teralguma clareza a respeito do construto que sequer avaliar. No caso da inteligncia, estapode ser entendida como um construto quedesigna uma condio abstrata do ser humano.Entre os acadmicos existe uma diversidadede definies, dependendo da orientaoterica adotada, embora se observe certoconsenso de que o ato de resolver problemasseja uma das caractersticas principais da

    inteligncia (Flores-Mendoza & Nascimento,2001). Na populao leiga, praticamente todosos indivduos reconhecem, desde o menosinstrudo at o mais culto, que as pessoas secomportam de maneira diferenciada ao resolverproblemas ou tomar decises. Algumaspessoas so rpidas e eficientes e sochamadas de pessoas muito inteligentes;outras no so to rpidas e nem to eficientese so chamadas de pessoas poucointeligentes. O criador de um teste parte deuma concepo do que venha a ser inteligncia,a fim de elaborar itens cuja soluo representea manifestao desse construto. Sabercalcular, possuir informaes sobre o ambienteem que reside, resolver problemas doquotidiano, realizar analogias, possuir umvocabulrio extenso so todos indcios decomportamento inteligente. Quais dessescomportamentos representam melhor ainteligncia? Talvez nunca se chegue a umacordo. Sabemos que as atividades humanas,quaisquer que sejam, implicam sempre, emmaior ou menor grau, o uso da inteligncia. Ese essa inteligncia se mantm relativamenteestvel num indivduo, enquanto resposta adeterminadas situaes, ento a inteligncia um trao do comportamento humano quepode ser medido. A existncia diferenciadanos seres humanos desse trao decomportamento constitui a base das diferenasindividuais. O teste psicolgico delineado paraavaliar a inteligncia dever, portanto,apresentar itens que demandem o uso dehabilidades cognitivas que representem o traode inteligncia, embora como diz Cronbach(1998) Nenhum construtor de testes podeelaborar um teste com todas as qualidadesdesejveis(pg. 172).

    Se as pontuaes em testes deinteligncia acompanham, em algum grau, ocomportamento fisiolgico e social de umindivduo, ento, que inteligncia essa que medida pelos testes? Qual a natureza e aestrutura da inteligncia?

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 27

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    Responder a essas questes implica emir alm da construo de testes. Saber que umteste apresenta resultados estveis no decorrerdo tempo (preciso), que se correlaciona comum critrio externo (validade de critrio) e quese utilizou uma amostra representativa dapopulao para a elaborao das normas no suficiente para explicar o construto que oteste pretende medir; para tanto, necessrioaprofundar as discusses no terreno tericocientfico e tambm analisar as interaesentre os testes e a vida quotidiana. Realizaressa anlise significa o que os psicometristaschamam de estabelecimento da validade deconstruto, ou seja, investigar se o teste constituiuma representao legtima do construto(Pasquali, 1997) e implica utilizar tcnicas deanlise fatorial e mtodos interdisciplinares deinvestigao experimental que possamcontribuir para a elucidao do construto.

    A anlise fatorial teve seu incio no finaldo sculo XIX, quando o ingls CharlesSpearman elaborou o mtodo tetrdico.Segundo esse mtodo, quando h correlaosignificativa entre dois ou mais testes, essacorrelao devida a um fator comum (ou fatorg). A parte que no se correlacionacorresponderia a fatores especficos a cadateste. Portanto, a anlise fatorial isola ambosos fatores (fator g e fatores especficos). Osfatores extrados, ento, so expressesestatsticas e no pressupem entidadesconcretas. Mas, Spearman (1955) afirmou queo fator g, em ltima instncia, reflete umaenergia mental, uma capacidade geral dosindivduos para resolver testes de naturezadiversa. Posteriormente, tanto o fator g comoos fatores especficos foram reunidos nomodelo dos dois fatores.2 Outros mtodosfatoriais, alm do tetrdico, foram surgindo naliteratura psicomtrica e em todos eles obteve--se um g significativo, desde que os estudosempregassem amostras amplas e

    representativas da populao, assim comotambm testes variados que demandassemdo sujeito distintas atividades cognitivas(Jensen & Weng, 1994; Jensen, 1998a).

    O que a prtica psicomtrica temmostrado? As estimativas dos fatores tmmostrado, como dito anteriormente, um fatorgeral permeando o desempenho em todas astarefas intelectuais; da a importncia do fatorg proposto por Spearman. Outrospsicometristas tm exigido a anlise minuciosados numerosos componentes e, portanto, dosdiversos fatores que seriam responsveis pelasdiferenas individuais. Dessa forma, desde otrabalho pioneiro do psiclogo ingls Spearmanat pouco tempo atrs, os psicometristas sedividiram; uns afirmando a importncia de umfator geral para explicar as diferenas individuaisna inteligncia (Eysenck,1982; Jensen, 1987;Burt, 1955; Gustafsson, 1988; R. Thorndike,1994) e outros afirmando a existncia denumerosos fatores como importantescomponentes estruturais da inteligncia (E.Thorndike, 1921; Thurstone, 1921; Guilford,1954, 1988).

    Tais arranjos fatoriais dividiram-se emdois grupos: o grupo dos modelos hierrquicos(que pressupem dimenses mais gerais naparte superior da estrutura da inteligncia edimenses de menor generalidade, freqen-temente as mais numerosas, que se encontramna parte inferior da estrutura) e o grupo dosmodelos no-hierrquicos (que pressupemdiversos componentes que compem aestrutura da inteligncia desconsiderandoqualquer relao entre as dimenses). At omomento, o modelo hierrquico o que maistem contribudo para a prtica da avaliaopsicolgica, dado que mais parcimoniosoestimar a capacidade de um indivduo a partirde testes de ampla generalidade do que utilizarnumerosos testes especficos (Colom, 1998;Juan-Espinosa, 1997).

    (2) Posteriormente, Spearman aceitaria o fato de que entre o fator g e o fator e haveria um certo nmero de fatoresde grupo, mas que considerava de menor importncia se comparado importncia do g (Thorndike,1994).

  • 28 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    Os modelos hierrquicos ganharam foratambm graas ao trabalho de John Carroll(1993), considerado um marco no campo dasdiferenas individuais. Trata-se de uma rduainvestigao em que o autor reanalisouaproximadamente 460 estudos fatoriaisrealizados em diversos pases num perodo de40 anos, a maioria nos Estados Unidos e queenvolveram mais de 130.000 sujeitos. Aconcluso dessa reanlise foi que os fatorespodem ser agrupados, de acordo com seugrau de generalidade, em trs dimenses ouestratos. O primeiro estrato corresponde aosfatores lingsticos, raciocnio, memria eaprendizagem, percepo visual, recepoauditiva, produo de idias, velocidadecognitiva, capacidade de conhecimento erendimento e capacidades motoras. O segundoestrato corresponde a fatores que caracterizama inteligncia fluida, inteligncia cristalizada,memria geral, percepo visual e auditiva,capacidade de recuperao da informao(memria a longo prazo) e velocidade cognitiva.O terceiro estrato corresponde ao fator grelacionado velocidade de processamentode informao e capacidade de memria detrabalho. Os fatores dos estratos superioresapenas resumem os fatores dos estratosinferiores. Assim, o fator g do terceiro estratoresume os fatores do segundo e estes ltimosresumem os fatores do primeiro estrato. Dadoque o estudo de Carroll representa as respostasdos sujeitos a situaes definidas (testes) emdiferentes pocas e em diversos ambientesculturais, a teoria dos trs estratos representa,atualmente, o modelo psicomtrico mais bemaceito na comunidade acadmica; nele seconfirma a superioridade do fator g como adimenso mais geral subjacente a todaatividade cognitiva (Juan-Espinosa, 1997).

    A obra The g Factor: The science ofmental ability, do professor americano ArthurJensen (1998a), constitui a compilao deseus numerosos estudos efetuados durantequase 50 anos sobre a validade do fator g. Oprofcuo trabalho de Jensen mereceu umaedio especial da revista Intelligence, na

    qual Detterman (1998) afirma: ...belamenteescrito eu predigo que o livro ser o fundamentodas pesquisas nas prximas dcadas.(pg.176). A obra, em resumo, mostra o fatorg, a partir de estudos das reas da gentica,da neurologia e da psicologia da condutahumana, como a dimenso mais geral naanlise hierrquica e que parece estarassociado, inclusive, a variveis no-psicomtricas como tempo de reao. Dessaforma, o fator g representaria uma varivelque ligaria a psicologia biologia; uma tesecompartilhada nos ltimos anos de vida por R.L. Thorndike (1994).

    Para elucidao da natureza e estruturada inteligncia e sua medio, a validade de umteste de inteligncia verificada utilizando-sedo princpio de correlao. No caso da validadede critrio, correlaciona-se o resultado obtidocom o instrumento (teste) e um critrio (ex.rendimento escolar). A relao entre doisfenmenos, no caso os resultados do teste eo desempenho em outra atividade cognitiva,expressa-se mediante o coeficiente decorrelao r. Uma correlao pode ser positivaou negativa: se positiva, os dois fenmenosassumem valores na mesma direo; senegativa, cada fenmeno assume um valor emsentido inverso ao do outro. Se o coeficientede correlao for prximo de 1,00, a relao quase perfeita (ex. 0,90 ou -0,90) e pode-sepredizer o valor de um fenmeno a partir dovalor do outro. Inversamente, se o coeficientede correlao for prximo de zero a relao imperfeita (ex. 0,09 ou -0,09) e, portanto, ovalor de um fenmeno no prediz o valor do outro.

    O valor da correlao denominadocoeficiente de validade. comum que ascorrelaes entre um teste de inteligncia e oscritrios externos no sejam muito altas, postoque diversos fatores concorrem e afetam ascorrelaes (ex. amadurecimento do sujeito,variao no sistema de atribuio de notas es-colares, experincias que afetam o sujeito - co-mo as familiares e sociais -, a margem deerro na preciso do instrumento, etc.).Portanto, no campo da medio da inteligncia

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 29

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    improvvel uma correlao perfeita entre oinstrumento e o critrio. Segundo Cronbach(1998), pouco freqente, inclusive, que ondice de validade alcance um valor acima de0,60. Esperar, portanto, que um teste predigaperfeitamente o nvel de inteligncia de umindivduo ou afirmar que um teste de inteligncianada prediz da conduta inteligente de umindivduo so posturas, no mnimo, insensatas.

    Encontrar correlatos tanto fisiolgicosquanto sociais do desempenho em testes deinteligncia no significa encontrar uma relaode causa e efeito entre eles. As correlaesapenas indicam em que medida dois fenmenosse relacionam. Dependendo do ndice de robtido, a predio de uma varivel em funoda outra possvel. Para efeitos prticos, tila um psiclogo organizacional ou escolar saberem que medida se pode predizer o desempenhode uma pessoa num cargo de chefia ou nosistema de ensino regular a partir dodesempenho em testes de inteligncia.Predizer a partir de outros critrios pode noser uma conduta profissional acertada.Segundo Juan-Espinosa (1997), a predio dorendimento laboral a partir de testes depersonalidade gira ao redor de 0,24; a partir deentrevistas, 0,14 e a partir de inventrios deinteresses, 0,10 (os testes de intelignciaconseguiriam uma predio em torno de 0,52).

    Enquanto os avanos psicomtricos noso do domnio de muitos dos que praticam aavaliao psicolgica, comum ouvir dizerque os testes de inteligncia no so teispara predizer o rendimento na vida quotidiana(ex. na escola ou no trabalho) dado que seusitens freqentemente parecem alheios vidaquotidiana, isto , devido a seu vis interno.Aqui se deve fazer uma distino entre o usode testes importados sem nenhuma adaptaoao novo meio cultural e o uso de testesadaptados, validados e normatizados para apopulao que se deseja testar. Enquanto aprimeira situao reflete quase a metade dostestes utilizados no Brasil, a crtica, no sentidoacima, estar sempre correta; no entanto, as

    crticas segunda situao no se sustentam,pois trata-se de um dos princpios de construode testes. O item que compe um teste nodeve necessariamente representar fielmente arotina do dia-a-dia (tampouco se afirma que oitem deve ser o mais alheio possvel experincia do indivduo), posto que o contedodos testes importa pouco. A chave est nacomplexidade de processamento que o testesolicita do sujeito. Por exemplo, quando seextrai o fator g de um conjunto de testescognitivos, observa-se que sujeitos maisinteligentes obtm altas pontuaes em provascomo dgitos ou vocabulrio do WAIS do quesujeitos menos inteligentes. H, portanto, umarelao entre a memria (dgitos) e o fator g,assim como entre fluncia verbal (vocabulrio)e o fator g. Mas esse resultado no indica queo fator g equivale a guardar nmeros nacabea ou saber o significado das palavras.O fator g no se relaciona ao contedoespecfico dos problemas dos testes ou comsuas caractersticas superficiais. Isto constituio princpio da indiferena do indicador, teoremacunhado por Spearman (1955) ao observar ascorrelaes entre as distintas tarefas quecompunham a bateria de Binet e o alcanceacadmico. O fator g relaciona-se com o queh de comum no desempenho de diversastarefas e que exige dos indivduos determinadonvel de cognio. Os tratamentos fatoriaisconseguem detectar esse aspecto comum eos psicometristas o chamam de g psicomtricoou inteligncia geral. O fator g est relacionado complexidade da atividade cognitiva exigidapelos diversos problemas, isto , com acapacidade de estabelecer relaes entre oselementos, entre os conceitos abstratos,raciocinar, analisar, discriminar entreinformaes relevantes e aquelas irrelevantese inferir concluses a partir dos elementos deinformao (Colom, 1998). Nesse sentido,Jensen (1998a) enfatiza que g no o processocognitivo ou a configurao dos circuitosneuronais com que opera o crebro; g seria acapacidade para realizar operaes cognitivas,uma noo semelhante ao conceito de CPU ou

  • 30 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    de potncia e eficincia de um computador. Eo que mais interessante, como bemdestacam Colom e Andrs-Pueyo (1999), gno exclui as diversas aptides que compema inteligncia. Tanto assim que o modelode Carroll (1993) mostra que a intelignciaenquanto construto cientfico seria compostade aproximadamente 60 aptides. O fator g a dimenso compartilhada por essasaptides.

    Um sculo de investigaes com testesde inteligncia tem mostrado resultadosinteressantes:

    a) A correlao entre as pontuaes detestes de inteligncia e o rendimentoescolar gira em torno de 0,50 (Neisseret al., 1996).

    b) H correlao significativa entre o fatorg e rendimento laboral. Os coeficientesgiram em torno de 0,50 a 0,90,dependendo do tipo de emprego (Hunter& Hunter, 1984; Jensen, 1998a; Ree &Earle, 1992; Ree, Earles & Teachout,1994).

    c) H significativas correlaes negati-vas, porm pequenas, entre QI eproblemas sociais como delinqncia,alcoolismo, autoritarismo (Brand,1987), taxa de acidentes automobi-lsticos graves (OToole & Stankov,1992).

    d) No h diferenas significativas entreos sexos com respeito ao desempenhoem testes de inteligncia geral (Colomet al., 1999; Aluja-Fabregat et al., 2000;Andrs-Pueyo, 1997).

    e) H correlao significativa entre odesempenho em testes de intelignciae variveis psicobiolgicas como tempode reao e tempo de inspeo. Algunspesquisadores situam a relao entre-0,40 e -0,50 (Bates & Eysenck, 1993;Chaiken & Young, 1993; Kranzler &Jensen, 1986; Deary, 1994, 1996), mas

    outros consideram que a relao nodever ultrapassar a barreira de -0,30 a-0,40 (Hunt, 1980).

    f) H correlao significativa, pormpequena, entre QI e tamanho cerebral(medio intracraniana por neuroimagem).Os coeficientes giram em torno de0,35 (Willerman et al., 1994) a 0,40(Andreasen et al., 1993).

    Na abertura do Tenth Meeting ofInternational Society of the Study of IndividualDifferences - ISSID, realizado em Edimburgo(2001), foi descrito um dos estudos maisconsistentes sobre a validade dos testes deinteligncia. Trata-se da retomada dos estudosde Godfrey Thomson (que coordenou atestagem, em 1932 e 1947, de todas ascrianas da Esccia nascidas entre 1921 e1936), pelo pesquisador escocs Ian Deary.Os primeiros resultados da avaliao depessoas sobreviventes da testagem de 1932,isto , da retestagem de pessoas (n=101)depois de 66 anos da primeira testagemutilizando-se o mesmo instrumento, mostram,entre outras coisas, a estabilidade dasdiferenas individuais nas habilidades mentaisna ausncia de enfermidades ou doenascrnicas (r= 0,63). As implicaes de taisresultados para outras reas do conhecimentohumano, especialmente a geriatria, soextremamente positivas, dado que possvelestudar, com certo grau de preciso, a extensoe a poca do declnio de funes cognitivas noser humano (veja-se tambm Deary, Whalley,Lemmon & Crawford, 2000).

    Assim sendo, conclui-se que ainteligncia uma varivel psicolgica estvele, portanto, passvel de ser medida. Ela tambm ubqua, presente em maior ou menorgrau em todas as atividades humanas e oinstrumento que a mede, o teste psicomtrico,pode ser considerado uma das mais importantescontribuies da cincia psicolgica.

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 31

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    Crtica 4: Interessa mais a IntelignciaEmocional do que a IntelignciaAcadmica

    Uma dimenso importante docomportamento inteligente a capacidade degerenciar as emoes de forma a permitir spessoas a sociabilidade e a aquisio de umpadro de vida adequado. A psicologia temchamado essa capacidade de intelignciaintra e interpessoal (Gardner, 1994) deinteligncia prtica (Sternberg, 1985, 2000)e, desde 1990, de inteligncia emocional porMayer e Salovey (1997).

    A popularizao do termo intelignciaemocional veio com Goleman, um psiclogoformado pela Universidade de Harvard.Goleman (1995) enfatiza que o sucesso daspessoas na vida quotidiana depende mais douso inteligente das emoes do que dainteligncia acadmica tal como medidapelos testes de QI. Nesse sentido, o autorrelata diversos casos de pessoas que notiveram sucesso na vida apesar dos seus altosnveis intelectuais. O analfabetismo emocionalseria o responsvel pelo fracasso social dessaspessoas.

    Os resultados dos testes de inteligncia,como visto anteriormente, correlacionam-sefortemente com o desempenho acadmico,laboral e, em menor grau, com o desempenhosocial e afetivo. Isto porque seus itens visamavaliar a capacidade subjacente resoluode problemas lgico-matemticos, verbais,espaciais, psicomotores e outros. Os testesde inteligncia no foram criados para avaliara capacidade de reconhecer os prpriossentimentos e os dos outros; tampouco avaliama capacidade de controlar e gerenciar asemoes, embora se saiba h muito tempoque tais capacidades podem auxiliar ou dificultaro desempenho acadmico e laboral. Anegligncia da emoo nos testes deinteligncia pode dever-se ao fato de que oscasos em que a influncia de emoesnegativas al tera signif icat ivamente odesempenho acadmico e laboral, a ponto de

    arruinar a qualidade de vida de uma pessoa,constituem uma pequena parcela e no ,portanto, a regra. As evidncias psicomtricasainda continuam apoiando a tese de que quantomais inteligente for uma pessoa maior ser asua capacidade em gerenciar seussentimentos, suas emoes e seufuncionamento adaptativo. Talvez, ascapacidades relacionadas administrao dasemoes possam ser mais bem entendidas naesfera da personalidade e das habilidadessociais (Flores-Mendoza & Nascimento, 2002).

    Um estudo que refora a suspeita daligao da inteligncia emocional a aspectosda personalidade constitui o trabalho deCiarrochi, Chan e Caputi (2000). Esses autoresaplicaram em 134 universitrios australianosuma bateria de testes composta por medidasde QI, personalidade, satisfao de vida,qualidade de relacionamento e a EscalaMultifatorial de Avaliao da IntelignciaEmocional (MEIS). Os estudantes tambmforam induzidos a experimentar diversoshumores para observar se aqueles quet ivessem altas pontuaes no MEISapresentavam melhor capacidade em gerenciarseus humores e discriminavam melhor seusjulgamentos sociais para prevenir humoresinadequados. Os resultados mostraram que ainteligncia emocional no estava relacionadaao QI (r = 0,05) e sim a aspectos dapersonalidade como empatia (r = 0,43) ouaspectos motivacionais como satisfao navida (r = 0,28). Surpreendentemente, enquantoo QI se relacionou tanto com o gerenciamentoquanto com a preveno de estados humorais,a partir de julgamentos adequados, ainteligncia emocional esteve relacionadaapenas com o gerenciamento humoral.

    Mais tarde, uma anlise realizada porCiarrochi et al. (2001) sobre as diversas escalase questionrios de inteligncia emocionalapontou que as medidas de intelignciaemocional baseadas no desempenho estariammais relacionadas a medidas tradicionais deQI do que a medidas de auto-relato. Estas

  • 32 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    ltimas estariam mais relacionadas com asdimenses da personalidade. Contudo, umestudo recente de Roberts, Zeidner e Matthews(2001) foi realizado para investigar aspropriedades psicomtricas e correlatospsicolgicos do MEIS (uma medida baseadaem desempenho). Participaram 704 sujeitosque, alm do MEIS, completaram o Inventriode Auto-Descrio do Trao-IADT (uma medidado modelo dos Cinco Fatores dePersonalidade), e o ASVAB (Armed ServicesVocational Aptitude Battery), uma medida deinteligncia. Os resultados mostraram que,embora o MEIS tenha se correlacionadomoderadamente com o ASVAB e levementecom o IADT, encontraram-se ndices pobresde preciso de alguns subtestes do MEIS,assim como a pontuao dada por peritos foibastante diferente da que foi dada pelos noperitos. Tais resultados levantam srias dvidassobre a estabilidade e validade do construto.Em outro documento Zeidner, Matthews eRoberts (2001) analisam as condiesnecessrias para que um construto se tornecientificamente vlido; entre elas, esto: anecessidade de demonstrar um nmero dehabilidades primrias emocionais, que reunidasdefinam um construto de ordem superior;apresentar evidncias genticas, neuropsico-lgicas, cognitivas e de desenvolvimento;identificar os componentes fluido e cristalizado.Sem essas condies a inteligncia emocionalainda constitui uma miragem.

    CONSIDERAES FINAIS

    A reviso dos pontos mais polmicosrelacionados aos testes psicolgicos,especificamente daqueles relacionados medio da inteligncia humana, teve comoobjetivo auxiliar a corrigir algumas atitudeserradas a respeito dos testes. A principaldelas a crena bastante generalizada nopas de que os testes no servem para medira conduta humana. Como j se argumentou,so significativas as correlaes entre o

    desempenho intelectual e as atividadesfisiolgicas, acadmicas e sociais. Emboraainda no haja um consenso sobre o quevenha a ser inteligncia, pode-se afirmar queos testes medem aquela capacidade utilizadana cultura ocidental para resolver e enfrentardesafios quotidianos (por exemplo, escola,emprego). No entanto, deve-se ressaltar quetestes mal adaptados e/ou construdos cominadequadas propriedades psicomtricas,como o caso da maioria dos testes nacionais,prejudicam qualquer avaliao psicolgica. Asegunda crena, que provavelmente fornecebase primeira, a de que os testesinferiorizam ainda mais alguns segmentostnico-sociais. Os testes no podem serresponsabilizados pelas diferenas observadasentre as pessoas, eles apenas as retratam.Infelizmente, a interpretao errnea dosresultados obtidos nos testes e a suspeita deinveno de dados por parte de algunspsicometristas do incio do sculo passado,parece ter provocado uma resistncia aosavanos ocorridos na esfera das diferenasindividuais.

    E, ultimamente, um interesse populartem surgido sobre a chamada intelignciaemocional. Trata-se de um construto para oqual ainda no h evidncia cientfica da suavalidade porque os instrumentos que tentammedi- lo ainda apresentam problemaspsicomtricos. Para que a intelignciaemocional conquiste o mesmo status que ainteligncia geral (ou fator g) necessrioreplicar e delinear numerosos estudos por umbom perodo de tempo a fim de verificar asolidez e abrangncia do referido constructo.

    Em relao inteligncia propriamentedita, embora ainda persistam diversasperguntas, conforme mostra o relatrio daAPA (Neisser et al., 1996), inegvel que amedio psicolgica tem melhorado com opassar dos anos e tem auxiliado a compreendermelhor a cognio humana. Ignorar tais avanose afirmar que os testes somente servem aosinteresses da classe dominante significa voltar

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 33

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    s discusses j superadas das dcadas de60 e 70. O principal desafio agora no saberse existem diferenas entre as pessoas ougrupos, o desafio maior saber, por um lado,a que se devem essas diferenas e, por outrolado, como ajudar as pessoas desfavorecidas.O novo milnio exige que cientistas epesquisadores encontrem respostas a essesdesafios.

    REFERNCIAS BIBLIOGRFICAS

    ALUJA-FABREGAT, A., Colom, R., Abad, F.& Juan-Espinosa, M. (2000). Sex differencesin general intelligence defined as g amongyoung adolescents. Personality andIndividual Differences, 28, 813-820.

    ANDREASEN, N.C., Flaum, M., Swayze, V.,Oleary, D.S., Alliger, R., Cohen, G.,Ehrhardt, J.& Yuh, W. T. C. (1993).Intelligence and brain structure in normalindividuals. American Journal of Psychiatry,150, 130-134.

    ANDRES-PUEYO, A. (1997). Manual depsicologia diferencial. Barcelona: McGraw-Hill.

    BATES, T.C. & Eysenck, H. J. (1993).Intelligence, inspection time, and decisiontime. Intelligence, 17, 523-531.

    BOUCHARD, T., Lykeen, D., Mc Gue, M.Segal, N. & Tellegen, A. (1990). Sources ofhuman psychological differences: TheMinnesota Study of Twins Reared Apart.Science, 250, 223-228.

    BRAND, C. (1987). The importance of generalintelligence. In S. Modgil & C. Modgil (Eds.),Arthur Jensen: Consensus and Controversy(pp.251-265). New York: Falmer.

    BURT, C. (1955). The evidence for the conceptof intelligence. British Journal of EducationalPsychology, 25, 159-177.

    CARROLL, J. B. (1993): Human cognitiveabilities. A survey of factor analytic studies.Cambridge, Cambridge Univ. Press.

    Chaiken, S. R. & Young, R. K. (1993). Inspectiontime and intelligence: Attempts to eliminatethe apparent movement strategy. AmericanJournal of Psychology, 106, 191-210.

    CIARROCHI, J. V., Chan, A. Y. C. & Caputi, P.(2000). A critical evaluation of the emotionalintelligence construct. Personality andIndividual Differences, 28, 539-561.

    CIARROCHI, J. V., Chan, A. Y. C., Caputi, P.& Roberts, R. D. (2001). Measuringemotional intelligence. In: J. Ciarrochi, J.Forgas, & J.D. Mayer (Eds.). Emotionalintelligence in every life: A scientific inquiry.(pp. 25-45). Philadelphia, PA: PsychologyPress.

    COLOM, R. (1995). Tests, inteligencia ypersonalidad. Madrid: Pirmide.

    COLOM, R. (1998). Psicologa de lasdiferencias individuales. Teora y prctica.Madrid: Pirmide.

    COLOM, R. (2000). Algunos de laPsicologa: Entre la Ciencia y la Poltica.Psicothema, 12, 1, 1-26.

    COLOM, R., Abad, F.J., Garcia, L. F. & Juan-Espinosa, M. (no prelo). Education,Wechslers Full Scale IQ, and g.

    COLOM, R., Andrs-Pueyo, A. & Juan-Espinosa, M. (1998). Generational IQ gains:Spanish data. Personality and IndividualDifferences, 25, 927-935.

    COLOM, R. & Andrs-Pueyo, A. (1999). Elestudio de la intel igencia humana:recapitulacin ante el Cmbio de Milenio.Psicothema, 11, 3, 453-476.

    COLOM, R., Quiroga, M. A. & Juan-Espinosa,M. (1999). Are cognitive sex differencesdisappearing?. Evidence from Spanishpopulations. Personality and IndividualDifferences, 27, 1189-1195.

    CRONBACH, L. J. (1998). Fundamentos delos tests psicolgicos. Madrid: BibliotecaNueva.

    DEARY, I. J. (1994). Sensory discriminationand intel l igence: Postmortem or

  • 34 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    resurrect ion? American Journal ofPsychology, 107, 95-115.

    DEARY, I. J. (1996). Intelligence and inspectiontime. American Psychologist, 51, 6, 599-608.

    DEARY, I.J., Whalley, L.J., Lemmon, H. &Crawford, J.R. (2000). The stability ofindividual differences in mental ability fromchildhood to old age: Follow-up of the 1932Scottish Mental Survey. Intelligence, 28,1,49-55.

    DETTERMAN, D. K . (1998). Kings of men:introduction to a special Issue. Intelligence.26, 3, 175-180.

    DETTERMAN, D. K. & Daniel, M. H. (1989).Correlations of mental tests with each otherand with cognitive variables are highest forlow-IQ groups. Intelligence, 15, 247-250.

    EYSENCK, H. J. (1982). A model forintelligence. New York: Springer-Verlag.

    EYSENCK, H. J. & Kamin, L. (1982). O grandedebate sobre a inteligncia. Trad. MariaJulieta A. A. C. Penteado. Braslia: EditoraUNB.

    FLETCHER, R. (1990). The Cyril Burt scandal:Case for the defense. New York: MacMillan.

    FLORES-MENDOZA, C. E. & Nascimento, E.(2001). Inteligncia: o melhor construtoinvestigado em Psicologia (manuscritosubmetido a publicao).

    FLORES-MENDOZA, C.E. & Nascimento, E.(2002). Intel igncia emocional: Umconstruto cientfico? (manuscrito submetidoa publicao).

    FLYNN, J. R. (1987). Massive IQ gains in 14nations: What IQ tests really measure.Psychological Bulletin, 101, 171-191.

    FLYNN, J.R. (1998). IQ gains over time: Towardfinding the causes. In: Ulric Neisser (ed.).The rising curve: Long-term gains in IQ andrelated measures. (pp.25-66). Washington:APA.

    GARDNER, H. (1994). Estruturas da mente. Ateoria das inteligncias mltiplas. Trad.Sandra Costa. Porto Alegre: Artes Mdicas.

    GOLEMAN, D. (1995). Inteligncia emocional.Trad. Marcos Santarrita. Rio de Janeiro:Objetiva (original publicado em 1995).

    GOULD, S. J. (1996). The mismeasure ofman. 2. ed. New York: Norton.

    GUILFORD, J. P. (1954). Psychometricmethods. NY : McGraw-Hill.

    GUILFORD, J. P. (1988). Some changes in thestructure of intellect model. Educationaland Psychological Measurement, 48, 1-4.

    GUSTAFSSON, J. (1988). Hierarchical modelsof individual differences in cognitives abilities.In: R. J. Sternberg (ed.). Advances in thePsychology of Human Intelligence, vol. 4.New Yersey : LEA.

    HAIR, J. F., Anderson, R. E, Tatham, R. L. &Black, W. C. (1995). Multivariate dataanalysis. New Yersey: Prentice Hall.

    HERRNSTEIN, R. J. & Murray, Ch. (1994). Thebell curve - intelligence and class structurein American life. New York: A Free PressPaperbacks Books.

    HUNT, H. (1980). Intelligence as an Information--Processing Concept. British Journal ofPsychology, 71, 4, 449-474.

    HUNTER, J. E. & Hunter, R. F. (1984). Validityand utility of alternative predictors of jobperformance. Psychological Bulletin, 96,72-98.

    JENSEN, A. R. (1987). Psychometric g as afocus of concerted research effort.Intelligence, 11 3, 193-198.

    JENSEN, A. R. (1998a). Jensen on"Jensenism". Intelligence, 26, 3, 181 - 208.

    JENSEN, A. R. (1998b). The g factor. NewYork: Praeger.

    JENSEN, A. R. & Weng, L. (1994): What is agood g?. Intelligence, 18, 231-258.

    JUAN-ESPINOSA, M. (1997). Geografa de lainteligencia humana. Madrid: Pirmide.

    KAMIN, L. (1974). Ciencia y poltica delcociente intelectual. Madrid: Pirmide.

  • A CRTICA DESINFORMADA AOS TESTES DE INTELIGNCIA 35

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    KRANZLER, J. H. & Jensen, A. R. (1989).Inspection time and intelligence: A Meta-Analysis. Intelligence, 13, 4, 329-347.

    MAYER, J. D. & Salovey, P. (1997). What isemotional intelligence?. In P. Salovey & D.Sluyter (Eds.) Emotional Development andEmotional Intelligence: Implications foreducators (pp. 3-31). New York: BasicBooks.

    MAYER, J. D., Caruso, D. R. & Salovey, P.(2000). Emotional intelligence meetstraditional standards for an intelligence.Intelligence, 27, 4, 267-298.

    NEISSER, U. (1998). The rising curve - longterm gains in IQ and related measures.Washington, DC: APA.

    NEISSER, U., Boodoo, G., Bouchard, T.,Boykin, A., Brody, N., Ceci, S., Halpern,D., Loehlin, J., Perloff, R., Sternberg, R. &Urbina, S. (1996): Intelligence: knowns andunknowns. American Psychologist, 51, 2,77-101.

    NYBORG, H. & Jensen, A.P. (2001).Occupation and income related topsychometric g. Intelligence, 29, 45-55.

    OTOOLE, B. J. & Stankov, L. (1992). Ultimatevalidity of psychological tests. Personalityand Individual Differences, 13, 699-716.

    PASQUALI, L. (1997). Psicometria: teoria eaplicaes. Braslia: Editora UnB.

    REE, M. J. & Earle, J. A. (1992). Intelligenceis the best predictor of job performance.Current Directions in Psychological Science,1, 86-89.

    REE, M. J., Earles, J. A. & Teachout, M. S.(1994). Predicting job performance: Notmuch more than g. Journal of AppliedPsychology, 79, 518-524.

    ROAZZI, A., Spinillo, A., & Almeida, L. S.(1991). Definio e aval iao dainteligncia: Limites e perspectivas. In: L.S. Almeida. Cognio e AprendizagemEscolar. Lisboa: APPORT.

    ROBERTS, D. R., Zeidner, M. & Matthews, G.(2001). Does emotional intelligence meettraditional standards for an intelligence?Some New Data and Conclusions. Emotion,1,196-231.

    ROSENTHAL, R. & Jacobson, L. (1966).Teachers expectancies: determinants ofpupils IQ gains. Psychological Report, 19,115-118.

    ROSENTHAL, R. & Jacobson, L. (1968).Pygmalion in the classroom: teacherexpectation and pupils intel lectualdevelopment. New York: Holt, Rhinehart &Winston.

    RUSHTON, J. P. (1994). The equalitariandogma revisited. Intelligence, 19, 263-280.

    RUSHTON, J. P. (1998). The Jensen effectand the Spearman-Jensen Hypothesis ofblack-white IQ differences. Intelligence, 26,3, 217-225.

    SPEARMAN, C. H. (1955). Las habilidadesdel hombre. Trad. Jaime Bernstein. Bs.As.: Paidos (original publicado em 1927).

    SPITZ, H. H. (1999). Beleaguered Pygmalion:A history of the controversy over claims thatteacher expectancy raises intelligence.Intelligence, 27, 3, 199-234.

    STERNBERG, R. J. (1985). Beyond IQ: Atriarchic theory of human intelligence. NewYork: Cambridge University Press.

    STERNBERG, R. J. (1992). As capacidadesintelectuais humanas: uma abordagem emprocessamento de informao. Trad. DayseBatista. Porto Alegre: Artes Mdicas(original publicado em....).

    THORNDIKE, E. P. (1921). Contribution tointelligence and its measurement. Journalof Educational Psychology, 12, 124-127.

    THORNDIKE, R. L. (1994). G. Intelligence,19, 2, 145-155.

    THURSTONE, L. L. (1921). Contribution tointelligence and its measurement. Journalof Educational Psychology, 12, 201-207.

  • 36 C.E. FLORES-MENDOZA et al.

    Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

    WECHSLER, D. (1971). Intelligence: definition,theory and the IQ. In: Cancro R. (ed.)Intelligence: genetic and environmentalinfluences. New York: Grune Straton.

    WILLERMAN, L., Shultz, R., Rutledge, A. N. &Bigler, E. D. (1992). Hemisphere sizeasymmetry predicts relative verbal andnonverbal intelligence differently in thesexes: Na MRI study of structure-functionrelations. Intelligence, 16, 315-328.

    WILSON, E. (1995). Ciencia e ideologa.Academic Questions, vol. 8, 06-10. Trad.Andrs-Pueyo e R. Colom (Comps):Ciencia y poltica de la inteligencia en lasociedad moderna. Madrid: BibliotecaNueva, 1998.

    ZEIDNER, M., Matthews, G. & Roberts, R. D.(2001). Slow down, you move too fast:emotional intelligence remains an elusiveintelligence. Emotion.1, 265-275.