Desafio das Correlações Espúrias

11
 O desafio das correlações espúrias Série Matemática na Escola Objetivos 1. Apresentar o conceito de correlação; 2. Discutir correlação entre variáveis.

description

Paper

Transcript of Desafio das Correlações Espúrias

  • O desafio das correlaes esprias

    Srie Matemtica na Escola

    Objetivos 1. Apresentar o conceito de correlao; 2. Discutir correlao entre variveis.

  • O desafio das correlaes esprias

    Srie Matemtica na Escola

    Contedos Estatstica Correlaes esprias.

    Durao Aprox. 10 minutos.

    Objetivos 1. Apresentar o conceito de

    correlao; 2. Discutir correlao entre

    variveis.

    Sinopse Mulheres com mais filhos tm presso mais alta. A causa disto so os filhos? Cidades com mais cegonhas tm mais nascimentos. As cegonhas que trazem as crianas? Um repentista responde esta e outras perguntas para uma estudante.

    Material relacionado udios: Histria da Estatstica; Experimentos: Sries Temporais - Batimentos; Softwares: Medidas do corpo grfico de disperso; Medidas do corpo Box Plot.

  • VDEO

    O desafio das correlaes esprias 3/11

    Introduo Sobre a srie A srie Matemtica na Escola aborda o contedo de matemtica do ensino mdio atravs de situaes, fices e contextualizaes. Os programas desta srie usualmente so informativos e introdutrios de um assunto a ser estudado em sala de aula pelo professor. Os programas so ricos em representaes grficas para dar suporte ao contedo mais matemtico e pequenos documentrios trazem informaes interdisciplinares.

    Sobre o programa Neste vdeo discutido um dos principais problemas de estatstica descritiva em estudos observacionais: como explicar a correlao entre as variveis de interesse.

    A estatstica trabalha com a incerteza que aparece cotidianamente em nossas vidas:

    1. os pais de uma criana que tem uma doena gentica pensam muito antes de decidir ter outro filho, e sua deciso estar baseada na chance de um segundo filho vir a apresentar o mesmo problema.

    2. um mdico deve comparar a evoluo de um paciente submetido a vrios tratamentos, a fim de escolher o melhor deles. Um tratamento pode ser considerado um sucesso, um fracasso, ou um resultado intermedirio; a deciso do mdico depender das chances de cada ocorrncia para o atual paciente.

    3. em um experimento para estudar se um certo aditivo alimentar cancergeno (ou seja, causa ou aumenta a possibilidade de desenvolver um tipo de cncer), animais so tratados com e sem o

  • VDEO

    O desafio das correlaes esprias 4/11

    aditivo. Freqentemente, haver casos de cncer em ambos os grupos de animais, os com e os sem tratamento. E em ambos, haver indivduos que no apresentam cncer. Precisamos ento de um mtodo que nos permita determinar se o grupo tratado com aditivo tem muito mais chance de desenvolver cncer.

    4. bem sabido que fumar provoca cncer. Mas existem muitos indivduos que fumam muito e por muito tempo e que no apresentam nenhum tipo de cncer. Portanto, a formao de um cncer decorrente de hbito de fumar no um fato determinista, e sim um fato que pode acontecer em uma frao das vezes.

    Estudos observacionais

    Um estudo observacional consiste em realizar mensuraes de diversas variveis em um grupo de indivduos de uma populao, a fim de determinar padres ou verificar relaes entre as variveis, que permitam predizer alguma varivel em funo das outras ou tomar decises para futuras observaes.

    Podemos tambm comparar duas populaes em termos de alguma varivel de interesse: indivduos com ou sem certa caracterstica. Por exemplo, em estudos sobre os efeitos do cigarro, podemos comparar indivduos fumantes e no-fumantes com relao a variveis de interesse. Chamamos estes grupos de tratamento e de controle, respectivamente.

  • VDEO

    O desafio das correlaes esprias 5/11

    Em um estudo observacional, os pesquisadores no determinam quais os indivduos que sero submetidos ao tratamento ou quais sero controles. Por exemplo, os estudos sobre os efeitos do cigarro so necessariamente observacionais: ningum vai fumar durante dez anos somente para agradar um estatstico.

    Os pesquisadores comparam um grupo de fumantes (o grupo de tratamento) com um grupo de no-fumantes (o grupo de controle) para determinar os efeitos do cigarro (o tratamento).

    Os fumantes geralmente se do mal nesta comparao: doenas cardacas, cncer de pulmo, acidentes automobilsticos e suicdios so mais comuns entre fumantes que entre no-fumantes. De modo que existe uma forte associao entre o hbito de fumar e doenas cardacas, cncer de pulmo e o resto. O cigarro provoca cncer? O culpado o ato de fumar? Fumar provavelmente no bom, mas o veredito deve ser: no est provado. Hipoteticamente, poderia haver um fator hereditrio predispondo a pessoa a ambos: fumar e ter algum tipo de cncer. Hipoteticamente.

    O importante ressaltar que muitos estudos podem ser realizados somente mediante a observao e em estudos observacionais devemos lidar com o problema de mistura de efeitos. Portanto a escolha do grupo de controle dever ser feita de modo que as diferenas entre os dois grupos possam ser creditados somente ao tratamento.

  • VDEO

    O desafio das correlaes esprias 6/11

    Se houver outros fatores cujos efeitos possam ser confundidos com os efeitos do tratamento, importante encontrar quais ajustes poderiam ser feitos para superar este problema e definir se estes ajustes ou explicaes so razoveis.

    Correlao no causalidade

    Causalidade associa a causa a um evento. muito tentador querer estabelecer uma relao de causalidade quando h alta correlao entre duas variveis. No entanto, importante ser cauteloso e no tirar concluses precipitadas. A histria est cheia de erros deste tipo, e em nenhum momento estamos livres de voltar a comet-los.

    Por exemplo, nos anos 50, nos Estados Unidos, foram realizados muitos estudos sobre a paralisia infantil, em busca dos fatores que favorecessem seu aparecimento e de uma vacina efetiva contra a doena. Em um estudo exploratrio como este, muitas variveis so consideradas, mesmo no tendo relao clara e imediata com a varivel principal do estudo, a fim de tentar estabelecer um padro ou relao entre as diversas variveis.

    Em um segundo momento, modelos probabilsticos para estas relaes so ajustados para tentar realizar previses, estabelecer diagnsticos ou tomar decises.

    Entre as diversas variveis medidas em um desses estudos sobre a plio, verificou-se a existncia de uma forte associao positiva entre o nmero de casos de plio por semana e o nmero de vendas de refrigerante na mesma semana.

  • VDEO

    O desafio das correlaes esprias 7/11

    Uma das primeiras

    tentaes, como dito anteriormente, querer estabelecer uma relao de causalidade onde h uma forte correlao. No exemplo, uma pergunta neste sentido pode ser: o refrigerante causa plio? ou a plio aumenta a vontade de beber refrigerante? Uma resposta afirmativa a esta ltima pergunta poderia ter conseqncias desastrosas se os produtores de refrigerantes acreditassem nisso...

    luz do nosso conhecimento atual, estas perguntas so claramente sem sentido. No entanto, para estudos recentes, com doenas ainda pouco estudadas, por exemplo, perguntas similares podem no parecer to absurdas.

    Com as ferramentas estatsticas atuais no possvel responder pergunta sobre causalidade. Em estudos observacionais como este, podemos estabelecer e verificar correlaes, mas no causalidade.

    Uma correlao alta (positiva ou negativa) entre duas variveis pode nos levar a estudar com mais detalhe outros fatores que possam estar afetando ambas as variveis simultaneamente e que possam explicar a correlao.

  • VDEO

    O desafio das correlaes esprias 8/11

    No caso da correlao positiva entre vendas de refrigerante e casos de plio, os pesquisadores perceberam que analisando os dados com relao varivel poca do ano, a correlao entre as variveis

    desaparecia.

    Mais precisamente, havia um aumento tanto nos casos de plio quanto nas vendas de refrigerante no vero, e uma diminuio das duas variveis no inverno. No entanto, em cada um dos perodos, no havia nenhuma tendncia visvel para as duas variveis.

    Em outras palavras, o clima ou estao do ano era uma varivel que afetava as duas variveis positivamente. O aumento na temperatura explica o aumento das vendas de refrigerante, e tambm o aumento do nmero de casos de plio, j que esta doena est relacionada com condies de higiene, que pioram em pocas mais quentes.

    Esta terceira varivel chamada fator de confuso ou terceiro fator, e pode explicar a correlao entre as variveis estudadas.

    A busca pelo terceiro fator deveria ser um dos nossos primeiros impulsos ao receber informao de correlaes, to comuns nos meios de comunicao.

  • VDEO

    O desafio das correlaes esprias 9/11

    O questionamento das explicaes imediatas o que pode nos levar a aprofundar nosso conhecimento nas reas de nosso interesse.

    Sugestes de atividades Antes da execuo Alguns dos experimentos da coleo M3 trabalham com algumas tcnicas de anlise grfica de dados e de correlao de variveis.

    Em particular, o experimento Variveis Antropomtricas permite coletar dados da sala de classe que podem ser analisados nos softwares Medidas do Corpo: boxplot e Medidas do Corpo: grfico de disperso. Ambas as atividades analisam medidas de correlao entre duas variveis.

    Uma destas atividades poderia ser realizada antes de assistir o vdeo, para que os alunos adquiram familiaridade com a noo de correlao entre variveis.

    O vdeo Lembranas de Sofia mostra em maior detalhe um dos estudos realizados nos anos 50 em busca de uma vacina contra a poliomielite.

    Uma referncia bibliogrfica nesta rea e bastante acessvel ao leitor o livro de Costa Neto, que poderia ser utilizado como leitura complementar.

  • VDEO

    O desafio das correlaes esprias 10/11

    Depois da execuo Motivar nos alunos o questionamento das informaes recebidas e das explicaes dadas nos meios de comunicao pode ser um desafio para o professor.

    Propomos a seguir um exerccio mental em que os alunos devem tentar explicar as correlaes informadas, usando seu conhecimento prvio e, principalmente, seu bom senso.

    Explique as seguintes correlaes 1. Um estudo realizado com crianas em idade escolar mostrou

    que h uma forte correlao entre o tamanho do p e a fluncia em leitura. Ser que ler melhor aumenta o tamanho do p? Ou que o tamanho do p ajuda na leitura?

    R. Nenhuma das perguntas razovel luz do que conhecemos. Aqui fica clara a necessidade da busca de um terceiro fator explicando a correlao. Neste exemplo, o fator de confuso bastante claro: a idade da criana. Crianas mais velhas tm maior tamanho de p e tambm tem maior fluncia em leitura.

    2. Estudos mostram uma correlao negativa entre horas em frente TV e as notas em testes de leitura: quem assiste mais TV, tem menor nota em testes de leitura. Ser que assistir TV deixa as pessoas com menor compreenso de leitura?

    R. razovel supor que a compreenso de leitura aumenta com o hbito da leitura.

    3. Casais que pagam mais impostos tm filhos com melhor rendimento na escola. Subir os impostos pode fazer melhorar o rendimento na escola?

    R. Casais que pagam mais impostos tm renda maior e, em geral, podem oferecer melhores condies de educao para seus filhos.

  • VDEO

    O desafio das correlaes esprias 11/11

    Pea aos seus alunos que procurem nos meios de comunicao notcias ou alguma informao relacionando algumas variveis. Discutam em sala de aula o que poderia explicar a correlao mostrada.

    Lembre sempre aos seus alunos que, em estudos observacionais, estabelecer causalidade pode ser uma concluso precipitada. Analisar o problema mais a fundo pode levar a novas explicaes mais razoveis.

    Sugestes de leitura P. Meyer (2000). Probabilidade: Aplicaes Estatstica. Editora LTC. P. L. Costa Neto (2002). Estatstica. Editora Edgard Blcher. Site recomendado: ALEA Aco Local de Estatstica Aplicada, http://alea-estp.ine.pt

    Ficha tcnica Autor: Laura Leticia Ramos Rifo Reviso: Samuel Rocha de Oliveira Coordenador de audiovisual Prof. Dr. Jos Eduardo Ribeiro de Paiva Coordenador acadmico Prof. Dr. Samuel Rocha de Oliveira Universidade Estadual de Campinas Reitor Fernando Ferreira Costa Vice-reitor Edgar Salvadori de Decca Pr-Reitor de Ps-Graduao Euclides de Mesquita Neto Instituto de Matemtica, Estatstica e Computao Cientfica Diretor Jayme Vaz Jr. Vice-diretor Edmundo Capelas de Oliveira