Relatorio_Mª Alice Martins

116
Projeto Mestrado em Educação e Tecnologia em Matemática ESTATÍSTICA NO ENSINO BÁSICO E SECUNDÁRIO Maria Alice da Silva Martins Leiria, maio de 2012

description

estatostica

Transcript of Relatorio_Mª Alice Martins

  • ProjetoMestrado em Educao e Tecnologia em Matemtica

    ESTATSTICANO ENSINO BSICO E SECUNDRIO

    Maria Alice da Silva Martins

    Leiria, maio de 2012

  • ProjetoMestrado em Educao e Tecnologia em Matemtica

    ESTATSTICANO ENSINO BSICO E SECUNDRIO

    Maria Alice da Silva Martins

    Dissertao de Mestrado realizada sob a orientao da Doutora Helena

    Ribeiro, Professora da Escola Superior de Tecnologia e Gesto do Instituto

    Politcnico de Leiria, e co-orientao do Doutor Rui Santos, Professor da

    Escola Superior de Tecnologia e Gesto do Instituto Politcnico de Leiria.

    Leiria, maio de 2012

  • Agradecimentos

    Ao meu marido e s minhas filhas, pela compreenso que tiveram comigo e pela fora que metransmitiram ao longo desta caminhada.

    Aos meus pais, pelo apoio dado, estando presentes sempre que foi necessrio.

    Aos meus orientadores, Doutora Helena Ribeiro e Doutor Rui Santos, pelo tempo dis-pensado, pelas sugestes feitas e todo o apoio prestado, que possibilitaram a realizao destetrabalho.

    Aos meus colegas de mestrado, pela ajuda e fora dadas, mesmo quando a vontade decontinuar escasseava.

    minha amiga Teresa, pelo estmulo dado ao longo deste percurso.Aos meus colegas de trabalho, que direta ou indiretamente contriburam com as suas pa-

    lavras de encorajamento.A todos os meus sinceros agradecimentos.

    i

  • Resumo

    RESUMO

    A sociedade da informao exige que todos os cidados tenham conhecimentos de Es-tatstica para poderem intervir de forma crtica e fundamentada. Esta situao conduziu aEstatstica a um lugar de relevo no currculo dos alunos, que exige um novo olhar sobre o seuensino, como preconizam os atuais programas.

    neste contexto que surge o presente trabalho que, numa primeira parte, apresenta umareviso dos conceitos estatsticos lecionados no ensino bsico e secundrio, uma ferramentaimportante para o trabalho dos professores, permitindo-lhes uma clarificao desses conceitos,num texto que se pretende cientificamente rigoroso.

    De forma a alertar para incorrees, gralhas e/ou erros comuns, segue-se uma anlisecrtica a alguns materiais disponveis, nomeadamente manuais escolares atuais, onde o estudoda regresso linear assume uma anlise mais detalhada.

    Com o intuito de enriquecer os materiais existentes, numa perspetiva inovadora, capazde promover aprendizagens significativas, apresenta-se um conjunto de propostas de trabalhopara a sala de aula onde a tecnologia, nomeadamente o GeoGebra, adquire um papel de relevona compreenso dos conceitos. De forma a facilitar a utilizao deste software surge, noincio da terceira etapa deste trabalho, uma explicao detalhada sobre o uso do GeoGebra naestatstica descritiva.

    Em suma, este trabalho pretende contribuir para a melhoria do ensino da Estatstica, querno que se refere preparao do corpo docente, quer atravs da incluso de propostas detrabalho para utilizao em sala de aula.

    Palavras chave: ensino de estatstica, estatstica descritiva, GeoGebra, regresso linear.

    Estatstica no Ensino Bsico e Secundrio iii

  • Abstract

    ABSTRACT

    The media industry requires that all citizens have a knowledge of Statistics in order toplay a critical and fundamented role in society. This situation has led Statistics to a prominentplace in the curriculum of students and demands a new look to education, as recommendedby current programs.

    It is in this context that the present work has been elaborated. The first part presents areview of statistical concepts taught at an elementary and secondary level, an important toolfor teachers work, and allows the clarification of these concepts in a text intended to bescientifically rigorous.

    In order to draw ones attention to mistakes, typos and/or common errors, the first part isfollowed by a critical analysis of some available materials, which includes current textbooksand where the study of linear regression assumes a more detailed analysis.

    Having as main target the improval of the existing materials, with an innovative approach,which can foster meaningful learning, a set of suggested tasks are presented to the classroom.In this space, technology, namely GeoGebra, assumes a relevant role in the understanding ofconcepts. In order to make the use of this software easier, a detailed explanation of GeoGebrain descriptive statistics comes in the begining of the third stage of this work.

    In summary, this paper aims to contribute to the improvement of Statistic teaching,whether it concerns the preparation of mathematics teachers or by the inclusion of tasks ap-plied in the classrooms context.

    Keywords: Statistic teaching, descriptive statistics, GeoGebra, linear regression.

    Estatstica no Ensino Bsico e Secundrio v

  • Contedo

    Agradecimentos i

    Resumo iii

    Abstract v

    Lista de Figuras ix

    Lista de Tabelas xi

    1 Introduo 1

    2 Conceitos de Estatstica 7

    2.1 Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    2.2 Dados estatsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    2.3 Tabelas de frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    2.3.1 Tabela de frequncias de uma varivel qualitativa . . . . . . . . . . . 15

    2.3.2 Tabela de frequncias de uma varivel quantitativa discreta . . . . . . 16

    2.3.3 Tabela de frequncias de uma varivel quantitativa contnua . . . . . 18

    2.4 Representaes Grficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    2.4.1 Pictograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    2.4.2 Grfico de pontos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    2.4.3 Grfico de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    vii

  • Contedo

    2.4.4 Grfico circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    2.4.5 Histograma e polgono de frequncias . . . . . . . . . . . . . . . . . 24

    2.4.6 Representao grfica da funo cumulativa . . . . . . . . . . . . . . 24

    2.4.7 Diagrama de caule e folhas . . . . . . . . . . . . . . . . . . . . . . . 26

    2.5 Medidas de tendncia central . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    2.5.1 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    2.5.2 Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    2.5.3 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    2.5.4 Comparao das medidas de tendncia central . . . . . . . . . . . . . 32

    2.6 Medidas de tendncia no central . . . . . . . . . . . . . . . . . . . . . . . . 34

    2.6.1 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    2.6.2 Diagrama de extremos e quartis . . . . . . . . . . . . . . . . . . . . 37

    2.6.3 Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    2.7 Medidas de disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    2.7.1 Amplitude total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    2.7.2 Amplitude interquartis . . . . . . . . . . . . . . . . . . . . . . . . . 39

    2.7.3 Desvio mdio absoluto, varincia e desvio padro . . . . . . . . . . . 40

    2.8 Distribuies bidimensionais . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    2.8.1 Diagrama de disperso . . . . . . . . . . . . . . . . . . . . . . . . . 44

    2.8.2 Coeficiente de correlao . . . . . . . . . . . . . . . . . . . . . . . . 45

    2.9 Regresso linear simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    2.9.1 Regresso linear no Ensino Secundrio . . . . . . . . . . . . . . . . 48

    2.9.2 O mtodo dos mnimos quadrados . . . . . . . . . . . . . . . . . . . 49

    2.9.3 A regresso linear inversa . . . . . . . . . . . . . . . . . . . . . . . 51

    2.9.4 Estimao de y condicionada a x = x0 . . . . . . . . . . . . . . . . . 53

    viii Estatstica no Ensino Bsico e Secundrio

  • Contedo

    3 Anlise crtica aos materiais disponveis 55

    3.1 Erros nas escalas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

    3.2 Confuso entre dados e frequncia . . . . . . . . . . . . . . . . . . . . . . . 57

    3.3 Clculo da mdia quando a varivel contnua . . . . . . . . . . . . . . . . 58

    3.4 Um erro comum na regresso linear . . . . . . . . . . . . . . . . . . . . . . 58

    3.5 Definies pouco claras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    3.6 Erros e/ou falta de clareza na notao . . . . . . . . . . . . . . . . . . . . . 60

    4 Materiais e sugestes metodolgicas 63

    4.1 O GeoGebra no ensino da Estatstica . . . . . . . . . . . . . . . . . . . . . . 63

    4.1.1 Inserir dados no GeoGebra . . . . . . . . . . . . . . . . . . . . . . . 64

    4.1.2 Construo de tabelas de frequncia . . . . . . . . . . . . . . . . . . 65

    4.1.3 Representaes grficas . . . . . . . . . . . . . . . . . . . . . . . . 66

    4.1.4 Clculo de medidas estatsticas . . . . . . . . . . . . . . . . . . . . . 69

    4.1.5 Regresso linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

    4.2 Propostas de trabalho para a sala de aula . . . . . . . . . . . . . . . . . . . . 72

    4.2.1 Proposta 1 Quantas pessoas vivem em minha casa? . . . . . . . . . 73

    4.2.2 Proposta 2 Classificaes obtidas num teste de Matemtica . . . . 74

    4.2.3 Proposta 3 Meio de transporte utilizado para chegar escola . . . . 74

    4.2.4 Proposta 4 Classificaes internas versus classificaes externas nadisciplina de Matemtica . . . . . . . . . . . . . . . . . . . . . . . . 75

    4.2.5 Proposta 5 Salrios dos trabalhadores de uma empresa . . . . . . . 76

    4.2.6 Proposta 6 Comparao de duas turmas . . . . . . . . . . . . . . . 76

    4.2.7 Proposta 7 Peso e altura dos alunos de uma turma do 10.o ano . . . 77

    5 Concluso 79

    Referncias Bibliogrficas 81

    Estatstica no Ensino Bsico e Secundrio ix

  • Contedo

    A Propostas de trabalho para a sala de aula I

    A.1 PROPOSTA 1 Quantas pessoas vivem em minha casa? . . . . . . . . . . . II

    A.2 PROPOSTA 2 Classificaes obtidas num teste de Matemtica . . . . . . . III

    A.3 PROPOSTA 3 Meio de transporte utilizado para chegar escola . . . . . . V

    A.4 PROPOSTA 4 Classificaes internas versus classificaes externas na dis-ciplina de Matemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII

    A.5 PROPOSTA 5 Salrios dos trabalhadores de uma empresa . . . . . . . . . X

    A.6 PROPOSTA 6 Comparao de duas turmas . . . . . . . . . . . . . . . . . XII

    A.7 PROPOSTA 7 Peso e altura dos alunos de uma turma do 10.o ano . . . . . . XIV

    x Estatstica no Ensino Bsico e Secundrio

  • Lista de Figuras

    2.1 Pictograma dos hbitos de leitura dos alunos . . . . . . . . . . . . . . . . . . 21

    2.2 Grfico de pontos das idades dos alunos . . . . . . . . . . . . . . . . . . . . 22

    2.3 Grfico de barras das idades dos alunos . . . . . . . . . . . . . . . . . . . . 23

    2.4 Grfico circular das cores preferidas de 25 alunos . . . . . . . . . . . . . . . 23

    2.5 Histograma da altura (em cm) de 25 alunos . . . . . . . . . . . . . . . . . . 242.6 Polgono de frequncias referente altura dos alunos . . . . . . . . . . . . . 25

    2.7 Funo cumulativa relativa idade dos alunos . . . . . . . . . . . . . . . . . 25

    2.8 Funo cumulativa relativa altura dos alunos . . . . . . . . . . . . . . . . . 26

    2.9 Diagrama de caule e folhas relativo altura dos alunos . . . . . . . . . . . . 27

    2.10 Tipos de assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    2.11 Distribuio simtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    2.12 Distribuies assimtricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    2.13 Esquema relativo aos extremos e quartis de uma distribuio . . . . . . . . . 36

    2.14 Diagrama de extremos e quartis relativo idade dos 25 alunos . . . . . . . . 37

    2.15 Diagrama de disperso das notas de Matemtica e de Cincias Fsico-Qumicas 442.16 Diagrama de disperso da idade dos pais e das mes . . . . . . . . . . . . . . 46

    2.17 Diagramas de disperso com diferentes relaes entre as variveis . . . . . . 48

    2.18 Definio dos erros na regresso linear . . . . . . . . . . . . . . . . . . . . . 52

    2.19 Regresso de y condicionada a x versus de x condicionada a y . . . . . . . . . 53

    3.1 Erros de escala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

    xi

  • Lista de Figuras

    3.2 Erros de escala horizontal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

    3.3 Confuso entre dados e frequncia . . . . . . . . . . . . . . . . . . . . . . . 57

    4.1 Janela principal do GeoGebra e folha de clculo . . . . . . . . . . . . . . . . 64

    4.2 Tabela de frequncias absolutas da varivel cor preferida . . . . . . . . . . . 65

    4.3 Tabela de frequncias absolutas da varivel idade . . . . . . . . . . . . . . . 66

    4.4 Tabela de frequncias da varivel altura . . . . . . . . . . . . . . . . . . . . 66

    4.5 Medidas estatsticas para a varivel idade . . . . . . . . . . . . . . . . . . . 70

    4.6 Medidas estatsticas da idade, aps a alterao de um valor . . . . . . . . . . 70

    4.7 Anlise univariada para a varivel idade . . . . . . . . . . . . . . . . . . . . 71

    xii Estatstica no Ensino Bsico e Secundrio

  • Lista de Tabelas

    2.1 Dados obtidos atravs de um questionrio a 25 alunos do 8.o ano . . . . . . . 13

    2.2 Tabela de frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    2.3 Tabela de frequncias da varivel cor preferida dos alunos . . . . . . . . . . 16

    2.4 Tabela de frequncias da varivel idade dos alunos . . . . . . . . . . . . . . 17

    2.5 Tabela de frequncias da altura dos alunos (como uma varivel discreta) . . . 18

    2.6 Tabela de frequncias da varivel altura . . . . . . . . . . . . . . . . . . . . 19

    2.7 Rendimentos agrupados em classes de igual amplitude . . . . . . . . . . . . 20

    2.8 Nmero de faltas por doena . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    2.9 Tabela de frequncias do peso dos alunos . . . . . . . . . . . . . . . . . . . 30

    2.10 Clculo do desvio mdio absoluto . . . . . . . . . . . . . . . . . . . . . . . 41

    2.11 Exemplos de valores do coeficiente de correlao . . . . . . . . . . . . . . . 47

    3.1 Sugesto de notao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    4.1 Comandos para o clculo de medidas estatsticas com o GeoGebra . . . . . . 69

    A.1 Classificaes obtidas num teste . . . . . . . . . . . . . . . . . . . . . . . . III

    A.2 Meio de transporte mais utilizado pelos alunos . . . . . . . . . . . . . . . . . V

    A.3 Classificaes internas versus classificaes externas . . . . . . . . . . . . . VIII

    A.4 Salrios dos trabalhadores de uma empresa . . . . . . . . . . . . . . . . . . X

    A.5 Classificaes de Matemtica das turmas A e B do 7.o ano . . . . . . . . . . XII

    xiii

  • Captulo 1

    Introduo

    Desde as primeiras grandes civilizaes que a Estatstica tem sido utilizada de forma profcua.Em 3050 A.C. j os egpcios recorriam Estatstica para apurar os recursos humanos e materi-ais disponveis para a construo das pirmides. Outras civilizaes, tais como os Chineses, osGregos ou os Romanos, utilizaram a Estatstica para conhecerem os bens que o estado possuabem como a sua distribuio pela populao. Desde ento, muitos foram os desenvolvimentosdas aplicaes da Estatstica, nomeadamente no que se refere recolha, organizao e anlisede dados, quer esta seja restrita ao resumo da sua informao quer seja com o intuito de infe-rir ou efetuar previses. Atualmente, a Estatstica no s um instrumento indispensvel napoltica de qualquer estado (no sculo XVII, em Inglaterra, a Estatstica era a Aritmtica doEstado) como tambm um instrumento importante em muitas outras reas, tais como a Psi-cologia, a Sociologia, a Medicina, a Economia, o Desporto, a Biologia, a Fsica, a Educao,a Meteorologia, entre muitas outras. Deste modo, presentemente a Estatstica desempenhaum papel fundamental na vida do cidado, no s pela utilidade das suas mltiplas aplica-es, mas igualmente por ser indispensvel para a anlise, interpretao e compreenso dainformao que os meios de comunicao social divulgam.

    Como refere Fernandes a influncia da Estatstica na vida das pessoas e nas instituiestem-se tornado cada vez mais visvel, o que implica que todos os cidados devam ter conhe-cimentos de Estatstica para se poderem integrar na sociedade actual (Fernandes, 2009, p.1). Assim, tem havido um reconhecimento da importncia da Estatstica no currculo dosalunos, de tal modo que esta tem vindo a ocupar, cada vez mais, um lugar de destaque noensino, desde o ensino bsico ao ensino secundrio, pois segundo Martins et al. a Estatstica encarada como uma rea favorvel ao desenvolvimento de certas capacidades expressas

    1

  • Introduo

    nos currculos, tais como interpretar e intervir no real; formular e resolver problemas; comu-nicar; manifestar rigor e sentido crtico e ainda a aquisio de uma certa atitude positiva face Cincia. Deste modo, ensinar estatstica no pode limitar-se ao ensino de tcnicas e frmulase aprender estatstica no pode ser aprender a aplicar rotineiramente procedimentos desinse-ridos de contextos, sem ter de interpretar, de analisar e de criticar (Martins et al., 1997, pp.78). A coletnea de artigos Ensino e Aprendizagem da Estatstica (Loureiro et al. (2000)) um bom exemplo das reflexes sobre a importncia do Ensino da Estatstica no currculo doensino secundrio e ensino bsico, da utilidade da incluso da tecnologia na lecionao destescontedos, bem como a partilha de experincias e materiais didticos no incio do sculo XXI.

    No atual programa do ensino bsico o ensino da Estatstica inicia-se no primeiro ciclo as-sim como os aspetos elementares da Probabilidade, constituindo, em conjunto, desde 2007, otema Organizao e Tratamento de Dados (OTD)(1), conforme as orientaes internacionaispresentes em NCTM(2) (2008). No ensino secundrio o tema aparece no 10.o ano com a de-signao Estatstica, onde se pretende ampliar os conhecimentos adquiridos anteriormente. de referir que no objetivo deste projeto abordar conceitos relativos Probabilidade, peloque nos restringiremos anlise dos contedos referentes a Estatstica.

    Nos ltimos anos tem havido um esforo por parte de alguns autores em fornecer suporteterico e didtico que possa ajudar os professores nas suas aulas e que se encontram de acordocom os programas atuais. Martins et al. (2007) elaboraram uma brochura direcionada aos pro-fessores do 1.o ciclo que surgiu no mbito do Programa Nacional de Formao Contnua emMatemtica. Esta brochura, alm de conter os conceitos e procedimentos fundamentais paraum professor deste nvel de ensino, apresenta vrias propostas de tarefas a implementar nasala de aula com a respetiva explorao. A brochura elaborada por Martins & Ponte (2010)desenvolve as orientaes metodolgicas relativas OTD, apresentando quatro captulos re-servados Estatstica, onde tambm so sugeridas tarefas a propor aos alunos na sala de aula.

    Um site de referncia na rea da Estatstica o ALEA Aco Local Estatstica Apli-cada, www.alea.pt (podemos encontrar mais informaes em INE (2009)). Este projetoexiste desde 1999 e tem-se mantido sempre em crescimento, apresentando vrias compo-nentes, tais como entretenimento, cursos de estatstica e dados estatsticos. direcionado a

    (1) Consulte-se, por exemplo, Loura (2009) para uma anlise crtica ao novo programa.(2) NCTM National Council of Teachers of Mathematics.

    2 Estatstica no Ensino Bsico e Secundrio

  • Introduo

    alunos, professores e pblico em geral e pretende contribuir para melhorar a literacia esta-tstica(3) e fomentar situaes e experincias de aprendizagem recorrendo s Tecnologias daInformao e Comunicao (TIC). de referir que aquando da comemorao do seu 10.o ani-versrio foi editado um livro constitudo por 5 dossiers produzidos pelo ALEA e que maisum documento til nesta temtica. H, contudo, diversos outros materiais para o ensino eaprendizagem da Estatstica disponveis (cf. Nascimento (2009)).

    Este projeto, intitulado Estatstica no Ensino Bsico e Secundrio, tem como principaisobjetivos:

    apresentar os conceitos mais elementares de Estatstica lecionados nestes ciclos de en-sino, num texto cientificamente rigoroso, direcionado a professores, permitindo-lhes aclarificao destes conceitos;

    analisar alguns materiais disponveis para o ensino da Estatstica nestes ciclos, apresen-tando as incorrees, gralhas e/ou erros detetados, bem como materiais que considere-mos insuficientes e/ou inadequados para os objetivos para os quais foram concebidos;

    criar novos materiais bem como sugerir metodologias que possam ser utilizados noensino da Estatstica.

    Neste sentido, o segundo captulo apresentar uma reviso dos conceitos de Estatsticalecionados no ensino bsico e no ensino secundrio: tabelas de frequncias, representaesgrficas e principais medidas de estatstica descritiva, conforme definido no Programa de Ma-temtica do Ensino Bsico (Ponte et al., 2007) e no Programa de Matemtica A do EnsinoSecundrio (Silva et al., 2001). Este captulo ir basear-se em livros de autores especialistasna rea, tais como Murteira (1993), Reis (1998), Batanero & Godino (2003), Pestana & Velosa(2009) e Maria Eugnia Martins com os seus diversos trabalhos nesta rea (como por exemploMartins (2005), Martins & Cerveira (1999), Martins & Ponte (2010) ou Martins et al. (2007,1997)). No se pretende que este captulo seja direcionado para os alunos, mas antes paraprofessores que podem procurar neste trabalho a clarificao de qualquer conceito, entre osque so abordados no ensino bsico e secundrio. Sendo assim, a principal preocupao ser apreciso e clareza dos conceitos, com um ou outro exemplo, mas sem a preocupao didticaque um manual para alunos do ensino bsico ou secundrio deve conter. Por esta razo no

    (3) Para uma clarificao deste conceito podemos consultar, por exemplo, Branco & Martins (2002).

    Estatstica no Ensino Bsico e Secundrio 3

  • Introduo

    haver preocupao em colocar os conceitos por ordem de lecionao, mas antes pela ordemque se considere mais adequada para obtermos uma clara exposio dos mesmos.

    No terceiro captulo do projeto pretende-se fazer uma anlise crtica aos materiais dis-ponveis para o ensino e compreenso dos conceitos mais elementares de Estatstica. Seroanalisados vrios manuais escolares, nomeadamente os adotados na escola onde a autora le-ciona, e apresentadas e fundamentadas as incorrees, gralhas ou erros detetados nos temasOTD e Estatstica. Analisaremos deste modo a adequao dos materiais de forma a seremidentificadas lacunas nos materiais usualmente utilizados. Ser igualmente importante e per-tinente a comunicao dos erros encontrados, via e-mail, s entidades responsveis. dereferir que este procedimento j teve incio no que diz respeito ao manual adotado na escolada autora, para o 10.o ano, atravs da representante da editora. Salienta-se ainda que o obje-tivo desta anlise aos manuais no se restringe deteo de gralhas que, embora tenham deser corrigidas, por vezes podem at no comprometer o ensino dos contedos previstos nosprogramas. Pretende-se igualmente identificar contedos cujas metodologias propostas nosmanuais nos paream insuficientes para a compreenso dos conceitos ensinados, dos quaisdestacamos a regresso linear. de referir um estudo realizado por Martinho & Viseu (2009)que consistiu na anlise de dois manuais do 7.o ano quanto s dimenses: interpretao, crticae produo. A primeira dimenso refere-se capacidade de ler e compreender a informao(textos, tabelas, grficos). A segunda dimenso abrange a capacidade de avaliar criticamentea informao estatstica. Por fim, a dimenso designada de produo contempla a capacidadede argumentar, de comunicar a informao estatstica e de tomar decises. Estes autores con-cluram que a dimenso mais presente nos dois manuais a de interpretao. Concluiu-seainda que num manual as dimenses crtica e de produo so quase inexistentes e no outro,apesar de mais expressivas, no promovem o desenvolvimento da atitude crtica no aluno. de salientar a relevncia subjacente anlise de manuais escolares uma vez que a maioria dosprofessores recorre, habitualmente, a eles quando prepara as suas aulas. Segundo o estudoMatemtica 2001 realizado pela Associao de Professores de Matemtica (APM (1998)),no que diz respeito s prticas profissionais dos professores e no item materiais usados napreparao das aulas, concluiu-se que 87% dos professores utiliza sempre ou muitas vezes omanual adotado na escola e 68% outros manuais.

    Tendo em conta o trabalho desenvolvido no terceiro captulo do projeto, nomeadamente assituaes analisadas e que, de alguma forma, exigem uma correo, uma explicao, exemplos

    4 Estatstica no Ensino Bsico e Secundrio

  • Introduo

    mais enriquecedores, entre outros, pretende-se no captulo quatro do projeto apresentar novosmateriais e propor metodologias que possam ser utilizados no ensino da Estatstica, de formaa facilitar a compreenso e explorao dos principais conceitos por parte dos alunos. Umavez que uma das vertentes fundamentais para o sucesso do ensino da Estatstica termosprofessores preparados para o seu ensino, pretendemos que estes materiais vo tambm aoencontro das necessidades dos professores, como ilustrar o caso da regresso linear simples(consultar seco 3.4 na pgina 58), pois trata-se de um erro encontrado em vrios manuaisconsultados. Sendo um erro to generalizado s pode advir da falta de compreenso dosconceitos, pelo que iremos elaborar propostas para a sua clarificao. Acrescente-se ainda quedos materiais a elaborar podem constar: propostas de trabalho para realizar na sala de aula;a explicao de como construir materiais interativos de forma a possibilitar a construo deapresentaes a utilizar pelos professores; metodologias direcionadas ao ensino da estatstica,sendo que o software utilizado na explorao destes materiais ser o GeoGebra.

    De referir igualmente que a escolha deste projeto foi fortemente motivada pelo gosto daautora pela Estatstica, o qual bem patente na contnua participao em diversos trabalhosrealizados dentro e fora da sala de aula com os seus alunos, nas suas orientaes a alunos paraa participao em concursos a nvel nacional para estudantes (como ilustra o Prmio PedroMatos organizado pelo IPL, o Prmio Estatstico Jnior organizado pela SPE e os Desafiosdo ALEA promovidos pelo site www.alea.pt), bem como o seu olhar, sempre atento e cr-tico, aos manuais adotados para a lecionao dos contedos programticos da disciplina deMatemtica, essencialmente do 7.o ano ao 12.o ano. Por outro lado, a autora considera umdesafio explorar as potencialidades do GeoGebra na Estatstica, uma vez que as experinciasque tinha deste software eram no mbito da Geometria e da lgebra. Acrescente-se aindaque, a propsito do Plano da Matemtica e das sesses em que participa regularmente, temtido oportunidade de analisar o programa atual do ensino bsico com mais pormenor, estandomais sensibilizada para as ideias a preconizadas.

    Este projeto pretende contribuir para melhorar o ensino da Estatstica, uma vez que qual-quer professor do ensino bsico ou secundrio poder encontrar neste trabalho esclarecimen-tos relativos a conceitos que tem de lecionar, chamadas de ateno para erros comuns na reada Estatstica e sugestes de materiais e metodologias para o ensino da Estatstica. Tambmpoder contribuir para que os manuais venham a ser cada vez melhores, uma vez que as in-correes, gralhas ou erros detetados sero comunicados aos seus autores.

    Estatstica no Ensino Bsico e Secundrio 5

  • Captulo 2

    Conceitos de Estatstica

    A Estatstica uma cincia atual, com mltiplas funes e til humanidade. Desde sempreque o homem procura o conhecimento e, para tal, recolhe dados com determinadas intenes,nas mais diversas reas do saber. Todos os dias a comunicao social faz-nos chegar notciasbaseadas em estudos estatsticos, apresentando-nos as concluses mais relevantes. Para seobter essas concluses h um caminho a percorrer, mais ou menos longo, consoante o estudorealizado, mas bastante facilitado com o recurso tecnologia, Teoria das Probabilidades enomeadamente Inferncia Estatstica. Tendo em conta os programas do ensino bsico e doensino secundrio (Matemtica A) este projeto vai incidir sobre Estatstica Descritiva cuja fi-nalidade descrever os dados recolhidos a partir de uma amostra ou populao, resumindo ainformao atravs de grficos, tabelas e algumas medidas estatsticas, sem esquecer as com-paraes, por exemplo, entre dois conjuntos de dados. O desenvolvimento destes contedosacompanhado de alguns exemplos ser objeto deste captulo. Relembramos ainda que noprograma do ensino bsico a Estatstica aparece desde o primeiro ciclo e designa-se por Or-ganizao e Tratamento de Dados, desde 2007, data em que o Programa de Matemtica doensino bsico foi homologado. No programa de Matemtica A do ensino secundrio o temaaparece no 10.o ano com a designao Estatstica onde se pretende ampliar os conhecimen-tos adquiridos anteriormente. Neste captulo os conceitos sero apresentados sem que se faareferncia ao ano de escolaridade em que se lecionam, utilizando a ordem que nos parece maisadequada para a sua exposio.

    Tendo em conta que os dados que pretendemos resumir e interpretar devem, preferencial-mente, estar associados a um contexto, vamos comear por enumerar as etapas de um estudoestatstico. Deste modo, um estudo estatstico inclui as seguintes etapas:

    7

  • Conceitos de Estatstica

    1. definio do problema a estudar, formulando as questes s quais se pretende dar res-posta;

    2. planeamento da recolha de dados tendo em vista o estudo a realizar. nesta fase quedevemos decidir se recorremos populao ou amostra e definir as variveis comrigor;

    3. organizao e tratamento dos dados atravs de tabelas de frequncia, grficos e algumasmedidas estatsticas;

    4. interpretao dos resultados obtidos e estabelecimento de concluses.

    Exemplo 2.1. Exemplos de estudos estatsticos: hbitos alimentares dos alunos do 9.o ano;a crise econmica na vida dos torrejanos; o peso e a altura dos alunos do 8.o ano da EscolaArtur Gonalves e a durabilidade (em quilmetros percorridos) dos pneus de uma determinadamarca.

    Quando se faz um estudo estatstico pode obter-se informao de todos os elementos(indivduos) do universo (populao) sobre o qual incide o estudo e, neste caso, faz-se umcenso; ou recorre-se a uma parte representativa da populao (amostra) e o estudo efetuadodenomina-se sondagem.

    Definio 2.1. Uma populao uma coleo de unidades individuais, que podem ser pes-soas, animais, objetos, acontecimentos ou resultados experimentais com uma ou mais caracte-rsticas comuns que se pretendem estudar. A cada elemento da populao chama-se indivduoou unidade estatstica. O nmero de elementos da populao representado por N (caso estaseja finita).

    Definio 2.2. Uma amostra um subconjunto representativo da populao que se obtmatravs de mtodos apropriados. A sua dimenso representada por n.

    Nas situaes em que o estudo implica a destruio dos elementos a observar (por exem-plo, quando pretendemos estudar a fiabilidade dos pneus ou a existncia de bactrias nosiogurtes) recorre-se sempre a uma amostra. Tambm aconselhvel recorrer a uma amostrapor razes econmicas ou de tempo, pois observar todos os elementos da populao podeimplicar custos elevados ou a obteno tardia dos resultados.

    8 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    A determinao dos elementos que constituem a amostra, com vista obteno dos da-dos para a realizao do estudo estatstico, tambm designado por processo de amostragem,dever se objeto de especial cuidado. Sempre que pretendemos estender os resultados de umestudo estatstico a toda a populao devemos observar o princpio da aleatoriedade. Quando,para todo o elemento da populao existe uma probabilidade positiva de pertencer amostra,dizemos que estamos perante uma amostra aleatria. Caso particular o processo de amos-tragem simples onde cada grupo de dimenso n tem igual probabilidade de ser selecionado(com probabilidade igual a 1

    (Nn), uma vez que existem

    (Nn

    )amostras distintas com igual pro-

    babilidade de serem selecionadas). Neste caso prova-se que cada indivduo tem a mesmaprobabilidade de ser selecionado, sendo esta probabilidade igual a nN . Para mais informaesconsultar INE (2009, p. 43-71).

    Quando existem elementos da populao que podem no ser selecionados para a amos-tra estamos perante um processo de amostragem no aleatria. Neste caso dizemos que oprocesso de recolha da amostra inviesado e poder conduzir a interpretaes erradas.

    Exemplo 2.2. Exemplos de situaes que originam amostras enviesadas: perguntar aos alu-nos do 9.o ano que almoam diariamente no refeitrio da escola os hbitos alimentares egeneralizar a todos os alunos do 9.oano; perguntar aos torrejanos que trabalham numa em-presa os efeitos da crise econmica e generalizar a todos os torrejanos; perguntar o clubepreferido porta do Estdio da Luz e generalizar a toda a populao e efetuar um inqurito,num Hospital, sobre a sade dos portugueses.

    No primeiro caso ilustrado no exemplo 2.2 no obteramos qualquer informao relativaaos alunos que almoam no bar da escola, em casa ou nos arredores da escola. No segundocaso, pelo facto de as pessoas questionadas trabalharem numa empresa, no estavam includos,por exemplo, indivduos desempregados. No terceiro caso, os indivduos seriam todos ouquase todos do Benfica e no ltimo caso as pessoas inquiridas estariam doentes (ou eramacompanhantes dos doentes).

    As situaes anteriores evidenciam fontes de enviesamento na recolha dos dados, peloque esses estudos no conduziriam a resultados eficientes, nem permitiriam efetuar genera-lizaes. No entanto h diversos estudos possveis de realizar ao nvel do ensino bsico esecundrio em que, recorrendo a amostras no enviesadas, se pode generalizar os resultadosobtidos. Por exemplo, se selecionarmos aleatoriamente 5 alunos de cada turma de uma escola(supondo que cada turma tem um nmero de alunos aproximado) e estudarmos o nmero de

    Estatstica no Ensino Bsico e Secundrio 9

  • Conceitos de Estatstica

    irmos, o nmero do sapato ou a altura, faz sentido generalizar para toda a escola. Neste casoestamos a considerar que a populao, constituda pelos alunos da escola, est dividida em v-rias subpopulaes (designadas de estratos) mais ou menos homogneas e em cada uma destassubpopulaes recolhe-se uma amostra aleatria simples (amostra aleatria estratificada). de salientar que os alunos mais novos, nomeadamente do 1.o ciclo, podero usar a sua turmacomo populao em estudo de modo a facilitar os seus projetos nesta rea.

    Em qualquer estudo estatstico, necessrio identificar e classificar as caractersticas emanlise, de acordo com os objetivos traados.

    2.1 Variveis

    Tendo em conta a amostra sobre a qual recai o estudo estatstico e os objetivos fixados,definem-se as caratersticas a analisar (variveis estatsticas), as quais devem ser comunsa todos os elementos da populao.

    Definio 2.3. Varivel estatstica (ou atributo) a propriedade ou caracterstica comum quese observa em cada uma das unidades estatsticas. Representa-se, habitualmente, por uma dasltimas letras do alfabeto, por exemplo, x ou y.

    As variveis estatsticas podem classificar-se em quantitativas ou qualitativas. A varivelquantitativa aquela que se refere a uma caracterstica mensurvel, isto , que se pode contarou medir. Por conseguinte, traduz-se por valores numricos.

    Exemplo 2.3. Exemplos de variveis quantitativas: nmero de divises de uma habitao;idade de um indivduo; nmero de alunos por turma e tempo necessrio para chegar de casa escola.

    Uma varivel quantitativa pode ser discreta ou contnua. Quando a caracterstica em es-tudo se pode apenas contar e no medir, a varivel discreta, como por exemplo o nmero dealunos por turma. Por outro lado, uma varivel quantitativa que se pode medir uma varivelcontnua, como por exemplo o tempo necessrio para chegar de casa escola.

    A varivel qualitativa aquela que se refere a uma caracterstica que no susceptvel demedio ou contagem e, como tal, traduz-se por diferentes modalidades (possveis respostasque a varivel pode assumir).

    10 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Exemplo 2.4. Exemplos de variveis qualitativas: ano de escolaridade dos alunos; profissodos pais; meio de transporte utilizado para chegar de casa escola e cor preferida dos estu-dantes de uma turma.

    As variveis qualitativas podem ser classificadas em nominais ou ordinais. Um varivelestatstica nominal quando no se pode estabelecer uma relao de ordem entre as modali-dades e ordinal no caso em que as modalidades apresentam uma ordem subjacente. Comoexemplo de uma varivel qualitativa ordinal podemos considerar as habilitaes literrias deum indivduo. Um exemplo de uma varivel qualitativa nominal pode ser a cor preferida dosestudantes.

    2.2 Dados estatsticos

    Sempre que se observa uma varivel estatstica, quantitativa ou qualitativa, obtemos determi-nados resultados que designamos por dados estatsticos.

    Definio 2.4. Dado estatstico o resultado de cada observao da varivel numa unidadeestatstica.

    Se a varivel em estudo for, por exemplo, o nmero de alunos por turma, os dados estats-ticos podem ser:

    22,28,24,24,28,20,28, ,

    mas no caso da varivel ser o ano de escolaridade dos alunos, alguns dados estatsticos podemser:

    5.o ano; 6.o ano; 6.o ano; 8.o ano; 7.o ano; 12.o ano,

    Os dados estatsticos so muito mais do que nmeros ou modalidades. Eles esto sempreassociados a um contexto. Na primeira situao apresentada, em que a varivel o nmerode alunos por turma, cada unidade estatstica uma turma. Para cada turma observou-se onmero de alunos, obtendo-se, assim, os dados estatsticos. Na segunda situao, em que avarivel o ano de escolaridade, cada unidade estatstica um aluno. Para cada aluno registou-se o seu ano de escolaridade. Deste modo, obtiveram-se os dados estatsticos que neste casoso modalidades, pois a varivel qualitativa. Aproveitamos para reforar a importncia de,

    Estatstica no Ensino Bsico e Secundrio 11

  • Conceitos de Estatstica

    num estudo estatstico, saber quais os dados que queremos obter de modo a dar resposta squestes levantadas, apresentando concluses pertinentes.

    Neste captulo vamos recorrer, como exemplo, ao resultado de um inqurito efetuado a25 alunos de uma escola, selecionados de entre as trs turmas do 8.o ano, relativamente suacor preferida; seus hbitos de leitura; idade (em anos); altura (em centmetros - cm); notasdo teste diagnstico de Matemtica (Mat.) e do teste diagnstico a Cincias Fsico-Qumicas(C.F.Q.) numa escala de 0 a 100 valores. Os dados obtidos esto apresentados na Tabela 2.1.

    Notemos que as variveis cor preferida e hbitos de leitura so variveis qualitativas, asvariveis nota a Matemtica, nota a Cincias Fsico-Qumicas e idade(1) so variveis quanti-tativas discretas e a varivel altura uma varivel quantitativa contnua.

    Relativamente notao que utilizaremos ao longo deste trabalho, as observaes daamostra sero representadas por

    x1, x2, . . . , xn,

    onde xi representa a resposta do indivduo i relativamente varivel x. Para o tratamento esta-tstico usual agrupar os indivduos cujas respostas so iguais, sendo as diferentes respostaspresentes na amostra representadas por

    x1, x2, . . . , x

    p

    onde p representa o nmero de respostas distintas e, naturalmente, p n. Desta forma pode-mos construir as tabelas de frequncias.

    2.3 Tabelas de frequncias

    Aps a recolha de dados, outra fase muito importante a sua organizao em tabelas defrequncias. Com este objetivo devemos atender s seguintes definies.Definio 2.5. A frequncia absoluta o nmero de vezes que cada valor da varivel (oucada modalidade) aparece num conjunto de dados. Representa-se por ni que corresponde aonmero de vezes que se observou xi.

    (1) Apesar dos dados resultarem de uma medio, a forma como so apresentados (nmero inteiro de anos)tm a aparncia de dados discretos. Contudo, por exemplo, o valor 14, refere-se a todas as idades maiores ouiguais a 14 e menores que 15. Por esta razo podemos tambm considerar a varivel idade como uma varivelcontnua que foi discretizada.

    12 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Aluno Cor Hbitos Idade Altura Nota a Nota apreferida de leitura (anos) (cm) Mat. C.F.Q.

    1 azul leio todos os dias 15 150 42 602 branco no costumo ler 14 159 37 433 azul leio todas as semanas 13 146 80 814 branco leio todos os dias 14 157 78 805 azul leio todas as semanas 14 163 79 856 amarelo no costumo ler 13 158 63 607 azul leio todos os dias 15 160 63 648 azul leio todas as semanas 15 165 45 539 amarelo leio todas as semanas 14 154 50 5510 verde s leio nas frias 13 149 32 3511 branco s leio nas frias 14 153 60 7012 branco leio todas as semanas 14 166 38 3913 cor-de-rosa leio todas as semanas 13 153 45 4714 cor-de-rosa s leio nas frias 13 152 60 6215 azul leio todos os dias 14 159 71 7016 amarelo leio todos os dias 14 155 25 2717 amarelo s leio nas frias 13 156 60 6418 cor-de-rosa leio todas as semanas 14 152 64 6519 cor-de-rosa leio todas as semanas 14 163 65 6020 cor-de-rosa s leio nas frias 14 157 37 3821 verde leio todos os dias 15 164 64 6522 azul leio todas as semanas 15 169 87 9023 cor de rosa leio todas as semanas 14 157 87 8824 verde no costumo ler 16 164 48 5425 cor-de-rosa s leio nas frias 14 155 50 55Tabela 2.1: Dados obtidos atravs de um questionrio a 25 alunos do 8.o ano

    A soma das frequncias absolutas igual dimenso da amostra, isto ,p

    i=1

    ni = n. (2.1)

    Estatstica no Ensino Bsico e Secundrio 13

  • Conceitos de Estatstica

    Definio 2.6. A frequncia relativa de cada modalidade xi a proporo de observaesiguais a xi, isto , o quociente que se obtm dividindo a frequncia absoluta de um valor (oumodalidade) pelo nmero total de dados. Representa-se por fi sendo

    fi = nin, (2.2)

    onde n o nmero de elementos da amostra.

    Uma propriedade importante das frequncias relativas a soma das frequncias relativasser igual a 1, isto ,

    p

    i=1

    fi = 1. (2.3)

    Notemos que quando pretendemos efetuar comparaes devemos usar a frequncia rela-tiva, pois muitas vezes as amostras tm dimenses diferentes e, nestes casos, no faz sentidousar a frequncia absoluta. Por exemplo, quando se pretende comparar o nmero de aprova-es de duas turmas com dimenses distintas no se deve comparar as frequncias absolutasmas antes as frequncias relativas.

    Definio 2.7. A frequncia absoluta acumulada de cada valor xi da varivel o nmerototal de dados com valor menor ou igual a xi. Representa-se por Ni.

    A frequncia absoluta acumulada obtm-se adicionando as frequncias absolutas desde oprimeiro at ao ltimo valor considerado da varivel, isto ,

    Ni =i

    j=1

    n j, (2.4)

    onde, naturalmente, Np = n.

    Definio 2.8. A frequncia relativa acumulada de cada valor xi da varivel a soma dasfrequncias relativas de todos os dados com valor menor ou igual a xi. Representa-se por Fi.

    A frequncia relativa acumulada obtm-se adicionando as frequncias relativas desde oprimeiro at ao ltimo valor considerado da varivel, isto ,

    Fi =i

    j=1

    f j, (2.5)

    ou utilizando as frequncias absolutas acumuladas

    Fi =Nin, (2.6)

    14 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    onde Fp = 1.

    Uma das formas de organizarmos os dados estatsticos atravs da construo de tabelasde frequncias, pois trazem-nos fortes vantagens na leitura dos dados. Agora que j definimosos diferentes tipos de frequncia, apresentamos na Tabela 2.2 uma tabela de frequncias geral.Na primeira coluna so apresentados os diferentes valores ou modalidades, da varivel estats-tica, presentes na amostra e nas colunas seguintes as correspondentes frequncias absolutas,relativas e acumuladas. Na ltima linha da tabela apresentada a soma da respetiva coluna,sempre que tal tenha significado.

    Varivel Frequncia Frequncia Frequncia Frequnciaabsoluta absoluta relativa relativa

    x ni acumulada Ni fi acumulada Fix1 n1 N1 = n1 f1 F1 = f1x2 n2 N2 = n1 +n2 f2 F2 = f1 + f2 xi ni Ni = n1 + +ni Fi = fi f1 + + fi xp np Np = n1 + +np = n fn Fp = f1 + + fp = 1

    Total n 1

    Tabela 2.2: Tabela de frequncias

    comum designar a tabela de frequncias de acordo com as frequncias que a compem.Por exemplo, uma tabela de frequncias absolutas simples apresenta apenas estas frequnciaspara cada um dos valores ou modalidades.

    2.3.1 Tabela de frequncias de uma varivel qualitativa

    Quando a varivel em estudo qualitativa os dados estatsticos apresentam-se na forma demodalidades. Como tal, deve proceder-se contagem das diferentes modalidades e organizaros dados numa tabela de frequncias absolutas e relativas simples. Vamos ilustrar esta situaocom as cores preferidas dos alunos, dadas na Tabela 2.1 presente na pgina 13. Os dadosapresentam 5 modalidades diferentes (p = 5) e encontram-se organizados na Tabela 2.3.

    Estatstica no Ensino Bsico e Secundrio 15

  • Conceitos de Estatstica

    Cor Frequncia Frequnciapreferida absoluta relativa

    dos alunos ni fibranco 4 4:25 = 0,16 (16%)amarelo 4 4:25 = 0,16 (16%)

    cor-de-rosa 7 7:25 = 0,28 (28%)azul 7 7:25 = 0,28 (28%)

    verde 3 3:25 = 0,12 (12%)Total 25 1

    Tabela 2.3: Tabela de frequncias da varivel cor preferida dos alunos

    Refira-se que, caso estivssemos perante uma varivel qualitativa ordinal, por exemplo,habilitaes literrias, faria sentido o clculo das frequncias acumuladas, uma vez que nestecaso a ordem das modalidades tem significado.

    2.3.2 Tabela de frequncias de uma varivel quantitativa discreta

    Tratando-se de uma varivel quantitativa discreta deve proceder-se contagem dos diferentesvalores e organizao dos dados numa tabela de frequncias absolutas ou relativas, simplesou acumuladas. Neste tipo de varivel os dados estatsticos apresentam-se na forma de valoressendo, sempre possvel, a sua ordenao.

    Para ilustrar esta situao consideremos agora as idades dos 25 alunos. Verificamos queexistem quatro valores diferentes da varivel (13, 14, 15 e 16), logo p = 4. Os dados podemorganizar-se numa tabela de frequncias conforme a apresentada como Tabela 2.4.

    Funo cumulativa para dados discretos

    Associada a cada uma das frequncias acumuladas podemos definir a funo cumulativa. Nocaso das frequncias absolutas, associa a cada valor de x o nmero total de dados observadoscom valor menor ou igual a x, isto ,

    N(x) = xix

    ni. (2.7)

    16 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Idade Frequncia Frequncia Frequncia Frequnciados absoluta absoluta relativa relativa

    alunos ni acumulada Ni fi acumulada Fi13 6 6 6:25 = 0,24 (24%) 0,24 (24%)14 13 19 13:25 = 0,52 (52%) 0,76 (76%)15 5 24 5:25 = 0,2 (20%) 0,96 (96%)16 1 25 1:25 = 0,04 (4%) 1 (100%)

    Total 25 1Tabela 2.4: Tabela de frequncias da varivel idade dos alunos

    No caso das frequncias relativas, faz corresponder a cada valor de x a frequncia relativa dototal de dados observados com valor menor ou igual a x, isto ,

    F(x) = xix

    fi. (2.8)

    Como exemplo vamos definir, analiticamente, as funes cumulativas das frequncias abso-lutas e das frequncias relativas para a varivel idade dos alunos,

    N(x) =

    0 se x < 13

    6 se 13 x < 1419 se 14 x < 1524 se 15 x < 1625 se x 16

    , (2.9)

    F(x) =

    0 se x < 13

    0,24 se 13 x < 140,76 se 14 x < 150,96 se 15 x < 161 se x 16

    . (2.10)

    A representao grfica da funo (2.9) pode ver-se na seco 2.4.6 (pgina 24).

    Estatstica no Ensino Bsico e Secundrio 17

  • Conceitos de Estatstica

    2.3.3 Tabela de frequncias de uma varivel quantitativa contnua

    Quando a varivel em estudo quantitativa contnua(2), os dados estatsticos podem tomarqualquer valor de um certo intervalo, surgindo poucas repeties. Por este motivo, no fazsentido atribuir uma frequncia a cada valor diferente da varivel, pois a tabela assim obtidano permitiria obter concluses importantes pelo facto de no conduzir a regularidades, comoilustra o exemplo apresentado na Tabela 2.5. Neste exemplo consideramos a altura dos alunose tratamos a varivel altura como quantitativa discreta.

    Altura dos alunos Frequncia absoluta ni

    146 1149 1150 1152 1153 2154 1155 2156 1157 3158 1159 1160 2162 1163 2164 1165 2166 1169 1

    Tabela 2.5: Tabela de frequncias da altura dos alunos (como uma varivel discreta)

    Uma vez que as regularidades so impercetveis nesta tabela, vamos agrupar os dados,

    (2) Este procedimento tambm deve ser aplicado em variveis quantitativas discretas que assumam muitosvalores distintos

    18 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    relativos s alturas, em classes procedendo do seguinte modo:

    calcular a diferena entre a altura mxima e a altura mnima (amplitude da amostra);

    determinar o nmero de classes k a construir, utilizando a regra de Sturges, (onde k omenor nmero inteiro tal que 2k n);

    determinar a amplitude de cada classe que ser aproximadamente (por excesso) o quo-ciente que se obtm dividindo a amplitude da amostra pelo nmero de classes.

    Vamos assim obter os intervalos, habitualmente denominados por intervalos de classe,

    [l0, l1[, [l1, l2[, , [lk2, lk1[, [lk1, lk],

    onde l0 < l1 < l2 < < lk1 < lk. Os intervalos so disjuntos dois a dois e a sua unio contmtodos os valores. Notemos que l0 menor ou igual que o valor mnimo observado e lk maiorou igual que o valor mximo observado (de forma a garantir que o intervalo [l0, lk] contenhatodas as observaes).

    Tendo em conta os passos anteriores, relativamente altura dos 25 alunos, verifica-se quea altura mxima 169, a altura mnima 146 e a amplitude 169146 = 23. Como 25 25(e 24 < 25), iremos considerar k = 5 classes. Dado que 235 = 4,6, vamos construir 5 classestodas de amplitude 5. Assim obtm-se a tabela de frequncias apresentada na Tabela 2.6.

    Altura Frequncia Frequncia Frequncia Frequnciados absoluta absoluta relativa relativa

    alunos ni acumulada Ni fi acumulada Fi[145,150[ 2 2 2:25 = 0,08 (8%) 0,08 (8%)[150,155[ 5 7 5:25 = 0,20 (20%) 0,28 (28%)[155,160[ 8 15 8:25 = 0,32 (32%) 0,60 (60%)[160,165[ 6 21 6:25 = 0,24 (24%) 0,84 (84%)[165,170] 4 25 4:25 = 0,16 (16%) 1 (100%)

    Tabela 2.6: Tabela de frequncias da varivel altura

    Pode aplicar-se este processo (regra de Sturges) de modo idntico sempre que a varivelseja quantitativa contnua. Saliente-se, contudo, que no mtodo nico e que nem sempre

    Estatstica no Ensino Bsico e Secundrio 19

  • Conceitos de Estatstica

    conduz a resultados aceitveis. A ttulo de exemplo, usando este mtodo, se analisarmos orendimento de 100 indivduos e um deles tiver um rendimento muito superior aos restantespodemos obter 7 classes de igual amplitude, onde na primeira esto 99 indivduos e na ltimaapenas um, como se ilustra no exemplo 2.5.

    Exemplo 2.5. De um grupo de 100 trabalhadores de um empresa, 99 auferem entre 475 euros(rendimento mnimo) e 1100 euros e um indivduo aufere 5000 euros (rendimento mximo).Tendo em conta os passos descritos previamente, a amplitude igual a 5000475 = 4525 e onmero de classes a considerar igual a 7 (k = 7) uma vez que 27 100 (e 26 < 100). Dadoque 45257 646,4, segundo a regra de Sturges vamos construir 7 classes todas de amplitude647, de onde se obtm a tabela de frequncia apresentada como Tabela 2.7. Naturalmente,num caso como este pertinente o uso de classes com diferentes amplitudes.

    Rendimento Frequnciaem absoluta

    euros ni

    [475,1122[ 99[1122,1769[ 0[1769,2416[ 0[2416,3063[ 0[3063,3710[ 0[3710,4357[ 0[4357,5004[ 1

    Total 100Tabela 2.7: Rendimentos agrupados em classes de igual amplitude

    2.4 Representaes Grficas

    Para alm de se poder organizar os dados estatsticos em tabelas de frequncias, outra formade os apresentar recorrer a vrios tipos de representaes grficas, tais como pictogramas,grficos de pontos, diagramas de barras, grficos circulares, diagramas de caule e folhas ehistogramas.

    20 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Um grfico um instrumento de sntese apelativo e que nos d uma ideia geral da questoabordada, sem no entanto deixar de destacar alguns aspetos particulares. Quando pretendemosrepresentar conjuntos de dados graficamente deveremos selecionar o grfico mais adequadoa cada situao. Por outro lado, deve ter-se em conta que a informao que nele existe suficiente para que qualquer pessoa o compreenda.

    2.4.1 Pictograma

    O pictograma um tipo de representao grfica muito sugestivo, pois na sua construo soutilizadas figuras representativas da informao. Apesar de se poder usar o mesmo smbolo,variando a rea ou volume de forma a que sejam proporcionais frequncia absoluta, torna-semais simples usar uma figura que se repete sempre da mesma maneira. As figuras devemestar igualmente espaadas e devem apresentar-se em linhas ou colunas. Apesar de nos daruma ideia geral da situao uma das desvantagens , por vezes, no ser possvel uma leiturarigorosa das frequncias absolutas de cada valor ou modalidade. Um pictograma tem de in-cluir o significado do smbolo que pode ser a unidade ou no. Pode visualizar-se um exemplode pictograma na Figura 2.1, respeitante aos hbitos de leitura dos alunos (cujos dados estoapresentados na Tabela 2.1, na pgina 13).

    Figura 2.1: Pictograma dos hbitos de leitura dos alunos

    2.4.2 Grfico de pontos

    Um grfico de pontos uma representao grfica muito simples e que pode utilizar-se paravariveis qualitativas ou para variveis quantitativas. Para a sua elaborao comea-se pordesenhar um eixo horizontal onde se marcam os valores ou modalidades que a varivel assume

    Estatstica no Ensino Bsico e Secundrio 21

  • Conceitos de Estatstica

    em cada conjunto de dados. Por cima de cada valor ou modalidade marca-se um ponto sempreque um elemento da amostra for igual a esse valor ou a essa modalidade.

    Na Figura 2.2 utilizamos a idade dos alunos para ilustrar um grfico de pontos.

    Figura 2.2: Grfico de pontos das idades dos alunos

    2.4.3 Grfico de barras

    Um grfico de barras um grfico muito comum para representar informao, pelo facto de serfcil de elaborar e interpretar. Pode ser usado quando a varivel qualitativa ou quantitativadiscreta. Serve para representar um conjunto de dados ou para comparar conjuntos de dadosrelativamente a uma varivel. Tal como no grfico de pontos, no eixo horizontal indicam-seas modalidades ou os valores da varivel. Para alm deste eixo necessrio um eixo verticalonde se marcam as frequncias absolutas ou relativas. No deve haver quebra de escala no eixovertical pois os grficos tornam-se enganadores, mostrando aparentemente grandes variaesquando na verdade no existem (ou ao contrrio). As barras devem ter a mesma largura,devem estar igualmente espaadas e a sua altura deve ser proporcional s frequncias. Namaioria das vezes a altura de cada barra coincide com a frequncia.

    Na Figura 2.3 utilizamos a idade dos alunos para ilustrar um grfico de barras.

    2.4.4 Grfico circular

    Um grfico circular constitudo por um crculo no qual se definem setores de rea direta-mente proporcional frequncia que representam. Cada um dos setores corresponde a uma

    22 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Figura 2.3: Grfico de barras das idades dos alunos

    modalidade ou a um valor da varivel. Desta forma, deve ser utilizado quando a varivelapresenta um nmero reduzido de valores ou modalidades e sempre que essas frequncias nosejam prximas de 0.

    Alguns programas constroem estes grficos a partir da tabela de frequncias, no entantose utizarmos o GeoGebra ou se os construirmos usando papel e lpis, necessrio determi-nar a amplitude de cada setor. Para isso habitual usar uma regra prtica que consiste emmultiplicar a frequncia relativa por 360 (graus). Outra alternativa utilizar regras de trssimples considerando que o todo (total de elementos da amostra) corresponde a 360. Parafacilitar a leitura e interpretao dos grficos devemos incluir as percentagens corresponden-tes a cada setor (como se mostra na Figura 2.4) e sempre que necessrio uma legenda. Estegrfico mostra-nos as cores preferidas dos alunos, cujos dados se encontram na Tabela 2.1.

    Figura 2.4: Grfico circular das cores preferidas de 25 alunos

    Estatstica no Ensino Bsico e Secundrio 23

  • Conceitos de Estatstica

    2.4.5 Histograma e polgono de frequncias

    O histograma uma representao grfica que se utiliza quando a varivel em estudo con-tnua. composto por uma sucesso de retngulos adjacentes que tm por base um intervalode classe e rea igual frequncia(3) (absoluta ou relativa). Desta forma a rea total do histo-grama n (dimenso da amostra) ou 1 (soma das frequncias relativas). Na primeira situao,para determinar a altura de cada retngulo, deve usar-se nihi ; na segunda situao, deve usar-sefihi , onde hi representa a amplitude da classe i, isto , hi = li li1, i = 1, ,k.

    de referir que nos casos em que os intervalos de classe tm a mesma amplitude habitualconsiderar as alturas dos retngulos iguais (ou proporcionais) s frequncias absolutas ourelativas, como por exemplo, no grfico presente na Figura 2.5.

    Figura 2.5: Histograma da altura (em cm) de 25 alunos

    O polgono de frequncias um grfico de linhas associado ao histograma e que se obtmunindo os pontos mdios da base superior de cada retngulo. Para que o polgono comecee termine no eixo horizontal, imagina-se uma classe esquerda da primeira (com a mesmaamplitude da primeira) e outra direita da ltima (com a mesma amplitude da ltima), ambascom frequncia igual a zero, como se ilustra no grfico presente na Figura 2.6. Notemos que,deste modo, a rea do histograma ser igual rea entre o polgono e o eixo Ox.

    2.4.6 Representao grfica da funo cumulativa

    Tratando-se de dados discretos, o grfico da funo cumulativa, quer das frequncias relativasacumuladas quer das frequncias absolutas acumuladas em escada. A ttulo de exemplo, na

    (3) No obrigatrio ser igual, pode ser proporcional. Contudo estes so os casos mais utilizados.

    24 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Figura 2.6: Polgono de frequncias referente altura dos alunos

    Figura 2.7 apresentamos o grfico da funo cumulativa presente na pgina 17, referente idade dos alunos.

    Figura 2.7: Funo cumulativa relativa idade dos alunos

    No caso da varivel ser contnua a representao grfica da funo cumulativa umalinha poligonal que pode ser obtida a partir do histograma de frequncias acumuladas. Con-siderando as alturas dos 25 alunos, vamos representar a funo cumulativa a partir do histo-grama de frequncias relativas acumuladas. Assim, como podemos ver na Figura 2.8, antes dafrequncia da 1.a classe, a frequncia acumulada nula, pelo que se traa um segmento sobreo eixo Ox at ao limite inferior da 1a classe (ficando sobreposto ao eixo Ox). A partir daqui, eadmitindo que as observaes se distribuem uniformemente em cada uma das classes, unimosos pontos de coordenadas (li,Fi), i = 0,1,2,3,4,5, onde li o limite inferior da classe [li, li+1[e Fi a frequncia relativa acumulada da classe anterior com F0 = 0. Quando chegamos ltimaclasse temos a garantia que a frequncia acumulada correspondente ao seu limite superior

    Estatstica no Ensino Bsico e Secundrio 25

  • Conceitos de Estatstica

    igual a 1, razo pela qual se desenha um segmento de reta paralelo ao eixo Ox, a partir desseponto.

    Figura 2.8: Funo cumulativa relativa altura dos alunos

    2.4.7 Diagrama de caule e folhas

    O diagrama de caule e folhas uma forma de representar os dados de fcil construo. Podesituar-se entre a tabela e o grfico, sendo uma das vantagens o facto de todos os dados obser-vados estarem presentes e ordenados.

    Para construir um diagrama de caule e folhas desenha-se uma linha vertical e coloca-se dolado esquerdo o dgito ou dgitos de maior grandeza e do lado direito os restantes dgitos.

    Por exemplo, no caso da altura dos alunos, 146, 149, 150, , registadas na Tabela 2.1, napgina 13, colocamos os dgitos das centenas e das dezenas esquerda e os algarismos dasunidades direita, ficando o incio do diagrama com este aspeto 14| 6 9 (conforme Figura 2.9).Aos valores colocados esquerda do trao vertical chamamos caule e aos valores colocados direita denominamos por folhas.

    Notemos que o diagrama de caule e folhas tem uma representao grfica semelhante dohistograma, se fizermos uma rotao de 90, no sentido contrrio ao dos ponteiros do relgio.Deste modo, corresponderia a um histograma com trs classes, respetivamente [140,150[,[150,160[ e [160,170[. Uma das vantagens do histograma relativamente ao diagrama de caulee folhas o facto de haver menos restries na construo das classes do que na construo doscaules, no entanto ao construir as classes para a elaborao do histograma perde-se informao

    26 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    existente na amostra.

    Figura 2.9: Diagrama de caule e folhas relativo altura dos alunos

    2.5 Medidas de tendncia central

    Nas duas seces anteriores dedicmo-nos construo de tabelas de frequncias e repre-sentao grfica dos dados. As tabelas de frequncias permitem organizar e facilitam a leiturados dados. Os grficos, apesar de geralmente conterem menos informao que as tabelas defrequncias, so de fcil leitura e tm um peso significativo na anlise descritiva dos dados,no esquecendo que uma imagem vale mais do que mil palavras.

    A partir daqui e at ao final deste captulo, vamos estudar um conjunto de medidas des-critivas que permitem sumariar alguns dos aspetos mais importantes do conjunto de dados.Nesta seco, em particular, vamos estudar as medidas de tendncia central: moda, mdia emediana.

    2.5.1 Moda

    A moda uma medida com especial interesse para resumir os dados no caso da varivelser qualitativa. Nesta situao nem a mdia nem a mediana podem ser calculadas ou sodesprovidas de significado.

    Definio 2.9. A moda, representada por Mo, o valor ou modalidade que surge com maiorfrequncia na amostra.

    Se considerarmos o conjunto de dados constitudo pelas 25 cores preferidas dos alunos ve-rificamos que h duas modalidades com a frequncia absoluta mais elevada (consultar Tabela2.3 da pgina 16). Neste caso dizemos que h duas modas: cor-de-rosa e azul, e a distribuio

    Estatstica no Ensino Bsico e Secundrio 27

  • Conceitos de Estatstica

    bimodal. Se tivesse trs modas seria trimodal. No caso de ter mais do que trs modas multimodal. Quando nenhum valor ou modalidade aparece com maior frequncia do que osrestantes diz-se que no h moda.

    Quando a varivel quantitativa contnua e no se conhecem os dados reais podemos iden-tificar a classe modal (classe com maior frequncia por unidade de amplitude). Por exemplo,relativamente altura dos alunos, representada na Tabela 2.6 da pgina 19 a classe modal [155,160[, porque corresponde classe com maior frequncia absoluta por unidade de ampli-tude. Notemos que, quando as classes tm igual amplitude, bastar identificar a classe commaior frequncia. Caso contrrio devemos utilizar a classe com maior nihi , conforme ilustra oexemplo 2.6.

    Exemplo 2.6. Perguntou-se a 40 indivduos o nmero de dias que faltaram ao trabalho, pordoena, no ano anterior. Os dados encontram-se organizados na Tabela 2.8. Como podemosverificar as classes no tm todas a mesma amplitude. Neste caso indicar a classe modalimplica encontrar a classe em que o quociente entre a frequncia absoluta e a respetiva ampli-tude, maior. Por observao da tabela conclumos que a classe modal a classe [4,8[ (e noa classe [8,16[ que corresponde de maior frequncia).

    N.o de faltas por doena Frequncia absoluta nihi[0,4[ 4 44 = 1[4,8[ 10 104 = 2,5[8,16[ 12 128 = 1,5[16,24[ 9 98 = 1,125[24,30] 5 56 = 0,8(3)

    total 40Tabela 2.8: Nmero de faltas por doena

    2.5.2 Mdia

    De entre as medidas de localizao estudadas, a mdia(4) a mais usada.

    (4) Geralmente quando falamos em mdia estamos a referir-nos mdia aritmtica, como a definimos nestetrabalho. No entanto h outros tipos de mdias, como por exemplo a mdia geomtrica, a mdia harmnica

    28 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Definio 2.10. A mdia, representada por x, obtm-se dividindo a soma de todos os valoresde uma varivel pelo nmero total de observaes,

    x =x1 + x2 + + xn

    n=

    1n

    n

    i=1

    xi, (2.11)

    onde x1,x2, ,xn so os n valores da varivel quantitativa.

    Em muitos casos os dados encontram-se organizados numa tabela como, por exemplo, naTabela 2.4 na pgina 17. Nestes casos, para calcular a mdia utilizamos a frequncia absolutade cada valor distinto da varivel, do seguinte modo:

    x =x1n1 + x

    2n2 + + xpnp

    n=

    1n

    p

    i=1

    xini, (2.12)

    onde p representa o nmero de valores diferentes da varivel.

    Aplicando este raciocnio idade dos alunos (Tabela 2.4 na pgina 17) temos:

    x =136+1413+155+161

    25 =35125 = 14,04 anos. (2.13)

    Por vezes, quando a varivel em estudo contnua, no conhecemos os seus valores reais.Nestes casos partimos dos dados agrupados em classes e determinamos um valor aproximadoda mdia. Para ilustrar esta situao, vamos supor que o peso (em kg) dos 25 alunos estoorganizados em 5 classes, conforme Tabela 2.9. Determina-se a marca da classe, isto , oponto mdio de cada classe,

    xi =li1 + li

    2, i = 1,2, ,5 (2.14)

    e considera-se, para cada classe, que o peso de cada aluno igual marca da classe(5). Depois

    ou a mdia (aritmtica) aparada. A mdia geomtrica muito usada, por exemplo, em economia no clculo detaxas de variao ou de crescimento (se colocarmos no banco um montante com uma taxa de juro igual a 2%no primeiro ano e 3% no segundo ano, a taxa mdia de crescimento no ser exactamente igual a 2,5%). Amdia harmnica utiliza-se quando estamos perante grandezas inversamente proporcionais, como o caso davelocidade e do tempo (notemos que se fizermos um trajeto duas vezes, uma a 80 km/h e outra a 120 km/h, avelocidade mdia no ser 100 km/h). Quando temos alguns valores muito distantes da mdia (outliers) comumretirar as % de observaes menores e as % de observaes maiores, determinando-se a mdia aritmtica dasrestantes (1002)% de observaes. A esta mdia denomina-se por mdia aparada a %, sendo uma medidamais robusta que a mdia aritmtica quando estamos perante um conjunto de dados com outliers.

    (5) Se considerarmos que as observaes esto igualmente espaadas dentro de cada classe (uniformementedistribudas) o resultado ser exatamente o mesmo, contudo a ideia ser mais difcil de transmitir aos nossosalunos.

    Estatstica no Ensino Bsico e Secundrio 29

  • Conceitos de Estatstica

    procede-se como no caso anterior e obtemos, desta forma, um valor aproximado do pesomdio dos alunos dado por:

    x =145225 = 58,08 kg. (2.15)

    Peso Frequncia Marcados absoluta da classe xi ni

    alunos (kg) ni xi[40,48[ 5 44 445 = 220[48,56[ 5 52 525 = 260[56,64[ 9 60 609 = 540[64,72[ 3 68 683 = 204[72,80] 3 76 763 = 228Total 25 1452

    Tabela 2.9: Tabela de frequncias do peso dos alunos

    A mdia goza de algumas propriedades importantes. De seguida apresentaremos duasdelas.

    Com este propsito, consideremos que a idade dos 25 alunos foi registada no dia 1 desetembro de 2010. Por (2.13) sabemos que, nesta data, a idade mdia dos alunos igual a14,04 anos. Qual ser a mdia das idades destes alunos no dia 1 de setembro de 2011?

    Facilmente respondemos que, como passou um ano completo para cada aluno, a mdiaaumenta uma unidade, passando de 14,04 para 15,04 anos.

    Para generalizar este resultado, sejam x1,x2, ,xn os n valores da varivel quantitativa xcom mdia x.

    Propiedade 2.1. Se a cada valor da varivel x adicionarmos uma constante c 6= 0 obteremosuma nova varivel, que representamos por y, cuja mdia :

    y = x+ c. (2.16)

    De facto,

    y =1n

    n

    i=1

    yi =1n

    n

    i=1

    (xi + c) =1n

    n

    i=1

    xi +1n

    n

    i=1

    c = x+ c.

    30 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Para ilustrar a segunda propriedade da mdia, suponhamos que todos os alunos comearama frequentar o ginsio que se situa junto escola no dia 1 de outubro de 2010. Suponhamosainda que ao fim de um ms cada aluno tinha perdido 2% do seu peso. Qual o peso mdiodos alunos da turma no dia 1 de novembro do mesmo ano? A resposta, em kg, ser dada por

    58,080,0258,08 = 0,9858,08 56,92 kg.

    Cada peso registado no dia 1 de novembro corresponde a 98% do respetivo peso anterior.Ento a mdia obtida ser 98% da mdia anterior. De um modo geral, temos a seguintepropriedade.

    Propiedade 2.2. Se multiplicarmos cada valor da varivel x por uma constante c obteremosuma nova varivel w cuja mdia :

    w = c x. (2.17)

    Efetivamente,w =

    1n

    n

    i=1

    wi =1n

    n

    i=1

    cxi = c1n

    n

    i=1

    xi = cx.

    2.5.3 Mediana

    Para determinar a mediana devemos previamente ordenar as observaes. Neste sentido sejamx(1),x(2), ,x(n) as observaes x1,x2, ,xn ordenadas. Desta forma x(1) representa a menorobservao, x(2) a segunda menor observao, , x(i) a i-sima menor observao, e x(n)ser a observao mxima, isto ,

    x(1) x(2) x(n). (2.18)

    Definio 2.11. A mediana, representada por Me, um valor que divide ao meio o conjuntodas observaes, isto , 50% dos valores so inferiores ou iguais mediana e 50% dos valoresso superiores ou iguais mediana.

    Existe uma regra prtica para calcular a mediana. Depois de ordenar os valores por ordemcrescente consideram-se os seguintes dois casos.

    1. Se n mpar a mediana o valor que ocupa a posio central. Ento, numa amostra dedimenso n, teremos

    Me = x( n+12 ). (2.19)

    Estatstica no Ensino Bsico e Secundrio 31

  • Conceitos de Estatstica

    2. Se n par a mediana a mdia dos dois valores que ocupam a posio central. Ento,numa amostra de dimenso n, teremos

    Me =x( n2)

    + x( n2+1)

    2. (2.20)

    Notemos que, neste ltimo caso, a mediana pode no coincidir com nenhuma das observaesda amostra.

    Exemplo 2.7. Consideremos os dados registados na Tabela 2.1 relativos idade dos 25 alunose ordenemo-los por ordem crescente,

    13,13,13,13,13,13,14,14,14,14,14,14,14,14,14,14,14,14,14,15,15,15,15,15,16.

    Como o nmero de observaes mpar, n = 25, a mediana dada por

    Me = x(13) = 14. (2.21)

    No caso de dados no agrupados, atravs da tabela de frequncias podemos determinarfacilmente o valor que ocupa a posio central (ou os dois valores que ocupam as posiescentrais) recorrendo s frequncias acumuladas (absolutas ou relativas). Caso haja uma mo-dalidade xi onde Fi = 0,5 (ou Ni = n2 ), ento Me = 12

    (xi + x

    i+1). Caso contrrio, a mediana

    corresponder primeira modalidade xi tal que Fi > 0,5 (ou Ni > n2 ).Por outro lado, quando os dados esto agrupados em classes, podemos encontrar a classe

    mediana de modo idntico. Assim, a classe mediana ([li1, li[) ser aquela que corresponde primeira classe com frequncia relativa acumulada superior ou igual a 50% (Fi 0.5) ou, oque equivalente, primeira classe com frequncia absoluta acumulada superior ou igual an2 (Ni n2). Por exemplo, relativamente altura dos 25 alunos, apresentada na Tabela 2.6, napgina 19, a classe mediana [155,160[, pois esta classe acumula 60% dos valores e a anterioracumula apenas 28%. No entanto, como neste caso se conhecem todos os valores da varivel,deve calcular-se o valor da mediana, em vez da classe mediana.

    2.5.4 Comparao das medidas de tendncia central

    As medidas estatsticas mdia, moda e mediana so designadas por medidas de tendnciacentral, pois so trs formas distintas de representar o centro dos dados. A utilizao de cadauma destas medidas apresenta vantagens e desvantagens em relao s outras medidas.

    32 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    A moda pode ser determinada quer a varivel seja qualitativa quer seja quantitativa. Noentanto, um conjunto de dados pode no ter moda. Alm disso, esta medida no influenciadapelos valores extremos. Para ilustrar a relevncia desta medida podemos referir, a ttulo deexemplo, a importncia que pode ter para uma empresa do setor do calado saber qual otamanho do sapato mais vendido, ou para uma empresa de laticnios saber o sabor dos iogurtespreferido dos clientes.

    A mdia uma medida estatstica muito utilizada e no seu clculo intervm todos osdados. Se por um lado no h perda de informao, por outro lado qualquer alterao numdos valores produz um valor diferente no resultado da mdia. A mdia pode ser enganadorapois influenciada pelos valores extremos (nomeadamente se existirem valores muito baixosou muito altos), podendo em alguns casos deixar de ser representativa (isto , exigir umcuidado particular na sua interpretao). Notemos que, por exemplo, duas turmas com amesma mdia na classificao da disciplina de Matemtica podem ter comportamentos muitodistintos. Neste caso, a determinao das medidas de disperso, que medem a variabilidadedos dados, podem ser fulcrais para uma melhor interpretao dos dados. Salientemos aindaque a mdia apenas se pode calcular quando a varivel quantitativa, podendo em algunscasos, o seu valor no coincidir com nenhum dos possveis valores da varivel (por exemplo,o nmero mdio de elementos de um agregado familiar em determinada cidade de Portugal 2,3, contudo no possvel haver um agregado familiar constitudo por 2,3 indivduos!).

    A mediana divide as observaes em dois grupos com igual nmero de indivduos, maso seu valor nem sempre coincide com um dos dados. Uma vez que o seu valor depende donmero de observaes e no de todos os valores, uma medida estatstica mais robusta doque a mdia no sentido em que no influenciada pelos valores muito altos nem pelos valoresmuito baixos (outliers).

    Estes valores muito elevados ou muito pequenos, comparativamente aos restantes, socomuns em algumas distribuies que designamos por assimtricas (positivas ou negativas).O tipo de assimetria decorre da comparao das medidas de tendncia central. Seguidamenteapresentamos trs distribuies tpicas, conforme se ilustra na Figura 2.10.

    distribuio simtrica se x = Me = Mo.

    distribuio assimtrica positiva se Mo Me x.

    distribuio assimtrica negativa se x Me Mo.

    Estatstica no Ensino Bsico e Secundrio 33

  • Conceitos de Estatstica

    Simetria Assimetria positiva Assimetria negativax = Me = Mo Mo Me x x Me Mo

    Figura 2.10: Tipos de assimetria

    A ttulo de exemplo vamos apresentar os diagramas de barras referentes s classificaesde Matemtica, obtidas no final do primeiro perodo, por trs turmas do 7.o ano. Por obser-vao do grfico da Figura 2.11 podemos afirmar que a turma A apresenta uma distribuiosimtrica, pois os dados esto igualmente distribudos direita e esquerda do centro (valordas medidas de tendncia central). De facto, a mdia, a moda e a mediana tm o mesmo valor,x = Me = Mo = 3. Quanto s turmas B e C (ver grficos da Figura 2.12), verificamos quena turma B, a distribuio assimtrica positiva ou enviesada direita, sendo a mdia iguala 2,76 e a moda e a mediana iguais a 2, logo Mo Me x. Na turma C, a distribuio assimtrica negativa ou enviesada esquerda, sendo a mdia 3,92, a mediana 4 e a moda 5,logo x Me Mo.

    Figura 2.11: Distribuio simtrica

    2.6 Medidas de tendncia no central

    Para alm das medidas de tendncia central existem outras medidas que nos informam rela-tivamente localizao dos valores da varivel. Costumam designar-se por quantis e iremosaqui abordar os quartis e os percentis, apesar dos percentis no estarem contemplados nos

    34 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Assimetria positiva Assimetria negativa

    Figura 2.12: Distribuies assimtricas

    programas do ensino bsico e secundrio (contudo so utilizados em diversas situaes donosso quotidiano).

    2.6.1 Quartis

    Os quartis so medidas estatsticas extremamente teis na caracterizao de uma amostra. Apartir deles podemos obter uma representao grfica designada por diagrama de extremos equartis (subseco 2.6.2) e calcular uma medida de disperso (seco 2.15).

    Definio 2.12. Os quartis so os valores que dividem o conjunto das observaes, depois deordenado, em quatro partes iguais, cada uma contendo 25% das observaes. Os quartis so3 e representam-se por Q1, Q2 e Q3, sendo Q2 = Me. Assim:

    Q1 o 1.o quartil o valor que verifica a seguinte propriedade: 25% das observaesso menores ou iguais a Q1 e 75% so superiores ou iguais a Q1, conforme ilustrado naFigura 2.13 (onde xmin e xmax representam o mnimo e o mximo da amostra).

    Q2 o 2.o quartil igual mediana.

    Q3 o 3.o quartil o valor que verifica a seguinte propriedade: 75% das observaesso menores ou iguais a Q3 e 25% so superiores ou iguais a Q3.

    Para determinar o 1.o e o 3.o quartis de um conjunto ordenado de observaes comea-sepor determinar a mediana, Q2, dividindo esse conjunto em duas partes iguais. O 1.o quartilser a mediana das observaes que se encontram esquerda de Q2 e o 3.o quartil ser amediana das observaes que se encontram direita de Q2.

    Estatstica no Ensino Bsico e Secundrio 35

  • Conceitos de Estatstica

    Figura 2.13: Esquema relativo aos extremos e quartis de uma distribuio

    Para exemplificar, consideremos as idades dos 25 alunos, da tabela 2.1 presente na pgina13. J vimos que Me = x(13) = 14.

    13,13,13,13,13,13,14,14,14,14,14,14, 14, 14,14,14,14,14,14,15,15,15,15,15,16

    O 1.o quartil a mediana dos 12 primeiros valores, isto ,

    Q1 =x(6)+ x(7)

    2=

    13+142

    = 13,5. (2.22)

    O 3.o quartil a mediana dos 12 ltimos valores, isto ,

    Q3 =x(19)+ x(20)

    2=

    14+152

    = 14,5. (2.23)

    Por outro lado, quando a varivel contnua podemos determinar as classes s quais per-tencem o 1.o e 3.o quartis, recorrendo frequncia relativa acumulada, como procedemoscom a mediana. Assim, a classe que contm o 1.o quartil ser aquela que corresponde pri-meira classe com frequncia relativa acumulada superior ou igual a 25% (Fi 0,25) ou, oque equivalente, primeira classe com frequncia absoluta acumulada superior ou igual an4 (Ni n4 ). Analogamente, a classe que contm o 3.o quartil ser aquela com frequncia re-lativa acumulada superior ou igual a 75% (Fi 0,75) ou com frequncia absoluta acumuladasuperior ou igual a 34n (Ni 34n).

    Voltando de novo ao exemplo relativo s alturas dos 25 alunos apresentadas na Tabela2.6, da pgina 19, j vimos que a classe mediana [155,160[, pois esta classe acumula 60%dos valores e a anterior acumula apenas 28%. Conclui-se, igualmente, que a classe qualpertence o 1.o quartil [150,155[, pois esta classe acumula 28% dos valores e a anterioracumula apenas 8%. Do mesmo modo, a classe qual pertence o 3.o quartil [160,165[ poisesta classe acumula 88% dos valores e a anterior acumula apenas 60%.

    36 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    2.6.2 Diagrama de extremos e quartis

    Um diagrama de extremos e quartis uma representao grfica que podemos utilizar quandopretendemos representar esquematicamente um conjunto de dados numricos. A sua cons-truo depende de 5 valores: valor mnimo, valor mximo, 1.o quartil, 2.o quartil e 3.o quar-til. Comea-se por traar um eixo graduado, onde se assinalam os 5 valores. De seguida,acima desse eixo, traa-se um segmento horizontal desde o mnimo at ao 1.o quartil. Depoisdesenha-se um retngulo desde o 1.o quartil at ao 3.o quartil, divido pela mediana. Por fim,faz-se novamente um segmento horizontal desde 3.o quartil at ao valor mximo. No incioe no fim do diagrama desenha-se, ainda, um pequeno segmento vertical. Deste modo, ficamdefinidas quatro zonas (contendo cada uma 25% dos dados), sendo duas delas centrais.

    Este diagrama fornece informaes sobre a forma como os dados estatsticos se distri-buem, nomeadamente sobre a concentrao/disperso. Quanto mais estreita for uma zona,maior concentrao de dados existe nessa zona. Os diagramas de extremos e quartis podemsurgir na posio horizontal ou vertical. Na Figura 2.14 temos o diagrama de extremos equartis das idades dos alunos.

    Figura 2.14: Diagrama de extremos e quartis relativo idade dos 25 alunos

    2.6.3 Percentis

    Como j foi referido, os percentis esto fora do mbito dos programas do ensino bsico e se-cundrio, no entanto optamos por fazer uma pequena abordagem pelo facto destas medidas seutilizarem na vida real, nomeadamente, para informar sobre o desenvolvimento das crianas.

    Definio 2.13. Os percentis so os valores que dividem o conjunto das observaes, depoisde ordenado, em cem partes iguais, cada uma contendo 1% das observaes. Os percentisso 99 e representam-se por P1, P2, . . . , P99, sendo P25 = Q1, P50 = Me e P75 = Q3. Deste

    Estatstica no Ensino Bsico e Secundrio 37

  • Conceitos de Estatstica

    modo, P = k significa que % das observaes so inferiores ou iguais a k e (100)% dasobservaes so iguais ou superiores a k.

    Assim, por exemplo, se para um conjunto de dados tivermos:

    P16 = 34, significa que 16% das observaes so inferiores ou iguais a 34 e 84% soiguais ou superiores a 34.

    P72 = 55, significa que 72% das observaes so inferiores ou iguais a 55 e 28% soiguais ou superiores a 55.

    Exemplo 2.8. Consideremos que numa consulta o pediatra, aps pesar e medir a criana,afirma que esta est no percentil 80 no peso e no percentil 25 em relao altura (algumasdas medidas patentes na Caderneta de Sade da Criana so os percentis do peso, da alturae do permetro ceflico por idade). Qual o significado destes valores referidos pelo pediatra?Significam que, relativamente s crianas da mesma idade, existem 80% de criaas com umpeso menor ou igual e apenas 20% com um peso maior ou igual. No que se refere altura,relativamente s crianas com a mesma idade, exitem 25% de crianas mais baixas e 75% decrianas mais altas (a forma da evoluo de cada um destes percentis bem como a discrepnciaentre eles um dado importante na anlise do desenvolvimento da criana).

    2.7 Medidas de disperso

    Abordmos at agora vrias medidas estatsticas que permitem caracterizar uma amostra re-lativamente sua localizao (seja ela central ou no central). Contudo, quando se pretendeestabelecer comparaes, deparamo-nos com muitas situaes em que estas medidas no serevelam suficientes. A ttulo ilustrativo consideremos as notas, numa escala de 0 a 20 valores,obtidas por dois alunos do mesmo ano de escolaridade, em dez fichas de avaliao de umadeterminada disciplina.

    Aluno A 9, 9, 11, 12, 8, 7, 13, 11, 9, 11

    Aluno B 5, 15, 4, 4, 5, 17, 13, 17, 6, 14

    Os dois alunos apresentam a mesma nota mdia, dez valores, mas da observao das suasnotas poderemos dizer que os dois alunos so muito diferentes no que respeita ao aproveita-mento nessa disciplina, apesar de terem tido o mesmo nmero de fichas com nota positiva.

    38 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Para alm deste exemplo podemos considerar muitos outros, tais como duas cidades com amesma temperatura mdia e a mesma temperatura mediana, apresentando amplitudes trmi-cas muito distintas ou duas turmas com a mesma mdia a Matemtica, em que uma delasapresenta uma percentagem de negativas bastante superior outra.

    Nestes casos h ento necessidade de calcular outras medidas estatsticas, medidas dedisperso, para conhecer de que forma os dados se encontram distribudos.

    2.7.1 Amplitude total

    Uma das medidas de disperso mais fcil de determinar a amplitude total. O seu clculodepende apenas dos dois valores extremos da amostra.

    Definio 2.14. A amplitude total ou amplitude a diferena entre o valor mximo e o valormnimo do conjunto das observaes. Representa-se por IT e tem-se

    IT = x(n) x(1). (2.24)

    A amplitude d-nos informao sobre a distncia entre os valores extremos. Em duasturmas com a mesma mdia, a amplitude ser maior na que apresenta as classificaes maisdispersas. No entanto, esta situao pode resultar apenas de uma s classificao muito baixaou muito alta. Pelo facto de a amplitude ser muito sensvel aos extremos, uma medida dedisperso pouco utilizada. Outra medida de disperso que podemos calcular, no sensvel aosvalores extremos, a amplitude interquartis.

    2.7.2 Amplitude interquartis

    Recorrendo definio de quartis de uma distribuio, podemos determinar a amplitude in-terquartis que uma medida de disperso que envolve no seu clculo o 1.o e o 3.o quartis.A amplitude interquartis no s insensvel aos valores extremos observados (mximo e m-nimo), como tambm s 25% de observaes de valores mais baixos e s 25% de valores maiselevados.

    Definio 2.15. A amplitude interquartis a diferena entre o 3.o e o 1.o quartis.Representa-se por IQ e determina-se atravs de

    IQ = Q3Q1. (2.25)

    Estatstica no Ensino Bsico e Secundrio 39

  • Conceitos de Estatstica

    Esta medida indica-nos a amplitude do intervalo onde se situam as 50% das observaescentrais, mostrando-nos a variabilidade dos dados em relao mediana. Assim, possvelestabelecer comparaes entre dois conjuntos de observaes no que diz respeito dispersoou concentrao dos valores em relao mediana. Quanto menor for a amplitude interquartis,maior a concentrao dos valores em relao mediana.

    2.7.3 Desvio mdio absoluto, varincia e desvio padro

    J conhecemos uma medida estatstica que mede a variabilidade dos valores em relao mediana, no entanto a medida de tendncia central mais utilizada a mdia e, por isso, fazsentido que haja uma medida de disperso que nos d a variabilidade dos valores em relao mdia. Neste mbito parece interessante que faamos o clculo dos desvios de cada obser-vao em relao mdia. De seguida bastaria fazer a mdia dos desvios. Procedendo destemodo, verifica-se, facilmente, que a soma dos desvios nula (conforme exemplo das idadesdos alunos apresentado na Tabela 2.10), uma vez que

    1n

    n

    i=1

    (xi x) = 1n

    n

    i=1

    xi 1n

    n

    i=1

    x = x 1n

    n x = 0.

    Para ultrapassar esta situao definiu-se o desvio mdio absoluto, no qual se considera osvalores absolutos dos desvios, impedindo que a soma dos desvios d zero e obtendo a mdiadas distncias entre as observaes e a mdia.

    Definio 2.16. O desvio mdio absoluto, representado por dm, a mdia das distncias entreas observaes e a mdia, isto ,

    dm =1n

    n

    i=1

    |xi x|= 1n

    p

    i=1

    ni|xi x|. (2.26)

    Outra forma de contornar o facto de a soma dos desvios ser nula calcular a mdia dosquadrados dos desvios. Surge assim outra medida de disperso, a varincia, que teve maisaceitao.

    Definio 2.17. A varincia a mdia(6) dos quadrados dos desvios de cada observao da

    (6) Efetivamente no a mdia(na sua conceo habitual) uma vez que no dividimos por n, mas antes porn1. Esta correo est ligada inferncia estatstica, nomeadamente utilizao da varincia da amostra comoestimador da varincia da populao.

    40 Estatstica no Ensino Bsico e Secundrio

  • Conceitos de Estatstica

    Idade Frequncia Valores absolutos Quadradosdos absoluta Desvios dos desvios dos desvios

    alunos ni ni(xi x) ni|xi x| ni(xi x)2

    13 6 6(1314,04) =6,24 6,24 6,489614 13 13(1414,04) =0,52 0,52 0,020815 5 5(1514,04) = 4,8 4,8 4,60816 1 1614,04 = 1,96 1,96 3,8416

    Total 25 0 13,52 14,96Tabela 2.10: Clculo do desvio mdio absoluto

    amostra relativamente mdia. Representa-se por s2,

    s2 =1

    n1n

    i=1

    (xi x)2 = 1n1

    p

    i=1

    ni(xi x)2. (2.27)

    Pegando na definio de varincia e aplicando propriedades dos somatrios podemos obteruma frmula simplificada para o clculo da varincia, frmula de Kning,

    s2 =1

    n1

    [n

    i=1

    x2i nx2]=

    1n1

    [p

    i=1

    nixi2nx2

    ](2.28)

    Notemos que apesar desta frmula simplificar os clculos, com o recurso a computadores ou mquina de calcular a sua utilid