Estatística

87
ESTATÍSTICA ESTATÍSTICA

Transcript of Estatística

Page 1: Estatística

ESTATÍSTICAESTATÍSTICA

Page 2: Estatística
Page 3: Estatística

Introdução ao estudo da EstatísticaIntrodução ao estudo da EstatísticaAo folheares os jornais ou revistas, ao consultares um

livro de História, Ciências ou outra disciplina já encontraste informação sobre os mais diversos assuntos, apresentada sob a forma de tabelas e gráficos.

Page 4: Estatística
Page 5: Estatística
Page 6: Estatística

Recolher e organizar a informação é muito importante no mundo actual. Analisando os dados recolhidos podem tirar-se conclusões que permitem prever situações e planificar actividades com muita segurança. Cabe à Estatística, recolher, organizar e analisar a informação, tirar conclusões e fazer previsões.

A Estatística é um dos ramos da Matemática que se dedica à recolha, análise e interpretação de dados. Preocupa-se com os métodos de recolha, organização, resumo, apresentação e interpretação dos dados, assim como em tirar conclusões sobre as características das fontes donde estes foram retirados, para melhor compreender as situações.

Page 7: Estatística

A Estatística parte da observação de conjuntos de pessoas, objectos ou acontecimentos.

Exemplo 1- Idade dos alunos de uma turma

Quando se pretende saber a idade dos alunos de uma turma é possível fazê-lo, perguntando a cada um a sua idade, dado que o número de inquiridos é finito e pouco numeroso.

Neste caso, podemos dizer que a população - são todos os alunos da turma.

Ao conjunto de pessoas, objectos ou acontecimentos que têm uma ou mais características em comum e que vai ser alvo de um estudo estatístico chamamos POPULAÇÃO OU UNIVERSO ESTATÍSTICO.

Censos e sondagens. População e amostraCensos e sondagens. População e amostra

Page 8: Estatística
Page 9: Estatística

Nem sempre é possível estudar toda a população. Por vezes, temos de escolher uma amostra, ou seja, uma parte representativa da população.

Exemplo II- Sondagem

Quando se faz uma sondagem, não se interroga toda a população, mas apenas uma parte desta, ou seja uma amostra.

Intenção de voto para as eleições de 1996 Neste caso,

PopulaçãoPopulação- conjunto de todos os eleitores Amostra-Amostra- 1013 indivíduos dos 18 aos 64 anos residentes em Lisboa e no Porto, em lares com

telefone.

AMOSTRA – é um subconjunto da população que se estuda com o objectivo de tirar conclusões sobre a população onde foi recolhida.

DIMENSÃO DA AMOSTRA- DIMENSÃO DA AMOSTRA- é o nº de elementos da amostra.

Page 10: Estatística

CuriosidadeCuriosidade – O primeiro censo geral da população portuguesa teve lugar em 1864. São feitos de 10 em 10 anos e trata-se de uma contagem oficial dos indivíduos que vivem em Portugal.

Quando o estudo estatístico tem em conta toda a população, estamos perante um censo ou recenseamento; quando incide sobre uma amostra da população, trata-se de uma sondagem.

Escola virtual

Estudo científico efectuado a partir da análise de uma amostra.

Definições - pág. 58 do manual.

Page 11: Estatística
Page 12: Estatística

Variáveis e dados estatísticosVariáveis e dados estatísticos

Quando se realiza um estudo estatístico, o objectivo é estudar uma ou mais variáveis estatísticas, características comuns a determinado estudo estatístico.

Variável estatística

Qualitativa

Quantitativa

raça, desporto favorito, sexo, cor do cabelo, estado civil, etc.

exs. idade, número de irmãos, pesos, altura,…É uma variável susceptível de medição.

Discretas:Discretas: Nº de irmãos; número de livros,…

ContínuasContínuas: altura, peso, idade, …

Página 61 do manual adoptado.

Page 13: Estatística

Dado qualitativo é qualquer observação feita sobre um elemento da população de uma variável qualitativa.

Os dados quantitativos é qualquer observação feita sobre um elemento da população de uma variável quantitativa.

Dado estatístico - Dado estatístico - é qualquer observação sobre um elemento da população de uma variável estatística

Dados discretosQuando a observação recai sobre uma variável estatística discreta.

Dados contínuosQuando a observação recai sobre uma variável estatística contínua.

Page 14: Estatística

Exemplos:Exemplos:

Custo de um automóvel

Variável Variável quantitativa quantitativa contínuacontínua

Dado Dado quantitativo quantitativo contínuocontínuo

20000 euros; 21000 euros,…

Variável Variável quantitativa quantitativa discretadiscreta

Dado Dado quantitativo quantitativo discretodiscreto

Número de irmãos

0, 1, 2,…

Variável Variável qualitativaqualitativa

Estado civil Solteiro, casado, viúvo ou divorciado

Dado qualitativoDado qualitativo

Variáveis Variáveis quantitativaquantitativa

Page 15: Estatística

Exercícios do manual adoptado das páginas 59 e 61.Exercícios do manual adoptado das páginas 59 e 61.

Page 16: Estatística

RECOLHA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS

Page 17: Estatística

RECOLHA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS

Tabela de frequências absoluta e relativa – forma de apresentar os dados estatísticos de modo organizado.

Exemplo: Duas sapatarias, “O Caminhante” e o “O Confortável”, efectuaram um estudo para saber qual o número de sapatos femininos mais procurados. Para tal, consideraram como amostra todos os pares de sapatos vendidos num certo dia, registando o seu número.

O Caminhante36 38 36 37 37 39 38 38 36 39 37 37 38

38 38 39 37 36 36 37 38 38 37 38 39

O Confortável38 38 37 39 36 38 37 36 37 37 37 38 38

37 38 38 37 36 38 37 38 37 37 36 37

Vamos construir a tabela de frequência destas duas distribuições.

Page 18: Estatística

a) Qual é o número mais pedido em cada sapataria?

Caminhante - 38 Confortável – 37

b) Em qual das duas sapatarias houve uma maior percentagem de pedidos do número 37?

Na sapataria “O Confortável”, 44%.

A frequência relativa de um acontecimento é o quociente entre a frequência absoluta e o número total de dados.

Definições:

A frequência absoluta ou efectivo de um dado estatístico é o número de vezes que esse acontecimento (dado) se verifica.

Agora, dá-mos facilmente resposta a qualquer questão.

Page 19: Estatística

GRÁFICOS

Page 20: Estatística

São muito utilizados para representar São muito utilizados para representar graficamente dados qualitativos ou graficamente dados qualitativos ou

quantitativos discretos.quantitativos discretos.

GRÁFICOS DE BARRASGRÁFICOS DE BARRAS

Page 21: Estatística

Sapatos vendidos num dia pela sapataria “O Caminhante”

Forma de apresentar a informação de modo organizado.

Gráfico de barrasGráfico de barras

5

7

9

4

0

2

4

6

8

10

36 37 38 39 N.º do sapato

Fr. Abs.

6.º- O comprimento de cada barra corresponde ao valor da respectiva frequência.

1.º- O gráfico deve ter um título.

2.º- Num dos eixos colocam-se os dados a estudar.

3.º- No outro eixo colocam-se as frequências absolutas ou relativas.

4.º- As barras devem ter todas a mesma largura.

5.º- O espaço entre as barras deve ser sempre igual.

Excel

GRÁFICOS DE BARRAS

Page 22: Estatística

Exercícios do manual adoptado da Exercícios do manual adoptado da página 67.página 67.

Page 23: Estatística

GRÁFICOS GRÁFICOS CIRCULARESCIRCULARES

Page 24: Estatística

GRÁFICOS CIRCULARESGRÁFICOS CIRCULARES

Os gráficos circulares são muito utilizados. São constituídos por círculos divididos em sectores em que as amplitudes dos sectores são proporcionais às respectivas frequências. Podem mostrar-nos as frequências absolutas, mas, na maioria das vezes, apresentam as frequências relativas sob a forma de percentagem.

Page 25: Estatística

Exemplo 1

Durante um campeonato, o número de vitórias, de empates e de derrotas de uma equipadesportiva tem a seguinte distribuição:

Vitórias 10Empate

s7

Derrotas

8

A partir da informação dada pode-se construir uma tabela de frequências.

Resultados

Freq. absolut

a

Freq. relativ

a

Freq. Relativa (em %)

Vitórias 10 0,4 40

Empates 7 0,28 28

Derrotas 8 0,32 32

Total 25 1 100

Para construir um gráfico circular começa-se por determinar as amplitudes dos ângulos correspondentes aos sectores circulares.

Page 26: Estatística

Sector correspondente às vitórias

Resultados

Freq. absolu

ta

Freq. relati

va

Freq. Relativa (em %)

Vitórias 10 0,4 40

Empates 7 0,28 28

Derrotas 8 0,32 32

Total 25 1 100

Considerando que um círculo representa o número total dos dados (100%) e quecorresponde 360º, utilizando uma regra de 3 simples, tem-se:

º1443604,0360100

40

100

36040

360.

relativafr

x100% ______360º40% ______ x

Assim, podemos concluir que, para determinar a amplitude de um sector circular, basta, multiplicar a frequência relativa por 360º.

Conhecidas as amplitudes dos diversos sectores, com uma régua, um transferidore um compasso faz-se a construção do diagrama circular, percorrendo as seguintes fases:

Amplitude = frequência relativa Amplitude = frequência relativa 360º 360º

Amplitudefix360º

144º

100,8º

115,2º

360º

Page 27: Estatística

-Desenha-se um círculo e marca-se um raio qualquer. A partir desse raio, com o transferidor, marca-se um arco de 144º de amplitude.

Tendo o primeiro sector marcado, os restantes são obtidos, como é sugerido nas figuras abaixo.

Page 28: Estatística

Assim, os resultados podem ser representados no seguinte diagrama circular.

Por fim, atribuí-se um título e uma legenda ao gráfico circular.

Nunca te esqueças que os gráficos transmitem informação. Por isso, é fundamental atribuir um título ao gráfico e legendá-lo.

Page 29: Estatística

Exercício:

Regressemos ao exemplo da sapataria “O Confortável”.

Número Freq. absoluta

Freq. relativa

36 4 0,1637 11 0,4438 9 0,3639 1 0,04

Total 25 1

Amplitudes fix360º

0,16x360º = 58º158º130º14º360

Número de sapatos femininos vendidos num dia pela sapataria “O Confortável”

Excel

Page 30: Estatística

PICTOGRAMAS PICTOGRAMAS

Um pictograma é um gráfico que utiliza figuras ou símbolos para apresentar a informação.

Page 31: Estatística

Para construir um pictograma:

Começa-se por escolher um símbolo alusivo ao tema em estudo e atribui-se-lhe um certo valor;

representa-se graficamente a informação repetindo esse símbolo em linhas ou colunas igualmente espaçadas;

indica-se o significado de cada símbolo;

dá-se um título ao gráfico.

Page 32: Estatística

DADOS AGRUPADOS EM CLASSESDADOS AGRUPADOS EM CLASSES

Page 33: Estatística

Exemplo

Os pesos, em quilogramas, dos 36 alunos de uma escola de ténis são os seguintes:

55 66 60 53 58 50 58 69 57 59

59 64 56 59 55 59 64 58 54 57

61 51 55 70 65 58 60 61 62 56

54 61 60 62 58 61

1. Elabora uma tabela de frequências.

2. Quantos alunos pesam:

2.1) menos de 58 kg? 2.2) pelo menos 62kg? 2.3) menos de 66 kg mas 62 kg ou mais?

Como os dados são muitos e variados, é difícil responder a estas questões. Nestes casos é conveniente agrupar os dados em classes. Isto é:

Page 34: Estatística

ClassesFrequência

absoluta

[50,54[ 3

[54,58[ 9

[58,62[ 16

[62,66[ 5

[66,70] 3

Total 36

Como construímos as classes?Como construímos as classes?

Identificámos os valores máximos e mínimo observados.Máximo 70 kg

Mínimo 50 kg

Adoptámos 5 classes de amplitude 4 (p.e.)

Construímos uma tabela de frequências.

55 66 60 53 58 50 58 69 57 59

59 64 56 59 55 59 64 58 54 57

61 51 55 70 65 58 60 61 62 56

54 61 60 62 58 61

2.1) 12 alunos.2.2) 8 alunos.2.3) 5 alunos.

2. Quantos alunos pesam:

2.1) menos de 58 kg? 2.2) pelo menos 62kg? 2.3) menos de 66 kg mas 62 kg ou mais?

Agora, dá-mos facilmente Agora, dá-mos facilmente resposta a qualquer questão.resposta a qualquer questão.

Page 35: Estatística

HISTOGRAMAHISTOGRAMA

O histograma usa-se para representar graficamente dados agrupados em classes.É constituído por uma sucessão de rectângulos adjacentes, tendo por base o intervalo da classe e a área das suas barras é proporcional à frequência da classe que representa.

Na construção de um histograma deve ter-se em atenção o seguinte:O gráfico deve ter um título;

Os dados devem ser agrupados em classes;

No eixo horizontal representam-se os intervalos das classes;

No eixo vertical representam-se as frequências absolutas ou relativas das classes;

As barras são desenhadas verticalmente e sem qualquer espaço entre elas;

A área de cada barra é directamente proporcional à respectiva frequência.

Vamos então construir o histograma, respeitante à distribuição anterior.

Page 36: Estatística

ExercExercííciocio: :

Um padre está muito preocupado com a frequência dos jovens na missa de Domingo.No último Domingo, as idades das pessoas presentes na missa da sua freguesia eram as seguintes:

75 67 67 12 70 15 17 41 19 21 83 72 49 56 39 45 61 33 45 27

63 64 52 53 24 31 37 45 60 72 28 38 42 53 64 70 71 65 50

a) Usando intervalos [10,20[, …constrói uma tabela de frequência e um histograma de acordo com os dados.

Idades Fr. absoluta

Fr. relativa Fr. Relativa

(%)[10,20[ 4 4/39 10[20,30[ 4 4/39 10[30,40[ 5 5/39 13[40,50[ 6 6/39 15[50,60[ 5 5/39 13[60,70[ 8 8/39 21[70,80[ 6 6/39 15[80,90[ 1 1/39 3Total 39 1 100

Page 37: Estatística

Idades das pessoas presentes na missa de Domingo numa determinada freguesia

Excel

Page 38: Estatística

b) Comenta a preocupação do padre?

c) Quantas pessoas têm 50 anos ou mais?

d) Qual a percentagem de pessoas que têm pelo menos 30 anos?

Idades Fr. absoluta

Fr. relativa Fr. Relativa

(%)[10,20[ 4 4/39 10[20,30[ 4 4/39 10[30,40[ 5 5/39 13[40,50[ 6 6/39 15[50,60[ 5 5/39 13[60,70[ 8 8/39 21[70,80[ 6 6/39 15[80,90[ 1 1/39 3Total 39 1 100

Page 39: Estatística

GRÁFICOS DE LINHAS OU GRÁFICOS DE LINHAS OU CRONOGRAMASCRONOGRAMAS

Page 40: Estatística

Gráficos de linhas ou cronogramasGráficos de linhas ou cronogramas

Manual páginas 72 e 73

Durante uma aula de Geografia o Paulo ficou surpreendido quando o seu professor lhe mostrou um gráfico demonstrativo do crescimento demográfico mundial nos últimos anos. O Paulo curioso como é, logo quis saber quantos habitantes terá o nosso planeta daqui a alguns anos.

Observa o Gráfico que o professor do Paulo mostrou à sua turma:

Para o obter, registou-se o número de habitantes do planeta em cada um dos anos considerados e uniram-se os pontos consecutivos. O gráfico obtido chama-se gráfico de linha. Este tipo de gráficos permite visualizar a variação de uma determinada Este tipo de gráficos permite visualizar a variação de uma determinada característica ao longo do tempo, sendo também indicado para fazer previsões.característica ao longo do tempo, sendo também indicado para fazer previsões.

ExcelExcel

Page 41: Estatística

Se observares o gráfico com atenção podes verificar, por exemplo, que:

Em 1960 a população mundial era de, aproximadamente, três mil milhões de pessoas; na década de oitenta verificou-se o maior crescimento da população mundial; em 1975 a população mundial era, aproximadamente, de quatro mil milhões de pessoas; no fim da década de oitenta a população mundial era de, aproximadamente, cinco mil milhões de pessoas.

O gráfico de linha permite, como já foi referido, fazer previsões. Atendendo à variação da linha O gráfico de linha permite, como já foi referido, fazer previsões. Atendendo à variação da linha podes estimar o número de habitantes do nosso planeta daqui a uns anos. Por exemplo, em podes estimar o número de habitantes do nosso planeta daqui a uns anos. Por exemplo, em 2020, a continuar este nível de crescimento, a população mundial poderá atingir os 8 mil milhões 2020, a continuar este nível de crescimento, a população mundial poderá atingir os 8 mil milhões de habitantes!de habitantes!

Page 42: Estatística

DIAGRAMA DE CAULE-E-FOLHASDIAGRAMA DE CAULE-E-FOLHAS

Os resultados de 16 testes, numa escala de 0 a 100, foram os seguintes:

35 78 50 63 86 73 57 8259 75 66 79 83 71 94 59

Vamos aprender a representar os dados num diagrama de caule-e-folhas.

1.º Traça-se uma linha na vertical.1.º Traça-se uma linha na vertical.

2.º Em cada um dos dados considera-se duas partes: 2.º Em cada um dos dados considera-se duas partes: o caule e a folha.o caule e a folha.

3 5

CauleCaule FolhaFolhaAlgarismo das Algarismo das

dezenasdezenasAlgarismo das Algarismo das

unidadesunidades

Page 43: Estatística

33

55

66

99

88

77

3.º Do lado esquerdo da linha vertical 3.º Do lado esquerdo da linha vertical colocam-se os caules sem os repetir.colocam-se os caules sem os repetir.

35 78 50 63 86 73 57 8259 75 66 79 83 71 94 59

4.º Do lado direito da linha vertical 4.º Do lado direito da linha vertical colocam-se as folhas correspondentes colocam-se as folhas correspondentes aos respectivos caules.aos respectivos caules.

55

00

33

44

66

88

9977

66

22

33

99

33

11 55 99

5. Para cada caule ordenam-se as folhas, 5. Para cada caule ordenam-se as folhas, por ordem crescente.por ordem crescente.

33

55

66

99

88

77

55

00

33

44

22

11

9977

66

33

33

99

66

99 55 88

Vantagens:Vantagens:-Não se perde informação;-È de fácil construção;-Por simples observação, permite verificar facilmente o modo como os dados estão distribuídos;-Possibilita a ordenação dos dados da amostra;

Page 44: Estatística

Observação:Observação:

O caule pode conter um qualquer número de algarismos mas, por norma, cada folha é constituída apenas por um algarismo.

Por exemplo:

Para representar 230, procede-se do seguinte modo:

23 0

Page 45: Estatística

Que gráficos se deve utilizar?Que gráficos se deve utilizar?

Nos dados de natureza qualitativa, Nos dados de natureza qualitativa, os gráficos mais utilizados são:

Gráficos de barras;Gráficos de barras;Gráficos de pontos;Gráficos de pontos;Pictogramas;Pictogramas;Diagramas circulares.Diagramas circulares.

Nos dados de natureza quantitativa discreta, Nos dados de natureza quantitativa discreta, os gráficos mais utilizados são:

Gráficos de barras;Gráficos de barras;Gráficos de pontos.Gráficos de pontos.

Nos dados de natureza quantitativa contínua, Nos dados de natureza quantitativa contínua, o gráfico mais utilizado é o:

HistogramaHistograma

O O diagrama caule-e-folhas diagrama caule-e-folhas pode ser usado para pode ser usado para dados contínuos ou discretosdados contínuos ou discretos. . Os Os gráficos de linhas gráficos de linhas usam-se para analisar a evolução de uma variável com o usam-se para analisar a evolução de uma variável com o tempo.tempo.

Page 46: Estatística

MEDIDAS DE LOCALIZAÇÃOMEDIDAS DE LOCALIZAÇÃO OUOU

MEDIDAS DE TENDÊNCIA CENTRALMEDIDAS DE TENDÊNCIA CENTRAL

Page 47: Estatística

Habitualmente os valores de um conjunto de dados estão dispersos, pelo que é aconselhável verificar se os valores têm tendência a concentrar-se em torno de um valor central ou médio. As medidas estatísticas que nos dão uma indicaçãodeste valor, designam-se por medidas de localização ou medidas de tendência centrallocalização ou medidas de tendência central. São usadas para indicar um valor que represente melhor um conjunto de dados.

Nesta aula vais poder recordar a média aritmética e a moda e aprender uma nova medida estatística: a medianamediana.

No nosso quotidiano colocámos questões tais como:

Qual é o programa de televisão com maior audiência?

Qual é a altura média dos habitantes de uma cidade?

Qual é a classificação mediana dos alunos de uma turma a Matemática?

Qual é o tempo médio necessário para produzir um medicamento?

Quantos golos sofre em média, uma equipa por jogo?

Page 48: Estatística

Média aritmética

Page 49: Estatística

Exemplo 1Exemplo 1 A visita de estudo.

Alguns amigos foram a uma visita de estudo. Cada um deles levou uma certa quantia em dinheiro para as suas despesas.

Patrícia €15 Catarina €35 Bruno €40Joana €10 Carlota €50 Sebastião €60Pedro € 35 João €50 Susana €55Daniel €35 Vera €55

Se os amigos juntarem o dinheiro, e dividirem igualmente entre si o total do dinheiro, com quanto ficará cada um?

4011

440

11

60405525023531015

x

Cada um dos amigos ficará com 40 euros.

Page 50: Estatística

RegressemosRegressemos ao exemplo da sapataria “O Confortável”. ao exemplo da sapataria “O Confortável”.

Número Freq. absoluta

36 437 1138 939 1

Total 25

A partir de uma tabela de frequências, também podemos determinar a média.A partir de uma tabela de frequências, também podemos determinar a média.

28,3725

932

25

399381137436

x

Para calcular a média de um conjunto de valores, ____________ todos os valores

e ___________ a soma pelo número de valores considerados. Representa-se por .x

Nota: Só se pode calcular a média se os dados forem _____________

Qual a média do número do parQual a média do número do par de sapatos vendidos nesse dia?de sapatos vendidos nesse dia?

quantitativos.

somam-sesomam-se

divide-sedivide-se

Page 51: Estatística

Moda

Page 52: Estatística

No ano lectivo 2008/2009, três amigos que frequentam o 10.º ano, tiveram nos testes de Matemática, as seguinte notas:

ZÉ: 10 10 12 13 14 16

ARTUR: 10 11 12 13 14 15

RICARDO: 10 10 12 14 14 15

A nota mais frequente é 10.

Logo, a moda do conjunto das notas do Zé é 10. (Unimodal)

Não há nenhum valor que seja mais frequente.

Logo, o conjunto das notas do Artur é amodal, não tem moda.

Há dois valores mais frequentes: 10 e 14

Logo, o conjunto das notas do Ricardo é bimodal.

Exemplo 2Exemplo 2

Page 53: Estatística

Se os dados estiverem representados, por exemplo, num gráfico de barras, a moda, é o dado (qualitativo ou quantitativo) que corresponde à barra mais alta; se a informação estiver representada num gráfico circular, a moda será o elemento que corresponde ao sector com maior amplitude ou o dado que corresponde ao maior número de símbolos, no caso dos pictogramas.

Excel

Moda de um conjunto de dados é o valor _______________ de uma distribuição.

Representa-se por M0.

mais frequente

Page 54: Estatística

MedianaMediana

Page 55: Estatística

Número ímpar de dados

Exemplo 3Mediram-se as alturas de 7 soldadinhos de chumbo e obtiveram-se os resultadosque, depois de ordenados são:

168 mm é o valor mediano deste conjunto de dados.

Mediana é Mediana é o o valor centralvalor central de uma distribuição.de uma distribuição.

Como o número total de dados é impar há apenas ______________ .

Ao valor __________, que neste exemplo é ______ chama-se _________.

um valor central

central 168 mediana

Page 56: Estatística

Número par de dados

E se o número de soldadinhos de chumbo fosse 6 ?!

1692

170168~

x A mediana é 169 mm.

Repara na altura dos soldadinhos, já ordenada por ordem crescente:

Qual será agora a mediana?!

Quando o número de valores é par há _______ valores centrais. Logo, a mediana é igual à ________________ dos dois valores centrais.

doisdoismédia aritméticamédia aritmética

Page 57: Estatística

Se o número de dados é par, número de dados é par, a mediana é igual à _______________ dosmediana é igual à _______________ dos dois valores centrais.dois valores centrais.

Representa-se por Representa-se por .~x

Passos que devemos seguir para determinar a mediana.Passos que devemos seguir para determinar a mediana.

Verificar se o número de dados é par ou ímpar,

Para determinar a mediana devemos começar por ________ os valores, isto é, escrevê-los por ordem ___________ ou ____________.

ordenarordenar crescentecrescente decrescentedecrescente

Se o número de dados é ímparnúmero de dados é ímpar, a mediana é a mediana é o valor o valor que ocupa a que ocupa a ______________. ______________. posição centralposição central

média aritmética média aritmética

Page 58: Estatística

E se o número de dados for muito grande?! E se o número de dados for muito grande?! Como fazemos para determinar a mediana? Como fazemos para determinar a mediana?

Na tabela seguinte estão representados os valores médios da temperatura do ar, em graus Celsius, durante o mês de Janeiro, numa cidade do interior do país. Identifica a mediana das temperaturas médias do ar.

Temperaturas (ºC)

fr. absoluta

4 1

5 1

6 4

7 4

8 4

9 8

10 4

11 4

12 1

Total 31

Fa

1

2

6

10

14

22

26

30

31

Como o número de dados é ímpar, a mediana só há um valor central.

165,152

31 Significa que a mediana será o

valor que se encontra em décimo sexto lugar.

Então: 9~

x

Page 59: Estatística

E se o número de dados for par?

Temperaturas (ºC)

fr. absoluta

4 1

5 1

6 6

7 5

8 3

9 6

10 4

11 4

12 2

Total 32

Como o número de dados é par, há dois valores centrais.

162

32 Significa que a mediana será igual

à média aritmética dos dois valores centrais. Os valores centrais são os valores centrais são os que se encontram em que se encontram em décimo sexto décimo sexto e décimo sétimoe décimo sétimo lugares lugares.

Então:

5,82

98~

x

Fa

1

2

8

13

16

22

26

30

32

4 5 6 6 6 6 6 6 7 7 7 7 7 8 8 8 9 9 9 9 9 9 10 10 10 10 11 11 11 11 12 12

15 valores15 valores

Page 60: Estatística

Como determinar a média a moda e a mediana, utilizando o Exel.Como determinar a média a moda e a mediana, utilizando o Exel.

Exemplo:

Perguntou-se a um grupo de 19 rapazes de 12 anos o valor da sua mesada (em euros). As respostas foram as seguintes:

0 20 90 20 40 25 10 30 0 50 10 20 25 45 12 6015 0 60

1. Calcula a média, a moda e a mediana do conjunto de dados.

2. Baseando-te nos cálculos anteriores, um dos elementos desse grupo, o Domingos (que recebia 10 euros mensais), decidiu pedir um aumento da mesada ao seu pai. Qual te parece ter sido a medida de localização utilizada pelo Domingos na sua argumentação? Explica o teu raciocínio.

Excel

28x 20~

x Moda: 0 e 20 bimodal

Page 61: Estatística

A média é afectada por valores extremos, isto é, por valores muito A média é afectada por valores extremos, isto é, por valores muito altos ou muito baixos.altos ou muito baixos.

Assim, quando o valor da mediana é muito diferente do da média, é Assim, quando o valor da mediana é muito diferente do da média, é aconselhável considerar sempre a mediana como valor de referência aconselhável considerar sempre a mediana como valor de referência mais importante.mais importante.

Portanto, pode-se concluir que:Portanto, pode-se concluir que:

Page 62: Estatística

QUARTIQUARTISS

ESCOLA VIRTUAL

Já estudamos a média, a moda e a mediana. Agora vamos estudar os Já estudamos a média, a moda e a mediana. Agora vamos estudar os quartis. A estas 4 medidas chamamos quartis. A estas 4 medidas chamamos medidas de localização.medidas de localização.

Page 63: Estatística

Como determinar os quartis?Como determinar os quartis?

1.º- Ordenar os dados, por ordem crescente e determinar a mediana.

2.º- O 1.º quartil, Q1 , é a mediana dos dados que se encontram à esquerda do valor da mediana.

3.º- O 3.º quartil, Q3 , é a mediana dos dados que ficam para a direita do valor da mediana.

A mediana é o 2.º quartil, Q2.

Page 64: Estatística

Exemplo:Exemplo:Determinar os quartis num Determinar os quartis num número par de dadosnúmero par de dados

1515 1616 1616 1717 1818 1919 2020 2121 2222 2525

Repara que os dados já se encontram ordenados mas, na maioria dos casos não estão, portanto, deves começar por ordená-los.

2

18 1918,5

2x Q

18,518,5

1.º Quartil1.º Quartil 3.º Quartil3.º Quartil

1Q 3Q

A mediana e os quartis são medidas de localização que dividem o A mediana e os quartis são medidas de localização que dividem o conjunto de dados em 4 partes, cada uma delas contendo 25% dos dados.conjunto de dados em 4 partes, cada uma delas contendo 25% dos dados.As posições centrais ocupadas por 50% dos dados ficam entre o 1.º e o As posições centrais ocupadas por 50% dos dados ficam entre o 1.º e o 3.º quartil.3.º quartil.

Page 65: Estatística

Exemplo:Exemplo:Determinar os quartis num Determinar os quartis num número ímpar de dadosnúmero ímpar de dados

15 16 1615 16 16 17 17 18 18 19 19 20 21 22 25 26 20 21 22 25 26

2x ou Q

Como neste caso a mediana pertence ao conjunto de dados, podemos determinar o Como neste caso a mediana pertence ao conjunto de dados, podemos determinar o 1.º e 3.º quartis por dois processos diferentes.1.º e 3.º quartis por dois processos diferentes.

1.º Processo1.º Processo: não considerar o valor da mediana.

15 16 1615 16 16 17 17 18 18 20 21 22 25 26 20 21 22 25 26

1 16Q 3 22Q

2.º Processo2.º Processo: considerar o valor da mediana nas duas metades do conjunto de dados.

15 16 16 17 1815 16 16 17 18 19 19 19 20 21 22 25 26 19 20 21 22 25 26

1 16,5Q 3 21,5Q

Page 66: Estatística

25% dos dados têm valor igual ou inferior ao 1.º quartil (75% 25% dos dados têm valor igual ou inferior ao 1.º quartil (75% dos dados têm valor superior ou igual ao 1.º quartil);dos dados têm valor superior ou igual ao 1.º quartil);

75% dos dados têm valor igual ou inferior ao 3.º quartil (25% 75% dos dados têm valor igual ou inferior ao 3.º quartil (25% dos dados têm valor superior ou igual a este)dos dados têm valor superior ou igual a este)

75%75%

25%25%

25%25%

75%75%

Page 67: Estatística

AMPLITUDE E AMPLITUDE E AMPLITUDES AMPLITUDES

INTERQUARTISINTERQUARTIS

Page 68: Estatística

Consideremos a distribuição das classificações, em percentagem, obtidas pela Helena e pelo Pedro em 5 testes de Matemática.

Classificações da HelenaClassificações da Helena Classificações do PedroClassificações do Pedro

15 25 55 65 70 10 15 55 60 80

46x

0M não tem

55x

46x

0M não tem

55x Repara que os dois conjuntos de dados têm a mesma média, moda e

mediana e no entanto são diferentes.

As classificações do Pedro estão mais dispersasmais dispersas.

Para resumir os dados, para além das medidas de localização já estudadas, vamos ainda estudar duas medidas de dispersãomedidas de dispersão: a amplitudeamplitude e a amplitude amplitude interquartis.interquartis.

Page 69: Estatística

Classificações da HelenaClassificações da Helena Classificações do PedroClassificações do Pedro

15 25 55 65 70 10 15 55 60 80

70-15=55 80-10=70

amplitude amplitude

As classificações do Pedro apresentam uma maior variabilidade entre a classificação mais alta e mais baixa.

AMPLITUDE: AMPLITUDE: A amplitude de um conjunto de dados é a diferença entre o maior e o menor A amplitude de um conjunto de dados é a diferença entre o maior e o menor desses valores. Amplitude = máximo - mínimodesses valores. Amplitude = máximo - mínimoRepresenta-se por R (range).Representa-se por R (range).

Page 70: Estatística

Classificações da HelenaClassificações da Helena Classificações do PedroClassificações do Pedro

15 25 55 65 70 10 15 55 60 80

1 20Q

3 67,5Q 1 17,5Q

3 70Q

67,5 20 47,5 70 17,5 52,5

Amplitude interquartisAmplitude interquartisA amplitude interquartis é a diferença entre o 3.º quartil e o A amplitude interquartis é a diferença entre o 3.º quartil e o 1.º quartil. Amplitude interquartis= Q1.º quartil. Amplitude interquartis= Q33 – Q – Q11

Fornece-nos informação acerca da amplitude do intervalo que contém 50% dos dados centrais. Fornece-nos informação acerca da amplitude do intervalo que contém 50% dos dados centrais.

Page 71: Estatística

Propriedades:Propriedades:

A amplitude interquartis será tanto maior quanto mais A amplitude interquartis será tanto maior quanto mais variabilidade houver entre o conjunto da dados.variabilidade houver entre o conjunto da dados.

Se não houver vSe não houver variabilidade, então a amplitude interquartis é ariabilidade, então a amplitude interquartis é zero.zero.

Uma amplitude iUma amplitude interquartis nula, não significa que não haja nterquartis nula, não significa que não haja variabilidade no conjunto de dados.variabilidade no conjunto de dados.

1 2 4 4 4 4 4 4 4 4 7

QQ33QQ11

QQ33 – Q – Q11=0=0

Page 72: Estatística

DIAGRAMA DE DIAGRAMA DE EXTREMOS E EXTREMOS E

QUARTISQUARTIS

Também conhecido por “caixa de bigodes”.

Page 73: Estatística

Construção:Construção:

1.º - Desenhamos um eixo graduado desde o valor do dado mínimo até ao valor do dado máximo.

2.º - Desenhamos um rectângulo cujo comprimento é a diferença entre o 3.º e o 1.º quartis, ou seja, a amplitude interquartis.

3.º - Dividimos o rectângulo por uma linha correspondente à mediana. Completamos o gráfico unido o rectângulo aos extremos.

GeogebraObservação:Observação: O diagrama de extremos e quartis pode ser construído na vertical ou na horizontal.

Page 74: Estatística

Exemplo:Exemplo: Para representar as classificações obtidas por duas das suas turmas num determinado teste, o professor de Matemática da Rita construiu os seguintes diagramas:

Turma ATurma A

Turma BTurma B

ClassificaçõesClassificações

Em que turma se verificou a classificação mais alta? E a mais baixa?Em que turma se verificou a classificação mais alta? E a mais baixa?

Em que turma se verifica uma maior amplitude das classificações?Em que turma se verifica uma maior amplitude das classificações?

Indica a percentagem de alunos da turma A que obteve uma classificação Indica a percentagem de alunos da turma A que obteve uma classificação positiva no teste. Explica o teu raciocínio.positiva no teste. Explica o teu raciocínio.

A classificação mais elevada, verificou-se na turma A, 100% e a mais A classificação mais elevada, verificou-se na turma A, 100% e a mais baixa na turma B, 15%.baixa na turma B, 15%.

A turma A tem uma amplitude de 60 e a turma B tem uma amplitude de 75. A turma A tem uma amplitude de 60 e a turma B tem uma amplitude de 75. Logo, na turma B verifica-se uma maior amplitude.Logo, na turma B verifica-se uma maior amplitude.

Para um aluno ter classificação positiva num teste tem de obter, pelo menos, Para um aluno ter classificação positiva num teste tem de obter, pelo menos, 50%. Na turma A, 50% é o 1.º quartil da distribuição. Como até ao 1.º quartil se 50%. Na turma A, 50% é o 1.º quartil da distribuição. Como até ao 1.º quartil se encontram 25% dos dados, podemos afirmar que, na turma A, houve 25% de encontram 25% dos dados, podemos afirmar que, na turma A, houve 25% de negativas. Assim, 75% dos alunos desta turma tiveram classificação positiva.negativas. Assim, 75% dos alunos desta turma tiveram classificação positiva.

Page 75: Estatística

Comparação da posição relativa da mediana e da média.Comparação da posição relativa da mediana e da média.

Numa escola há 3 clubes: a Clube do Ambiente, o Clube da Leitura e o Clube da Matemática.Cada clube integra 15 alunos. As distribuições das idades dos alunos dos três cubes são apresentadas a seguir.

14x 15,8x 14,6x

14x 14x 16x

Determinando a média e a mediana de cada uma das distribuições, obtemos o seguinte:

Page 76: Estatística

Repara que: Repara que:

No 1.º caso a média e a mediana têm o mesmo valor, então dizemos que a distribuição dos dados é simétrica.

No 2.º caso, o valor da média é superior ao da mediana, a distribuição dos dados concentra-se mais junto ao valor mínimo, assim diz-se que distribuição é enviesada à direita.

14x

14,6x

14x

14x

No 3.º caso, o valor da média é inferior ao da mediana, a distribuição dos dados concentra-se mais junto ao valor máximo, assim diz-se que distribuição é enviesada à esquerda.

15,8x

16x

Page 77: Estatística

Em distribuições simétricasEm distribuições simétricas

A média e a mediana tomam valores iguais ou A média e a mediana tomam valores iguais ou muito próximos.muito próximos.

Em distribuições enviesadas à esquerda (a cauda esquerda é mais longa)Em distribuições enviesadas à esquerda (a cauda esquerda é mais longa)

Em distribuições enviesadas à direita (a cauda direita é mais longa)Em distribuições enviesadas à direita (a cauda direita é mais longa)

O valor da média é superior ao da mediana, O valor da média é superior ao da mediana, logo o conjunto de dados da distribuição logo o conjunto de dados da distribuição concentra-se mais em torno do valor mínimo.concentra-se mais em torno do valor mínimo.

O valor da média é inferior ao da mediana, O valor da média é inferior ao da mediana, logo o conjunto da dados da distribuição logo o conjunto da dados da distribuição concentra-se mais em torno do valor máximo.concentra-se mais em torno do valor máximo.

Distrib

uiçõ

es assimétricas

Distrib

uiçõ

es assimétricas

Page 78: Estatística

Quais as medidas mais adequadas a estudar para Quais as medidas mais adequadas a estudar para cada caso concreto?!cada caso concreto?!

Não há regras que nos permitam decidir à priori, qual é a melhor medida a adoptar, uma vez que tal decisão depende inteiramente da situação em estudo.

No entanto, há alguns critérios que facilitam a escolha…

Se pretendermos saber o valor mais popular num determinado conjunto utiliza-se a moda, por exemplo:

“Qual é a cor automóvel preferida pelos portugueses?”

Média, moda, mediana ou amplitude interquartis?Média, moda, mediana ou amplitude interquartis?

Page 79: Estatística

E entre a média e a mediana, qual será a melhor opção?E entre a média e a mediana, qual será a melhor opção?

Em princípio se todos os valores tiverem a mesma importância, deve-se utilizar a média, por exemplo:

“Em média, quantos golos sofre uma equipa por jogo?”

No entanto, a mediana pode ser preferível em alguns casos, já que não é tão afectada por valores muito baixos ou muito altos.

Considera, por exemplo, os seguintes dados relativos às notas de um aluno à disciplina de Inglês.

1.º período 2.º período 3.º período

22% 68% 72% 71% 75% 65%

Repara que a nota do 1.º teste é muito mais baixa que as restantes. Se o professor entender desvalorizar a 1.ª nota e utilizar todos os dados, qual a medida de tendência central que devia utilizar para melhor traduzir a avaliação do aluno ao longo do ano?

Page 80: Estatística

Neste caso, o professor deveria escolher a mediana, uma vez que entendeu desvalorizar o resultado do 1.º teste comparativamente aos restantes.

626

657571726822

x

1.º período 2.º período 3.º período

22% 68% 72% 71% 75% 65%

22 65 68 71 68 71 72 75 5,692

7168~

x

Page 81: Estatística

Os salários dos 160 operários de uma determinada empresa, distribuem-se de acordo com a seguinte tabela de frequências:

Salário Salário (em euros)(em euros)

Frequência Frequência absolutaabsoluta

450450 8080

500500 4848

750750 2020

15001500 77

30003000 55

TotalTotal 160160

Vamos determinar a média e a mediana  e analisar Vamos determinar a média e a mediana  e analisar os resultados obtidos.os resultados obtidos.

O facto de termos obtido uma média de 628 e uma mediana de 475, é reflexo do facto de existirem alguns, embora poucos, salários muito altos, relativamente aos restantes.

Repara que, numa perspectiva social, a mediana é uma característica mais importante do que a média.

Na realidade 50% dos trabalhadores têm salário inferior a 475 €, embora a média de 628€ (aproximadamente) não transmita essa ideia.

628160

100500

160

3000515007750205004845080

x

4752

500450~

x

Exemplo: Exemplo:

Page 82: Estatística

Nestes casos e em muitos outros a média transmite-nos uma falsa informação, assim, o valor da mediana e a amplitude interquartis são os mais adequados para caracterizar a distribuição global dos dados.

Page 83: Estatística

A média é afectada por valores extremos, isto é, por valores muito A média é afectada por valores extremos, isto é, por valores muito altos ou muito baixos.altos ou muito baixos.

Assim, quando o valor da mediana é muito diferente do da média, é Assim, quando o valor da mediana é muito diferente do da média, é aconselhável considerar sempre a mediana e a amplitude interquartis aconselhável considerar sempre a mediana e a amplitude interquartis como valores de referência mais importante.como valores de referência mais importante.

Portanto, pode-se concluir que:Portanto, pode-se concluir que:

Page 84: Estatística

Como dizer ao meu pai que tive 8 (0 a 20) a matemática?Como dizer ao meu pai que tive 8 (0 a 20) a matemática?

O teste de Estatística não que correu bem, tive um 8. Como vou O teste de Estatística não que correu bem, tive um 8. Como vou dizer ao meu pai?dizer ao meu pai?Pensando bem, o resto das notas da turma não foram famosas. Pensando bem, o resto das notas da turma não foram famosas. Somos 10 e os resultados foram catastróficos!Somos 10 e os resultados foram catastróficos!

O geniozinho teve 19, é claro, mas, excluindo-o houve um 10, O geniozinho teve 19, é claro, mas, excluindo-o houve um 10, quatro 9 e três 2. Bom, a moda é 9 e a mediana também é 9, mas quatro 9 e três 2. Bom, a moda é 9 e a mediana também é 9, mas a média é de 7,9. Boa!a média é de 7,9. Boa!Direi ao meu pai que mesmo assim estou acima da média. Direi ao meu pai que mesmo assim estou acima da média.

Mais um 8! Mas, desta vez as notas são: 2, 3, 4, 5, 7, 8 (eu), 9, 9, 18 e Mais um 8! Mas, desta vez as notas são: 2, 3, 4, 5, 7, 8 (eu), 9, 9, 18 e 19 (o génio). A média é 8,4; bolas, estou abaixo dela. A moda é 9. Já 19 (o génio). A média é 8,4; bolas, estou abaixo dela. A moda é 9. Já sei, direi ao meu pai que estou acima da mediana (7,5).sei, direi ao meu pai que estou acima da mediana (7,5).

Não tenho mesmo sorte nenhuma! Não saio do 8! Deve ser culpa da prof! Desta vez Não tenho mesmo sorte nenhuma! Não saio do 8! Deve ser culpa da prof! Desta vez as questões eram tão difíceis que houve três 7. Os outros tiveram 19 (sempre o as questões eram tão difíceis que houve três 7. Os outros tiveram 19 (sempre o mesmo), 18, 12, 11, 10 e 2 (também sempre o mesmo). Já calculei a média, é 10,1. mesmo), 18, 12, 11, 10 e 2 (também sempre o mesmo). Já calculei a média, é 10,1. Não me serve de nada. Desta vez há 5 colegas com nota melhor que a minha! Já não Não me serve de nada. Desta vez há 5 colegas com nota melhor que a minha! Já não posso contar com a mediana. Felizmente, houve três colegas que tiraram 7, logo a posso contar com a mediana. Felizmente, houve três colegas que tiraram 7, logo a moda é 7. moda é 7.

Chico espertoChico esperto

Ih, ih, ih, desta vez direi ao meu pai que estou acima da moda, e espero que ele não Ih, ih, ih, desta vez direi ao meu pai que estou acima da moda, e espero que ele não saiba as diferenças entre a média, moda e a mediana!saiba as diferenças entre a média, moda e a mediana!

Page 85: Estatística

Ficha de trabalho

FIMFIM

Page 86: Estatística

Existe mais do que um processo para Existe mais do que um processo para determinar os quartis quando o número de determinar os quartis quando o número de dados é ímpar. Podemos optar por qualquer um dados é ímpar. Podemos optar por qualquer um destes processos, apesar dos valores obtidos destes processos, apesar dos valores obtidos serem diferentes (repara no entanto que os serem diferentes (repara no entanto que os valores são aproximados).valores são aproximados).

Exercícios da página 83.Exercícios da página 83.

Page 87: Estatística

Num diagrama de extremos e quartis existem características que permitem avaliar o grau de simetria ou enviesamento da distribuição e a sua maior ou menor concentração: os comprimentos da caixa e das linhas que saem da caixa (“os bigodes”), e a distância da mediana aos 1.º e 3.º quartis.

Enviesamento para a esquerdaEnviesamento para a esquerda

Enviesamento para a direitaEnviesamento para a direita

Dados simétricosDados simétricos