Estatística 10 Ano

22
Estatística - 2º Período A estatística é uma ciência que estuda uma ou varias características ou propriedades de uma população tendo por base a recolha, classificação, apresentação e interpretação dos dados sobre o fenómeno em estudo. Noções básicas sobre estatística: - População: sobre quem é o estudo - Amostra: quem responde - Variável estatística: sobre o que é o estudo - Unidade estatística: cada elemento da população - Efectivo da população: número de elementos da população - Censo: estudo estatístico que incide sobre todos os elementos de uma população - Sondagem: estudo estatístico em que se utiliza apenas uma amostra da população Variáveis estatísticas: A variável estatística é aquilo que se está a estudar, e esta pode ser: - Variável estatística qualitativa: não podem ser expressas numericamente, pois relacionam situações como a cor da pele, cor dos olhos, marca de refrigerante, marca de automóvel, preferência musical entre outras. - Variável estatística quantitativa: são expressas numericamente, quer traves de uma contagem, quer através de uma medição; podem dividir-se em variável estatística quantitativa discreta que só toma valores isolados, como por exemplo o número de irmãos; e em variável estatística quantitativa continua que toma qualquer valor de um dado intervalo, como por exemplo a altura, a temperatura, o peso. Planeamento e aquisição de dados: Uma análise estatística envolve, geralmente, duas fases fundamentais e com objectivos distintos: - Estatística Descritiva, que visa descrever o real de forma a permitir entendê-lo melhor; trata da recolha, classificação e redução dos dados com vista a descrever e interpretar a realidade actual ou factos passados relativos ao conjunto observado. O seu objectivo é informar, prevenir, esclarecer. - Estatística Indutiva que, a partir de uma amostra da população, permite estender os resultados à população inteira; trata de estabelecer conclusões relativas a um conjunto mais vasto de indivíduos (população) a partir da observação de parte dela (amostra). Ao seleccionar uma amostra: - deve ser aleatório - deve ter elementos suficientes A amostra pode ser: 1

Transcript of Estatística 10 Ano

Page 1: Estatística 10 Ano

Estatística - 2º PeríodoA estatística é uma ciência que estuda uma ou varias características ou propriedades de uma população tendo por base a recolha, classificação, apresentação e interpretação dos dados sobre o fenómeno em estudo.

Noções básicas sobre estatística:- População: sobre quem é o estudo- Amostra: quem responde- Variável estatística: sobre o que é o estudo- Unidade estatística: cada elemento da população- Efectivo da população: número de elementos da população- Censo: estudo estatístico que incide sobre todos os elementos de uma população- Sondagem: estudo estatístico em que se utiliza apenas uma amostra da população

Variáveis estatísticas:A variável estatística é aquilo que se está a estudar, e esta pode ser:- Variável estatística qualitativa: não podem ser expressas numericamente, pois relacionam situações como a cor da pele, cor dos olhos, marca de refrigerante, marca de automóvel, preferência musical entre outras.- Variável estatística quantitativa: são expressas numericamente, quer traves de uma contagem, quer através de uma medição; podem dividir-se em variável estatística quantitativa discreta que só toma valores isolados, como por exemplo o número de irmãos; e em variável estatística quantitativa continua que toma qualquer valor de um dado intervalo, como por exemplo a altura, a temperatura, o peso.

Planeamento e aquisição de dados:Uma análise estatística envolve, geralmente, duas fases fundamentais e com objectivos distintos:- Estatística Descritiva, que visa descrever o real de forma a permitir entendê-lo melhor; trata da recolha, classificação e redução dos dados com vista a descrever e interpretar a realidade actual ou factos passados relativos ao conjunto observado. O seu objectivo é informar, prevenir, esclarecer.- Estatística Indutiva que, a partir de uma amostra da população, permite estender os resultados à população inteira; trata de estabelecer conclusões relativas a um conjunto mais vasto de indivíduos (população) a partir da observação de parte dela (amostra).Ao seleccionar uma amostra:- deve ser aleatório- deve ter elementos suficientesA amostra pode ser:- Amostra representativa da população: estamos perante uma amostra bem recolhida, ou seja, significa que representa bem a população- Amostra enviesada: estamos perante uma amostra mal recolhida, ou seja, não representa bem a população.

Aplicação e concretização dos processos referidos:1.º Fase - identificação do objecto do estudo estatístico: decide-se o objecto do estudo e a variável a estudar2.º Fase - recolha de dados: através de inquéritos, observações...3.º Fase - organização e apresentação de dados: reduzir os dados obtidos e organiza-los em tabelas ou gráficos4.º Fase - análise e interpretação de resultados: fase em que se obtém as conclusões

1

Page 2: Estatística 10 Ano

Construção de tabelas de frequência:

número de dias(xi)

número de pessoas(fi) Fi fri fri (%) Fri (%)

10 5 5 0,1 10 1012 3 8 0,06 6 1613 8 16 0,16 16 3215 9 25 0,18 18 5017 6 31 0,12 12 6221 10 41 0,20 20 8222 8 49 0,16 16 9830 1 50 0,02 2 100

Total 50 1 100

xi - todas as opções referentes á variável estatística em estudofi - frequência absoluta, numero de efectivos de xiFi - frequência absoluta acumulada - soma-se sempre o que está para trás em fifri - frequência relativa - fi/totalfri (%) - frequência relativa em %Fri - frequência relativa acumulada - soma-se o que está para trás em fri (%)

Na máquina:ir á tabela: STAT + EDITxi - L1 -fi - L2 -Fi - L3 - cumsum (2ND + LIST + OPS) (L2)fri - L4 - L2/TOTALfri (%) - L5 - L4 x 100Fri - L6 - cumsum (2ND + LIST + OPS) (L5)

Importante:1. Quando o estudo estatístico é sobre uma variável estatística qualitativa (no xi tem letras) a

tabela de frequência não tem as colunas de frequências acumuladas Fi e Fri.2. Quando o total não dá 100 na frequência relativa: retira-se um ao mais pequeno, por

exemplo:0,30769 = 0,310,07692 = 0,08 <- retira-se aqui, faz-se batota.

2

L1 L2 L3 L4 L5 L6

Page 3: Estatística 10 Ano

Dados agrupados em classe:

Para descobri-mos o número de classes:- n = 24 (efectivo da população/total)- 2k ≥ n (sendo K o numero de classes): 21 = 2; 22 = 4; 23 = 8; 24 = 16; 25 = 32- K = 5 classes- xmax - xmin = 102 - 60 = 42

- = = 8,4 <- amplitude da classe

8,5 <- amplitude da classe definitiva

classes marca de classes (xi) fi Fi fri fri (%) Fri contagem

[60; 60,8[ 6 6 0,25 25 25 llllll[68,5; 77[ 5 11 0,21 21 46 lllll[77; 85,5[ 4 15 0,17 17 63 llll[85,5; 94[ 5 20 0,21 21 84 lllll

[94; 102,5[ 4 24 0,16 16 100 llllTotal 24 1 100 24

classes -xi - todas as opções referentes á variável estatística em estudofi - frequência absoluta, numero de efectivos de xiFi - frequência absoluta acumulada - soma-se sempre o que está para trás em fifri - frequência relativa - fi/totalfri (%) - frequência relativa em %Fri - frequência relativa acumulada - soma-se o que está para trás em fri (%)contagem -

3

Page 4: Estatística 10 Ano

Representações gráficas:- Diagrama de caule - e - folhas:Idade dos pais dos alunos e da professora de MACS:

- Gráfico Circular:Deve ter atenção que este tipo de gráficos, construídos, de um modo geral, para dados qualitativos:- tem de ter legenda e a percentagem de cada sector;- tem a área de cada sector igual à frequência;- deve ter um titulo.Este é um tipo de gráfico bastante atractivo e muito útil para estabelecer comparações entre as frequências das diferentes categorias.No entanto não deve ser usado quando a variável pode assumir muitas modalidades diferentes.

Para calcular a amplitude dos ângulos: fri × 360⁰

4

Pai -> 49 5046 4631 3948 6145 3946 3940 59

Mãe -> 50 43 40 38 41 41 44 40 45 40 40 56 47

8 3 9 9 9 7 5 4 3 1 1 0 0 0 0 0 0 1 5 6 6 6 8 9 6 0 5 0 9 6 1

Page 5: Estatística 10 Ano

- Pictograma:São gráficos onde se utilizam figuras ou símbolos alusivos á variável em estudo.Deve ter em conta que no gráfico:- tem de existir a legenda do símbolo;- o símbolo deve de estar relacionado com a característica em estudo;- o número de símbolos é proporcional á frequência;- os símbolos podem ser desenhados em linhas ou em colunas;- os símbolos devem poder dividir-se segundo eixos de simetria.Os pictogramas são gráficos muito sugestivos e de fácil leitura.No entanto são pouco precisos.

- Gráficos de Barras:São gráficos formados por um conjunto de barras em que a altura é proporcional às frequências.Num dos eixos marcam-se as frequências (absolutas ou relativas) e no outro os valores da variável. As barras devem ficar igualmente distanciadas umas das outras.Uma das vantagens é a sua fácil construção.

5

Page 6: Estatística 10 Ano

- Gráficos de linhas:Este tipo de gráfico é utilizado para representar informação que varia ao longo do tempo.Nota: só para variáveis estatísticas contínuas

- Histogramas:Estes gráficos utilizam-se sempre que os dados estão agrupados em classes, na forma de intervalos, devendo ter-se em conta que:- no eixo horizontal representa-se os intervalos das classes;- no eixo vertical representa-se as frequências;- no histograma as barras são juntas.Nota: só para variáveis estatísticas contínuasNota: Quando as amplitudes não são iguais, tem de se calcular a altura das barras = fi/amplitude

6

Page 7: Estatística 10 Ano

- Polígonos de frequências:Nota: para frequências absolutas e relativasO polígono parte do ponto médio de uma classe fictícia com frequência zero, passa pelos pontos médios de cada uma das classes e termina no ponto médio de outra classe fictícia de frequência zero.

Nota: para frequências absolutas acumuladas e relativas acumuladasNo polígono de frequências acumuladas não se recorre à marca da classe. À esquerda do limite inferior da primeira classe, a frequência acumulada é zero a á direita da última classe é 1 (ou o efectivo se for frequência absoluta)

7

Page 8: Estatística 10 Ano

Medidas de localização/medidas de tendência central:

- Média: ( ) é o quociente da soma de todos os lados pelo numero dos lados, ou seja:

No caso em que os dados são discretos e estão organizados em tabelas, podemos calcular a média do seguinte modo:

A marca da classe obtém-se fazendo a média:

- Moda: (Mo) é o valor da variável ao qual corresponde uma maior frequência (absoluta ou relativa)Quando existem dois valores com a mesma frequência diz-se que a amostra é bimodal.Quando os valores têm todos a mesma frequência diz-se que a amostra é amodal.Quando existem vários valores com a frequência mais alta diz-se que a amostra é plurimodal.A moda pode ser calculada nos dois tipos de variáveis (qualitativas e quantitativas) e é a única que se pode calcular para dados qualitativos.Caso os dados estejam agrupados em classes, indicaremos a classe modal, e determinamos graficamente um valor aproximado para esta medida através de um histograma.

8

Page 9: Estatística 10 Ano

- Mediana: ) é o valor que divide o conjunto de dados (ordenados por ordem crescente ou decrescente) em duas partes com o mesmo numero de observações.Se o número de dados é impar, a mediana é o valor central.Se o número de dados é par, a mediana é a media aritmética dos valores centrais.

14 15 15 15 17 17 18

14 15 15 15 17 17 18 19

Se o numero de dados for muito grande:

- se o número de dados n é impar, a ordem k da mediana é dada por

- se o número de dados n é par, a mediana é a media dos valores de ordens

Caso os dados estejam agrupados em classes, indicaremos a classe mediana e determinaremos geometricamente um valor aproximado da mediana:

Podemos dizer que mediana é o valor que divide a amostra (organizada por ordem crescente) ao meio, isto é, metade dos elementos do conjunto de dados são menores ou iguais á mediana, enquanto que os restantes são superiores ou iguais.

9

então: = = 16

Page 10: Estatística 10 Ano

Medidas de localização:- Quartis:

10

Page 11: Estatística 10 Ano

11

Page 12: Estatística 10 Ano

- Diagrama de extremos e quartis:Exemplo 14:As notas do Francisco nos primeiros testes do 2º período nas diferentes disciplinas foram as seguintes:

12

Page 13: Estatística 10 Ano

8 12 14 15 15 17 17 19 20

Por observação dos dados, concluímos que Q1 = 13, = 15 e Q3 = 18, o valor máximo é 20 e o valor mínimo é 8.

Analise do diagrama:Existe uma maior concentração dos dados entre o 1ºQ e o 2ºQ e também entre o 3ºQ e o valor máximo (xmax.)Como os dados estão mais concentrados à esquerda do 2ºQ então, existe enviesamento para a direito.

Este diagrama pode informar quanto ao enviesamento de uma distribuição:- Dados simétricos: os dados estão distribuídos de forma simétrica- Enviesamento para a esquerda: os dados estão mais concentrados à direita de Q2- Enviesamento para a direita: os dados estão mais concentrados à esquerda de Q2

- Percentis: dividem uma amostra ordenada em cem partes iguais.

13

Q1 Q2/ Q3

Page 14: Estatística 10 Ano

Quando os dados estão agrupados em classes, os percentis podem ser calculados de forma idêntica à dos quartis, ou seja, não se determina o valor exacto dos percentis mas, apenas, a classe a que pertencem.

Vantagens, desvantagens e limitações das medidas de tendência central:

14

Page 15: Estatística 10 Ano

Medidas de dispersão:15

Page 16: Estatística 10 Ano

- Amplitude: é a diferença entre o valor máximo e o valor mínimo da variável:

a = xmáx. - xmín.- Amplitude Interquartil: é a diferença entre o 3º quartil e o 1º quartil:

Aq = Q3 - Q1# se o valor de Aq for grande, a dispersão entre os valores centrais é grande.# se o valor de Aq for pequeno, a dispersão é pequena.

- Desvio Padrão:

= = 2,68 idas à biblioteca

idas à biblioteca nº de alunos (xi - )2 (xi - )2 x fi0 1 7,1824 7,18241 3 2,8224 8,46722 7 0,4624 3,23683 8 0.1024 0,81924 4 1,7424 6,96965 2 5,3824 10,765

Total 25 37,44

L1 = xiL2 = fiL3 = (L1 - )2

L4 = (L1 - )2 x fi

16

= 1,2238

L1 L2 L3 L4

soma L4 (2ND + LIST + MAT)

Page 17: Estatística 10 Ano

Introdução gráfica à análise de dados bivariados:

- Gráfico de correlação ou Diagrama de dispersão: é um gráfico de pontos em que as coordenadas de cada ponto são os valores das duas variáveis em estudo.O conjunto dos pontos num gráfico de correlação designa-se por nuvem de pontos.

A correlação diz-se linear se a nuvem de pontos se distribuir ao longo de uma linha recta, a recta de regressão.

Esta representação permite analisar de que forma se relacionam as duas variáveis:

17

XY

Correlação positiva

Page 18: Estatística 10 Ano

A correlação é linear positiva, porque à medida que uma variável aumenta os valores correspondentes à outra variável também aumentam.

A correlação é linear negativa, porque à medida que uma variável aumenta os valores correspondentes à outra variável diminuem.

18

Correlação negativa

Correlação nula

Page 19: Estatística 10 Ano

MÁQUINA GRÁFICA:

- Calcular média, moda, mediana, desvio padrão e quartis:STAT + calc + 1-Var Stats1-Var Stats L1, L2

- Fazer os gráficos:1. STAT, EDIT, colocar os dados na tabela L1 e L22. 2ND + Y = + ENTER, colocar ACT e escolher o tipo3. Em Xlist colocar L1 e em Ylist colocar L2 (escolher a marca, facultativo)4. WINDOW escolher o xmin, o xmax, a escala em EscX; o ymin, o ymax e a escala em EscY5. GRAPH

19