ATPS estatistica

25
Introdução

description

ATPS ETAPA 1 E 2 ESTATÍSTICA

Transcript of ATPS estatistica

Page 1: ATPS estatistica

Introdução

Page 2: ATPS estatistica

ETAPA 1

Passo 1

CONCEITOS INTRODUTÓRIOS

Definição de Estatística

Ciência que fornece métodos para a coleta de dados consiste em informações que vêm de

observações, contagens, medições ou respostas que organizados, analisados e interpretados

os dados, serão utilizados na tomada de decisões.

Divisão da Estatística:

Estatística Descritiva:

Preocupa-se com os procedimentos relacionados com a coleta, organização, apresentação e

descrição dos dados de observação visando facilitar a sua interpretação. Ex: Rol, tabelas,

gráficos, medidas descritivas.

Estatística Indutiva ou Inferencial:

Visa tirar conclusões sobre a população a partir de amostras. Ex: Intervalo de

confiança/testes estatísticos.

Conjuntos de Dados:

Os dois tipos de conjunto de dados usados na estatística são amostra e população.

População é uma coleta de todos os resultados, respostas, medições ou contagens que são de

interesse.

Amostra é um subgrupo de uma população.

Ex. para fazer uma pesquisa entre os alunos das escolas da educação básica precisamos

definir quais são os alunos que formam o universo: os que atualmente estão no colégio ou

devemos incluir os que já passaram pela escola? A solução do problema depende de cada

caso em particular. Na maioria das vezes, por impossibilidade ou inviabilidade econômica

ou temporal, limitamos a pesquisa a apenas uma parte da população. A essa parte

proveniente da população em estudo denominamos amostra.

Definimos então como amostra um subconjunto da população, compatível com ela.

Uma amostra é extraída de uma população por meio de métodos adequados que constituem

uma especialidade da estatística chamada amostragem.

Em geral, o levantamento da população é muito oneroso ou pode até ser impossível, porém

Page 3: ATPS estatistica

uma amostra é sempre possível de ser obtida e, a partir desta, podemos inferir resultados

acerca da população.

Aplicações da Estatística

A estatística é uma ciência de múltiplas aplicações e de fundamental importância no campo

da investigação científica, sendo de utilização cada vez mais acentuada em qualquer

atividade profissional. Sua aplicação é voltada para pesquisas, organização de

relatórios/palestras e tomadas de decisão.

Parâmetros

São medidas estatísticas obtidas com base na população. Média aritmética, desvio padrão,

variância, proporção.

Estatísticas

São medidas estatísticas obtidas com base na amostra. Média aritmética, desvio padrão,

variância, proporção.

Variáveis estatísticas:

É cada um dos resultados provenientes da observação do fenômeno em estudo. As variáveis

estatísticas podem ser classificadas em:

a)Qualitativas: Indicam uma qualidade ou propriedade do fenômeno em observação. São

representados por palavras. Também chamados de atributos.

Ex: raça, estado civil, nível sócio-econômico, sexo, classe social.

Nominal: Os indivíduos são classificados em categorias segundo uma característica.

Ex: sexo (masculino, feminino), hábito de fumar (fumante, não fumante), cargo na empresa

(diretor, vice, financeiro).

Não existe ordem entre as categorias e suas representações, se numéricas, são destituídas de

significado numérico.

Ex: sexo masculino = 1, sexo feminino = 2. Os valores 1 e 2 são apenas rótulos.

Ordinal: Os indivíduos são classificados em categorias que possuem algum tipo inerente de

ordem.

Neste caso, uma categoria pode ser "maior" ou "menor" do que outra.

Ex: nível sócio-econômico (A, B, C e D; onde A representa maior poder aquisitivo); nível de

retinol sérico (alto, aceitável, baixo, deficiente) onde alto: maior ou igual a 50,0 µg/dl;

aceitável: 20,0 a 49,9 µg/dl, baixo: 10,0 a 19,9 µg/dl e deficiente: menor ou igual a 10,0

µg/dl; grau de instrução.

Page 4: ATPS estatistica

b)Quantitativas: São resultantes de uma contagem ou mensuração. Representadas por

números.

Ex: estatura de uma pessoa, peso, número de filhos de cada família.

Discretas: Quando assumem somente valores inteiros.

Ex: número de refeições em um dia (nenhuma, uma, duas, três, quatro, ...), freqüência de

consumo semanal de determinado alimento (1 vez, 2 vezes, 3 vezes, 4 vezes, 5 vezes, 6

vezes, 7 vezes), número de filhos de cada família, número diário de clientes que chegam em

uma loja.

Contínuas: podem assumir qualquer valor do intervalo. Ex: estatura, salário.

Passo 2

Considerar o seguinte caso:

“A empresa “Vendomundo” importou 10 contêineres de lâmpadas especiais de duas marcas

distintas (marca A e B). Um controle de qualidade é realizado antes que cada lote de

lâmpada importada saia dos países de origem. Para tanto, os dois fabricantes coletam uma

amostra de 40 lâmpadas de 100 watts e medem o tempo de vida útil (em horas) de cada

lâmpada. Abaixo, vemos os resultados obtidos pelos fabricantes da lâmpada A e lâmpada B:

Tabela 1 – Tempo de vida útil de duas marcas de lâmpadas de 100 watts (em horas).

Lâmpada da marca A

684 697 720 773 821

831 835 848 852 852

859 860 868 870 876

893 899 905 909 911

922 924 326 926 938

939 943 946 954 971

972 977 984 1005 1014

1016 1041 1052 1080 1093

Lâmpada da marca B

819 836 888 897 903

907 312 918 942 943

952 959 962 986 992

994 1004 1005 1007 1015

1016 1018 1020 1022 1034

1038 1072 1077 1077 1082

1096 1100 1113 1113 1116

1153 1154 1174 1188 1230

Fonte: Importadora “Vendomundo

Page 5: ATPS estatistica

Passo 3

Desafio A - Diagrama de Caule e Folha.

MARCA A MARCA B32 6 31 2 68 4 81 9 69 7 83 6 72 0 88 877 3 89 782 1 90 3 783 1 5 91 8 84 8 94 2 385 2 2 9 95 2 986 0 8 96 287 0 6 98 689 3 9 99 2 490 5 9 100 4 5 791 1 101 5 6 892 2 4 6 102 0 2 93 8 9 103 4 894 3 6 107 2 7 7 95 4 108 297 1 2 7 109 6 98 4 110 0 100 5 111 3 3 6101 4 6 115 3 4104 1 117 4105 2 118 8108 0 123 0109 3

Desafio B - Considerar as seguintes informações para a montagem das distribuições de

frequência:

Page 6: ATPS estatistica

Lâmpada A

Utilizar a Regra de Sturges para obter o número de classes da distribuição de frequência.

Limite de classe inferior da 1ª classe igual a 680 horas.

Amplitude do intervalo de classe igual a 70 horas.

Intervalos de classe fechados à esquerda e abertos à direita.

Lâmpada A:

Intervalo de classes

Frequência (f)

P. Médio (x)

Freq.Acumulat (fa)

Freq. Relativ (fr)

680 |--------- 750 3 715 3 0,08

750 |--------- 820 1 785 4 0,03

820 |--------- 890 11 855 15 0,28

890 |--------- 960 13 925 28 0,33

960 |-------- 1030 7 995 35 0,18

1030|-------- 1100 4 1065 39 0,10

39 ---------- 1,00

HISTOGRAMA

Lâmpada AIntervalo de classes Frequênci

a (f)P. Médio

(x)Freq. Relativ

(fr%)680 |------------ 750 3 715 0,08%

750 |------------ 820 1 785 0,03%

820 |------------ 890 11 855 0,28%

890 |------------ 960 13 925 0,33%

960 |----------- 1030 7 995 0,18%

1030|----------- 1100 4 1065 0,10%

39 ---------- 1,00%

Page 7: ATPS estatistica

715 785 855 925 995 10650.00%

0.05%

0.10%

0.15%

0.20%

0.25%

0.30%

0.35%LÂMPADA A - TEMPO DE VIDA ÚTIL

MÉDIA EM HORAS

FREQ

UÊN

CIA

RELA

TIVA

POLIGONO DE FREQUÊNCIA

Frequência (f)

P. Médio (x)

0 645

3 715

1 785

11 855

13 925

7 995

4 1065

0 1135

645 715 785 855 925 995 1065 11350

2

4

6

8

10

12

14

LÂMPADA A - TEMPO DE VIDA ÚTIL

MÉDIA EM HORAS

FREQUÊNCIA

Page 8: ATPS estatistica

OGIVA

Intervalo de classes

Frequência (f)

Freq.Acumulat (fa)

680 |--------- 750 3 3

750 |--------- 820 1 4

820 |--------- 890 11 15

890 |--------- 960 13 28

960 |-------- 1030

7 35

1030|-------- 1100

4 39

fa

39

35

28

15

4

3

0 680 750 820 890 960 1030 1100 ic

Page 9: ATPS estatistica

Lâmpada B

Utilizar a Regra de Sturges para obter o número de classes da distribuição de frequência.

Limite de classe inferior da 1ª classe igual a 815 horas.

Amplitude do intervalo de classe igual a 70 horas.

Intervalos de classe fechados à esquerda e abertos à direita.

Lâmpada B

Intervalo de classes

Frequência (f)

P. Médio (x)

Freq.Acumulat (fa)

Freq. Relativ (fr%)

815 |--------- 885 2 850 2 0,05%

885 |--------- 955 8 920 10 0,21%

955 |-------- 1025 13 990 23 0,33%

1025 |-------- 1095 6 1060 29 0,15%

1095 |-------- 1165 7 1130 36 0,18%

1165 |-------- 1235 3 1200 39 0,08%

39 ---------- 1,00%

HISTOGRAMA

Intervalo de classes

Frequência (f)

P. Médio (x)

Freq. Relativ (fr%)

815 |--------- 885 2 850 0,05%

885 |--------- 955 8 920 0,21%

955 |-------- 1025 13 990 0,33%

1025 |-------- 1095 6 1060 0,15%

1095 |-------- 1165 7 1130 0,18%

1165 |-------- 1235 3 1200 0,08%

39 ---------- 1,00%

Page 10: ATPS estatistica

850 920 990 1060 1130 12000.00%

0.05%

0.10%

0.15%

0.20%

0.25%

0.30%

0.35%

LÂMPADA B - TEMPO DE VIDA ÚTIL

MÉDIA EM HORAS

FR

EQ

NC

IA R

EL

AT

IVA

POLÍGONO DE FREQUÊNCIA

Frequência (f)

P. Médio (x)

0 7803 850

1 92011 99013 10607 11304 1200

0 1270

780 850 920 990 1060 1130 1200 12700

2

4

6

8

10

12

14LÂMPADA B - TEMPO DE VIDA ÚTIL

MÉDIA EM HORAS

FRENQUÊNCIA

Page 11: ATPS estatistica

OGIVA

Intervalo de classes

Frequência (f)

Freq.Acumulativa (fa)

815 |-------- 885 2 2

885 |-------- 955 8 10

955 |------- 1025 13 23

1025 |------- 1095 6 29

1095 |------- 1165 7 36

1165 |------- 1235 3 39

fa

39

36

29

23

10

2

0 815 885 955 1025 1095 1165 1235 ic

Page 12: ATPS estatistica

ETAPA 2

Passo 1

Medidas de Posição

Fornece medidas que podem caracterizar o comportamento dos elementos de uma série;

possibilitando determinar se um valor está entre o maior e menor valor da série, ou se esta

localizado no centro do conjunto de dados por exemplo.

Medidas de Tendência Central

São valores estabelecidos num ponto central em torno do qual os dados se distribuem. As

medidas de tendência central que iremos estudar são: média aritmética, mediana e moda.

Média Aritmética:

É a soma de todos os elementos em nosso conjunto de dados dividido pelo total de

elementos. Isto é,

 

Onde n é o total de elementos no conjunto de dados.

A média aritmética é um valor que pode substituir todos os valores da variável, isto é, é o

valor que a variável teria se em vez de “variável” ela fosse “constante”.

Mediana (Md)

É o valor que ocupa a posição central de um conjunto de dados ordenados. Ou seja, é o valor

que tiver o mesmo número de elementos no seu lado esquerdo e direito.

Sejam os números a seguir, as cinco observações de uma variável qualquer:

5 6 7 8 8

A mediana para este conjunto é 7, correspondente à 3a observação que ocupa a posição

central.

Assim, se o número de elementos for ímpar, a mediana é o elemento cuja a ordem da

posição central é:

Page 13: ATPS estatistica

Onde n é o número de elementos no conjunto de dados.

Sejam as seguintes observações: 5,0 5,5 7,0 8,0 8,5 10,0

Como o número de elementos é par, a mediana é a média aritmética dos dois elementos

centrais, cuja ordem:

 e 

Neste exemplo: T1 = 6/2 = 3 (3O termo) e T2 = (6+2)/2 = 4 (4O termo), logo a mediana é:

Md = 

Observe que este é um valor teórico, pois não figura entre os dados originais.

Moda (Mo)

É o valor que ocorre com maior freqüência em um conjunto de dados.

Exemplo: Conjunto de dados: 7 8 5 7 7 7 5 8 9 7

Moda = Mo = 7

Em um conjunto de dados podemos ter duas modas ou nenhuma; a distribuição que possui

duas modas chamamos de distribuição bimodal.

Comparação entre média aritmética, mediana e moda.

1. A moda é uma medida que requer apenas o conhecimento da freqüência absoluta e pode ser

utilizada para qualquer tipo de variáveis, tanto qualitativas, quanto quantitativas.

2. A mediana é uma medida que exige uma ordenação de categorias, da mais alta a mais baixa,

assim ela só pode ser obtida para variáveis qualitativas ordinais ou para as quantitativas,

jamais para variáveis qualitativas nominais. Além disso, a mediana não é influenciada por

valores extremos.

3. A média aritmética trabalha com todos os elementos do conjunto de dados, enquanto a

mediana utiliza apenas um ou dois valores. No entanto a média sofre influência de valores

extremos (muito alto ou baixo).

4. A média é uma medida que pode ser calculada apenas para variáveis quantitativas. E embora

a média seja um valor mais fácil de entender, tem o defeito de nos induzir em erro se a nossa

amostra tiver valores muito extremos.

Page 14: ATPS estatistica

Quando a distribuição dos dados é considerada "normal", então a melhor medida de

localização do centro, é a média.

Medidas de Dispersão ou Medidas de Variabilidade

Medidas de dispersão ou de variabilidade são “estatísticas” que medem as oscilações ou as

variações de uma variável.

Para calcularmos esta dispersão em relação à média, utilizaremos algumas medidas:

Variância:   (para população)

 (para amostras)

Desvio Padrão:   (para população)

 (para amostras)

Desvio Médio: DV = 

Coeficiente de Variação

O coeficiente de variação mede a homogeneidade dos dados em conjunto, em relação a

média, sua fórmula é expressa por:

O valor obtido será dado em porcentagem. E acima de 30% o conjunto de dados é

considerado heterogêneo e abaixo de 30% o conjunto é considerado homogêneo.

Page 15: ATPS estatistica

Passo 2

As medidas de posição têm o objetivo de resumir o conjunto de dados em alguns valores que

possam representar a variável em estudo. As medidas de dispersão ajudam a medir o quanto

a média aritmética realmente representa os dados em estudo. Quanto maior a dispersão,

menor a representatividade da média e quanto menor a dispersão, mais confiável é a média.

A respeito do estudo da vida útil das lâmpadas da marca A e B, podemos afirmar que:

I – o tempo médio de vida útil das lâmpadas A e B são respectivamente: 894,65 horas e

1003,35 horas. Resp: (afirmativa incorreta).

Lâmpada A Lâmpada B

X.F X.F

715 x 3 = 2.145 850 x 3 = 2.550

785 x 1 = 785 920 x 1 = 920

855 x 11 = 9.405 + 990 x 11 = 10.890 +

925 x 13 = 12.025 1060 x 13 = 13.780

995 x 7 = 6.965 1130 x 7 = 7.910

1065 x 4 = 4.260 1200 x 4 = 4.800

35.585/39 = 912,44 40.850/39 = 1.047,44

II – comumente, as lâmpadas da marca A duram 852 horas e da as marca B 1.077 horas;

(afirmativa incorreta, conforme graficos).

III – o tempo mediano de vida útil para a lâmpada da marca A é 910 horas e para a lâmpada

B é 1.015,5 horas;

(o tempo mediano das lâmpadas A e B estão incorretos).

Lampada A – localização da posição do termo Calculo da mediana

P= n+1/2 P= 39+1/2 P= 20 Me= 911

Lampada B – localização da posição do termo Calculo da mediana

P= n+1/2 P= 39+1/2 P= 20 Me= 1015

IV – de todas as medidas de tendência central obtidas no estudo de caso em questão, a média

é a que melhor representa o tempo de vida útil da lâmpada da marca B;

(afirmativa incorreta). A mediana representa melhor o tempo de vida útil.

V – a moda é a melhor medida representativa para a sequência de dados referentes à

lâmpada da marca B;

Page 16: ATPS estatistica

(afirmativa correta) 1077 e 1113

VI – a sequência de dados referentes à lâmpada da marca A apresenta uma forte

concentração de dados em sua área central; Resp:

(firmativa correta).

VII – a lâmpada da marca B possui uma distribuição assimétrica positiva; Resp: (afirmativa

incorreta), conforme mostra o grafico.

VIII – 75% dos valores apresentados na tabela 1, para a lâmpada da marca A, possuem um

tempo de vida útil menor do que 971 horas;

(afirmativa correta).

IX – 25% dos valores apresentados na tabela 1, para a lâmpada da marca B, possuem um

tempo de vida útil maior do que 1.000 horas;

(afirmativa incorreta).

X – os gráficos Box-Plot para os dados amostrais da lâmpada da marca A e marca B são:(a afirmativa esta incorreta).

Box-Plont Vida útil das lâmpadas das marcas A e B Horas

1312

1112

912

712 512

312 . .

Lâmpada A Lâmpada B

Page 17: ATPS estatistica

REFERENCIAS BIBLIOGRAFICAS:

LARSON, Ron.; FABER, Betsy. Estatística Aplicada - PLT – Livro texto. Nova edição.

http://www.unifra.br/professores/9011/Conceitos%20Introdut%C3%B3rios1.pdf

http://www.ebah.com.br/content/ABAAAAYZ8AD/material-06-medidas-posicao-dispersao