Estatística Inferencial (cap. 7 Martins)

26
Estatística Inferencial (cap. 7 Martins) Estatística descritiva – trata da organização, sumarização e descrição dos dados Estatística inferencial – métodos que tornam possível a estimação de características de uma população baseadas nos resultados amostrais População é a totalidade de itens, objetos, ou pessoas sob consideração Amostra é uma parte da população que é selecionada

description

Estatística Inferencial (cap. 7 Martins). Estatística descritiva – trata da organização, sumarização e descrição dos dados Estatística inferencial – métodos que tornam possível a estimação de características de uma população baseadas nos resultados amostrais - PowerPoint PPT Presentation

Transcript of Estatística Inferencial (cap. 7 Martins)

Page 1: Estatística Inferencial             (cap. 7 Martins)

Estatística Inferencial (cap. 7 Martins)

• Estatística descritiva – trata da organização, sumarização e descrição dos dados

• Estatística inferencial – métodos que tornam possível a estimação de características de uma população baseadas nos resultados amostrais

• População é a totalidade de itens, objetos, ou pessoas sob consideração

• Amostra é uma parte da população que é selecionada

Page 2: Estatística Inferencial             (cap. 7 Martins)

Amostragem

Amostragem aleatória simples – todos os elementos da população têm igual probabilidade de compor a amostra;

Se a população é finita, a escolha de uma amostra aleatória envolve a compilação de uma lista de todos os elementos da população, e a realização de sorteios para escolher os itens que irão compor a amostra

Page 3: Estatística Inferencial             (cap. 7 Martins)

Níveis de mensuraçãoAs operações aritméticas e técnicas estatísticas admissíveis dependem do nível de mensuração da variável

Nível nominal – a variável pode assumir duas ou mais categorias. Ex.: estado civil, religião. Não é possível realizar operações aritméticas. Estas variáveis são chamadas de variáveis categóricas

Nível ordinal – quando as categorias mantêm uma relação de ordem. Ex.: escolaridade

Nível intervalar – além de manter uma ordem, os intervalos de medição são iguais. Ex.: peso, altura, volume. Permite operações aritméticas básicas.

Nível de razão – além das características do nível intervalar, o zero é real, é absoluto (não é arbitrário).

Page 4: Estatística Inferencial             (cap. 7 Martins)

Medidas de posição e de dispersão

X =Soma dos valores de x

Número de observações =

Σ x

n

X

Dispersão Amostra (a) = 20, 19, 21

Amostra (b) = 30, 20, 10

Xa = 20 Xb = 20

O que interessa é o desvio em relação à média

Page 5: Estatística Inferencial             (cap. 7 Martins)

Medidas de posição e de dispersão

X

Dispersão Amostra (a) = 20, 19, 21

Amostra (b) = 30, 20, 10

Xa = 20 Xb = 20

O que interessa é o desvio em relação à média, mas ......

A variância amostral (S²), de uma amostra de n medidas é igual à soma dos quadrados dos desvios dividido por (n-1)

S² = Σ (Xi –X)²

n-1

S = √S²

O desvio padrão (S),

Page 6: Estatística Inferencial             (cap. 7 Martins)

Regra empírica

• O intervalo X ± S contém entre 60% e 80% de todas as observações amostrais

• O intervalo X ± 2S contém aproximadamente 95% de todas as observações amostrais

Coeficiente de variação de Pearson

Mede a dispersão relativa C.V = x 100 S

X

C.V < 15% baixa dispersão C.V > 30% alta dispersão

Page 7: Estatística Inferencial             (cap. 7 Martins)

Escore padronizado

É outra medida relativa de dispersão Para uma medida Xi é dado por:

Zi = Xi –XS

Um escore negativo indica que Xi está à esquerda da média e positivo à direita

Exemplo: São dadas as médias e os desvios padrões das avaliações de duas disciplinas:Português Xp = 6,5 Sp = 1,2Matemática Xm = 5,0 Sm= 0,9

Relativamente às duas disciplinas, em qual delas obteve melhor desempenho um aluno que tirou 7,5 em português e 6,0 em matemática?

Page 8: Estatística Inferencial             (cap. 7 Martins)

Utilizando escore padronizado teremos:

Zi = Xi –XS

Zp = 7,5 – 6,51,2

Zp = 0,83

Zm = 6,0 – 5,00,9

Zm = 1,11

Logo, o desempenho melhor foi em matemática, apesar da sua nota ter sido menor

3-3 Xp= 6,5 Xm = 5,0

0,83

7,5

1,11

6,0

Page 9: Estatística Inferencial             (cap. 7 Martins)

OutliersObservações que fogem das dimensões esperadasConsiderar outliers as observações cujos escores padronizados sejam maiores do que 3, em valor absoluto

99,74 %

3-3

Page 10: Estatística Inferencial             (cap. 7 Martins)

Distribuição normal padrão

Z=0 Zi

Uma tabela fornece a área em função de Z

Área = probabilidade

Z = X -

Page 11: Estatística Inferencial             (cap. 7 Martins)

Exercício 1As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir entre 1,50 e 1,80m

Z = 0

= 1,60 = 0,30P (1,50 < X < 1,80) = P(Z1 < Z < Z2)

Z1Z2

Z = X -

Z1 = 1,50 – 1,60 0,3

Z1 = - 0,33 Z2 = 1,80 – 1,60 0,3

Z2 = 0,67

Solução

Page 12: Estatística Inferencial             (cap. 7 Martins)

Exercício 1 - continuação

Z = 0Z1

Z2

Consultando a tabela:Área = 0,1293 p/Z1 = 0,33Área = 0,2486 p/Z2 = 0,67

Logo, Área total = 0,1293+ 0,2486Área = 0,3779 ouP (1,50 < X < 1,80) = 37,79%

Page 13: Estatística Inferencial             (cap. 7 Martins)

As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir mais de 1,75 m

Exercício 2

X=1,60 1,75

Transformando em normal padrão

0 0,5

Consultando a tabela temos a área (amarela) que é 0,1915, logo a área azul será 0,5 – 0,1915 = 0,3085 A probabilidade de um aluno com mais de 1,75m é de 30,85%

Solução

Page 14: Estatística Inferencial             (cap. 7 Martins)

As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir menos de 1,48 m

Exercício 3

1,48 1,60 -0,4 0

Z = 1,48 – 1,60

0,3

Z = - 0,4

Consultando a tabela temos a área igual (0,5 – 0,1554) = 0,3446A probabilidade de um aluno com menos de 1,48m é de 34,46%

Solução

Page 15: Estatística Inferencial             (cap. 7 Martins)

As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Qual deve ser a medida mínima para escolhermos 10% dos mais altos?

Exercício 4

Solução

0 Z

10% mais altos, logo conhecemos a área e queremos determinar o valor de Z

Consultando a tabela para uma área igual a 0,40 (0,5-0,1) temos Z=1,28

Z = (X – 1,60)/ 0,3Logo X = (1,28x0,3) + 1,60

X = 1,98Assim, a medida mínima para

escolhermos os 10% mais altos é 1,98m

Page 16: Estatística Inferencial             (cap. 7 Martins)

Inferência estatística

Inferência ou indução estatística

EstimadorParâmetro

populacional

Busca obter informações sobre a população a partir dos elementos amostrais

População Amostra

Page 17: Estatística Inferencial             (cap. 7 Martins)

Inferência estatística

População

Amostra

xs

Page 18: Estatística Inferencial             (cap. 7 Martins)

Inferência estatísticaPode ser feita por ponto ou por intervalo de confiançaExemplo: retira-se uma amostra aleatória de 500 brasileiros e calcula-se a média de suas alturas, encontrando-se 1,66. Uma estimativa pontual da verdadeira altura média (μ) é dada por X = 1,66m. Através do intervalo de confiança poder-se-ia encontrar um intervalo, por exemplo [1,58; 1,68] que, em 95% das vezes incluiria μ, o verdadeiro valor da média dos brasileiros

Page 19: Estatística Inferencial             (cap. 7 Martins)

Intervalo de confiança

α = erro (nível de significância) 1- α = nível de confiançaα = 5% 1- α = 95%

1- α

-Z α/2 Z α/2

α/2α/2

Page 20: Estatística Inferencial             (cap. 7 Martins)

Intervalo de confiança

O intervalo de confiança para a média populacional (μ) quando a variância (²) é conhecida

X - Zα/2 ≤ μ ≤ X + Zα/2√n

√n

P [ ]= 1- α

Page 21: Estatística Inferencial             (cap. 7 Martins)

Exemplo: a duração da vida de uma peça é tal que horas. Foram amostradas 100 dessas peças obtendo-se a média de 500 horas. Deseja-se construir a verdadeira duração média da peça com um nível de 95%.

Solução

Do enunciado do problema se tem:n = 100 X = 500 (1- α)100 = 95%

Page 22: Estatística Inferencial             (cap. 7 Martins)

95%

-Z α/2 = -1,96 Z α/2 = 1,96

2,5%2,5%

Para se encontrar o valor de Z α/2 entrou-se na tabela com 0,475

X - Zα/2 ≤ μ ≤ X + Zα/2√n

√n

P [ ]= 1- αSubstituindo os valores na fórmula abaixo

Solução Do enunciado do problema se tem:n = 100 X = 500 (1- α)100 = 95%

P[ 500 – 1,96. 5/√100 ≤ μ ≤ 500 + 1,96. 5/√100] = 95%

P[ 499,02≤ μ ≤ 500,98] = 95% Intervalo de confiança

Page 23: Estatística Inferencial             (cap. 7 Martins)

Estimativa de intervaloEx.: O intervalo [ 1,60m; 1,64m] contém a altura média dos moradores do município X, com um nível de confiança de 95% .O risco do erro de inferência será de 5%, isto é, se tomarmos 100 amostras de tamanhos iguais, poderíamos esperar que 95 desses intervalos iriam conter o parâmetro populacional

1

2

3

4

5

6

99

100

Page 24: Estatística Inferencial             (cap. 7 Martins)

AmostragemAmostra é um subconjunto da população que deve de fato representar toda a população

População

AmostraN

n

nN

= fração amostral

Page 25: Estatística Inferencial             (cap. 7 Martins)

Tamanho da amostra para se estimar a média de uma população finita

n = Z .

d[ ]2

Amostragem

Z = abscissa da distribuição normal padrão

d = erro amostral, máxima diferença entre e x admissível

= desvio padrão da população

n = tamanho da amostra aleatória simples

Z = 1,96 para um nível de confiança de 95%

Z = 2,57 para um nível de confiança de 99% Z = 2,0 para um nível de confiança de 95,5%

Page 26: Estatística Inferencial             (cap. 7 Martins)

ExemplosSuponha que a variável escolhida em um estudo seja o peso de uma certa peça, e que a população é infinita. O desvio padrão é de 10kg. Admitindo-se um nível de confiança de 95,5% e um erro amostral de 1,5 kg, qual deve ser o tamanho da amostra?

n = Z .

d[ ]2 Z = 2,0 d = 1,5 kg

= 10kg

n = tamanho da amostra aleatória simplesn =

2 . 101,5[ ]

2

= 178

Z = 2,0 para um nível de confiança de 95,5%