Estatística Aplicada à Administração - Aula 16: Testes de Normalidade das Distribuições
-
Upload
marcus-araujo -
Category
Education
-
view
215 -
download
5
Transcript of Estatística Aplicada à Administração - Aula 16: Testes de Normalidade das Distribuições
Briefing
• Nessa aula você irá:
1. Tomar ciência sobre o que são dadosparamétricos e não paramétricos;
2. Aprender sobre os testes de normalidade;
3. Conhecer o Teorema do Limite Central.
2/16
Sumário
• Características da Estatística dos Dados;
• Testes de Normalidade;
• Hipóteses dos Testes;
• Interpretação dos Testes;
• Teorema do Limite Central.
3/16
Características da Estatística dos Dados
• Estatística Paramétrica:
– É um ramo da Estatística que formula testes tomandocomo pressuposto o fato dos dados a serem testadosserem provenientes de um tipo específico de distribuição;
– Esse tipo de distribuição é a distribuição normal;
– Tais distribuições são proveniente de mecanismosgaussianos aleatórios;
– A maioria dos teste estatísticos clássicos são paramétricos;
– Os teste paramétricos possuem um maior poder deexplicação.
4/16
Características da Estatística dos Dados
• Estatística Não Paramétrica:
– É um ramo da Estatística que formula testes que nãotomam como pressuposto o fato dos dados a seremparamétricos;
– São uma alternativa aos testes paramétricos e aos seuspressupostos;
– As distribuições testadas podem ser provenientes dequalquer mecanismo;
– Os teste não paramétricos possuem um menor poder deexplicação, mas possuem sua utilidade.
5/16
Características da Estatística dos Dados
• A distribuição égaussiana?
• Os dados sãoparamétricos ounão paramétricos?
• Quais tipos detestes utilizar naanálise dos dados?
6/16
0,5%1,2%
5,6%
11,1%
17,8%
23,8%
21,1%
12,0%
4,6%
1,7%0,7%
0 1 2 3 4 5 6 7 8 9 10
Conhecimento Científico (0-10)
0
20
40
60
80
100
120
140
160
Nº d
e O
bs
erv
aç
õe
s
Testes de Normalidade
• Para responder tais perguntas, o pesquisador deveutilizar um ou mais testes de normalidade (ou deaderência);
• São testes empregados para determinar se uma dadadistribuição de frequências pode ou não ter sidogerada por um mecanismo gaussiano;
• Há diversos tipos distintos de testes de normalidade.Porém, a maioria deles possui a mesmainterpretação.
7/16
Testes de Normalidade
• Teste de Kolmogorov-Smirnov (K-S): Um dos mais
antigos testes, sendo também um dos que mais
aceita os dados como paramétricos;
• Teste de Lilliefors (L): Uma variante do teste K-S,
sendo mais precisa do que este;
• Teste de Shapiro-WilkK (W): Um dos testes mais
rigorosos na aceitação dos dados como
paramétricos, sendo, também, um dos mais
amplamente utilizados.
8/16
Hipóteses dos Testes
• Hipótese Nula (H0):
– A distribuição da amostra testada é retirada dadistribuição de referência (teste uniamostral);
– As distribuições das amostras testadas sãoretiradas da mesma distribuição (testebiamostral).
• Testa-se, portanto, se a distribuição é proveniente deum mecanismo aleatório gaussiano e, portanto,apresenta dados paramétricos.
10/16
Hipóteses dos Testes
• Hipótese Alternativa (H1):
– A distribuição da amostra testada não é retiradada distribuição de referência (teste uniamostral);
– As distribuições das amostras testadas não sãoretiradas da mesma distribuição (testebiamostral).
• Ao rejeitar H0, tem-se que a distribuição não éproveniente de um mecanismo aleatório gaussianoe, portanto, apresenta dados não paramétricos.
11/16
Interpretação dos Testes
• Os testes de normalidade, em geral, emitem umvalor de probabilidade (p) de H0 ser confirmada;
• Para valores de (p) ≤ 0,05: rejeita-se H0 e aceita-se H1
onde os dados são considerados não paramétricos eprovenientes de um mecanismo não gaussiano;
• Para valores de (p) > 0,05: confirma-se H0
considerando que os dados são paramétricos eprovenientes de um mecanismo gaussiano.
13/16
Interpretação dos Testes
14/16
K-S d=,18075, p<,01 ; Lil l iefors p<,01
Shapiro-Wilk W=,88242, p=0,0000
-1 0 1 2 3 4 5 6 7
Nº de Filhos
0
20
40
60
80
100
120
140
160
180
200
220
Nº d
e O
bs
erv
aç
õe
s
Interpretação dos Testes
15/16
K-S d=,05133, p> .20; Lil l iefors p<,20
Shapiro-Wilk W=,97696, p=,00156
-0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0
Indicador de Decisões Controladas
0
10
20
30
40
50
60
Nº d
e O
bs
erv
aç
õe
s
Interpretação dos Testes
16/16
K-S d=,09386, p<,01 ; Lil l iefors p<,01
Shapiro-Wilk W=,98130, p=,00000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Acertos no Teste
0
20
40
60
80
100
120
Nº d
e O
bs
erv
aç
õe
s
Teorema do Limite Central
• Trata-se de um fenômeno matemático;
• A média de muitas variáveis aleatóriasindependentes tende à distribuição gaussiana;
• Funciona sempre quando as distribuições são todasidênticas e na grande maioria dos casos quando elassão diferentes entre si;
• O teorema justifica o fato da elevada prevalência dadistribuição gaussiana nos fenômenos.
17/16
Teorema do Limite Central
18/16
K-S d=,08923, p<,01 ; Lilliefors p<,01
Gaussiana
0 10 20 30 40 50 60 70 80 90 100
PROBABILIDADE DE SUCESSO (R$ 50 Mil)
0
20
40
60
80
100
120
140
160
Nº
de
Ob
se
rva
çõ
es
K-S d=,11397, p<,01 ; Lilliefors p<,01
Gaussiana
0 10 20 30 40 50 60 70 80 90 100
PROBABILIDADE DE SUCESSO (R$ 200 mil)
0
20
40
60
80
100
120
140
160
180
Nº
de
Ob
se
rva
çõ
es
K-S d=,15573, p<,01 ; Lilliefors p<,01
Gaussiana
0 10 20 30 40 50 60 70 80 90 100
PROBABILIDADE DE SUCESSO (R$ 1 Milhão)
0
20
40
60
80
100
120
140
160
180
200
220
Nº
de
Ob
se
rva
çõ
es
K-S d=,11927, p<,01 ; Lilliefors p<,01
Gaussiana
-10 0 10 20 30 40 50 60 70 80 90 100
RETORNO DO INVESTIMENTO DE R$ 50 MIL (%)
0
20
40
60
80
100
120
140
160
Nº
de
Ob
se
rva
çõ
es
K-S d=,09270, p<,01 ; Lilliefors p<,01
Gaussiana
-10 0 10 20 30 40 50 60 70 80 90 100
RETORNO DO INVESTIMENTO DE R$ 200 MIL (%)
0
20
40
60
80
100
120
140
160
Nº
de
Ob
se
rva
çõ
es
K-S d=,14156, p<,01 ; Lilliefors p<,01
Gaussiana
-20 0 20 40 60 80 100 120 140 160 180 200
RETORNO DO INVESTIMENTO DE R$ 1 MILHÃO (%)
0
50
100
150
200
250
300
Nº
de
Ob
se
rva
çõ
es
K-S d=,20539, p<,01 ; Lilliefors p<,01
Gaussiana
-20 -10 0 10 20 30 40 50 60 70 80 90 100
TEMPO DE RETORNO DO INVESTIMENTO DE R$ 50 MIL (Meses)
0
50
100
150
200
250
300
350
400
450
500
550
Nº
de
Ob
se
rva
çõ
es
K-S d=,19744, p<,01 ; Lilliefors p<,01
Gaussiana
-10 -5 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80
TEMPO DE RETORNO DO INVESTIMENTO DE R$ 200 MIL (Meses)
0
50
100
150
200
250
Nº
de
Ob
se
rva
çõ
es
K-S d=,25238, p<,01 ; Lilliefors p<,01
Gaussiana
-20 -10 0 10 20 30 40 50 60 70 80 90 100 110 120
RETORNO DO INVESTIMENTO DE 1 MILHÃO (Meses)
0
50
100
150
200
250
300
350
400
Nº
de
Ob
se
rva
çõ
es
K-S d=,03898, p> .20; Lilliefors p<,01
Gaussiana
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85
MÈDIAS
0
20
40
60
80
100
120
140
160
180
Nº
de
Ob
se
rva
çõ
es
Média
Encerramento
Fim da Aula 16: Testes de
Normalidade
Prof. MSc. Marcus Araújo
br.linkedin.com/in/araujomarcus
@marcus_araujo19/16