Probabilidade e Estatística -...
Transcript of Probabilidade e Estatística -...
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
Probabilidade e Estatística
Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva
Teste Qui-quadrado
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
2
Teste Qui-quadrado • É um teste não paramétrico, pois independe dos
parâmetros populacionais (média, variância, etc.);
• É utilizado quando se deseja comparar freqüências
observadas com freqüências esperadas, estas
baseadas em distribuições de probabilidades
conhecidas.
O método é aplicado a dois tipos de testes:
1º) Teste de aderência ou teste de bondade de
ajustamento;
2º) Teste de independência de duas variáveis
aleatórias.
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
3
Teste de Aderência
É utilizado para testar a natureza de uma distribuição
de probabilidade amostral, ou seja, se os dados da
amostra aderem a uma determinada distribuição de
probabilidade (Binomial, Poisson, Hipergeométrica,
Normal, etc.).
Ho: os dados da amostra aderem à distribuição
H1: os dados da amostra não aderem à distribuição
As hipóteses são:
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
4
Teste de Aderência
será tanto menor, quanto mais se aproximarem
os valores esperados dos valores observados.
2calc
Onde:
foi é a freqüência observada da classe i
fei é a freqüência esperada da classe i
∑k
=i ei
eioicalc f
ff=
1
22 )-(
A estatística do teste é calculada através da expressão:
tem aproximadamente distribuição qui-quadrada
com (k – 1) graus de liberdade.
2calc
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
5
2calcA hipótese nula será aceita se
Teste de Aderência 2crit<
2critonde é a abscissa da distribuição qui-quadrada
para (k – 1) graus de liberdade e um nível de
significância α.
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
6
Exemplos
Teste de aderência
1) No lançamento de uma moeda 200 vezes,
ocorreram 80 caras e 120 coroas. Testar se a
moeda é honesta ao nível de significância de 1%.
2) Um dado foi lançado 300 vezes e o resultado
observado está apresentado na tabela abaixo.
Verifique se o dado é honesto ao nível de
significância de 2,5%.
1 2 3 4 5 6
foi 58 55 52 43 40 52
fei 50 50 50 50 50 50
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
7
Teste de aderência
3) Um livro foi impresso com 1000 páginas. Acredita-
se que o número de erros por página observado
no livro, apresentado na tabela abaixo, estão
distribuídos segundo a distribuição de Poisson.
Utilize o nível de significância de 1% para avaliar
esta hipótese.
Número de erros
por página 0 1 2 3 4
Número de páginas
observado (foi) 500 340 120 30 10
Número de páginas
esperado (fei) 492 349 124 29 5
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
8
Teste de aderência
2crit2
calc <
Logo, aceita-se a hipótese nula, ou seja, ao nível de significância de 1%, o
número de erros por páginas do livro estão distribuídos segundo a
distribuição de Poisson.
Ho: as freqüências observadas distribuem-se segundo Poisson
H1: as freqüências observadas não distribuem-se segundo Poisson
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
9
Este teste é utilizado para verificar se há
independência entre duas variáveis aleatórias X e Y,
sendo que X tem “n” amostras e Y tem “m” amostras.
X1 X2 ... Xn
Y1 fo11 fo12 ... fo1n
Y2 fo21 fo22 ... fo2n
... ... ... ... ...
Ym fom1 fom2 ... fomn
Teste de Independência
A tabela de contingência abaixo apresenta as
freqüências observadas.
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
10
Teste de Independência
Procedimentos:
1º) Definir as hipóteses:
Ho: as variáveis X e Y são independentes
H1: as variáveis X e Y não são independentes
2º) Fixar o nível de significância (α);
3º) Determinar a região de aceitação (RA) de Ho
através da abscissa na tabela da distribuição
qui-quadrado para (n - 1).(m - 1) graus de
liberdade e nível de significância α;
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
11
4º) Montar a tabela de contingência das freqüências
esperadas feij que é a soma dos elementos da
linha i multiplicado pela soma dos elementos da
coluna j dividido pelo total de observações;
5º) Determinar o valor da estatística:
6º) Se < aceita-se Ho, caso contrário
rejeita-se Ho.
∑∑m
=j eij
eijoijn
=icalc f
ff=
1
2
1
2)-(
2crit
2calc
Teste de Independência
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
12
Exemplo
Teste de Independência
Emissora
Bairro
B1 B2 B3
E1 56 42 102 200
E2 39 30 56 125
E3 19 9 22 50
E4 36 19 70 125
150 100 250 500
Pesquisou-se a preferência de 4 emissoras de rádio em 3 bairros
diferentes com 500 pessoas, numa determinada cidade. O
resultado está apresentado na tabela abaixo. Verifique se há
independência entre o bairro onde foi realizado a pesquisa e a
preferência pela emissora, ao nível de significância de 10%.
Tabela de contingência das freqüências observadas (foij)
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
13
Emissora
Bairro
B1 B2 B3
E1 60 40 100 200
E2 37,5 25 62,5 125
E3 15 10 25 50
E4 37,5 25 62,5 125
150 100 250 500
Teste de Independência
Tabela de contingência das freqüências esperadas (feij)
Exemplo
Ho: as variáveis Bairro e Emissora são independentes
H1: as variáveis Bairro e Emissora não são independentes
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
14
2crit2
calc <
Logo, aceita-se a hipótese nula, ou seja, ao nível de significância de 10%,
existe independência entre o bairro onde foi realizado a pesquisa e a
preferência pela emissora de rádio.