Probabilidade e Estatística -...

14
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva Teste Qui-quadrado

Transcript of Probabilidade e Estatística -...

Page 1: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

Probabilidade e Estatística

Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva

Teste Qui-quadrado

Page 2: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

2

Teste Qui-quadrado • É um teste não paramétrico, pois independe dos

parâmetros populacionais (média, variância, etc.);

• É utilizado quando se deseja comparar freqüências

observadas com freqüências esperadas, estas

baseadas em distribuições de probabilidades

conhecidas.

O método é aplicado a dois tipos de testes:

1º) Teste de aderência ou teste de bondade de

ajustamento;

2º) Teste de independência de duas variáveis

aleatórias.

Page 3: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

3

Teste de Aderência

É utilizado para testar a natureza de uma distribuição

de probabilidade amostral, ou seja, se os dados da

amostra aderem a uma determinada distribuição de

probabilidade (Binomial, Poisson, Hipergeométrica,

Normal, etc.).

Ho: os dados da amostra aderem à distribuição

H1: os dados da amostra não aderem à distribuição

As hipóteses são:

Page 4: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

4

Teste de Aderência

será tanto menor, quanto mais se aproximarem

os valores esperados dos valores observados.

2calc

Onde:

foi é a freqüência observada da classe i

fei é a freqüência esperada da classe i

∑k

=i ei

eioicalc f

ff=

1

22 )-(

A estatística do teste é calculada através da expressão:

tem aproximadamente distribuição qui-quadrada

com (k – 1) graus de liberdade.

2calc

Page 5: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

5

2calcA hipótese nula será aceita se

Teste de Aderência 2crit<

2critonde é a abscissa da distribuição qui-quadrada

para (k – 1) graus de liberdade e um nível de

significância α.

Page 6: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

6

Exemplos

Teste de aderência

1) No lançamento de uma moeda 200 vezes,

ocorreram 80 caras e 120 coroas. Testar se a

moeda é honesta ao nível de significância de 1%.

2) Um dado foi lançado 300 vezes e o resultado

observado está apresentado na tabela abaixo.

Verifique se o dado é honesto ao nível de

significância de 2,5%.

1 2 3 4 5 6

foi 58 55 52 43 40 52

fei 50 50 50 50 50 50

Page 7: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

7

Teste de aderência

3) Um livro foi impresso com 1000 páginas. Acredita-

se que o número de erros por página observado

no livro, apresentado na tabela abaixo, estão

distribuídos segundo a distribuição de Poisson.

Utilize o nível de significância de 1% para avaliar

esta hipótese.

Número de erros

por página 0 1 2 3 4

Número de páginas

observado (foi) 500 340 120 30 10

Número de páginas

esperado (fei) 492 349 124 29 5

Page 8: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

8

Teste de aderência

2crit2

calc <

Logo, aceita-se a hipótese nula, ou seja, ao nível de significância de 1%, o

número de erros por páginas do livro estão distribuídos segundo a

distribuição de Poisson.

Ho: as freqüências observadas distribuem-se segundo Poisson

H1: as freqüências observadas não distribuem-se segundo Poisson

Page 9: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

9

Este teste é utilizado para verificar se há

independência entre duas variáveis aleatórias X e Y,

sendo que X tem “n” amostras e Y tem “m” amostras.

X1 X2 ... Xn

Y1 fo11 fo12 ... fo1n

Y2 fo21 fo22 ... fo2n

... ... ... ... ...

Ym fom1 fom2 ... fomn

Teste de Independência

A tabela de contingência abaixo apresenta as

freqüências observadas.

Page 10: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

10

Teste de Independência

Procedimentos:

1º) Definir as hipóteses:

Ho: as variáveis X e Y são independentes

H1: as variáveis X e Y não são independentes

2º) Fixar o nível de significância (α);

3º) Determinar a região de aceitação (RA) de Ho

através da abscissa na tabela da distribuição

qui-quadrado para (n - 1).(m - 1) graus de

liberdade e nível de significância α;

Page 11: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

11

4º) Montar a tabela de contingência das freqüências

esperadas feij que é a soma dos elementos da

linha i multiplicado pela soma dos elementos da

coluna j dividido pelo total de observações;

5º) Determinar o valor da estatística:

6º) Se < aceita-se Ho, caso contrário

rejeita-se Ho.

∑∑m

=j eij

eijoijn

=icalc f

ff=

1

2

1

2)-(

2crit

2calc

Teste de Independência

Page 12: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

12

Exemplo

Teste de Independência

Emissora

Bairro

B1 B2 B3

E1 56 42 102 200

E2 39 30 56 125

E3 19 9 22 50

E4 36 19 70 125

150 100 250 500

Pesquisou-se a preferência de 4 emissoras de rádio em 3 bairros

diferentes com 500 pessoas, numa determinada cidade. O

resultado está apresentado na tabela abaixo. Verifique se há

independência entre o bairro onde foi realizado a pesquisa e a

preferência pela emissora, ao nível de significância de 10%.

Tabela de contingência das freqüências observadas (foij)

Page 13: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

13

Emissora

Bairro

B1 B2 B3

E1 60 40 100 200

E2 37,5 25 62,5 125

E3 15 10 25 50

E4 37,5 25 62,5 125

150 100 250 500

Teste de Independência

Tabela de contingência das freqüências esperadas (feij)

Exemplo

Ho: as variáveis Bairro e Emissora são independentes

H1: as variáveis Bairro e Emissora não são independentes

Page 14: Probabilidade e Estatística - UTFPRpaginapessoal.utfpr.edu.br/ngsilva/publicacoes/probabilidade-e-e... · ... Um dado foi lançado 300 vezes e o resultado ... 50 50 50 50 50 50 .

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

14

2crit2

calc <

Logo, aceita-se a hipótese nula, ou seja, ao nível de significância de 10%,

existe independência entre o bairro onde foi realizado a pesquisa e a

preferência pela emissora de rádio.