Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4...

Post on 22-Jul-2020

0 views 0 download

Transcript of Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4...

Introdução a Estatística

Profa. Juliana Freitas PiresDepartamento de Estatística

Universidade Federal da Paraíba - UFPBjuliana@de.ufpb.br

Introdução

O curso foi dividido em três etapas:1 vimos como resumir descritivamente variáveisde um conjunto de dados.

2 aprendemos um pouco de probabilidade e co-nhecemos a distribuição Normal, que é capazde representar adequadamente o comportamentode algumas variáveis.

3 esta etapa, apresentaremos métodos para fa-zer afirmações sobre as características de umapopulação (parâmetros), com base em informa-ções dadas por amostras.

Revisando alguns conceitos . . .

População: conjunto de todos os elementos ouindivíduos sob investigação.Amostra: qualquer subconjunto (não vazio) dapopulação.Variável Aleatória: característica da populaçãosujeita a variação.Parâmetro: Característica numérica observadana população.Estimador: Característica numérica estabelecidapor valores da amostra (uma função da amostra).Estimativa: um particular valor assumido porum estimador.

Introdução à Inferência Estatística

O uso de informações de uma amostra para con-cluir sobre o todo faz parte do dia a dia da maioriadas pessoas. Por exemplo:• Uma cozinheira ao verificar o sal de um pratoque está preparando;

• Um comprador, após experimentar uma pe-quena fatia de queijo, decide se vai ou não com-prar o queijo;

• A forma como as mães verificam a temperaturado mingau de seus bebês.

Inferência

• Inferência Estatística: conjunto de métodosde análise estatística que permitem tirar con-clusões sobre uma característica da populaçãocom base em somente uma parte dela (umaamostra).

• Em outras palavras, a inferência estatística tratade métodos que permitem a obtenção de con-clusões sobre um ou mais parâmetros de umaou mais populações através de quantidades (es-timadores) calculadas a partir da(s) amostra(s);

Inferência

• Fazer inferência (ou inferir) = tirar conclusõessobre as características de uma população (pa-râmetros), com base em informações dadas apartir da amostra (estimadores);

• Os métodos de inferência podem ser agrupadosem duas categorias:

1 Estimação: pontual ou intervalar2 Testes de Hipóteses

Com o que lida a Inferência?

Suponha que desejamos saber qual a altura médiados brasileiros adultos. Como podemos obter essainformação?• Medindo a altura de todos os brasileiros adul-tos. Nesse caso, não será necessário usar infe-rência estatística.

• Selecionar adequadamente uma amostra alea-tória (X1, X2, . . . , Xn) da população de brasi-leiros adultos e, através dessa amostra, inferirsobre a altura média (parâmetro).

Podemos inferir sobre a altura média dos brasileiros adultosde duas formas:

1 Estimação:• Estimativa Pontual: calculando a média das altu-ras dos brasileiros adultos selecionados na amostra;

• Estimativa Intervalar: através dos valores da amos-tra construir um intervalo de tal forma que a proba-bilidade de o verdadeiro valor da altura média dosbrasileiros pertencer a este intervalo seja alta.

2 Testes de Hipóteses:• Em uma outra situação, poderíamos estar interessa-dos em testar se a afirmação “os brasileiros têm, emmédia, 169 cm” é verdadeira. Com base na amostra,podemos realizar um Teste de Hipóteses.

Contudo, estes resultados dependerão da qualidade da amos-tra, que tem que ser representativa da população.

A forma como selecionamos uma amostrainterfere nos resultados?

Ex 1: Análise da quantidade de glóbulos bran-cos no sangue de certo indivíduo. Uma gotado dedo seguramente será representativa paraa análise. Caso Ideal!Ex 2: Opinião sobre um projeto governamen-tal. Se escolhermos uma cidade favorecida, oresultado certamente conterá erro (viés)

OBS: Observe que a forma como se obtém a amos-tra é determinante para a validade da pesquisa.

Como selecionar uma amostra?

• A maneira de selecionar a amostra é tão im-portante que existem diversos procedimentosde obtê-la.

• A teoria da amostragem é o ramo da estatísticaque fornece procedimentos adequados para aseleção de amostras.

• Aqui, trataremos do caso mais simples de amos-tragem probabilística, e que serve como basepara procedimentos mais elaborados: a amos-tragem aleatória simples, com reposição, a serdesignada por AAS.

Amostragem Aleatória Simples (AAS)

• Supomos que podemos listar todos os N ele-mentos de uma população homogênea e finita.

• Usando um procedimento aleatório, sorteia-seum elemento da população.

• Repete-se o procedimento até que sejam sorte-adas as “n” unidades da amostra.

• Temos AAS com reposição e sem reposição,contudo, com reposição implica independênciaentre as unidades selecionadas facilitando o es-tudo das propriedades dos estimadores.

• Neste curso, será considerada a amostragemaleatória simples, com reposição, a ser desig-nada por AAS.

Estimação

• Em qualquer área do conhecimento nos depara-mos com o problema de estimar alguma quan-tidade de interesse.

Exemplo: estimar a proporção de indivíduos quevotarão em determinado candidato.

• A estimação pode ser feita de duas formas:1 Estimação Pontual: um único valor e utilizadopara inferir sobre um parâmetro de interesse.

2 Estimação Intervalar: uma faixa de valores ouintervalo é utilizado para inferir sobre umparâmetro de interesse, com algum grau deconfiança.

Estimação Pontual

Na estimação pontual desejamos encontrar umúnico valor numérico que esteja bastante próximodo verdadeiro valor do parâmetro.

Parâmetro EstimadorMédia (µ)

X =

∑ni=1Xi

nVariância (σ2)

S2 =

∑ni=1(Xi −X)2

n− 1Desvio Padrão (σ)

S =√S2

Proporção (p)p̂ = X

nondeX é o número de indivíduos

que possuem a mesma característica deinteresse

Exemplo

Os preços de um determinado produto em 10 diferentesmercados em um determinado mês foram:

0.75 1.1 0.6 2 1.3 0.69 2.1 1.3 0.83 1

• A estimativa pontual da média do preço do produto édada por

X =0.75 + 1.1 + · · ·+ 0.83 + 1

10= 1.167

• A estimativa pontual da proporção de preços menoresque 1 real é dada por

p̂ =4

10= 0.4

Estimação Pontual × Estimação Intervalar

• Estimadores pontuais, especificam um único va-lor para o parâmetro.

• Mas, sabemos que diferentes amostras levam adiferentes estimativas, pois o estimador é umafunção de uma amostra aleatória.

• E, estimar um parâmetro através de um únicovalor não permite julgar a magnitude do erroque podemos estar cometendo.

• Daí, surge a ideia de contruir um intervalo devalores que tenha uma alta probabilidade deconter o verdadeiro valor do parâmetro (deno-minado intervalo de confiança).

Como construir um intervalo de confiança?

• Um intervalo de confiança (ou estimativa inter-valar) é construído de forma que a estimativapontual esteja acompanhada de uma medidade erro.

Intervalode Confiança =

[EstimativaPontual ± Erro de

Estimação

]

Estimação Intervalar

• Um intervalo de confiança (ou estimativaintervalar) representa uma amplitude de valo-res que tem alta probabilidade (grau de confi-ança) conter o verdadeiro valor do parâmetro.

• O grau de confiança (ou nível de confi-ança) é uma medida que representa a proba-bilidade do intervalo conter o parâmetro popu-lacional. Tal probabilidade é chamada de 1−α.Logo, α será a probabilidade de erro ao se afir-mar que o intervalo contém o verdadeiro valordo parâmetro.

Intervalo de confiança para a média populacional

• Duas situações são consideradas quando de-sejamos estabelecer um intervalo de confiançapara a média de uma população:

1 A variância σ2 é conhecida;

2 A variância σ2 é desconhecida;

Intervalo de confiança para a média populacional

• Adicionalmente, deve-se verificar se uma dasduas suposições seguintes é satisfeita:

1 A amostra é proviniente de uma populaçãonormal. Pois, sabemos que seX ∼ N(µ, σ2) então X ∼ N(µ, σ2/n).

2 A amostra tem tamanho maior do que 30,n > 30, o que nos permite aproximar a dis-tribuição da média amostral X pela distri-buição normal, como na suposição anterior.

Intervalo de confiança para a média populacional

De modo geral, estamos interessados em encontrarum intervalo na forma:

IC = [X − ε0;X + ε0] = [X ± ε0]

onde ε0 representa a margem de erro ou erro deprecisão em relação à média µ.• Mas, lembre-se que existem duas situações:

1 A variância σ2 é conhecida;

2 A variância σ2 é desconhecida;

Caso 1: A variância σ2 é conhecida

Quando a variância é conhecida a margem deerro em relação à média µ é da forma:

ε0 = zα/2σ√n

em que zα/2 é o quantil da normal padrão de nívelα/2.

Caso 1: A variância σ2 é conhecida

Dessa forma, se X for a média de uma amostraaleatoria de tamanho n, proveniente de uma po-pulação com variância conhecida, um intervalo de100(1 − α)% de confiança para a média populaci-onal é dado por:

ICµ100(1−α)% =

(X − zα/2

σ√n,X + zα/2

σ√n

)em que zα/2 é o quantil da normal padrão de nívelα/2.

Exemplo

• Em uma industria de cerveja, a quantidade decerveja inserida em latas se comporta comouma distribuição normal com média 350 ml edesvio padrão 3 ml. Após alguns problemas nalinha de produção, suspeita-se que houve al-teração na média. Uma amostra de 20 latasacusou uma média de 346 ml. Obtenha umintervalo de 95% para a quantidade média decerveja inserida em latas, supondo que não te-nha ocorrido alteração na variabilidade.

Exemplo

Resposta: A variância σ2 é conhecida, então ointervalo é dado por

ICµ100(1−α)% =

(X − zα/2

σ√n,X + zα/2

σ√n

)Como 1− α = 0, 95, temos que α = 0, 05. Então,α/2 = 0, 025. Ou seja, devemos olhar na tabelada normal padrão qual o número z0,025.

Exemplo

Olhando na tabela, temos que zα/2 = 1, 96. Assim,o intervalo é obtido através de:

ICµ95% =

(346− 1, 96

3√20, 346 + 1, 96

3√20

)= (344.69, 347.31)

Isto é, o intervalo de valores [344, 69; 347, 31] con-tém a quantidade média de cerveja inserida naslatas está com 95% de confiança. Logo, conclui-seque realmente houve alteração, após os problemasencontrados na linha de produção, na quantidademédia de cerveja inserida em latas.

Calculando o tamanho da amostra

Note que, a partir da expressão obtida para a mar-gem de erro ε0, podemos estimar o tamanho daamostra, se α e ε0 estiverem especificados:

ε0 = zα/2σ√n⇒√n = zα/2

σ

ε0⇒ n =

(zα/2

σ

ε0

)2

Se a população for finita, com N elementos, deve-se utilizar o fator de correção para populações fi-nitas. Nesse caso, o tamanho da amostra será de-terminado por:

n∗ =n

1 + nN

Exemplo

• Uma construtora deseja estimar a resistênciamédia das barras de aço utilizadas na constru-ção de casas. Qual o tamanho amostral neces-sário para garantir que haja um risco de 0, 001de ultrapassar um erro de 5kg ou mais na es-timação? O desvio padrão da resistência paraeste tipo de barra é de 25kg.

Exemplo

Resposta: Do enunciado tem-se α = 0, 001, ε0 =5 e σ = 25. Da tabela da distribuição normalpadrão obtemos zα/2 = z0,0005 = 3, 29. Assim,

n =

(zα/2

σ

ε0

)2

=

(3, 29× 25

5

)2

= 270, 602 ∼= 271

Intervalo de confiança para a média populacionalCaso 2: A variância σ2 é desconhecida

O processo para se obter o intervalo de confiança ésemelhante ao anterior. Contudo, como σ2 é desco-nhecida, é preciso substitui-la pela variância amos-tral (S2):

S2 =

∑ni=1(Xi −X)2

n− 1

E, a quantidade zα/2 é substituída por t(n−1,α/2),que é o quantil da t-student de nível α/2.

Distribuição t-Student

• A distribuição t-student apresenta proprieda-des semelhantes as da distribuição normal pa-drão (como, por exemplo, simetria em torno de0), no entanto, é mais dispersa. Em outras pa-lavras, a distribuição t-student concentra maisprobabilidades nas caldas do que a distribuiçãonormal padrão.

• A medida que n cresce, a distribuição t-studentse aproxima mais da distribuição normal pa-drão, pois S se aproxima mais de σ.

Distribuição t-Student

Existe uma distribuição t-student para cada valordos graus de liberdade (n− 1).

Intervalo de confiança para a média populacionalCaso 2: A variância σ2 é desconhecida

Dessa forma, se X for a média de uma amostraaleatória de tamanho n, proveniente de uma po-pulação com variância desconhecida, um intervalode 100(1 − α)% de confiança para a média popu-lacional é dado por:

ICµ100(1−α)% =

(X − t(n−1,α/2)

S√n,X + t(n−1,α/2)

S√n

),

onde t(n−1,α/2) é o quantil da t-student de nívelα/2.

Obs: Se σ2 for desconhecida, mas o tamanho da amostra forgrande (n > 30), pode-se utilizar zα/2 no lugar de t(n−1;α/2)

Exemplo

Deseja-se avaliar a dureza média do aço produzidosob um novo processo de têmpera. Uma amostrade 10 corpos de prova de aço produziu os seguintesresultados, em HRc:

36, 4 35, 7 37, 2 36, 5 34, 9

35, 2 36, 3 35, 8 36, 6 36, 9.

Construir um intervalo de 95% de confiança paraa dureza média do aço.

Resposta:

Temos a média amostral dada por: X =

∑ni=1Xi

n= 36.15

E a variância amostral:

Xi (Xi − X̄) (Xi − X̄)2

36, 4 0, 25 0, 062535, 7 −0, 45 0, 202537, 2 1, 05 1, 102536, 5 0, 35 0, 122534, 9 −1, 25 1, 562535, 2 −0, 95 0, 902536, 3 0, 15 0, 022535, 8 −0, 35 0, 122536, 6 0, 45 0, 202536, 9 0, 75 0, 5625∑

4, 865

Então,

S2 =

∑ni=1(Xi − X̄)2

n− 1

=4, 865

9= 0.5406

Daí S = 0.7352.

Resposta:

Além disso, n = 10 e 1− α = 0, 95, daí

t(n−1,α/2) = t(9,0.025) = 2.26

Assim,

ICµ95% =

(X − t(n−1,α/2)

S√n,X + t(n−1,α/2)

S√n

)=

(36.15− 2.26

0.7352√10

, 36.15 + 2.260.7352√

10

)= (35.625, 36.675) .

Ou seja, com 95% de confiança o intervalo [35, 625; 36, 675]

contém a dureza média do aço.

Intervalo de confiança para a proporçãopopulacional

• O intervalo que estamos procurando é da forma

IC = [p̂± ε0].

• Lembrando que p̂ é o estimador pontual para oparâmetro proporção populacional (p), e é daforma:

p̂ = Xn ; em que X é o número de indivíduos que

possuem a mesma característica de interesse.

Intervalo de confiança para a proporçãopopulacional

Dessa forma, se p̂ for a proporção de indivíduoscom uma característica de interesse em uma amos-tra aleatória, de tamanho n, proveniente de umapopulação onde a proporção verdadeira de indi-víduos com a característica é p, um intervalo de100(1−α)% de confiança para essa proporção po-pulacional p é dado por

ICp100(1−α)% =

(p̂− zα/2

√p(1− p)

n, p̂+ zα/2

√p(1− p)

n

)

em que zα/2 é o quantil da normal padrão comα/2 de nível de confiança.

Na prática, o valor de p é desconhecido (é justa-mente p que queremos estimar!). Nessa situação,duas abordagens são razoáveis:

1 Abordagem otimista: substituir o valor dep por sua estimativa p̂. Nesse caso,

ICp100(1−α)% =

(p̂− zα/2

√p̂(1− p̂)

n, p̂+ zα/2

√p̂(1− p̂)

n

)

2 Abordagem conservadora: substituirp(1− p) por seu valor máximo, 1/4, quandop = 1/2. Nesse caso,

ICp100(1−α)% =

(p̂− zα/2

1√4n, p̂+ zα/2

1√4n

)

Exemplo

• Um estudo foi feito para determinar a propor-ção de famílias que tem telefone em uma certacomunidade. Uma amostra de 200 famílias éselecionada ao acaso, e 160 afirmam ter tele-fone. Qual o intervalo para p com 95% de con-fiança?

Exemplo

Resposta:Temos que p̂ = 160/200 = 0, 8.Como 1− α = 0, 95 então zα/2 = z0,025 = 1, 96.Assim, adotando abordagem “otimista”, temos

ICµ95% =

(p̂− zα/2

√p̂(1− p̂)

n, p̂+ zα/2

√p̂(1− p̂)

n

)

=

(0, 8− 1, 96

√0, 8(1− 0, 8)

200, 0, 8 + 1, 96

√0, 8(1− 0, 8)

200

)= (0.7446, 0.8554).

Ou seja, com 95% de confiança o intervalo[74, 46%; 85, 54%] contém a porcentagem defamílias que tem telefone nessa comunidade.

Exemplo

Se calcularmos o intervalo adotando abordagem“conservadora”, temos

ICµ95% =

(p̂− zα/2

1√4n, p̂+ zα/2

1√4n

)=

(0, 8− 1, 96

1√4 · 200

, 0, 8 + 1, 961√

4 · 200

)= (0.7307, 0.8692).

Observe que, o intervalo com a abordagemconservadora fornece um intervalo maior.

Calculando o tamanho da amostra

Mais uma vez, podemos estimar o tamanho da amostra apartir da margem de erro ε0, basta especificar α e ε0:

ε0 = zα/2

√p(1− p)

n⇒√n = zα/2

√p(1− p)ε0

⇒ n = (zα/2)2 × p(1− p)

(ε0)2

Como p é desconhecido, para a substituição de p(1 − p) ouutiliza-se 1/4 ou adota-se um valor de p̂ obtida de um estudopiloto ou de um estudo similar. Se a população for finita,deve-se utilizar, de forma similar o fator de correção parapopulações finitas:

n∗ =n

1 + nN

Teste de Hipóteses

O Teste de Hipóteses consiste em uma regra dedecisão elaborada para rejeitar (ou não) uma afir-mação (hipótese) feita a respeito de um parâmetropopulacional desconhecido, com base em informa-ções colhidas de uma amostra aleatória.

Exemplo:• Verificar se o salário médio de certa categoriaprofissional no Brasil é igual a R$1.500, 00.

• Testar se 40% dos eleitores votarão em certocandidato nas próximas eleições.

• Testar se um medicamento é mais eficaz queoutro.

Conceitos fundamentais

Hipótese Nula (H0): É a hipótese a ser testada.

Hipótese Alternativa (H1): É a hipótese a serconfrontada com H0.• O teste será feito de tal forma que deverá sem-pre concluir na rejeição (ou não) de H0.

• Como estamos tomando uma decisão com baseem informações de uma amostra, estaremos su-jeitos a cometer dois tipos de erros.

Conceitos fundamentais

Erro do tipo I: Rejeitarmos H0 quando H0 é ver-dadeira.

α = P(erro do tipo I) = P(rejeitar H0|H0 é verdadeira)

Erro do tipo II: Não rejeitarmos H0 quando H0

é falsa.

β = P(erro do tipo II) = P(não rejeitar H0|H0 é falsa)

Obs: α é denominado de nível de significância doteste.

Conceitos fundamentais

Nossas decisões em um teste de hipóteses podemser resumidas na seguinte tabela:

Conceitos fundamentais

Estatística do teste: É a estatística utilizadapara julgar H0.

Região crítica do teste (RC): É formada peloconjunto de valores que levam a rejeição de H0. Eladepende do tipo de hipótese alternativa, do nivelde significância (α) adotado, e da distribuição deprobabilidade da estatística do teste.

Etapas para a elaboração de um Teste deHipóteses

1 Definir as hipóteses nula (H0) e alternativa (H1);

2 Fixar o nível de significância (α);

3 Determinar a estatística do teste;

4 Determinar a região crítica do teste;

5 Calcular o valor da estatística do teste (combase numa amostra da população de interesse);

6 Se o valor calculado no passo 5 pertencer aRC, rejeitar H0, caso contrário, não rejeitar H0;

7 Conclusão do teste.

Teste de Hipóteses para a média populacional

Caso 1: σ2 conhecida.

1. Definição das hipóteses:

H0 : µ = µ0 H0 : µ = µ0 H0 : µ = µ0

H1 : µ 6= µ0 ou H1 : µ < µ0 ou H1 : µ > µ0

2. Fixar o nível de significância α;

3. Definir a estatística de teste:

Z =X − µσ/√n∼ N (0, 1)

Teste de Hipóteses para a média populacional

4. Definir a região crítica do teste (RC):

Teste de Hipóteses para a média populacional

5. Com base nos valores observados da amostra,calcular o valor da Estatística de teste Z :

Zc =X − µ0σ/√n

6. Se Zc ∈ RC ⇒ rejeitar H0 (aceitar H1).Se Zc /∈ RC⇒ não rejeitar H0 (não aceitar H1).

7. Concluir sobre a decisão tomada no passo 6.

Exemplo

Os sistemas de escapamento de uma aeronave fun-cionam devido a propelente sólido. A taxa dequeima desse propelente é uma característica im-portante do produto. As especificações requeremque a taxa média de queima tem de ser 50 centíme-tros por segundo. Sabemos que a taxa de queimaé normalmente distribuída com desvio padrão deσ = 2 centímetros por segundo. O experimenta-lista seleciona uma amostra aleatória de tamanho25 e obtém uma taxa média amostral igual a 51, 3centímetros por segundo. Que conclusões pode-riam ser tiradas ao nível de significância, de 0, 05?

Resolução: Teste para média com σ2 conhecida

1. As hipóteses que queremos testar são:

H0 : µ = 50 contra H1 : µ 6= 50

2. Fixamos α = 0, 05;3. A estatística de teste é: Z = X−µ

σ/√n∼ N (0, 1)

4. A região crítica é do tipo:

onde z = zα/2 = z0,025 = 1, 96 (tabela da dis-tribuição normal padrão).

Resolução: continuação

5. A partir dos dados amostrais temos que:

Zc =X − µ0σ/√n

=51, 3− 50

2/√

25

6. Temos que Zc ∈ RC pois 3, 25 > 1, 96, por-tanto, rejeitamos a hipótese nula.

7. Baseados nos dados amostrais, podemos con-cluir, ao nível de 5% de significância, que ataxa média de queima difere de 50 centímetrospor segundo.

Teste de Hipóteses para a média populacional

Caso 2: σ2 desconhecida.

1. Definição das hipóteses:

H0 : µ = µ0 H0 : µ = µ0 H0 : µ = µ0

H1 : µ 6= µ0 ou H1 : µ < µ0 ou H1 : µ > µ0

2. Fixar o nível de significância α;

3. Definir a estatística de teste:

T =X̄ − µS/√n∼ t(n−1)

Teste de Hipóteses para a média populacional

4. Definir a região crítica do teste (RC):

Teste de Hipóteses para a média populacional

5. Com base nos valores observados da amostra,calcular o valor da Estatística de teste Z :

Tc =X̄ − µ0S/√n

6. Se Tc ∈ RC ⇒ rejeitar H0 (aceitar H1).Se Tc /∈ RC⇒ não rejeitar H0 (não aceitar H1).

7. Concluir sobre a decisão tomada no passo 6.

Obs: se σ2 for desconhecida, mas o tamanho daamostra for grande (n > 30), pode-se definir a re-gião crítica através da distribuição Normal padrão.

Exemplo

Suponha que, no exemplo anterior, o valor do des-vio padrão fosse desconhecido e o experimentalis-ta o tivesse estimado, a partir da amostra comoS = 2, 5 centímetros por segundo. Ao nível de 5%de significância, que conclusão obteríamos acercada queima média do propelente?

Resolução: Teste para média com σ2

desconhecida

1. As hipóteses que queremos testar são:

H0 : µ = 50 contra H1 : µ 6= 50

2. Fixamos α = 0, 05;3. A estatística de teste é: T = X−µ

S/√n∼ t(n−1)

4. A região crítica é do tipo:

onde t = tn−1;α/2 = t24;0,025 = 2, 064 (tabela dadistribuição t-student).

Resolução: continuação

5. A partir dos dados amostrais temos que:

Tc =X − µ0S/√n

=51, 3− 50

2, 3/√

25

6. Temos que Tc ∈ RC pois 2, 83 > 2, 064, por-tanto, rejeitamos a hipótese nula.

7. Baseados nos dados amostrais, podemos con-cluir, ao nível de 5% de significância, que ataxa média de queima difere de 50 centímetrospor segundo.

Teste de Hipóteses para a proporçãopopulacional

1. Definição das hipóteses:

H0 : p = p0 H0 : p = p0 H0 : p = p0

H1 : p 6= p0 ou H1 : p < p0 ou H1 : p > p0

2. Fixar o nível de significância α;

3. Definir a estatística de teste:

Z =p̂− p0√p0(1−p0)

n

∼ N (0, 1)

Teste de Hipóteses para a proporçãopopulacional

4. Definir a região crítica do teste (RC):

Teste de Hipóteses para a proporçãopopulacional

5. Com base nos valores observados da amostra,calcular o valor da Estatística de teste Z:

Zc =p̂− p0√p0(1−p0)

n

6. Se Zc ∈ RC ⇒ rejeitar H0 (aceitar H1).Se Zc /∈ RC⇒ não rejeitar H0 (não aceitar H1).

7. Concluir sobre a decisão tomada no passo 6.

Exemplo

Dentre 1655 pacientes tratados com um medica-mento A, 2, 1% tiveram reações adversas. A em-presa que fabrica o medicamento afirma que ape-nas 1, 2% dos usuários têm algum tipo de reaçãoadversa. Teste, ao nível de significância de 1%, aafirmativa da empresa pode ser considerada verda-deira.

Resolução: Teste para porporção

1. As hipóteses que queremos testar são:

H0 : p = 0, 012 contra H1 : p > 0, 012

2. Fixamos α = 0, 01;3. A estatística de teste é: Z = p̂−p0√

p0(1−p0)n

∼ N (0, 1)

4. A região crítica é do tipo:

onde z = zα = z0,01 = 2, 33 (tabela da distri-buição normal padrão).

Resolução: continuação

5. A partir dos dados amostrais temos que:

Zc =p̂− p0√p0(1−p0)

n

=0, 021− 0, 012√

0,012(1−0,012)1655

= 3, 36

6. Temos que Zc ∈ RC, pois 3, 36 > 2, 33 por-tanto, rejeitamos a hipótese nula.

7. Ao nível de significância de 1%, a amostra for-nece evidências estatísticas suficientes de queo percentual de usuários do medicamento quetêm alguma reação adversa é superior a 1, 2%