Introdução à Bioestatística – Turma Nutriçãoedna/bionutri/NUT-Aula08.pdf · Aula 8 :...
Transcript of Introdução à Bioestatística – Turma Nutriçãoedna/bionutri/NUT-Aula08.pdf · Aula 8 :...
Universidade Federal de Minas GeraisInstituto de Ciências ExatasDepartamento de Estatística
Introdução à Bioestatística – Turma Nutrição
Aula 8 :
Intervalos de Confiança para Média e Proporção
Distribuição t-Student
A distribuição t-Student aproxima-se da distribuição Normal Padrão à medida que seus graus de liberdade, k, crescem.
Tabela t
(continua…)
(… continuação)
Tabela t
879.0]10;20.0[ =t 812.1]10;05.0[ =t 753.1]15;05.0[ =t
Distribuição t-Student
A distribuição t-Student é simétrica em torno de 0 .
É por isso que somente os percentis positivos são tabelados.
812.1]05.0;10[
=t
812.1]05.0;10[]95.0;10[
−=−= tt
Um pesquisador quer conhecer as seguintes características dos sobre os estudantes de uma certa universidade:
• a médiada renda familiar per capita;
• a proporçãodeles que trabalha.
O pesquisador não tem acesso às informações de renda e ocupação de todos os (30 mil) estudantes da universidade (da população) para saber qual é o valor desta média e desta proporção. proporção.
Vamos chamar estes valores desconhecidos de média e proporção na população (todos os estudantes da universidade) de:
µ = valor da média da renda familiar per capita na população;
p = valor da proporção de estudantes que trabalha na população.
Ele selecionou aleatoriamente 100 estudantes e perguntou, para cada estudante desta amostra, sua renda familar per capita e o se estudante trabalha ou não.
Ele pretende usar os valores da média de renda dos estudantes da amostra ( )e da proporção de estudantes da amostra que trabalham ( )Para saber os valores na população.
x
p̂
Se por exemplo, p = 0.20
Histograma dos valores da proporção em 1000 amostras aleatórias de tamanho 100 retiradas da população com p =0.20.
A teoria da probabilidade diz que, se p = 0.20, os, valores da
proporção em amostras aleatórias de tamanho 100 têm, aprox. distribuição Normal com média = 0.20 e d.p.= 0.040.040.040.04=−
100
)2.01)(2.0(p̂
Inferência Estatística
Parâmetros:média (µ)
desvio-padrão (σ)proporção (p)
AMOSTRA
Estatísticas:média ( )
desvio-padrão (s) x
Conjunto de métodos de análise estatística que permitem tirar conclusões sobre uma população com base em
somente uma parte dela, a amostra .
POPULAÇÃO
desvio-padrão (s) proporção ( )p̂
Tipos de Inferência Estatística
Inferência sobre
Estimação de(de µ ou p)
Intervalo de Confiança
Inferência sobre os parâmetros
(µ ou p)
Teste de Hipóteses (sobre µ ou p)
Teste de Hipóteses
Estimação
Exemplo: de posse de uma amostra de 1000 eleitores de um Estado, deseja-se estimar a proporção de eleitores desse Estado que votarão no candidato Fulano.
O valor dessa proporção na população (p) é desconhecido.Este parâmetro pode ser estimado de duas formas:
somente um valor é dado como estimativa para θ. Exemplo : proporção amostral de eleitores de
Fulano, = 0.60.
Estimação pontual :
Estimação intervalar :
um intervalo de valores é dado como estimativa para θ. Exemplo : [ margem de erro ] = [0.60 0.03]
= [0.57 ; 0.63].± ±
p̂
p̂
Estimação Intervalar
Estimativa Intervalar
= Estimativa pontual ±±±± Margem de Erro
Exemplo:
Em uma amostra de 40 alunos da UFMG, encontrou-se umaEm uma amostra de 40 alunos da UFMG, encontrou-se umarenda familiar média de 1600 reais (estimativa pontual ),com desvio-padrão de 323 reais .
A margem de erro foi calculada em 104 reais .
Assim, a estimativa intervalar para a renda familiar média doaluno da UFMG é de
[1600 ±±±± 104] = [1496 ; 1704] reais.
EXEMPLO: estimar µ, a média da renda familiar dos alunos que ingressaram na UFMG este ano
Experimento :
1. Cada um de vocês tem acesso a uma amostra de 100 calouros;
2. Cada um calcula a estimativa pontual em sua amostra;
3. Os valores de irão variar de amostra para amostra:
x
x
Alguns valores de serão próximos a µ, outros não….x
Nível de Confiança de uma Estimativa Intervalar
A estimativa intervalar é associada a um nível de confiança(geralmente expresso em porcentagem).
Ex: nível de confiança de 95%.
Chamamos a Estimativa Intervalar de Intervalo de Confiança .
Ex: o intervalo de 95% de confiança para a renda familiar médiaEx: o intervalo de 95% de confiança para a renda familiar médiado aluno da UFMG vai de R$1496 a R$1704.
Interpretação:
Temos uma confiança de 95% de que o valor desconhecido da renda familiar média do aluno
da UFMG está entre R$1496 a R$1704.
O que entendemos por confiança ?
EXEMPLO: estimar µ, a renda média familiar dos alunos que ingressaram na UFMG este ano
Experimento :
1. Cada um de vocês tem acesso a uma amostra de 100 calouros;
intervalo de 95% de confiança 2. Cada um construirá um intervalo de 95% de confiança utilizando os dados da sua amostra.
Resultado esperado :
Intervalos de confiança com limites e comprimentos diferentes.
Cerca de 95% dos intervalos construídos por vocês irão conter o valor desconhecido de µ.
Interpretação do Nível de Confiança na Estimação In tervalar
95% dos IC95% construídos de diferentes amostras de mesmo tamanho contêmo valor desconhecido de µ.
Intervalo de Confiança para uma Média µµµµ
margem de erro
estimativa da variabilidade de entre amostras de tamanho n
x
percentil da distribuição t-Student com (n -1) g.l. que deixa acima dele uma probabilidade igual a α/2
/ 2;( 1)ntα −
α/2
estimativa
pontual de µ
tamanho nnível de confiança
Exemplo : Estimação da idade média ao falar
Em uma amostra de n=20 crianças, a idade média ao falar foi de= 10 meses, com desvio-padrão de s =1,5 meses.x
( 1; /2) (19; /2)100(1 )% . 10n
sIC x t t
nα α
αµ −
− = ± = ±
( 1; /2) (19; /2).1.5
. 1020
IC x t tα α = ± = ±
[ ]100(1 )%
nα−
= ± ]20
10 .0.335
[ ](19; /2)100(1 )% 10 .0.335IC t α
αµ
−
= ±
�Intervalo de 90% de confiança: 100(1-α)%=90%1-α = 0.90 → α = 0.10 → α/2 = 0.05 → t(19;0,05) = 1.729
[ ] [[ ]
90% 10 1.729 0.335 10 0,6 10 0.6;10 0.69.4;10.6
IC
ICµ = ± ⋅ = ± = − +
=[ ] [ ]10 1.729 0.335 10 0,6 10 0.6;10 0.6= ± ⋅ = ± = − +[
[ ]90% 9.4;10.6ICµ = “A idade média ao falar para esta populaçãode crianças é estimada entre 9.4 e 10.6meses, com 90% de confiança.”
�Intervalo de 95% de confiança: 100(1-α)%=95%1-α = 0.95 → α = 0.05 → α/2 = 0.025 → t(19;0,025) = 2.093
[ ] [ ] [ ][ ]
95% 10 2.093 0.335 10 0.7 10 0.7;10 0.7ICµ = ± ⋅ = ± = − += [ ]95% 9.3;10.7ICµ = “A idade média ao falar para esta população
de crianças é estimada entre 9.3 e 10.7meses, com 95% de confiança.”
Como reduzir a margem de erro (e o comprimento do IC )?
Reduzir o nível de confiança
Escolher uma população com menor
variabilidade
100(1 )% . 10s
IC x t tα− = ± = ±
Aumentar o tamanho da
amostra
[ ]( 1; /2) (19; /2)
100(1 )%
100(1 )%
. 10n
sIC x t t
nα α
αµ
α
−−
−
= ± = ±
= ±
Cálculo do Tamanho da Amostra para IC
nst me n ⋅= −
−)2/;1(
)%1(100α
αµ
Cálcular o tamanho da amostra (n) Cálcular o tamanho da amostra (n) tal que a margem de erro seja igual
ao valor especificado pelo pesquisador.
Exemplo: Em uma amostra de 40 alunos da UFMG, encontrou-se uma renda familiar média de 1600 reais, com d.p. de 323 reais.
A margem de erro com 95% de confiança na estimação da
média de renda na população de alunos (µ), é dada por:
reais. 104071.51)042.2(40
323)(]025.0;39[
%95 =⋅=⋅= tmeµ
Suponha que se deseja que a margem de erro caia para 50 reais.Suponha que se deseja que a margem de erro caia para 50 reais.Para quanto deveria ser aumentado o tamanho da amostra?
? reais 50323
]025.0;1[ =⇒=⋅− nn
nt
nntme
323]025.0;1[
%95 ⋅= −µ
Intervalo de Confiança para uma Proporção p
margem de erroestimativa da variabilidade de entre amostras de tamanho n
nível de confiança
p̂
Válido somente quando n > 30 (amostras grandes)
e 0.2<θ<0.8.
percentil da distribuição Normal Padrão que deixa acima dele probabilidade igual a α/2
estimativa pontual
de p
Exemplo: Deseja-se estimar:p = proporção de pessoas curadas com o novo tratamento.
Estimativa Pontual: a proporção amostral = 40/50 = 0.8
50 pessoas receberam o novo tratamento e 40 foram curadas.
Estimativa Intervalar:
90% de confiança: 100(1-α)%=90%
p̂
Com base nesta amostra, estimamos que a proporção de cura como novo tratamento está entre 70% e 90%, com 90% de confiança.
90% de confiança: 100(1-α)%=90%1-α = 0.90 → α = 0.10 → α/2 = 0.05 → zαααα/2 = z0,05 =1.64
[ ] [ ] [ ].9.0 ; 7.01.08.0 )06.0)(64.1(8.050
)2.0(8.0)64.1(8.0%90 =±=±=
±=pIC
Cálculo do Tamanho da Amostra para IC
nzme
ppp
)ˆ1(ˆ)2/( )%1(100 −⋅=−
αα
Para um valor de margem de erro (d) especificado pelo pesquisador,
o tamanho da amostra deve ser:
][ )ˆ1(ˆ
2
]2/[pp
d
zn −⋅
= α
o tamanho da amostra deve ser:
máximo=0.25 quando p=0.50
4
1 ][
22
]2/[]2/[)ˆ1(ˆ ⋅
=⇒⋅
= −
d
zn
d
zn pp
αα
Para 95% de confiança: 1-α=0.95 � zαααα/2 = z0,025 =1.96 ≈ 2
12122
]2/[ ⋅=⇒⋅
=zα
4
12
4
1]2/[ ⋅
=⇒⋅
=
dn
d
zn α
2222dn
1=