Lista de exercícios 1 - Aulas Particulares de...

29
MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1 USP - Universidade de São Paulo. IME – Instituto de Matemática e Estatística. São Paulo, segunda-feira, 21 de agosto de 2006. Disciplina : MAE418 – Estatística Documentária (Análise de Dados Categorizados). Professor : Júlio da Motta Singer. Curso : 45061 – Estatística Bacharelado. Alunos : 2945752 – Emerson Stigliani. 5196162 – Michelle Missae Kato. 5122645 – Tatiana Hiroe Wakaguri. 2956403 – Thiago Rodrigo Alves Carneiro. L L ISTA ISTA DE DE EXERCÍCIOS EXERCÍCIOS 1 1 Exercício 1 Item (a) MODELO PROBABILÍSTICO ADEQUADO – BINOMIAL Tabela 1.1 - Número de pacientes por método e eficácia Método É eficaz Não é eficaz Total Anestésico 70% 30% 100% Acupuntura 85% 15% 100% Um modelo probabilístico adequado para este problema é o modelo binomial para o total de cada linha: , e p: probabilidade de que o método de acupuntura tenha eficiência satisfatória quando aplicado a um paciente. TESTE DE HIPÓTESES A finalidade do hospital é adotar a acupuntura se este método apresentar eficiência satisfatória em uma proporção de casos maior que o anestésico usual. Estatisticamente, isto corresponde a testar as seguintes hipóteses: H 0 : p 0,70 (o hospital não adota o método alternativo) H 1 : p > 0,70 (o hospital adota o método alternativo) Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 1/29

Transcript of Lista de exercícios 1 - Aulas Particulares de...

Page 1: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

USP - Universidade de São Paulo.IME – Instituto de Matemática e Estatística.São Paulo, segunda-feira, 21 de agosto de 2006.Disciplina: MAE418 – Estatística Documentária (Análise de Dados Categorizados).Professor: Júlio da Motta Singer.Curso: 45061 – Estatística Bacharelado.Alunos: 2945752 – Emerson Stigliani.

5196162 – Michelle Missae Kato.5122645 – Tatiana Hiroe Wakaguri.2956403 – Thiago Rodrigo Alves Carneiro.

LLISTAISTA DEDE EXERCÍCIOSEXERCÍCIOS 1 1

Exercício 1Item (a)MODELO PROBABILÍSTICO ADEQUADO – BINOMIAL

Tabela 1.1 - Número de pacientes por método e eficácia

Método É eficazNão é eficaz Total

Anestésico 70% 30% 100%Acupuntura 85% 15% 100%

Um modelo probabilístico adequado para este problema é o modelo binomial para o total de cada linha:

, e p: probabilidade de que o método de acupuntura tenha eficiência satisfatória quando aplicado a um paciente.

TESTE DE HIPÓTESESA finalidade do hospital é adotar a acupuntura se este método apresentar eficiência satisfatória em uma proporção de casos maior que o anestésico usual. Estatisticamente, isto corresponde a testar as seguintes hipóteses:H0: p 0,70 (o hospital não adota o método alternativo)H1: p > 0,70 (o hospital adota o método alternativo)

Item (b)O nível de significância α corresponde à probabilidade do erro tipo I, isto é, o hospital adotar o método alternativo quando, na verdade, não deveria ter adotado.A decisão é tomada através da consideração de uma região crítica (RC).A região crítica é sempre construída sob a hipótese nula (H0 verdadeira) de modo que P(rejeitar H0 | H0 é verdadeira) = α, ou seja, a probabilidade do Erro Tipo I seja igual ao nível de significância α, fixado.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 1/24

Page 2: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Caso o valor observado da estatística do teste pertença a essa região crítica, o hospital adota o método alternativo; caso contrário, o hospital não adota o método alternativo.A estatística : proporção amostral da característica de interesse tem distribuição aproximadamente normal para um tamanho amostral n suficientemente grande, conforme o Teorema do Limite Central (TLC).Portanto, sob H0, temos:

No nosso caso, para α = 6% e sob a hipótese nula temos que:

onde .

Logo:

Item (c)Definimos a região crítica como sendo:

Sabendo que o método de acupuntura realmente tenha eficiência satisfatória em 85% dos casos, a probabilidade de o hospital deixar de adotar este método é dada por:

onde .

Assim, Portanto, a probabilidade de o hospital deixar de adotar o método da acupuntura - mesmo que os chineses estejam corretos - é, aproximadamente, 13,57%.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 2/24

Page 3: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Item (d)Queremos agora diminuir em 60% o alfa modificando apenas o tamanho amostral, ou seja, queremos encontrar um n que diminua a probabilidade da estatística do teste pertencer à região crítica, dado que a hipótese nula é verdadeira.

CASO INo caso (i), sob a hipótese nula:H0: p 0,7Queremos:

onde .

Desta forma:

Resposta: O número adicional de pacientes necessário é 88-54 = 34.

CASO IINo caso (ii), sob a hipótese nula:H0: p = 0,85Queremos:

Onde: .

Desta forma:

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 3/24

Page 4: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Resposta: O número adicional de pacientes necessários é, aproximadamente, 115-54 = 61.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 4/24

Page 5: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Exercício 2Objetivo: avaliar a eficácia de um medicamento para tratamento de um certo tipo de infecção vaginal.

Item (a)O nível de corrimento vaginal medido nas três avaliações (Corrim1, Corrim2 e Corrim3) são variáveis respostas.

Item (b)Uma tabela de contingência apropriada para a análise dos dados é apresentada a seguir:

Tabela 2.1 - Número de pacientes por combinações de avaliação do nível de corrimento  Avaliação Número

de Pacientes  1ª 2ª 3ª

Nível de corrimen

to

0 0 1 2 (4%)0 1 0 1 (2%)1 0 0 8 (16%)1 1 0 5 (10%)1 1 1 1 (2%)2 0 0 8 (16%)2 0 1 2 (4%)2 1 0 3 (6%)2 1 1 4 (8%)2 1 2 2 (4%)2 1 3 1 (2%)2 2 1 3 (6%)2 2 2 1 (2%)2 3 3 1 (2%)3 0 0 4 (8%)3 0 1 1 (2%)3 1 0 2 (4%)3 2 0 1 (2%)

Total       50 (100%)

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 5/24

Page 6: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Exercício 3Através da razão de chances podemos analisar a relação existente entre a chance de cura para pacientes submetidos ao tratamento ativo e a chance de cura para pacientes submetidos ao placebo e não a relação existente entre as probabilidades de cura para pacientes submetidos a diferentes tratamentos. Chance e probabilidade medem freqüência, mas em escalas diferentes. Assim, se a razão de chances obtida foi igual a 2, podemos concluir que a chance de cura para pacientes submetidos a um dos tratamentos é 2 vezes a chance de cura para pacientes submetidos ao outro tratamento, diferente da afirmação feita no enunciado.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 6/24

Page 7: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Exercício 4Em estudos prospectivos, a razão de chances é definida como:

Já em estudos retrospectivos é definida como:

Queremos mostrar que .Utilizando o Teorema de Bayes, temos que:

IMPORTÂNCIA PRÁTICA DESSE RESULTADOPara calcular a razão de chances em estudos prospectivos é necessário observarmos se há ou não à ocorrência da moléstia em certo intervalo de tempo, o que pode acarretar em um intervalo de muitos anos para coletar as informações necessárias e concluir o estudo.A igualdade acima nos permite calcular a mesma razão de chances de outra forma: planejando o estudo retrospectivo, em que observamos se houve ou não exposição ao fator de risco em indivíduos doentes e não doentes. Neste caso, podemos coletar as informações necessárias assim que planejarmos o estudo e selecionarmos os indivíduos e, portanto, não precisamos esperar um longo tempo para calcular a razão de interesse.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 7/24

Page 8: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Exercício 5

Tabela 5.1 - Freqüências relativas da ocorrência de micronúcleos Dose de radiação

gama (cGy)

Ocorrência de múltiplos micronúcleos Total

Sim Não0 0,0004 0,9996 120 0,0023 0,9977 150 0,0126 0,9874 1

100 0,0230 0,9770 1200 0,0314 0,9686 1300 0,0848 0,9152 1400 0,1059 0,8941 1500 0,1632 0,8368 1

Da tabela 5.1, observamos que a proporção de células com múltiplos micronúcleos cresce com o aumento da dose de radiação. Foram calculados os riscos relativos de ocorrência de micronúcleos para cada dose de radiação tomando como base a dose nula. Estes riscos foram calculados através da seguinte fórmula:

onde:: risco relativo de ocorrência de micronúcleos para a i-ésima dose;: proporção de células com múltiplos micronúcleos para a i-ésima dose; e: proporção de células com múltiplos micronúcleos para a dose nula de

radiação.

Tabela 5.2 - Riscos relativos de ocorrência de micronúcleos por doses de radiação gama (cGy)

Dose de radiação gama (cGy) Risco relativo

20 5,3550 29,80100 54,49200 74,53300 201,15400 251,35500 387,35

Gráfico 5.1 – Evolução do risco relativo por dose de radiação gama (cGy)

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 8/24

Page 9: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Com base nestes dados, nota-se que o risco relativo cresce com o aumento da dose de radiação. Este gráfico sugere que o comportamento do risco relativo seja linear em função da dose. Vale destacar que temos poucas observações para afirmar que este crescimento seja linear.As razões de chances foram calculadas da seguinte forma:

onde:: razão de chance para a i-ésima dose de radiação.

: chance de ocorrência de micronúcleos vs. não ocorrência de micronúcleos para a i-ésima dose de radiação.

: chance de ocorrência de micronúcleos vs. não ocorrência de micronúcleos para dose nula de radiação.

Tabela 5.3 - Razões de chances para cada doseDose de radiação

gama (cGy)Razão de chances

20 5,3650 30,16

100 55,74200 76,91300 219,69400 281,01500 462,71

Gráfico 5.2 – Evolução da razão de chances por dose de radiação gama (cGy)

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 9/24

Page 10: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Neste caso, também há evidências de que a razão de chances varie com a dose de radiação. Seu comportamento em função da dose é aproximadamente linear.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 10/24

Page 11: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Exercício 6Tabela 6.1 - Freqüência relativa do nível sérico de CEA

Estado do paciente Nível sérico de CEA TotalNormal ElevadoVIVOS cinco anos após o

diagnóstico 66% 34% 100%MORTOS antes dos cinco

anos do diagnóstico 17% 83% 100%

Item (a)MODELO PROBABILÍSTICO ADEQUADO - PRODUTO DE BINOMIAIS

onde p = (p11, p12, p21, p22)t, n = (n11, n12, n21, n22)t, pi1 + pi2 = 1 (i =1,2) e ni1 + ni2 = Ni (i = 1,2) epij: probabilidade de uma de um paciente no i-ésimo estado apresentar o j-ésimo nível sérico de CEA; i = 1 (vivo), i = 2 (morto) ; j = 1 (normal); j = 2 (elevado).nij: número de pacientes no i-ésimo estado que apresentaram o j-ésimo nível sérico de CEA amostrados. Ni: número de pacientes no i-ésimo estado amostrados.

Item (b)Um dos interesses seria testar a seguinte hipótese:H0: p11 = p21 = p.1 Sabendo que o modelo original é:

Impondo a restrição da hipótese nula, obtemos o seguinte modelo estrutural:

Logo, o modelo estrutural será:

,

Onde n = (n11, n12, n21, n22)t e ni1 + ni2 = Ni (i = 1,2).

Item (c)A probabilidade de encontrarmos valores maiores do que a estatística de teste observada, dado que a hipótese nula é verdadeira, é menor que 0,001.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 11/24

Page 12: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Ou seja, há evidências que devemos rejeitar a hipótese nula, pois o nível de significância é maior que o nível descritivo p.

Item (d)Testaremos a hipótese nula através do Teste Qui-Quadrado de Pearson.

Estatística de teste:

Tabela 6.2 - Valores esperados da freqüência absoluta do nível sérico de CEA sob H0

Estado do paciente Nível sérico de CEA TotalNormal ElevadoVIVOS cinco anos após o

diagnóstico N1*41,5% N1*58,5% N1MORTOS antes dos cinco

anos do diagnóstico N2*41,5% N2*58,5% N2

Assim,

Sabemos que, sob H0, QP ~ . Assim, calculamos o valor da estatística de teste e obtemos o nível descritivo p, onde , e comparamos com 0,001.Desta forma, é possível verificar a afirmação “p < 0,001” desde que os valores N1 e N2 sejam conhecidos (precisaremos dos valores absolutos observados e esperados para calcular a estatística de teste).

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 12/24

Page 13: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Exercício 7A variável de interesse é Y: número de filhos do sexo masculino em famílias com três filhos

MODELO PROBABILÍSTICO ADEQUADODistribuição binomial de parâmetros p e n = 3, onde p é a probabilidade de um filho ser do sexo masculino e n o número máximo de sucessos.

ESTIMADOR

TESTE DA HIPÓTESESH0: Y ~ Binomial (3;0,6)HA: Y ~ outra distribuição

Estatística do teste:

Onde:oi: número observado de famílias amostradas com três filhos dos quais i são do sexo masculinoei: número esperado de famílias amostradas com três filhos dos quais i são do sexo masculino, sob a hipótese nula.k: número de classes da distribuição de freqüênciar: número de parâmetros estimadosgraus de liberdade k-r-1 = 2

Sob H0, temos:

Tabela 7.1 – Distribuição observada e esperada (sob H0) do nº de filhosNúmero de filhos do sexo

masculino 0 1 2 3 TotalNúmero observado de

famílias 8 25 47 20 100P(Nº de filhos do sexo

masculino = i) 0,064 0,288 0,432 0,216 1Número esperado de

famílias 6,4 28,8 43,2 21,6 100

0,40 0,50 0,33 0,12 1,35

Ao nível de significância de 5%, temos a Região Crítica RC = { 5,991}A estatística do teste observada é = 1,35, que resulta em um nível descritivo p-value = 0,51. Portanto, não rejeitamos a hipótese nula, isto é, o modelo é adequado (o nº de filhos segue uma distribuição binomial com p = 0,6 e n = 3).

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 13/24

Page 14: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Exercício 8Item (a)Tome o intervalo [0,t], t >0, fixado e particione ele em n subintervalos iguais

. Estes subintervalos serão suficientemente pequenos.P(um evento ocorrer num intervalo h) = P(N((k-1)h , kh) =1) = λh, quando n é grande.P(dois ou mais eventos ocorrerem num intervalo h) = o(h), desprezível quando n é grande.Então, temos que:N((k-1)h, kh) ~ Bernoulli( )E também:N(t) ~ Binomial (n, )

, x = 1,2,3,...,n

Para , temos:

Portanto:

P(N(t) = x) = , quando .

Item (b)Primeiramente, para facilitar a interpretação das suposições, vamos supor que t represente o tempo.i) O número de observações do evento para determinado intervalo de tempo é independente do número de observações das mesmas características para quaisquer outros intervalos de tempos disjuntos.ii) A distribuição do número de observações do evento só depende do tamanho do intervalo de tempo considerado e não do seu instante inicial.iii) A probabilidade de ocorrência do evento num intervalo de tempo pequeno é aproximadamente proporcional ao tamanho do intervalo.iv) A probabilidade de ocorrência de dois ou mais observações das variáveis em estudo em intervalos suficientemente pequenos também é pequena.Portanto:i) O número de ocorrências do evento em um determinado intervalo de tempo independe do número de ocorrências das mesmas características em quaisquer outros intervalos de tempo disjuntos daquele, ou seja, os incrementos são independentes.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 14/24

Page 15: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

ii) A distribuição do número de ocorrências do evento só depende do tamanho do intervalo de tempo considerado e não do seu instante inicial, ou seja, os incrementos são estacionários.iii) A probabilidade de ocorrência do evento num intervalo de tempo pequeno é aproximadamente proporcional ao tamanho do intervalo.iv) A probabilidade de que duas ou mais ocorrências do evento em um intervalo de tempo suficientemente pequeno será menor quanto menor for este intervalo.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 15/24

Page 16: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Exercício 9Seja X1, X2, ..., Xn amostra de tamanho n de X ~ Bernoulli(p), X assume valor 1 com probabilidade p e valor zero com probabilidade (1 - p).

Item (a)Y: número de sucessos observados na amostra

Como Xi´s são variáveis identicamente distribuídas, temos que:

Assumindo que as observações da amostra são i.i.d., obtemos:

Item (b)A função de verossimilhança é dada por:

O log desta função é:

Derivando esta expressão em relação ao parâmetro π, obtemos:

Assim:

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 16/24

Page 17: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Portanto, o estimador de máxima verossimilhança de π é dado por:

A média e a variância do estimador de máxima verossimilhança são:

Item (c)Para n grande, utilizando o teorema do limite central, podemos aproximar a distribuição do estimador pela distribuição normal com parâmetros e

, ou seja,

Item (d)Para testar a hipótese H0: π = π0 , em que 0 < π0 < 1 é uma constante conhecida, temos os procedimentos descritos a seguir:

1ª parte: amostras pequenasREGIÃO CRÍTICAConsiderando que a hipótese alternativa é H1: π π0 , ou seja, trata-se de um teste bilateral, definimos a região crítica da seguinte forma:

Fixado um nível de significância α, podemos determinar essa região crítica calculando-se os valores de c1 e c2:

Sejam k1 = nc1 e k2 = nc2 , temos que:

(1)

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 17/24

Page 18: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Sob a hipótese nula, sabemos que . Desta forma, devemos

procurar os valores de k1 e k2 nesta distribuição de tal forma que satisfaçam

a igualdade (1) e (2)

Como a distribuição Binomial é discreta, dificilmente encontraremos valores k1 e k2 que satisfaçam (1) e (2). Neste caso, podemos determinar valores que satisfaçam:

Portanto, a região crítica será , com e .

TESTE DE HIPÓTESESObtida a amostra, calcula-se o valor do estimador de máxima verossimilhança . Fixamos um nível de significância α e determinamos a região crítica. Se o valor encontrado pertencer à região crítica, rejeitamos a hipótese nula de que π = π0 ; caso contrário, não rejeitamos.

2ª parte: amostras grandesREGIÃO CRÍTICAConsiderando-se novamente que o teste é bilateral, temos que a região crítica é da forma: Assim, temos que:

onde

Chamando e , obtemos:

(3)Assim, devemos procurar valores k1 e k2 na distribuição Normal Padrão tais que satisfaçam (3) e .Sob a hipótese nula e considerando que a amostra é grande sabemos, como

descrito no item (c), que .

Desta forma, os valores de c1 e c2 são calculados da seguinte maneira:

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 18/24

Page 19: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Portanto, a região crítica será:

TESTE DE HIPÓTESESÉ o mesmo procedimento descrito anteriormente:Obtida a amostra, calcula-se o valor do estimador de máxima verossimilhança . Fixamos um nível de significância α e determinamos a região crítica. Se o valor encontrado pertencer à região crítica, rejeitamos a hipótese nula de que π = π0 ; caso contrário, não rejeitamos.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 19/24

Page 20: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Exercício 101ª parte – Provocação de traumas gengivais

Tabela 10.1 – Número de crianças

Tipo de escova

Provocação de trauma gengival Total

sim nãoA 7 (50%) 7 (50%) 14 (100%)B 4 (33%) 8 (67%) 12 (100%)

Total 11(42%) 15 (58%) 26 (100%)

Item (a)MODELO PROBABILÍSTICO ADEQUADO – PRODUTO DE BINOMIAISA provocação de trauma gengival é uma variável categórica, com as categorias sim e não. Supondo que foram fixadas o número de crianças para cada tipo de escova, temos que o tipo de escova é uma variável explicativa e a provocação de trauma gengival variável resposta.Um modelo adequado para analisar estes dados é o modelo produto de binomiais:

Onde: p = (p11, p12, p21, p22)t, n = (n11, n12, n21, n22)t , pi1 + pi2 = 1 (i =1,2) e ni1 + ni2 = Ni. (i = 1,2) em que: pij: probabilidade de uma criança que usou a i-ésima escova ser classificada na j-ésima categoria de provocação de trauma gengival; i = 1 (escova A), i = 2 (escova B); j = 1 (sim); j = 2 (não);nij: número de crianças que usaram a i-ésima escova e que foram classificadas na j-ésima categoria de provocação de trauma gengival; eNi.: número de crianças que usaram a i-ésima escova.

Item (b)HIPÓTESES DE INTERESSENeste caso, nosso interesse seria verificar se as probabilidades de ocorrência de trauma gengival para cada escova são iguais, ou seja, testar a seguinte hipótese:H0: p11 = p21

Item (c)MÉTODO ESTATÍSTICO APROPRIADO PARA A ANÁLISEPodemos testar a hipótese do item anterior através do teste Qui-Quadrado de Pearson, descrito a seguir:A estatística do teste é:

,

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 20/24

Page 21: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

onde os valores esperados do número de crianças sob a hipótese nula podem ser estimados através de:

,

sendo:N.j: número total de crianças que foram classificadas na j-ésima categoria de provocação de trauma gengival.N: número total de crianças que participaram do estudo.

Estes valores encontram-se na tabela a seguir.

Tabela 10.2 – Valores esperados do número de crianças sob a hipótese nula

Tipo de escova

Provocação de trauma gengival Total

Sim nãoA 6 (42%) 8 (58%) 14 (100%)B 5 (42%) 7 (58%) 12 (100%)

Total 11(42%) 15 (58%) 26 (100%)

Sabemos que a estatística QP ~ , em que os graus de liberdade são dados por p = (nº de linhas - 1).(nº de colunas - 1), sob a hipótese nula.A região crítica é:RC = {QP / QP qcrítico}, em que qcrítico é dada na tabela .

Item (d)RESULTADOS DA APLICAÇÃO DO MÉTODO ESCOLHIDOO valor observado da estatística de teste é QP

O valor crítico é qcrítico = 3,841 , fixado um nível de significância α = 5%, ou seja a região crítica é RC = RC = {QP / QP 3,841}.Como , não rejeitamos a hipótese nula, ou seja, há evidências de que a proporção de ocorrências de trauma gengival para a escova A seja igual à proporção para a escova B.

Item (e)TRADUÇÃO DOS RESULTADOS NUMA LINGUAGEM ACESSÍVELNão há evidências de que as escovas sejam diferentes com relação à provocação de traumas gengivais em crianças em idade pré-escolar.

2ª parte - Remoção da placa bacteriana

Item (a)MODELO PROBABILÍSTICO ADEQUADOO índice de remoção de placa bacteriana é variável resposta quantitativa contínua.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 21/24

Page 22: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Um dos interesses é comparar as médias do índice de remoção de placa bacteriana entre as escovas A e B e, como a variabilidade desse índice não é conhecida, podemos verificar se as médias são iguais através do teste t-student. Esse teste supõe normalidade das observações e mesma variabilidade entre os dados referentes às escovas A e B.Por esse motivo propomos o modelo normal ao índice de placa bacteriana (X),isto é, Xi ~ N(μi,σ2), i = 1(escova A) e i = 2 (escova B).

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 22/24

Page 23: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

O teste de Lilliefors para normalidade apresentou nível descritivo de 66,06% para escova A e 78,09% para escova B, indicando evidência de que a distribuição do índice de placa bacteriana seja normal em ambos os casos.O teste de Bartlett para igualdade de variâncias apresentou nível descritivo de 56,22% indicando evidência de que a variância para cada tipo de escova é igual.Através dos gráficos QQ Normal e dos testes verificamos que o modelo normal proposto acima é adequado para esses dados.

Item (b)HIPÓTESES DE INTERESSEUm objetivo seria comparar as duas médias do índice de placa bacteriana de cada escova. Nesse caso a hipótese é dada por: H0: μ1 = μ2

Item (c)MÉTODO ESTATÍSTICO APROPRIADO PARA A ANÁLISE - TESTE T-STUDENTSuposições do teste: as duas populações são independentes com distribuição normal e mesma variância.

Estatística do teste:

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 23/24

Page 24: Lista de exercícios 1 - Aulas Particulares de …aulasdematematica.com.br/estatisticausp/mae418-2006146... · Web viewChance e probabilidade medem freqüência, mas em escalas diferentes.

MAE418 – Estatística Documentária (Análise de Dados Categorizados) Lista de exercícios 1

Onde

Sabemos que T ~ t-student com (n1 + n2 – 2) graus de liberdade, sob a hipótese nula.RC = {t | t < - tcrítico ou t > tcrítico }, tcrítico é dado pela tabela t-student.

Item (d)RESULTADOS DA APLICAÇÃO DO MÉTODO ESCOLHIDOO valor da estatística observado é t = -3,1075. O valor crítico é tcrítico = 2,064 com nível de significância de 5%, ou seja, a região crítica é da forma:RC = {t | t < - 2,064 ou t > 2,064 }Como a estatística de teste pertence à região crítica, rejeitamos a hipótese nula, ou seja, não há evidências de que as médias dos índices de placa bacteriana sejam iguais.

Agora, temos interesse em construir um intervalo de confiança para a diferença das médias. Seja D = µ1 - µ2.

O intervalo de confiança para D, com 95% de confiança, é dado por:

Como o intervalo de confiança para a diferença entre as médias possui somente valores negativos, concluímos que há evidências de que μ2 > μ1.

Item (e)TRADUÇÃO DOS RESULTADOS EM UMA LINGUAGEM ACESSÍVELCom relação ao índice de remoção de placa bacteriana podemos concluir que há indícios de que em média a escova B seja mais eficiente que a escova A.

Emerson Stigliani, Michelle Kato, Tatiana Wakaguri e Thiago Rodrigo Carneiro 24/24