Domingues 2005 - Estatística Aplicada as Ciências Militares

220
ESTATÍSTICA APLICADA ÀS CIÊNCIAS MILITARES

description

Estatistica aplicada

Transcript of Domingues 2005 - Estatística Aplicada as Ciências Militares

Page 1: Domingues 2005 - Estatística Aplicada as Ciências Militares

ESTATÍSTICA APLICADA ÀS CIÊNCIAS MILITARES

Page 2: Domingues 2005 - Estatística Aplicada as Ciências Militares

2

Page 3: Domingues 2005 - Estatística Aplicada as Ciências Militares

3

Clayton Amaral Domingues

ESTATÍSTICA APLICADA ÀS CIÊNCIAS MILITARES

RIO DE JANEIRO EsAO - 2005

Page 4: Domingues 2005 - Estatística Aplicada as Ciências Militares

4

© 2005 Domingues, Clayton Amaral. Reservados todos os direitos de publicação ao autor É proibida a duplicação ou reprodução deste volume, no todo ou em parte, sob quaisquer formas ou por quaisquer meios (eletrônico, gravação, fotocópia, distribuição na Web e outros), sem permissão expressa da EsAO.

Diagramação:

Clayton Amaral Domingues – Cap Art

Revisão:

José Fernando Chagas Madeira – Maj Com

Luiz Eduardo Possídio Santos – Cap MB

Clayton Amaral Domingues – Cap Art

Dados internacionais de Catalogação-na-Publicação (CIP)

D 671 Domingues, Clayton Amaral. Estatística aplicada às Ciências Militares / Clayton, Amaral Domingues. � Rio de Janeiro : ESAO, 2005. 220 p. : il. ; 21 cm.

Bibliografia: p. 219-220. ISBN

1. Estatística. I. Domingues, Clayton Amaral. II. Escola de Aperfeiçoamento de Oficiais (Brasil) . V.

Título.

CDD 340

Escola de Aperfeiçoamento de Oficiais Avenida Duque de Caxias, 2071

Rio de Janeiro/ RJ - CEP 21615-220 Fone (21) 24508500 (R 8075) – e-mail:[email protected]

Page 5: Domingues 2005 - Estatística Aplicada as Ciências Militares

5

SUMÁRIO

1 A CIÊNCIA ESTATÍSTICA 11

2 ESTATÍSTICA DESCRITIVA 15

2.1 VARIÁVEIS QUALITATIVAS....................................................................... 16 . 2.2 VARIÁVEIS QUANTITATIVAS..................................................................... 16 2.3 TÉCNICAS DE DESCRIÇÃO GRÁFICA........................................................ 17 2.3.1 Descrição Gráfica de Variáveis Qualitativas................................................. 18 2.3.2 Descrição Gráfica de Variáveis Quantitativas Discretas.............................. 20 2.3.3 Descrição Gráfica de Variáveis Quantitativas Contínuas............................ 23 2.4 CARACTERÍSTICAS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS....... 29 2.4.1 Medidas De Posição.......................................................................................... 30 2.4.1.1 Média.................................................................................................................. 30 2.4.1.2 Mediana.............................................................................................................. 31 2.4.1.3 Moda................................................................................................................... 34 2.4.1.4 Quartis e Percentis.............................................................................................. 35 2.4.2 Medidas de Dispersão....................................................................................... 36 2.4.2.1 A Amplitude Total.............................................................................................. 36 2.4.2.2 A Variância......................................................................................................... 36 2.4.2.3 O Desvio-Padrão................................................................................................ 38 2.4.2.4 O Coeficiente de Variação.................................................................................. 39 2.4.3 Medidas de Assimetria..................................................................................... 40 2.4.4 Medidas de Achatamento ou Curtose............................................................. 42

3 AMOSTRAGEM 45

3.1 AMOSTRAGEM NÃO ALEATÓRIA.............................................................. 46 3.1.1 Amostragem Intencional.................................................................................. 46 3.1.2 Amostragem Voluntária.................................................................................. 46 3.2 AMOSTRAGEM ALEATÓRIA........................................................................ 47 3.2.1 Amostragem Aleatória Simples....................................................................... 47 3.2.2 Amostragem Sistemática.................................................................................. 47 3.2.3 Amostragem Estratificada............................................................................... 48 3.2.4 Amostragem por Conglomerados................................................................... 48 3.3 FÓRMULAS PARA A DETERMINAÇÃO DO TAMANHO DA

AMOSTRA.................................................................................................................... 49

Page 6: Domingues 2005 - Estatística Aplicada as Ciências Militares

6

4 PROBABILIDADE 53

4.1 EXPERIMENTO ALEATÓRIO........................................................................ 53 4.1.1 Espaço Amostral ............................................................................................ 53 4.1.2 Eventos............................................................................................................... 54 4.2 PROBABILIDADE DE SUCESSO DE UM EVENTO.................................... 54 4.2.1 Eventos Complementares................................................................................ 55 4.2.2 Eventos Independentes..................................................................................... 56 4.2.3 Eventos Mutuamente Exclusivos..................................................................... 56 4.3 EXERCÍCIOS DE PROBABILIDADE............................................................. 57

5 MODELOS TEÓRICOS DE PROBABILIDADE 59

5.1 DEFINIÇÕES DE PROBABILIDADE............................................................ 59 5.1.1 Probabilidade Clássica.................................................................................... 59 5.1.2 Probabilidade Freqüencialista........................................................................ 60 5.1.3 Probabilidade Personalística........................................................................... 62 5.2 VARIÁVEL ALEATÓRIA................................................................................ 62 5.2 DISTRIBUIÇÃO DE PROBABILIDADE........................................................ 63 5.4 MODELOS TEÓRICOS DISCRETOS DE PROBABILIDADE..................... 64 5.4.1 Distribuição de Bernoulli................................................................................. 64 5.4.2 Distribuição Binomial...................................................................................... 65 5.4.3 Distribuição de Poisson.................................................................................... 67 5.5 MODELOS TEÓRICOS CONTÍNUOS DE PROBABILIDADE..................... 68 5.5.1 Distribuição Normal - Curva Normal............................................................. 68

6 ERRO, SIGNIFICÂNCIA, TAMANHO DO EFEITO E PODER ESTATÍSTICO

73

6.1 HIPÓTESES ESTATÍSTICAS........................................................................... 73 6.2 TIPOS DE ERROS ESTATÍSTICOS................................................................. 74 6.2.1 Erro Tipo I - Alfa (�) ....................................................................................... 75 6.2.2 Erro Tipo II - Beta (�) ..................................................................................... 76 6.2.3 Lógica do teste de significância....................................................................... 78 6.3 CURVA CARACTERÍSTICA DE OPERAÇÃO (CCO).................................. 80 6.4 SIGNIFICADO OU TAMANHO DO EFEITO................................................. 81 6.5 PODER............................................................................................................... 81

7 INFERÊNCIA ESTATÍSTICA 85

7.1 ESTIMATIVA POR PONTO............................................................................. 85 7.2 ESTIMATIVA POR INTERVALO................................................................... 85 7.3 INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL

QUANDO A VARIÂNCIA É CONHECIDA...............................................................

86

Page 7: Domingues 2005 - Estatística Aplicada as Ciências Militares

7

7.4 INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL QUANDO A VARIÂNCIA É DESCONHECIDA.......................................................

90

7.5 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA................................ 94 7.6 INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO...................... 96 7.7 INTERVALO DE CONFIANÇA PARA A PROPORÇÃO.............................. 97

8 TESTES PARAMÉTRICOS DE HIPÓTESES 101

8.1 TESTE DE SIGNIFICÂNCIA PARA MÉDIAS POPULACIONAIS.............. 102 8.2 TESTE DE SIGNIFICÂNCIA PARA VARIÂNCIAS POPULACIONAIS..... 104 8.3 TESTE DE SIGNIFICÂNCIA PARA A IGUALDADE ENTRE DUAS

VARIÂNCIAS POPULACIONAIS.............................................................................. 106

8.4 TESTE DE SIGNIFICÂNCIA PARA IGUALDADE ENTRE DUAS MÉDIAS POPULACIONAIS (VARIÂNCIAS CONHECIDAS)................................

108

8.5 TESTE DE SIGNIFICÂNCIA PARA IGUALDADE ENTRE DUAS MÉDIAS POPULACIONAIS (VARIÂNCIAS DESCONHECIDAS, MAS ADMITIDAS IGUAIS).................................................................................................

109

8.6 TESTE DE SIGNIFICÂNCIA PARA PROPORÇÕES POPULACIONAIS.... 111

9 ANÁLISE DE VARIÂNCIA 115

9. 1 ANOVA SIMPLES (ONE-WAY OU COM ÚNICO FATOR)......................... 115 9.2 ANOVA DUPLA (TWO-WAY OU COM DOIS FATORES).......................... 123 9.3 ANOVA FATORIAL (EXPERIMENTO COM DOIS FATORES E

REPETIÇÕES)............................................................................................................... 128

9.4 TESTE DE SCHEFFÉ (COMO POST-HOC).................................................... 134

10 TESTES NÃO-PARAMÉTRICOS PARA 2 GRUPOS 139

10.1 TESTE QUI-QUADRADO PARA ADEQUAÇÃO DO AJUSTAMENTO..... 139 10.2 TESTE QUI-QUADRADO PARA INDEPENDÊNCIA OU ASSOCIAÇÃO.. 142 10.3 TESTE QUI-QUADRADO PARA TABELAS (2 X 2)..................................... 146

10.4 TESTE DA MEDIANA...................................................................................... 148 10.5 TESTE DE MANN-WHITNEY......................................................................... 150 10.6 TESTE DOS SINAIS PARA DOIS GRUPOS RELACIONADOS.................. 155 10.7 TESTE DE WILCOXON - DOIS GRUPOS RELACIONADOS...................... 157

11 TESTES NÃO-PARAMÉTRICOS PARA 3 OU MAIS GRUPOS INDEPENDENTES

161

11.1 TESTE QUI-QUADRADO................................................................................ 161 11.2 TESTE DA MEDIANA...................................................................................... 161 11.3 TESTE KRUSKAL-WALLIS............................................................................ 163 11.4 ANOVA TWO-WAY DE FRIEDMAN POR ORDENAÇÕES.......................... 166

Page 8: Domingues 2005 - Estatística Aplicada as Ciências Militares

8

12 CORRELAÇÃO E REGRESSÃO 171

12.1 COEFICIENTE DE CORRELAÇÃO DE PEARSON...................................... 171 12.2 CORRELAÇÃO E CAUSA............................................................................... 174 12.3 INTERPRETAÇÃO DE “r” .............................................................................. 174 12.4 TRANSFORMAÇÃO “Z” DO “r” .................................................................... 175 12.5 REGRESSÃO LINEAR..................................................................................... 176 12.6 LINHA DE MELHOR AJUSTAMENTO E ERRO DE PREDIÇÃO............... 177 12.7 CORRELAÇÃO PARCIAL............................................................................... 179 12.8 REGRESSÃO MÚLTIPLA................................................................................ 180

13 DISTRIBUIÇÕES AMOSTRAIS 183

13.1 DISTRIBUIÇÃO AMOSTRAL DE X............................................................... 183 13.2 DISTRIBUIÇÕES AMOSTRAIS DE fi E fri...................................................... 185 13.3 DISTRIBUIÇÃO AMOSTRAL DE S2 — DISTRIBUIÇÕES �2...................... 186

13.5 DISTRIBUIÇÕES t DE STUDENT.................................................................. 187

13.6 DISTRIBUIÇÕES F DE SNEDECOR............................................................. 188

ANEXO A – ESTATÍSTICA DESCRITIVA............................................................ 190

ANEXO B – COMPARAÇÕES ENTRE AMOSTRAS........................................... 191

ANEXO C – RELAÇÃO ENTRE VARIÁVEIS...................................................... 192

ANEXO D – TABELA DE NÚMEROS ALEATÓRIOS......................................... 193

ANEXO E – ÁREA SUBTENDIDA PELA CURVA NORMAL – TABELA Z ... 194

ANEXO F – TABELA PARA O TESTE t................................................................. 195

ANEXO G – TABELA PARA TESTE F................................................................... 196

ANEXO H – VALORES CRÍTICOS DOS COEFICIENTES DE CORRELAÇÃO(TABELA r ) .......................................................................................

210

ANEXO I – TABELA PARA TRANSFORMAÇÃO DE r PARA Z....................... 211

ANEXO J – DISTRIBUIÇÃO QUI-QUADRADO.................................................. 212

ANEXO L - TABELA PARA O TESTE MANN-WHITNEY(PEQUENAS AMOSTRAS) ...............................................................................................................

215

ANEXO M - TABELA W (PEQUENAS AMOSTRAS).......................................... 217

REFERÊNCIAS........................................................................................................... 219

Page 9: Domingues 2005 - Estatística Aplicada as Ciências Militares

9

PREFÁCIO

Os programas de pós-graduação, conduzidos pelas instituições militares de

ensino superior, exigem a apresentação de trabalho acadêmico, dissertação ou tese

como requisito parcial para a obtenção dos certificados, diplomas e títulos

correspondentes. Estes trabalhos são desenvolvidos mediante pesquisa sobre um

tema relevante de determinada área, obedecendo à metodologia própria para

iniciação científica, preceitos da Associação Brasileira de Normas Técnicas (ABNT)

e regras ortográficas e gramaticais da língua portuguesa.

Este manual foi elaborado com a intenção de proporcionar, aos postulantes

dos Programas de Pós-Graduação do Ensino Superior Militar, ferramentas que

viabilizem a execução do tratamento estatístico das variáveis estudadas durante a

realização dos seus respectivos Trabalhos de Pós-Graduação (TPG).

Neste sentido, são apresentados idéias e conceitos relativos à Estatística

Descritiva, à Amostragem, à Probabilidade e à Estatística Inferencial, construindo

uma base sólida para a tomada de decisões quanto às hipóteses de estudo tratadas

nos TPG.

DOMINGUES, C. A.; MADEIRA, J. F. C.; SANTOS, L. E. P.

Page 10: Domingues 2005 - Estatística Aplicada as Ciências Militares

10

Page 11: Domingues 2005 - Estatística Aplicada as Ciências Militares

11

Capítulo 1 A Ciência Estatística

Podemos considerar a Estatística como a ciência que se preocupa com a organização, descrição, análise e interpretação dos dados experimentais, visando à tomada de decisões.

A razão pela qual consideramos a Estatística uma ferramenta importante para a tomada

de decisões está no fato de que ela não deve ser considerada como um fim em si própria, mas como um instrumento (ferramenta) fornecedor de informações que subsidiarão a tomada de melhores decisões, baseadas em fatos e dados. A Estatística é, portanto, uma ciência meio que tem utilidade em outros variados campos do conhecimento.

Evidentemente, tanto a parte de organização e descrição dos dados como aquela que

diz respeito a sua análise e interpretação são importantes. É razoável também que, para realizar-se a análise e interpretação dos dados observados, procede-se primeiramente a sua organização e descrição.

Neste contexto, podemos considerar a Ciência Estatística como dividida basicamente

em duas partes: a Estatística Descritiva que se preocupa com a organização e descrição dos dados experimentais, e a Estatística Indutiva*(são também utilizados as termos Estatística Inferencial ou Inferência Estatística, ou, ainda, Indução Estatística), que cuida da análise e interpretação dos dados.

A Estatística Descritiva, na sua função de organização e descrição dos dados, tem as

seguintes atribuições: A obtenção dos dados estatísticos – feita normalmente através de questionário ou de

observação direta de uma população ou amostra. A organização dos dados – consiste na ordenação e crítica quanto à correção dos

valores observados, falhas humanas, omissões, abandono de dados duvidosos etc. A redução dos dados - o entendimento e a compreensão de grande quantidade de

dados através da simples leitura de seus valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais experimentado pesquisador. A Estatística Descritiva apresenta duas formas básicas para a redução do número de dados com os quais devemos trabalhar, chamadas variável discreta e variável contínua.

A representação dos dados – os dados estatísticos podem ser mais facilmente

compreendidos quando apresentados por meio de uma representação gráfica, o que permite a visualização instantânea dos mesmos.

A obtenção de algumas informações que auxiliam a descrição do fenômeno

observado (médias, proporções, tendências, índices, taxas, coeficientes) que facilitam a

Page 12: Domingues 2005 - Estatística Aplicada as Ciências Militares

12

descrição dos fenômenos observados. Para darmos prosseguimento a apresentação da Estatística Descritiva, tratada mais

detalhadamente no capítulo 2, é interessante que se entenda dois conceitos: Dados brutos - é uma seqüência de valores numéricos não organizados, obtidos

diretamente da observação de um fenômeno coletivo; e Rol - é uma seqüência ordenada de dados brutos. Uma vez que o conceito usual do que seja a Estatística se relaciona, em geral, com o

que chamaremos de Estatística Descritiva, queremos deixar bem claro desde já qual a finalidade da Estatística Indutiva. Para tanto, dois conceitos fundamentais devem ser apresentados: o de população ou universo e o de amostra.

Uma população ou universo, no sentido geral, é um conjunto de elementos com pelo

menos uma característica comum. Essa característica comum deve delimitar inequivocamente quais os elementos que pertencem à população e quais os que não pertencem.

Assim, por exemplo, podemos estar interessados em realizar uma pesquisa sobre a

idade dos militares do Comando Militar do Leste. Logo, a população física que nos interessa examinar é aquela constituída pela totalidade dos militares existentes no Comando Militar do Leste. Isso parece extremamente simples, mas na verdade ainda não temos exatamente caracterizada a população que nos interessa. Será ela constituída apenas por aqueles que, no momento atual, estão na ativa? Ou deveremos incluir também os que já estão na reserva? Além de tudo, temos também o problema de definir a característica comum que distingue perfeitamente cada um dos elementos da população que realmente nos interessa pesquisar (do Efetivo Profissional ou também deveríamos incluir os do Efetivo Variável?).

Uma vez perfeitamente caracterizada a população, o passo seguinte é o levantamento

de dados acerca da característica (ou características) de interesse no estudo em questão. Grande parte das vezes, porém, não é conveniente, ou mesmo nem é possível, realizar o levantamento dos dados referentes a todos os elementos da população. Devemos então limitar nossas observações a uma parte da população, isto é, a uma amostra proveniente dessa população.

Uma amostra é, pois, um subconjunto necessariamente finito de uma população, pois

todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado.

O objetivo da Estatística Indutiva é tirar conclusões sobre populações com base nos

resultados observados em amostras extraídas dessas populações. O próprio termo "indutiva" decorre da existência de um processo de indução, isto é, um processo de raciocínio em que, partindo-se do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo (o oposto ocorre nos processos de dedução, em que, partindo-se do conhecimento do todo, concluímos exatamente sobre o que deve ocorrer em uma parte) .

É fácil perceber que um processo de indução não pode ser exato. Ao induzir, portanto,

estamos sempre sujeitos a erro. A Estatística Indutiva, entretanto, irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade. Esse fato é

Page 13: Domingues 2005 - Estatística Aplicada as Ciências Militares

13

fundamental para que uma indução (ou inferência) possa ser considerada estatística, e faz parte dos objetivos da Estatística Indutiva.

É intuitivo que, quanto maior a amostra, mais precisas e mais confiáveis deverão ser as

induções realizadas sobre a população. Levando esse raciocínio ao extremo, concluiríamos que os resultados mais perfeitos seriam obtidos pelo exame completo de toda a população, ao qual se denomina censo ou recenseamento.

Ocorre, em realidade, que diversas razões levam, em geral, à necessidade de recorrer-

se apenas aos elementos de uma amostra. Entre elas, podemos citar o custo do levantamento de dados e o tempo necessário para realizá-lo, especialmente se a população for muito grande, ou, então, podemos não ter acesso fácil ou possível a todos os elementos da população, etc.

Um outro problema que surge paralelamente é o de amostragem. É claro que, se

nossas conclusões referentes à população irão basear-se no resultado de amostras, certos cuidados básicos devem ser tomados no processo de obtenção dessas amostras, ou seja, no processo de amostragem. Muitas vezes, erros grosseiros e conclusões falsas ocorrem devido a falhas na amostragem. Esse problema será tratado com maior destaque no Cap. 3.

Em resumo, um estudo estatístico completo, que recorra às técnicas da Estatística

Indutiva, irá envolver também, direta ou indiretamente, tópicos de Estatística Descritiva, Cálculo de Probabilidades e Amostragem.

Assim, para se desenvolver um curso razoável de Estatística, todos esses assuntos

devem ser abordados em maior ou menor grau, dentro de uma seqüência, conforme indicado no diagrama da Fig. 1.

Amostragem

Estatística Descritiva

Cálculo de Probabilidades

Estatística Indutiva

Figura 1 - Esquema geral de um curso de Estatística.

Os ANEXOS A, B e C, indicam as análises inferenciais adequadas para as diversas

situações de pesquisa, porém, não descrevem os procedimentos a serem adotados em cada situação particular. Isso ocorre devido ao fato de que a decisão final depende não somente das restrições matemáticas, mas também dos objetivos do estudo e da própria natureza dos achados que serão produzidos. Contudo, é importante ter em mente que as tabulações apresentadas constituem um mapa de referência para auxiliar o pesquisador na escolha do procedimento mais adequado para cada situação de pesquisa.

Page 14: Domingues 2005 - Estatística Aplicada as Ciências Militares

14

Page 15: Domingues 2005 - Estatística Aplicada as Ciências Militares

15

Capítulo 2 Estatística Descritiva

A Estatística trabalha com informações referentes ao conjuntos de elementos observados. Nos problemas de Estatística Indutiva, esses elementos constituem uma amostra retirada da população que se deseja estudar. Em muitos casos, entretanto, o conjunto observado pode constituir a população inteira.

Para iniciarmos o tratamento dos dados é preciso antes que se tenha(m) bem

definida(s) qual(is) a(s) característica(s) de interesse que deverá(ão) ser verificada(s). Ou seja, não iremos trabalhar estatisticamente com os elementos existentes, mas com alguma(s) característica(s) desses elementos que seja(m) fundamental(is) ao nosso estudo.

Por exemplo, o conjunto de elementos a ser estudado pode ser a população de uma

Brigada. Este é o conjunto dos elementos, fisicamente definido e considerado. É claro que não iremos nem poderemos fazer qualquer tratamento matemático com os militares que formam esse conjunto. É preciso definir qual(is) característica(s) desses militares nos interessa(m) averiguar. Essa característica poderá ser, digamos, a idade dos militares. A idade é uma variável cujos valores (dados numericamente organizados em alguma escala de unidade), dependerão dos elementos considerados. Ou seja, se houver n elementos fisicamente considerados no estudo, esses elementos fornecerão n valores da variável idade, os quais serão então tratados convenientemente pela Estatística Descritiva.

No presente capítulo, vamos apenas tratar do caso de variáveis unidimensionais, ou

seja, quando apenas uma característica de interesse está associada a cada elemento do conjunto examinado. Esta característica poderá ser qualitativa ou quantitativa. Teremos, portanto, variáveis qualitativas ou quantitativas, como nos exemplos que seguem no Quad. 1.

TIPO CARACTERÍSTICA VARIÁVEL DADO

NOMINAL (QUALITATIVA)

Categorias não ordenadas Sexo grupo sangüíneo

M,F. A, B, AB,O.

ORDINAL (QUALITATIVA)

Categorias ordenadas grau de dor, escores em geral

I, F, M, S, A. E, MB, B, R, I.

INTERVALAR (QUANTITATIVA)

Espectro ordenado com intervalos quantificáveis

Flexões de braço Peso

0 a +� 0 a +�

RAZÃO (QUANTITATIVA)

Espectro ordenado com intervalos quantificáveis

Força Aceleração

-�<0< +� -�<0< +�

(2) Duas categorias: dicotômica ou binária; Três ou mais categorias: polinomial. (3) Podem ser contínuas ou discretas. Diferença entre intervalar e razão está na presença do zero absoluto (razão), mas o tratamento estatístico é o mesmo.

Quadro 1 - Variáveis e seus níveis de medidas.

Page 16: Domingues 2005 - Estatística Aplicada as Ciências Militares

16

2.1 VARIÁVEIS QUALITATIVAS A variável será qualitativa quando resultar de uma classificação por tipo ou atributo. EXEMPLO 2.1.1: Variáveis qualitativas: a) População: militares de uma Brigada. Variável: cor dos olhos (pretos, castanhos, azuis, verdes). b) População: peças produzidas por uma máquina. Variável: qualidade (perfeita ou defeituosa). c) População: óbitos em um Hospital de Guarnição, nos últimos cinco anos. Variável: causa mortis (moléstias cardiovasculares, cânceres, moléstias do

aparelho digestivo, etc). d) População: candidatos a um exame para o Quadro Complementar de Oficiais. Variável: sexo (masculino ou feminino).

2.2 VARIÁVEIS QUANTITATIVAS

A variável será quantitativa quando seus valores puderem ser expressos em números. As variáveis quantitativas podem ser subdividas em quantitativas discretas e quantitativas contínuas. Essa classificação corresponde aos conceitos matemáticos de discreto e contínuo. Assim, uma variável contínua será aquela que, teoricamente, pode assumir qualquer valor num certo intervalo razoável de variação. A variável discreta, ao contrário, pode assumir apenas valores pertencentes a um conjunto enumerável.

EXEMPLOS 2.2.1: Variáveis quantitativas discretas: a) População: casais residentes na Vila Militar. Variável: número de filhos (1,2,3,...). b) População: as jogadas possíveis com um dado. Variável: o ponto obtido em cada jogada (1,2,3,4,5,6). c) População: munições produzidas em uma linha de montagem. Variável: número de defeitos por unidade (1,2,3,...). Essas variáveis são todas discretas, pois seus possíveis valores são apenas números

inteiros não-negativos, havendo, ainda, no caso (b), a restrição de estarem compreendidos entre 1 e 6.

EXEMPLO 2.2.2: Variáveis quantitativas contínuas: a) População: militares residentes na Vila Militar. Variável: idade (18, 18,5, 19,3333, ...). b) População: carga transportada por uma viatura. Variável: peso líquido (3/4ton, 1ton, 1,5ton, 5ton,....). c) População: peças produzidas por uma máquina. Variável: diâmetro externo (5mm, 3cm, 1,5m, ...). d) População: salários dos militares. Variável: descontos em contracheque (R$ 333,33, R$ 1.005,39, R$ 1234,56, ...).

Page 17: Domingues 2005 - Estatística Aplicada as Ciências Militares

17

Pelos exemplos apresentados, podemos perceber que os valores das variáveis discretas são obtidos mediante alguma forma de contagem, ao passo que os valores das variáveis contínuas resultam, em geral, de uma medição, sendo freqüentemente dados em alguma unidade de medida.

Outra diferença entre os dois tipos de variáveis quantitativas está na interpretação de

seus valores. Assim, a interpretação de um valor de uma variável discreta é dada exatamente por esse mesmo valor. Quando dizemos que um casal tem dois filhos, isso significa que o casal tem exatamente dois filhos.

A interpretação de um valor de uma variável contínua, ao contrário, é a de que se trata

de um valor aproximado. Isso decorre do fato de não existirem instrumentos de medida capazes de oferecer precisão absoluta, e, mesmo que existissem, não haveria interesse nem sentido em se querer determinar uma grandeza contínua com todas as suas casas decimais. Assim, ao executarmos a medição de algum valor de uma variável contínua, estamos sempre fazendo uma aproximação, resulta que qualquer valor apresentado de uma variável contínua deverá ser interpretado como uma aproximação compatível com o nível de precisão e com o critério utilizado ao medir.

EXEMPLO 2.2.3: Se o diâmetro externo de uma munição for dado por 7,62 mm,

deveremos considerar que o valor exato desse diâmetro será algum valor entre 7,615 e 7,625 mm, que foi aproximado para 7,62 mm devido ao fato de a precisão adotada na medida ser apenas de centésimos de milímetros.

Uma convenção útil adotada no presente texto é a de ser a precisão da medida

indicada automaticamente pelo número de casas decimais com que se escrevem os valores da variável. Assim, um valor 7,60 indica que a variável em questão foi medida com a precisão de centésimos, não sendo exatamente o mesmo que 7,6, valor correspondente a uma precisão de décimos.

Após observar as diferenças mencionadas entre as variáveis quantitativas discretas e

contínuas, o leitor poderá ficar surpreso ao verificar que as técnicas da Estatística Descritiva serão praticamente idênticas em ambos os casos. Isso se deve, no entanto, ao fato de, formalmente, os dados referentes a variáveis discretas ou contínuas serem análogos, pois os valores da variável contínua serão sempre apresentados dentro de um certo grau de aproximação. Assim, apenas na interpretação e descrição gráfica dos resultados é que haverá diferenças a serem consideradas, conforme veremos,

A Estatística Descritiva pode descrever os dados por meios de gráficos, distribuições

de freqüência ou medidas associadas a essas distribuições, conforme veremos a seguir.

2.3 TÉCNICAS DE DESCRIÇÃO GRÁFICA

O primeiro passo para se descrever graficamente um conjunto de dados observados é verificar as freqüências (quantas vezes o valor aparece na série) dos diversos valores existentes da variável.

Definimos a freqüência de um dado valor de uma variável (qualitativa ou quantitativa)

como o número de vezes que esse valor foi observado. Denotaremos a freqüência do i-ésimo valor observado por fi, sendo n o número total de elementos observados, verifica-se

Page 18: Domingues 2005 - Estatística Aplicada as Ciências Militares

18

imediatamente que o somatório de todas as freqüências individuais é igual ao número de observações:

�fi = n

A associação das respectivas freqüências a todos os diferentes valores observados define a distribuição de freqüências. Alternativamente, poderemos usar as freqüências relativas.

Definimos a freqüência relativa (ou proporção) de um dado valor de uma variável

(qualitativa ou quantitativa), como o quociente de sua freqüência pelo número total de elementos observados. Ou seja, denotando por fri a freqüência relativa ou proporção do i-ésimo elemento observado, temos:

fi fri = n

Onde:

�fri = 1 = 100/100 = 100% EXEMPLO 2.3.1: Se de 50 alunos (n) de um curso de pós-graduação 20 (fi) alunos

terminarem o curso com menção MB, poderemos dizer que: fri = 20/50 = .40 (freqüência relativa) ou 40,00% (percentagem), ou seja, 40,00% dos alunos terminaram o curso com menção MB 2.3.1 Descrição Gráfica de Variáveis Qualitativas

No caso de variáveis qualitativas, a descrição gráfica é muito simples, bastando computar as freqüências individuais ou freqüências relativas das diversas classificações existentes, elaborando, a seguir, um gráfico conveniente. Esse gráfico poderá ser um diagrama de barras, um diagrama circular ou outro qualquer tipo de diagrama equivalente.

EXEMPLO 2.3.2: Um grupo de 135 candidatos a vagas em um curso de pós-

graduação do Centro de Estudos de Pessoal, classificados segundo sua formação específica de graduação (arma/quadro/serviço), conforme a Tab. 1. As duas colunas referentes ao número de militares contêm, respectivamente as freqüências individuais (fi), as freqüências relativas (fri), e as porcentagens (%) em que a formação acadêmica se distribui entre esses candidatos.

Tabela 1 - Formação específica de militares por graduação.

Número de militares Formação fi fri % Infantaria 38 .2815 28,15 Cavalaria 30 .2222 22,22 Artilharia 35 .2593 25,93

Engenharia 15 .1111 11,11 Outros 17 .1259 12,59 Total 135 1.000 100,0%

A variável qualitativa considerada no presente exemplo é dada pela formação do candidato, e

as freqüências apresentadas formam uma distribuição de freqüências.

Page 19: Domingues 2005 - Estatística Aplicada as Ciências Militares

19

CANDIDATOS POR GRADUAÇÃO A UM CURSO DE PÓS-GRADUAÇÃO DO CEP

17

15

35

30

38

0 5 10 15 20 25 30 35 40

Outros

Engenharia

Artilharia

Cavalaria

InfantariaFO

RM

ÃO

AC

AD

ÊM

ICA

CANDIDATOS

Figura 2 - Diagrama de barras da formação específica de militares por graduação.

Esses dados podem ser graficamente representados de diversas formas.Na Fig. 2 eles

estão representados por meio de um diagrama de barras e, na Fig. 3, por um diagrama circular. A vantagem da representação gráfica está em possibilitar uma rápida impressão visual de como se distribuem as freqüências ou as freqüências relativas no conjunto de elementos examinados.

CANDIDATOS POR GRADUAÇÃO A UM CURSO DE PÓS-GRADUAÇÀO DO CEP

Engenharia11,1%

Outros12,6%

Infantaria28,1%

Artilharia25,9%

Cavalaria22,2%

Figura 3 - Diagrama circular da formação específica de militares por graduação.

Entretanto deve-se mencionar ainda a possibilidade de se considerarem distribuições

segundo outros critérios que não propriamente a freqüência individual ou a freqüência relativa das observações.

EXEMPLO 2.3.3: Tomemos as superfícies das cinco regiões geográficas que

compõem o Brasil, apresentadas na Tab. 2 conforme dados do Instituto Brasileiro de

Page 20: Domingues 2005 - Estatística Aplicada as Ciências Militares

20

Geografia e Estatística (IBGE).

Tabela 2 - Regiões geográficas do Brasil.

Região Superfície (km2) %

Norte 3.869.637,9 45,30

Centro-oeste 1.612.077,2 18,90

Nordeste 1.561.177,8 18,30

Sudeste 927.286,2 10,80

Sul 577.214,0 6,70

Total 8.547.393,1 100,00 Calculando-se as porcentagens correspondentes, pode-se construir o diagrama circular

apresentado na Fig. 4.

ÁREA TERRITORIAL NACIONAL CORRESPONDENTE A CADA REGIÃO DO BRASIL

45,30%

18,90%

18,30%

10,80%6,70%

Norte

Centro-oeste

Nordeste

Sudeste

Sul

Figura 4 - Diagrama circular da área territorial nacional – percentuais por regiões.

2.3.2 Descrição Gráfica de Variáveis Quantitativas Discretas

No caso das variáveis quantitativas discretas, a representação gráfica será também, normalmente, feita por meio de um diagrama de barras. A diferença em relação ao caso anterior está em que, sendo a variável quantitativa, seus valores numéricos podem ser representados num eixo de abscissas, o que facilita a representação. Note-se que, aqui, existe uma enumeração natural dos valores da variável, o que não havia no caso das variáveis qualitativas.

A construção do diagrama de barras é feita, desde que se disponha da tabela de

freqüências. Esta, por sua vez, pode ser facilmente construída se conhecemos todos os valores da variável no conjunto de dados. As barras do diagrama podem ser verticais ou horizontais conforme a disposição das variáveis nos eixos cartesianos.

EXEMPLO 2.3.4: Vamos, a titulo de exemplo, representar graficamente o conjunto

dado a seguir, constituído hipoteticamente por vinte valores da variável “ número de erros de decriptografia” obtidos a partir de mensagens recebidas em um centro de mensagens. Sejam os seguintes os valores obtidos:

Page 21: Domingues 2005 - Estatística Aplicada as Ciências Militares

21

2 4 2 1 2

3 1 0 5 1

0 1 1 2 0

1 3 0 1 2

Usando xi para designar os diferentes valores da variável, podemos construir a distribuição de freqüências dada na Tab. 3.

Tabela 3 - Distribuição de freqüências de erros de decriptografia por mensagem.

xi fi

0 4

1 7

2 5

3 2

4 1

5 1

�fi= 20

Por meio das fi elaboramos o diagrama de barras correspondente, dado pela Fig. 5.

ERROS DE DECRIPTOGRAFIA AVALIADAS 20 MENSAGENS

4

7

5

21 1

012345678

0 1 2 3 4 5

NÚMERO DE ERROS

No

Figura 5 - Diagrama de barras para freqüências de erros de decriptografia por mensagem.

EXEMPLO 2.3.5: Caso o interesse fosse pela representação gráfica das

freqüências relativas da Tab. 3 poderíamos representá-la conforme a Tab. 4, a partir da qual elaboraríamos o diagrama de barras correspondente, dado pela Fig. 6.

Page 22: Domingues 2005 - Estatística Aplicada as Ciências Militares

22

Tabela 4 - Distribuição fri dos erros de decriptografia por mensagem.

Por meio das fri elaboramos o diagrama de barras correspondente, dado pela Fig. 6.

ERROS DE CRIPTOGRAFIA POR MENSAGEM

20,0%

35,0%

25,0%

10,0%

5,0% 5,0%

0,0%

10,0%

20,0%

30,0%

40,0%

0 1 2 3 4 5

NÚMERO DE ERROS

Figura 6 - Diagrama de barras para freqüências relativas de decriptografia por mensagem.

O diagrama de barras, conforme já mencionamos, mostra a distribuição das

freqüências no conjunto de dados. Tratando-se de variáveis quantitativas, uma outra forma de representação gráfica é

baseada nas freqüências acumuladas (Fi). A freqüência acumulada, em qualquer ponto do eixo das abscissas, é definida como a soma das freqüências de todos os valores menores ou iguais ao valor correspondente a esse ponto. Analogamente, teríamos as freqüências relativas acumuladas (Fri).

Fi=�fi e Fri=�fri

EXEMPLO 2.3.6: Voltando ao EXEMPLO 2.3.5 pode-se verificar que as

freqüências acumuladas (Fi) e as freqüências relativas acumuladas (Fri), correspondentes aos valores notáveis da variável, são as dadas na Tab. 5.

xi fi fri

0 4 .200

1 7 .350

2 5 .250

3 2 .100

4 1 .050

5 1 .050

�fi= 20 �fri= 1

Page 23: Domingues 2005 - Estatística Aplicada as Ciências Militares

23

ERROS DE CRIPTOGRAFIA POR MENSAGEM

4

11

1618

1920

0

5

10

15

20

25

0 1 2 3 4 5

NÚMERO DE ERROS

F i

ERROS DE CRIPTOGRAFIA POR MENSAGEM

55,0%

80,0%

90,0%95,0%

100,0%

20,0%

0,0%

20,0%

40,0%

60,0%

80,0%

100,0%

0 1 2 3 4 5

NÚMERO DE ERROS

F ri

Tabela 5 - Distribuição Fi e Fri dos erros de decriptografia por mensagem.

xi fi Fi fri Fri

0 4 4 .200 .200

1 7 11 .350 .550

2 5 16 .250 .800

3 2 18 .100 .900

4 1 19 .500 .950

5 1 20 .500 1.000

� 20 - 1 -

A partir da Tab. 5 pode-se construir o gráfico das freqüências acumuladas (Fig. 7) e o gráfico das freqüências relativas acumuladas, (Fig. 8).

Figura 7 - Freqüências acumuladas dos erros de

decriptografia em 20 mensagens.

Figura 8 - Freqüências relativas acumuladas dos erros de decriptografia em 20 mensagens.

De acordo com a Fig. 7 pode-se identificar que 4 mensagens não contêm erro de

decriptografia, 11 mensagens contêm até um erro de decriptografia, 16 mensagens contêm até 2 erros de decriptografia, e assim por diante.

Da mesma forma, de acordo com a Fig. 8 pode-se identificar que apenas 20,00% das

mensagens não contêm erro de decriptografia, 55,00% das mensagens contêm até um erro de decriptografia, 90,00% das mensagens contêm até 3 erros de decriptografia, e assim por diante.

2.3.3 Descrição Gráfica de Variáveis Quantitativas Contínuas

No caso das variáveis quantitativas contínuas, o procedimento até a obtenção da tabela

de freqüências pode ser análogo ao visto no caso anterior. Entretanto o diagrama de barras não mais se presta à correta representação da distribuição de freqüências, devido à natureza contínua da variável.

EXEMPLO 2.3.7: Tomemos uma amostra constituída por 25 valores da variável

diâmetro (mm) de peças produzidas por uma máquina:

Page 24: Domingues 2005 - Estatística Aplicada as Ciências Militares

24

21,5 21,4 21,8 21,5 21,6 21,5 21,9 21,6 21,3 21,5 21,7 21,6 21,4 21,2 21,7 21,4 21,5 21,6 21,9 21,5 21,3 21,5 21,7 21,4 21,4

A Tab. 6 apresenta esses mesmos dados organizados por freqüências.

Tabela 6 - fi, fri, Fi e Fri do diâmetro de peças produzidas por uma máquina.

Classe (i) Medida (xi) fi Fi fri Fri

21,15�21,25 21,2 10 10 .040 .040

21,25�21,35 21,3 23 33 .092 .132

21,35�21,45 21,4 47 80 .188 .320

21,45�21,55 21,5 70 150 .280 .600

21,55�21,65 21,6 38 188 .152 .752

21,65�21,75 21,7 32 220 .128 .880

21,75�21,85 21,8 12 232 .048 .928

21,85�21,95 21,9 18 250 .072 1.000

�= - 250 - 1,00 -

Ao passarmos à representação gráfica, porém, devemos lembrar a correta interpretação dos valores das variáveis contínuas. Assim, por exemplo, sabemos que a freqüência 5 associada ao valor 21,4 significa, na verdade, que temos cinco valores compreendidos entre os limites 21,35 e 21,45, que foram aproximados, no processo de medição, para 21,4. Logo, uma representação gráfica correta deverá associar a freqüência 5 ao intervalo 21 ,35�2 1,45.

Isso se faz por meio de uma figura formada com retângulos cujas áreas representam as

freqüências dos diversos intervalos existentes. Tal figura chama-se histograma e é apresentada na Fig. 9.

DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA

0

10

20

30

40

50

60

70

80

mm

fi

Figura 9 - Histograma das medidas do diâmetro de peças produzidas por uma máquina

(representação pelas classes).

21,15 21,35 21,45 21,55 21,25 21,65 21,65 21,85 21,95

Page 25: Domingues 2005 - Estatística Aplicada as Ciências Militares

25

Vemos que, no caso das variáveis contínuas, as freqüências serão, na verdade, associadas a intervalos de variação da variável e não a valores individuais. A tais intervalos chamaremos classes de freqüências. As classes de freqüências são comumente representadas pelos seus pontos médios, conforme a Fig. 10.

DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA

0

10

20

30

40

50

60

70

80

21,2 21,3 21,4 21,5 21,6 21,7 21,8 21,9mm

fi

Figura 10 - Histograma das medidas do diâmetro de peças produzidas por uma máquina

(representação pelos pontos médios das classes).

Uma outra representação gráfica que, como o histograma, pode ser feita no caso de variáveis contínuas é dada pelo polígono de freqüências, que se obtêm unindo-se os pontos médios dos patamares. Para completar a figura, consideram-se duas classes laterais com freqüência nula.

Uma exceção bastante comum a essa regra aparece no caso de variáveis essencialmente positivas cujo histograma se inicia no valor zero, pois não haveria sentido em se considerar um intervalo com valores negativos. Na Fig. 11 temos o polígono de freqüências correspondente ao histograma da Fig. 10.

DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA

0

10

20

30

40

50

60

70

80

21,2 21,3 21,4 21,5 21,6 21,7 21,8 21,9mm

fi

Figura 11 - Polígono de freqüências das medidas do diâmetro de peças produzidas por uma máquina.

Page 26: Domingues 2005 - Estatística Aplicada as Ciências Militares

26

Pode-se ainda construir o polígono de freqüências acumuladas, traçado a partir dos valores das Fi ou Fri, que são atribuídas ao limite superior das mesmas, conforme apresentados nas Fig.12a e Fig. 12b, baseadas nos dados da Tab. 6.

DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA

0255075

100125150175200225250275

21,15 21,25 21,35 21,45 21,55 21,65 21,75 21,85 21,95

mm

Fi

DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA

00,10,20,30,40,50,60,70,80,9

11,1

21,15 21,25 21,35 21,45 21,55 21,65 21,75 21,85 21,95

mm

Fri

Figura 12a - Ogiva de Galton (Fi) dos diâmetros de

peças produzidas por uma máquina. Figura 12b - Ogiva de Galton (Fri) dos diâmetros

de peças produzidas por uma máquina. Caso uma peça, para ser aprovada, não pudesse medir menos que 21,65mm, por meio

da Ogiva de Galton Fi (Fig. 12a) podemos notar que 188 peças estariam fora das especificações.Se as peças produzidas não pudessem medir 21,55mm ou mais, por meio da Ogiva de Galton Fri (Fig. 12b) é possível notar que 60,00% das peças estariam aprovadas.

No exemplo anterior vimos que, no caso das variáveis contínuas, a consideração de

classes de freqüências é fundamental para a correta representação gráfica. Naquele exemplo as classes consideradas tinham por pontos médios os próprios valores originais do conjunto de dados disponíveis, o que foi suficiente para a obtenção de uma representação gráfica satisfatória.

Muitas vezes, entretanto, uma representação satisfatória dos dados somente é

conseguida pelo seu agrupamento em classes de freqüências que englobam diversos valores da variável. A freqüência de cada classe será, nesse caso, igual à soma das freqüências de todos os valores existentes dentro da classe (esse procedimento também pode ser aplicado no caso de variáveis discretas, a fim de se obter uma representação mais conveniente).

O procedimento descrito corresponde a uma diminuição proposital da precisão com

que os dados foram computados. Ou seja, propositalmente deixamos de lado uma parcela da informação contida nos dados originais, tendo em vista obter uma representação mais adequada.

O problema prático a resolver, em tais casos, é o de determinar qual o número de

classes a constituir, qual o tamanho ou amplitude dessas classes e quais os seus limites. Usaremos a seguinte notação:

n: número total de dados disponíveis; k: número de classes; AT: amplitude total da distribuição de freqüência (Lmax – lmin); Lmax: maior valor da distribuição de freqüências;

Page 27: Domingues 2005 - Estatística Aplicada as Ciências Militares

27

lmin: menor valor da distribuição de freqüências; h: amplitude do intervalo de classes, diferença entre os limites (Li – li) Li: limite máximo da classe (normalmente aparente); li: limite mínimo da classe (valor real);

A questão do número de classes é teoricamente controvertida. Diversos autores

apresentam soluções diferentes. Entretanto, com um pouco de bom-senso e experiência, chega-se sem grande dificuldade a valores satisfatórios para k, h, e para os limites das classes.

Procedimento para determinação de k e h

(1) Para definição do número de classes adotaremos a fórmula proposta por Sturges.

k = 1+3,3 . log n

(2) Definição da a amplitude total

AT = Lmax – lmin

(3) Definição da amplitude de classe por meio de k e da AT

AT h= k

A amplitude das classes não deverá ser fracionária em relação à precisão com que os dados são apresentados, pois isso impossibilitaria uma correta subdivisão em classes.

Notemos também que os limites das classes são, muitas vezes, apresentados sob

formas que não correspondem ao significado real dos valores contidos na classe.Dizemos, então, que temos limites aparentes. Em tais casos, pode ser conveniente a determinação dos limites reais das classes.

EXEMPLO 2.3.8: Tomemos o conjunto de valores a seguir, relativos ao número de

repetições do exercício remador executado por n = 50 soldados, apresentados em forma de ROL (dados brutos obtidos, organizados em ordem crescente ou decrescente) abaixo:

ROL do número de repetições do exercício remador

41 43 44 46 46 48 48 48 49 49 50 50 50 51 51 51 51 53 53 53 53 53 54 54 54 54 54 54 55 55 55 55 55 56 56 57 57 58 59 61 61 62 62 63 64 64 65 67 68 71

É fácil verificar que a distribuição de freqüências diretamente obtida a partir desses

dados seria dada por uma tabela razoavelmente extensa. A representação gráfica dessa distribuição, apresentada na Fig. 13 deixa de ser conveniente para esses dados.

Page 28: Domingues 2005 - Estatística Aplicada as Ciências Militares

28

RESULTADO OBTIDO POR 50 SOLDADOS NO EXERCÍCIO REMADOR

01234567

41 43 44 46 48 49 50 51 53 54 55 56 57 58 59 61 62 63 64 65 67 68 71

Nr de repetições

Nr

Figura 13 - Gráfico de colunas do resultado obtido por 50 soldados no exercício remador (1) Determinando k

k = 1+3,3 . log n

k = 1+3,3 . log 50

k = 1+3,3 . 1,699

k = 6,61 (6 ou 7?)

Para que se acomodem os dados, de acordo com o intervalo de classe mais conveniente, o valor de k pode ser adequado de acordo com AT.

(2) Determinando AT

AT = Lmax – lmin

AT = 71 – 41

AT = 30

(3) Determinando h (amplitude de classe)

AT h= k

Para k = 6 Para k = 7

30 30 h1 = 6 h2 = 7

h1 = 5 h2 = 4,29

(4) Conclusão

Utilizamos k = 6, pois com 6 classes o intervalo de classes é inteiro h1 = 5 o que facilita a classificação dos dados em suas respectivas classes.

A Tab 7 apresenta os limites das classes e suas respectivas freqüências de três

maneiras equivalentes. As duas primeiras são formas usualmente empregadas e correspondem a limites aparentes. A terceira indica os limites reais dessas classes. O importante é não haver dúvida quanto a que classe cada elemento pertence.

Page 29: Domingues 2005 - Estatística Aplicada as Ciências Militares

29

Tabela 7 - Agrupamento em classes de freqüências do resultado obtido por 50 soldados no exercício remador.

Classes Limites aparentes Limites reais

Primeira notação Segunda notação

Ponto médio

(xi) fi

40 45 40 � 44 39,5 � 44,5 42.5 3 45 50 45 � 49 44,5 � 49,5 47.5 8 50 55 50 � 54 49,5 � 54,5 52.5 16 55 60 55 � 59 54,5 � 59,5 57.5 12 60 65 60 � 64 59,5 � 64,5 62.5 7 65 70 65 � 69 64,5 � 69,5 67.5 3 70 75 70 � 74 69,5 � 74,5 70.5 1

�= 50

O histograma e o polígono de freqüências, correspondentes ao agrupamento feito, são dados na Fig. 14 Vemos que essa representação gráfica é muito mais apropriada do que a anteriormente obtida.

Figura 14 - Representação gráfica dos dados agrupados.

Muitas vezes, o polígono de freqüências obtido sugere o traçado de uma curva

contínua.Em outras palavras, se os dados provém de uma amostra, eles estão sugerindo qual seria, aproximadamente, a distribuição da população, para a qual poderíamos adotar algum modelo ideal de distribuição. Um modelo freqüentemente usado é o da Distribuição Normal, estudada pelo Cálculo de Probabilidades conforme apresentado no capítulo 3.

2.4 CARACTERÍSTICAS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS

Além da descrição gráfica, muitas vezes é necessário sumariar certas características

das distribuições de freqüências por meio de certas quantidades, que iremos estudar a seguir. Tais quantidades são usualmente denominadas de medidas da distribuição de freqüências, por procurarem quantificar alguns de seus aspectos de interesse. Temos assim, as chamadas medidas de posição, de dispersão, de assimetria e de curtose.

As medidas de posição e de dispersão são as mais importantes, servindo para localizar

RESULTADOS DO EXERCÍCIO REMADOR

0

5

10

15

20

42.5 47.5 52.5 57.5 62.5 67.5 70.5

Repetições

Nr

Page 30: Domingues 2005 - Estatística Aplicada as Ciências Militares

30

as distribuições e caracterizar sua variabilidade, tendo grande aplicação em problemas de Estatística Indutiva. As medidas de assimetria e de achatamento ajudam a caracterizar a forma das distribuições. 2.4.1 Medidas de Posição

As medidas de posição servem para localizar a distribuição de freqüências sobre o eixo de variação da variável em questão. As principais medidas de posição são: a média, a mediana, a moda, os quartis e os percentis.

A média e a mediana indicam, por critérios diferentes, o centro da distribuição de freqüências. Por essa razão, costuma-se dizer também que são medidas de tendência central.

A moda indica a região de maior concentração de freqüências na distribuição. Os quartis (Q1, Q2, Q3) dividem o conjunto ordenado de valores em quatro

subconjuntos com igual número de elementos (25% dos elementos da seqüência). Pode haver o interesse em dividir a seqüência de dados em dez partes iguais, para

tanto utilizamos os decis (não abordados neste manual por tratarem-se de um tipo particular de percentis). Os percentis por sua vez dividem a distribuição de freqüência em cem partes iguais (note que: D1 = P10; D2 = P20; D3 = P30; D4 = P40; D5 = P50; D6 = P60; D7 = P70; D8 = P80; e D9 = P90).

2.4.1.1 Média ( X )

A média de uma distribuição de freqüências é o valor obtido quando todos os dados

observados são somados e divididos pelo número de observações.

Normalmente utiliza-se a média aritmética (quando os resultados dispostos em tabela primitiva ou ROL), ou a média ponderada (quando os resultados estão categorizados em uma tabela de freqüências)

Sendo xi (i = 1,2,...,n) os valores da variável, a média aritmética pode ser calculada pela seguinte fórmula:

�xi X= n

EXEMPLO 2.4.1: Utilizando os dados do Rol apresentado no EXEMPLO 2.3.7,

calcular a média aritmética do número de abdominais realizadas por 50 soldados.

41 + 43 + 46 + 46 + ...+ 71 X= 50

X= 54,62 = 55

Poderíamos dizer que "em média", os soldados executaram 55 abdominais. Notemos que X . ni = total de abdominais executadas pelos 50 soldados, ou seja, 2731.

~

Page 31: Domingues 2005 - Estatística Aplicada as Ciências Militares

31

Sendo xi (i = 1,2,...,n) os valores médios de cada intervalo de classe e fi a respectiva freqüência de observações, a média ponderada pode ser calculada pela seguinte fórmula:

�fi xi X= n

Onde: xi= ponto médio da classe fi= freqüência de cada classe n= número de observações Considerando uma distribuição por classes de freqüências, podemos definir sua média

como o valor obtido, substituindo os xi pelos pontos médios das classes e considerando as fi corno as respectivas freqüências (ou freqüências relativas, se for o caso). A média assim calculada para os dados agrupados em classes deverá ser aproximadamente igual à média aritmética exata dos ni dados originais.

EXEMPLO 2.4.2: Para o cálculo da média ponderada tomemos os resultados de

25 soldados no teste de 12 minutos de corrida contínua, apresentados na Tab 8.

Tabela 8 – Teste de 12 minutos de corrida contínua

Resultados em Km (xi) fi fixi 2,1 2,3 2,2 1 2,2 2,3 2,5 2,4 2 4,8 2,5 2,7 2,6 5 13,0 2,7 2,9 2,8 7 19,6 2,9 3,1 3,0 4 12,0 3,1 3,3 3,2 3 9,6 3,3 3,5 3,4 1 3,4 3,5 3,7 3,6 2 7,2

�= - 25 71,8 71,8

X= 25

X= 2,872

Poderíamos dizer que os soldados correram, em média, 2,872 Km em 12 minutos. Dentre as propriedades da média, podemos destacar as seguintes: a. multiplicando-se todos os valores de uma variável por uma constante, a média do

conjunto fica multiplicada por essa constante; b. somando-se ou subtraindo-se uma constante a todos os valores de uma variável, a

média do conjunto fica acrescida ou diminuída dessa constante.

Utilizando as propriedades citadas, podemos introduzir simplificações no cálculo da média, o que será particularmente útil se os valores xi forem elevados e o cálculo precisar ser

Page 32: Domingues 2005 - Estatística Aplicada as Ciências Militares

32

feito manualmente. Como hoje é muito comum dispor-se de calculadoras eletrônicas ou softwares que realizam esses cálculos, não nos preocuparemos com essa questão. 2.4.1.2 Mediana ( Md )

A mediana é calculada com base na ordenação das ni observações que formam o conjunto de dados, sendo definida como o valor que divide a série estatística ao meio, neste sentido, 50%dos valores serão menores ou iguais, e 50%dos valores serão maiores ou iguais ao seu valor.

A mediana é geometricamente interpretada como ponto tal que uma vertical por ele

traçada divide a área sob o histograma em duas partes iguais. Para variáveis discretas com n impar, a Md é igual ao valor de ordem (n + 1)/2

(n + 1) Md= 2

EXEMPLO 2.4.3: Dados os valores:

35 36 37 38 40 40 41 43 46

(9 + 1) Md= 2 Md = 5º elemento

Isto quer dizer que a Md possui o valor de x5 , ou seja, Md = 40. Notemos que o x5 (40), é o valor que divide a série estatística ao meio, 50% dos

valores são menores ou iguais a 40, e 50%dos valores serão maiores ou iguais a 40.

Para variáveis discretas com n par, a Md é igual ao valor médio entre o de ordem n/2 e o de ordem (n/2) + 1.

n/ 2< Md < (n/ 2) +1 ou seja xn/2 + x(n/2) + 1 2

EXEMPLO 2.4.4: Dados os valores:

12 14 14 15 16 16 17 20

8/ 2< Md < (8/ 2) +1

4º< Md < 5º

Isto quer dizer que a Md possui o valor médio entre o 4° e o 5° elemento da série, logo:

Md =(15+16)/2 Md =15,5

Notemos que 15,5 é o valor que divide a série estatística ao meio, muito embora por vezes não tenha um significado real para a variável, ele nos dá uma noção de posicionamento dos demais valores.

Page 33: Domingues 2005 - Estatística Aplicada as Ciências Militares

33

Considerando, agora, uma distribuição em classes de freqüências, podemos calcular um valor para sua mediana pela expressão:

( p` – Fant) �fi Md= l + fi . h tal que p`= 2

Onde: l: limite inferior da classe que contém a Md p`: número que define a posição em que se encontra a Md (classe que contém a Md) �fi: número de elementos do conjunto de dados Fant: freqüência acumulada da classe anterior à classe que contém a Md h: amplitude da classe que contém a Md fi: freqüência da classe que contêm a Md

EXEMPLO 2.4.5: Tomemos novamente os dados do EXEMPLO 2.4.2,

apresentados na Tab. 9.

Tabela 9 – Teste de 12 minutos de corrida contínua

Resultados em Km (xi) fi Fi 2,1 2,3 2,2 1 1 2,3 2,5 2,4 2 3 2,5 2,7 2,6 5 8 2,7 2,9 2,8 7 15 2,9 3,1 3,0 4 19 3,1 3,3 3,2 3 22 3,3 3,5 3,4 1 23 3,5 3,7 3,6 2 25

�= - 25

�fi 25 p`= 2 + 2 = 12,5

(p` – Fant) Md= l + f . h

(12,5 – 8) Md= 2,7 + 7 . 0,2

Md = 2,829 A mediana pode ser usada como alternativa, em relação à média, para caracterizar o

centro do conjunto de dados. Em certos casos, efetivamente, seu uso é mais conveniente, Por exemplo, no caso de distribuições de rendas, a mediana é, em geral, melhor indicador central que a média, pois não sobre a influência de valores extremos. Como ilustração, imaginemos um conjunto de doze pessoas com as seguintes rendas mensais (R$):

2.500 2.700 3,000 3.200 3.300 4.200 4,800 5.000 5.500 6.000 7.000 80.000

A média desses doze valores é 10.600, ao passo que a mediana é 4.500. Vemos, nesse caso, que a mediana fornece uma melhor idéia do centro da distribuição, pois não foi

Classe que contém Md

Page 34: Domingues 2005 - Estatística Aplicada as Ciências Militares

34

influenciada pelo valor extremo 80.000. Parece lógico que uma renda mensal de R$ 4.500 mos demais valores.

2.4.1.3 Moda ( Mo )

Definimos moda como o valor de maior freqüência em uma série estatística, ou como o valor que mais se repete em uma distribuição de freqüências.

No caso de distribuições de freqüências em classes de mesma amplitude, é comum

definir-se também a moda como um ponto pertencente á classe modal, dado por:

�1 �1 = fmo – fant Mo = l + �1+ �2 . h tal que

�2 = fmo – fpost Onde: l: limite inferior da classe que contém a Mo; fmo: freqüência da classe que contêm a Mo(classe modal); fant: freqüência da classe anterior à classe que contêm a Mo; fpost: freqüência da classe posterior à classe que contêm a Mo; e h: amplitude da classe que contém a Mo.

EXEMPLO 2.4.6: Para o cálculo da moda tomemos, por exemplo, os dados

EXEMPLO 2.4.2: apresentados na Tab. 10.

Tabela 10 – Teste de 12 minutos de corrida contínua

Resultados em Km (xi) fi Fi 2,1 2,3 2,2 1 1 2,3 2,5 2,4 2 3 2,5 2,7 2,6 5 8 2,7 2,9 2,8 7 15 2,9 3,1 3,0 4 19 3,1 3,3 3,2 3 22 3,3 3,5 3,4 1 23 3,5 3,7 3,6 2 25

�= - 25 Identificada a classe modal:

�1 = fmo – fant = 7 – 5 = 2

�2 = fmo – fpost = 7 – 4 = 3

�1 Mo = l + �1+ �2 . h

2 Mo = 2,7 + 2+ 3 . 0,2

Mo = 2,78

Classe que contém Mo

Page 35: Domingues 2005 - Estatística Aplicada as Ciências Militares

35

Relação empírica entre média, mediana e moda A seguinte relação empírica em geral subsiste aproximadamente para os conjuntos de

dados observados:

X – Mo = 3( X – Md)

Essa expressão pode ser apresentada sob diversas formas e indica geometricamente que a mediana situa-se entre a média e a moda, sendo sua distância à moda o dobro de sua distância à média. Sua verificação na prática tende a ser mais perfeita quanto maior for o conjunto dados, e quando a moda for calculada com base em dados agrupados por classes.

2.4.1.4 Quartis (Q) e Percentis (P)

A idéia de mediana, como vimos, é a de dividir o conjunto ordenado de dados em dois

subconjuntos com igual número de elementos. Essa idéia pode ser generalizada.

Como dito anteriormente, os quartis (Q1, Q2, Q3), dividem um conjunto ordenado de valores em quatro subconjuntos com igual número de elementos. Sua determinação seria feita de modo semelhante á da mediana. O segundo quartil (Q2), obviamente, é a própria mediana.

Se a mediana divide a distribuição de freqüências ao meio, os quartis dividem a

dividem em 1/4 e 3/4, ou seja:

25% dos valores < Q1 < 75% dos valores

75% dos valores < Q3 < 25% dos valores

12 14 14 15 16 16 17 20

Os valores dos quartis também podem ser obtidos em distribuições contínuas, de acordo com a fórmula dos percentis (fórmula genérica para este tipo de medida de posição):

( p` – Fant) c . �fi P = l + fi . h tal que p`= 100

Onde: l: limite inferior da classe que contém a posição desejada; p`: posição em que se encontra o percentil (classe que contém a P); �fi: número de elementos do conjunto de dados; Fant: freqüência acumulada da classe anterior à classe que contém o P; h: amplitude da classe que contém o P; fi: freqüência da classe que contêm o P; e c: valor do percentil que se deseja obter.

Para obtermos o valor que divide uma distribuição de freqüências, sendo que 15% dos valores sejam menores ou iguais a este valor, então deveríamos calcular P15, logo c=15

Sabemos que Q1 é o valor que divide a distribuição de freqüências em 25% e 75%, então podemos concluir que o valor de Q1 = P25, logo c=25

Sabemos que Q3 é o valor que divide a distribuição de freqüências em 75% e 25%, então podemos concluir que o valor de Q3 = P75, logo c=25

Q1 =14 Md =15,5 Q3 =16,5

Page 36: Domingues 2005 - Estatística Aplicada as Ciências Militares

36

2.4.2 Medidas de Dispersão

As informações fornecidas pelas medidas de posição podem ser insuficientes para compararmos e classificarmos as séries estatísticas quanto a sua homogeneidade, dispersão ou afastamento dos dados.

As medidas de dispersão surgem como instrumento para indicar o quanto os dados se

apresentam dispersos em torno da região central (medida de posição), caracterizando, portanto, o grau de variação existente no conjunto de valores.

As principais medidas de dispersão são: a amplitude total, a variância, o desvio-

padrão e o coeficiente de variação.

2.4.2.1 A Amplitude Total (AT)

A amplitude total, já mencionada no item 2.2.3, é definida como a diferença entre o maior e o menor valores do conjunto de dados:

AT = Lmax – lmin

É claro que o valor de AT está relacionado com a dispersão dos dados. Entretanto, por depender de apenas dois valores do conjunto de dados, a amplitude total contém relativamente pouca informação quanto à dispersão. Salvo aplicações no controle da qualidade, a amplitude total não é muito utilizada como medida de dispersão.

2.4.2.2 A Variância (S2)

A variância é a média dos quadrados das diferenças dos valores em relação à sua própria média, e para dados ordenados em tabelas primitivas ou ROL é dada por:

�(xi – X) 2 S2 = n-1

Notemos que xi – X corresponde ao desvio que cada elemento possui em relação à média, e que utilizamos o artifício matemático de elevarmos esta diferença ao quadrado [(xi – X)² ] , pois caso contrário o somatório teria o valor zero [�(xi – X)=0], tornando sem sentido a fórmula matemática.

Analogamente ao cálculo da média, se os dados constituírem uma distribuição por

classes de freqüências, poderemos calcular sua variância pela expressão abaixo, onde xi são os pontos médios das classes e fi as respectivas freqüências.

�(xi – X) 2 . fi S2 = n-1

EXEMPLO 2.4.7: Calcule a variância de um conjunto pequeno de dados, formado

pelos 20 valores, conforme o Rol abaixo, e apresentado na Tab. 11:

10 10 10 11 11 11 11 12 12 12 12 12 12 13 13 13 13 14 14 14

Page 37: Domingues 2005 - Estatística Aplicada as Ciências Militares

37

Tabela 11. Cálculo da variância (s2)

xi fi fixi xi – X (xi – X )² (xi – X )²fi

10 3 30 -2 4 12

11 4 44 -1 1 4

12 6 72 0 0 0

13 4 52 1 1 4

14 3 42 2 4 12

�= 20 240 0 10 32

X= 240/20=12

�(xi – X) 2fi S2 = n-1

32 S2 = 19

S2 = 1,684

Utilizamos o exemplo da Tab.11 para demonstrar que a variância é oriunda dos

desvios de cada elemento (ou ponto médio de classe), em relação à média da série estatística. No entanto, esta fórmula refere-se ao fato de se estar calculando a variância de uma

amostra, incluindo-se n – 1 como fator de correção, caso se deseje calcular a variância populacional (�2), conhecido N e a média populacional µ deve-se utilizar a fórmula abaixo:

�(xi – µ) 2 �2 =

N A variância tem, entre outras, as seguintes propriedades:

a. multiplicando-se todos os valores de uma variável por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante;

b. somando-se ou subtraindo-se uma constante a todos os valores de uma variável a variância não se altera.

A importância de estudarmos a variância dos dados está no fato da possibilidade de

compararmos distribuições amostrais e populacionais. Neste sentido, quanto maior a variância, menor será a concentração dos dados em torno da média. Por outro lado, quanto menor a variância, mais homogênia será a distribuição de freqüências.

A variância é uma medida de dispersão extremamente importante na teoria estatística. Do ponto de vista prático, ela tem o inconveniente de se expressar uma unidade quadrática em relação à da variável em questão, o que nem sempre faz sentido. Esse inconveniente é sanado com a definição do desvio padrão, que é a raiz quadrada da variância .

Page 38: Domingues 2005 - Estatística Aplicada as Ciências Militares

38

2.4.2.3 O Desvio-Padrão (S)

Definiremos o desvio-padrão como a raiz quadrada positiva da variância. Sendo expresso na mesma unidade da variável, ele é mais realístico para efeito da comparação de dispersões e juntamente com a média possibilita uma visão mais consistente a respeito da homogeneidade da série estatística.

O desvio-padrão é notado da seguinte forma:

�(xi – X ) 2fi s =

n – 1 EXEMPLO 2.4.8: Uma amostra de 100 projeteis do calibre 7,62mm foram

retirados de uma linha de produção. Calcular o desvio-padrão do diâmetro das munições produzidas:

Tabela 12. Cálculo do desvio-padrão do diâmetro de munições

Classes xi fi fixi (xi – X ) 2fi 7,613�7,615 7,614 1 7,614 0,000036 7,615�7,617 7,616 14 106,624 0,000224 7,617�7,619 7,618 20 152,360 0,000080 7,619�7,621 7,620 30 228,600 0,000000 7,621�7,623 7,622 20 152,440 0,000080 7,623�7,625 7,624 14 106,736 0,000224 7,625�7,627 7,626 1 7,626 0,000036

�= - 100 762,000 0,00068

X= 762,000/100=7,62

0,00068 S =

100 – 1

S = 0,00262

Interpretação do desvio-padrão

Aliado à média, o desvio-padrão permite a representação de extensas séries estatísticas com apenas 2 medidas síntese. Para tal, é necessário que a distribuição de freqüências seja normal (modelo teórico apresentado no Cap 4).

Por ora, tomaremos as seguintes relações:

X + S contém 68,26% dos dados da série

X + 2S contém 95,44% dos dados da série

X + 3S contém 99,74% dos dados da série Logo, Aproximadamente 68% das peças produzidas possuem diâmetro que varia entre

7,617 e 7,623mm, 95% entre 7,615 e 7,625mm, e 99% entre 7,612 e 7,628mm. À medida que o tamanho da amostra aumentar, a representação gráfica da série

estatística “ diâmetro dos projeteis produzidos por uma máquina” tenderá a apresentar as

Page 39: Domingues 2005 - Estatística Aplicada as Ciências Militares

39

características da Fig. 15.

Figura 15 – Interpretação do desvio padrão.

2.4.2.4 O Coeficiente de Variação (Cv)

O coeficiente de variação é definido como o quociente entre o desvio-padrão e a

média, sendo freqüentemente expresso em porcentagem:

S Cv =

X

A vantagem desta medida síntese é caracterizar a dispersão dos dados em termos relativos a seu valor médio, permitindo-se comparar séries estatísticas entre si. Quanto maior for o coeficiente de variação, maior será a dispersão dos dados em relação à média, e conseqüentemente, menos homogênia será a série estatística.

EXEMPLO 2.4.9: Utilizando os dados do EXEMPLO 2.4.8 temos:

0,00262 Cv1 =

7,62

Cv1 = 0,0003438 ou 0,034% Supondo que outra máquina avaliada, produzisse peças com diâmetro médio X = 7,62

mm, e desvio-padrão S = 0,00462mm:

0,00462 Cv2 =

7,62

Cv2 = 0,0006063 ou 0,061% Note que Cv2 > Cv1 (0,0 61% > 0,034%). Pode-se afirmar que a segunda máquina é

menos precisa que a primeira, pois,

Page 40: Domingues 2005 - Estatística Aplicada as Ciências Militares

40

2.4.3 Medidas de Assimetria Essas medidas procuram caracterizar como e quanto a distribuição de freqüências se afasta da condição de simetria. As distribuições alongadas à direita são ditas positivamente assimétricas, e as alongadas à esquerda, negativamente assimétricas. As medidas de assimetria, conforme sejam positivas, negativas ou aproximadamente nulas, procuram indicar o tipo de distribuição quanto a esse aspecto. Nas Fig. 16a e Fig.16b são mostrados dois tipos de assimetria.

RESULTADO DO 1º TESTE DE APTIDÃO FÍSICA DE RECRUTAS DE UM BATALHÃO DE INFANTARIA

020406080

100120140

I R B MB E

Conceitos

Nr

Figura 16a - Assimetria positiva

RESULTADO DO 1º TESTE DE APTIDÃO DE TIRO DE RECRUTAS DE UM BATALHÃO DE INFANTARIA

0

2040

60

80

100120

140

I R B MB EConceito

Nr

Figura 16b - Assimetria negativa

Para a caracterização do poder da assimetria utiliza-se o coeficiente de assimetria de

Pearson (A), definido como segue:

3(X – Md) A= S

Relação Classificação �A�< 0,15 Praticamente simétrica

0, 15 < �A� < 1 Moderadamente assimétrica �A�> 1. Fortemente assimétrica

Quadro 2 - Classificação da assimetria.

Page 41: Domingues 2005 - Estatística Aplicada as Ciências Militares

41

EXEMPLO 2.4.9: Consideremos os conceitos obtidos por 3 SU (A, B e C) em uma pista de Tiro de Ação Reflexa. Os conceitos obtidos foram atribuídos em função do número de impactos nos alvos, e fornecem uma visão geral do desempenho de cada SU:

DISTRIBUIÇÃO A

classe xi fi

A= 3(X – Md) S

02 06 4 6 06 10 8 12

10 14 12 24

Onde: X= 12,92 Md= 13,5 S= 4,22

14 18 16 30 18 22 20 6

�= 78

RESULTADO DO TIRO DE AÇÃO REFLEXA DE SOLDADOS DE UMA BATERIA DE OBUSES

05

101520253035

I R B MB E

Conceitos

Nr

A= -.347 Ass. Negativa

moderada

Figura 17a – Assimetria negativa moderada.

DISTRIBUIÇÃO B

classe xi fi

A= 3(X – Md) S

02 06 4 5 06 10 8 21

10 14 12 26

Onde: X= 12 Md= 12 S= 4,15

14 18 16 21 18 22 20 5

�= 78

RESULTADO DO TIRO DE AÇÃO REFLEXA DE SOLDADOS DE UMA BATERIA DE OBUSES

05

101520

2530

I R B MB E

Conceitos

Nr

A= 0 Simétrica

Figura 17b – Assimetria nula.

DISTRIBUIÇÃO C

classe xi fi

A= 3(X – Md) S

02 06 4 6 06 10 8 30

10 14 12 24

Onde: X= 11,08 Md= 10,5 S= 4,22

14 18 16 12 18 22 20 6

�= 78

RESULTADO DO TIRO DE AÇÃO REFLEXA DE SOLDADOS DE UMA BATERIA DE OBUSES

05

101520253035

I R B MB E

Conceitos

Nr

A= +.483 Ass.Positiva moderada

Figura 17c – Assimetria positiva moderada.

Note que, quando a distribuição de freqüência é assimétrica, os dados estão distribuídos em torno da mediana, medida síntese que, neste caso, é a mais indicada para representar os dados.

X Mdd

Mo

X = Mo = Md

Md X

Mo

Page 42: Domingues 2005 - Estatística Aplicada as Ciências Militares

42

2.4.4 Medidas de Achatamento ou Curtose

As medidas de curtose caracterizam a forma da distribuição quanto a seu achatamento. A comparação é feita em relação à distribuição normal, modelo teórico de distribuição estudado no Cálculo de Probabilidades (veja o capítulo 4). As Fig. 18a, Fig. 18b, e Fig. 18c, apresentam os três tipos característicos de distribuição:

EXEMPLO 2.4.10: Consideremos o número de flexões de braço realizado por soldados de 3 SU (A, B e C):

xi fi 5 4

15 7 25 9 35 11 45 12 55 13 65 13 75 13 85 12 95 11

105 9 110 7 115 4

FLEXÕES DE BRAÇO REALIZADAS POR SOLDADOS DA 1ª COMPANIA DE FUZILEIROS

0

10

20

30

40

50

60

70

5 15 25 35 45 55 65 75 85 95 105 110 115

Repetições

Nr

�= 125

Figura 18a – Distribuição Platicúrtica. xi fi 5 4

15 7 25 9 35 11 45 12 55 13 65 13 75 13 85 12 95 11

105 9 110 7 115 4

FLEXÕES DE BRAÇO REALIZADAS POR SOLDADOS DA 2ª COMPANIA DE FUZILEIROS

0

10

20

30

40

50

60

70

5 15 25 35 45 55 65 75 85 95 105 110 115

Repetições

Nr

�= 125

Figura 18b – Distribuição Mesocúrtica.

xi fi 5 0

15 0 25 1 35 2 45 6 55 24 65 59 75 24 85 6 95 2

105 1 110 0 115 0

FLEXÕES DE BRAÇO REALIZADAS POR SOLDADOS DA 3ª COMPANIA DE FUZILEIROS

0

10

20

30

40

50

60

70

5 15 25 35 45 55 65 75 85 95 105 110 115

Repetições

Nr

�= 125 Figura 18c – Distribuição Leptocúrtica.

Page 43: Domingues 2005 - Estatística Aplicada as Ciências Militares

43

Como dito, a classificação quanto à curtose dá-se em função do achatamento da distribuição de freqüências. Deste modo, uma distribuição normal tem um achatamento mediano, o que chamamos distribuição mesocúrtica (forma de boca de sino). As distribuições mais achatadas que a normal são denominadas platicúrticas (forma de prato) e as menos achatadas são denominadas leptocúrticas (forma de chapéu mexicano).

A caracterização do achatamento de uma distribuição só tem sentido, em termos práticos, se a distribuição for pelo menos aproximadamente simétrica. Desta forma é possível verificar que:

a. distribuições platicúrticas apresentam os dados bem dispersos em relação à média, o que caracteriza uma forma de distribuição heterogênia.

b. distribuições mesocúrticas apresentam os dados normalmente dispersos em relação à média, o que caracteriza uma forma de distribuição normal.

c. distribuições leptocúrticas apresentam os dados muito próximos da média, o que caracteriza uma forma de distribuição homogênia

Entre as possíveis medidas de achatamento, mencionaremos apenas o coeficiente percentílico de curtose, dado pela fórmula abaixo:

Q3 – Q1 C = 2(P90 - P10) Onde: Q1 = 1º quartil; Q3 = 3º quartil; P10 = Percentil 10; e P90 = percentil 90

Relação Classificação C = 0,263 Mesocúrtica C < 0,263 Leptocúrtica C > 0,263 Platicúrtica

Quadro 3 - Classificação quanto à curtose.

A partir do capítulo 7 trataremos sobre a Estatística Inferencial, onde serão abordadas

duas categorias de testes estatísticos: os paramétricos e os não-paramétricos. Neste momento é importante que se diga que a primeira categoria, testes

paramétricos, possuem três pressupostos básicos sobre a distribuição dos dados: a. a população estudada deve possuir uma distribuição normal; b. a amostra extraída deve ter as mesmas variações na variável estudada; e c. as observações devem ser independentes.

Sempre que estes pressupostos são alcançados, os testes paramétricos aumentam as chances de se rejeitar a hipótese nula, o que denominamos poder do teste (trataremos este conceito no item 4.3 do capítulo 4), desta forma os testes de assimetria e curtose tratados no presente capítulo crescem em importância no sentido de que, para comprovarmos o pressuposto a., deveremos verificar se a amostra, com a qual estamos trabalhando, é simétrica e mesocúrtica, características da distribuição normal.

Page 44: Domingues 2005 - Estatística Aplicada as Ciências Militares

44

Page 45: Domingues 2005 - Estatística Aplicada as Ciências Militares

45

Capítulo 3 Amostragem

A busca de informações a respeito de um fenômeno qualquer é necessária para lastrear

a tomada de decisões que envolvem este fenômeno. Em particular quando este fenômeno é aleatório, a busca de informações é direcionada para estabelecer a forma da distribuição da variável que descreve o fenômeno e os parâmetros desta distribuição.

Existem dois processos de abordagem para a solução deste problema. O primeiro

processo consiste em aplicar um Censo, o que identifica diretamente a forma da distribuição da variável e seus parâmetros.O segundo processo consiste em obter estas informações indiretamente, através da Estimação (por meio de amostras).

Quando é razoável a aplicação de um censo, o problema está resolvido.Vamos

desenvolver o segundo processo, com o objetivo de estimar os parâmetros da distribuição. A estimação é um processo que consiste em avaliar os parâmetros de uma distribuição

através de estimadores obtidos em uma amostra, com base no cálculo de probabilidades (instrumental que viabiliza avaliar parâmetros da distribuição a partir dos estimadores)..

A qualidade de uma estimação depende basicamente da representatividade da

amostra que consiste na capacidade de a amostra reproduzir as características importantes da população.

Vamos examinar a seguinte situação. A nutricionista de uma escola militar foi

encarregada de avaliar a qualidade nutritiva de uma sopa preparada por um fornecedor (contratado), que será servida a seus alunos.

Algumas reclamações de alunos sugerem que a sopa não está satisfazendo o padrão de

qualidade nutricional exigido pela escola. Se, de fato, a sopa não atender o padrão de qualidade contratado, a escola devolve a sopa e exige o pagamento da multa contratual.

O procedimento viável nesta situação é fazer esta avaliação através de uma amostra. Note que se a nutricionista tiver o cuidado de mexer suficientemente a sopa,

conseguirá um bom grau de homogeneidade no produto e uma pequena amostra retirada nestas condições irá conter os ingredientes aproximadamente na mesma proporção em que figuram na sopa.

Neste caso, a amostra é bem representativa da população, o que permitirá à

nutricionista fazer a avaliação com alto grau de precisão. No entanto, se a nutricionista não tiver o cuidado de mexer a sopa, pode ocorrer que a amostra selecionada não seja representativa da população, o que conduzirá a um erro de avaliação e a suas conseqüências.

Page 46: Domingues 2005 - Estatística Aplicada as Ciências Militares

46

Se a nutricionista, mesmo mexendo a sopa, desconfia do grau de homogeneidade da sopa, a maneira de conseguir boa representatividade consiste em aumentar o tamanho da amostra.

A análise desta situação leva-nos a concluir que populações com pequeno grau de

variabilidade de seus elementos podem ser estudadas a partir de pequenas amostras. À medida que esta variabilidade aumenta, é necessário aumentar o tamanho da amostra aleatória para manter sua representatividade.

Pode-se definir amostragem como o conjunto de técnicas utilizadas para a seleção de

uma amostra. Este conjunto de técnicas pode ser subdividido em dois grupos básicos: a amostragem aleatória e a amostragem não aleatória.

3.1 AMOSTRAGEM NÃO ALEATÓRIA

A amostragem não aleatória é aquela em que os elementos da amostra não são selecionados ao acaso, podendo ser intencional ou voluntária. É indicada nos casos em que o pesquisador não dispõe de fácil acesso a todos os elementos da população, ou quando existe uma característica peculiar (como voluntariado) que impõe uma seletividade não aleatória.

3.1.1 Amostragem Intencional

Ocorre quando o pesquisador seleciona intencionalmente os componentes da amostra. Estas amostras não permitem o controle da variabilidade amostral, o que inviabiliza o controle da qualidade da estimação, bem como a generalização dos resultados para toda a população.

EXEMPLO 3.1.1: De uma população constituída por Aspirantes a Oficial do

Exército, um pesquisador analisa o perfil profissiográfico dos Asp Of de sua guarnição (pois não têm acesso aos demais elementos da população), para verificar se conceitos “ MB” estão relacionados com a Liderança Militar. Note que a amostragem é intencional, pois existe um motivo (intenção) para não se alcançar todos os elementos populacionais (falta de recursos, falta de tempo...).

Se o pesquisador encontrasse um resultado satisfatório em sua investigação poderia

generalizar os resultados para toda a população de Asp Of? Não, somente para sua Guarnição, o que não deixa de ser um indicativo da existência de algum tipo de relação entre as variáveis.

3.1.2 Amostragem Voluntária

Ocorre quando o componente da população se oferece voluntariamente para participar

da amostra independentemente do julgamento do pesquisador. Estas amostras não permitem o controle da variabilidade amostral, o que também inviabiliza o controle da qualidade da estimação.

EXEMPLO 3.1.2: De uma população constituída por Aspirantes a Oficial do

Exército, um pesquisador analisa o perfil profissiográfico, para verificar se conceitos “ MB” estão relacionados com a Disciplina Intelectual, para solicita permissão ao Asp Of para ter acesso ao perfil do avaliado. Note que a amostragem é voluntária, pois depende da autorização (voluntariado) do pesquisado.

Page 47: Domingues 2005 - Estatística Aplicada as Ciências Militares

47

3.2 AMOSTRAGEM ALEATÓRIA

A amostragem aleatória é aquela em que os elementos são selecionados ao acaso, podendo ser simples, sistemática, estratificada ou por conglomerado.

3.2.1 Amostragem Aleatória Simples

É aquela em que se atribui aos elementos a mesma probabilidade de participar da

amostra. Pode-se proceder um sorteio dos elementos, utilizar-se de Tabelas de Números Aleatórios (TNA) ou randomizar os sujeitos com o auxílio de um computador.

A TNA (ANEXO D) contém números previamente sorteados, de forma que, se

iniciarmos em um ponto qualquer dessa tabela, e anotarmos os números na seqüência das linhas ou colunas a partir deste ponto inicial, poderemos elencar os sujeitos de uma população previamente organizada de acordo com um critério escolhido a priori.

EXEMPLO 3.2.1: De uma população finita de 500 sargentos da Vila Militar, dos

quais nos interessa uma característica comum (possuidores do Curso de Aperfeiçoamento de Sargentos), pelo Almanaque podemos colocá-los em ordem de antiguidade, e para selecionarmos uma amostra de 30 sargentos ao acaso, procederemos da seguinte forma:

Primeiramente adotaremos um critério para a leitura da TNA: começaremos lendo os

números da direita para a esquerda, de cima para baixo, tomados 3 a 3 (a população tem n=500); e o ponto inicial será o número contido na 5ª linha e 3ª coluna.

Notemos que o número correspondente ao ponto inicial é igual a 8.

Logo passaremos a ler os números com 3 dígitos tomando o cuidado de observar que

os números formados devem iniciar por 0, 1, 2, 3, 4 e 5(caso o número seja 500) .

116 9 467 586 082 066 69 047 56 184 6 451 112 353 245 5 041 134 322 017 031 329 69 192 75 401 65 429 7 274 99 009 5976 100 98 243 007 56 241 004 302 046 299 053

Ordenados os números obtidos da TNA poderemos selecionar os sargentos baseados

na antiguidade. 004; 007; 009; 017; 031; 041; 046; 047; 053; 066; 082; 100; 112; 116; 134; 184; 192; 241; 243; 245; 274; 299; 302; 322; 329; 353; 401; 429; 451; 467.

3.2.2 Amostragem Sistemática

Quando se conhece uma listagem dos elementos da população pode-se obter uma

amostra aleatória de n elementos dividindo-se o número de elementos da população pelo tamanho da amostra. Usando o número inteiro mais próximo anterior a esse resultado, selecionamos os elementos da lista que ocorrem com esta periodicidade.

EXEMPLO 3.2.2: Dada uma população finita de 1000 oficiais do CML dos quais

Page 48: Domingues 2005 - Estatística Aplicada as Ciências Militares

48

nos interessa uma característica comum (possuidores do Curso de Aperfeiçoamento de Oficiais), pelo Almanaque podemos colocá-los em ordem de antiguidade e escolhida uma amostra de 30 oficiais, procede-se da seguinte forma:

(1) Dividimos o N da população (1000) pelo valor de n da amostra (30)

y = 1000 / 30 = 33,33 que é aproximadamente 33.

(2) Sorteia-se um número ao acaso entre 1 e 33, por meio de uma urna ou pela TNA.

Digamos que o resultado foi 12;

(3) O primeiro elemento a ser relacionado na amostra seria o oficial que ocupasse a 12ª posição na lista; o segundo seria a 45ª; o terceiro seria a 78ª; e assim somaríamos o número 33 até obtermos os 30 elementos da amostra. 3.2.3 Amostragem Estratificada

Pode ocorrer que a população seja formada por subgrupos diferentes, mas cada um deles homogêneo (por Pelotões, SU, U, por faixa etária, etc...). Neste caso, vamos selecionar aleatoriamente uma quantidade de cada grupo para formar uma amostra, proporcional ao tamanho desse grupo

EXEMPLO 3.2.3: Dada uma população finita de 10000 soldado do efetivo variável

incorporados no CML dos quais nos interessa uma característica comum (resultado no 1° TAF) sabendo-se que estão dispostos em pelotões em suas respectivas Unidades podemos colocá-los em ordem de antiguidade e escolhida uma amostra de 600 soldados, procede-se da seguinte forma:

(1) Inicialmente precisamos saber quantos Pelotões existem no CML, suporemos 33 homens por Pelotão, o que nos dará um valor aproximado de 303 pelotões.

(2) Dividiremos então o n amostral (600) pelo número de Pelotões para sabermos quantos soldados de cada pelotão deveremos avaliar.

y = 500 / 33 = 1,98 que é aproximadamente 2.

(3) O próximo passo será determinarmos randomicamente de que posições no pelotão serão retirados os 2 elementos, o que pode ser feito por sorteio de 1 a 33 ou pela Tabela de números Aleatórios (suporemos que foram sorteados os números 7 e 32).

(4) O primeiro elemento a ser relacionado de cada pelotão será o 7° militar da listagem do pelotão; e o segundo será o 32°.

(5) Notemos, porém, que se tomarmos 2 soldados por Pelotão ao final da seleção teremos 606 soldados, sendo que a amostra necessária é de 600 soldados. Uma opção seria um sorteio de descarte de 6 soldados relacionados, no entanto, julgamos que um n amostral maior do que o previsto implicará em uma maior precisão na estimação, recomenda-se, portanto, que se mantenham os 606 soldados na amostra.

3.2.4 Amostragem por Conglomerados

Em algumas situações, podemos identificar um grupo de elementos que tenha aproximadamente a mesma composição de população. Neste caso, pode ser interessante

Page 49: Domingues 2005 - Estatística Aplicada as Ciências Militares

49

realizar a amostragem usando somente os elementos desse grupo. EXEMPLO 3.2.4: Considerando-se que existe uma formação comum aos soldados

do Efetivo Variável (EV) durante o Período Básico de Instrução, e ainda que os Objetivos de Instrução (OI) são comuns às Armas, Quadro e Serviço, possivelmente não seria necessária uma amostragem âmbito nacional para se verificar a validade de um determinado OI, bastaria verificar a validade deste OI em um determinado Comando Militar de Área (um dos conglomerados) para obter inferências que apontem para a sua validade ou não. 3.3 FÓRMULAS PARA A DETERMINAÇÃO DO TAMANHO DA AMOSTRA

Ao iniciarmos um estudo normalmente nos deparamos com a dúvida de qual o tamanho amostral necessário para que possamos generalizar os resultados de nossa pesquisa, ou mesmo para termos a certeza de que a amostra selecionada irá bem representar a população interesse.

Para iniciarmos a amostragem propriamente dita devemos: a. nos certificar se a população de interesse é finita ou infinita (podemos considerar

que uma população é infinita se N > 10000); b. estipular uma margem de erro para rejeição da hipótese nula, normalmente �= 0, 05

(trataremos deste tipo de erro no Cap. 6); e c. estipular a margem de erro admitida entre a média amostra(X)e a média

populacional (µ). Para um melhor ajuste do tamanho amostral deve-se ainda levar em consideração a

proporção esperada de sucesso do evento estudado (p) em relação ao seu insucesso (q), sendo p = 1 – q.

Cálculo do n amostral levando em consideração se a população é finita ou infinita para

estimação de uma proporção populacional.

POPULAÇÃO INFINITA POPULAÇÃO FINITA

Z²( � /2) . p.q.N Z²( � /2) . p.q.N n = e² n = e² ( N – 1) + Z²( � /2) . p.q.N

Onde: n = Número de elementos da amostra; Z²( � /2) = Quadrado da probabilidade aceita para o erro tipo I (retirado da Tabela Z) p = Proporção esperada de sucesso do evento; q = Proporção esperada de insucesso do evento; N = Número de elementos da população; e e² = Erro padrão de estimativa ao quadrado, onde e = X – µ. Quando não se dispõe de informações sobre o valor de p deve-se realizar uma pré-

amostragem com n1 elementos. Se o valor de n calculado nestas condições, for menor que n1, a pré-amostra já conterá um número suficiente de elementos para garantir a precisão determinada. Caso valor de n for maior que n1, completa-se a pré-amostra selecionando-se (n–n1) elementos.

Page 50: Domingues 2005 - Estatística Aplicada as Ciências Militares

50

Em algumas situações, o problema pode conter uma informação a respeito de p. Neste caso, esta informação poderá ser utilizada no cálculo de n.

Se não houver informações a respeito de p e não pudermos realizar uma a pré-

amostragem, o cálculo de n com p = 0,5, levará a um tamanho da amostra com o conseqüente problema de custo de amostragem associado (a amostra será muito grande).

EXEMPLO 3.3.1: Um pesquisador pretende avaliar a proporção de militares que

responderão sim a uma determinada pergunta, com 95% de confiança de que não errará por mais de 3%. Para isto, selecionou ao acaso uma pré-amostra (n1 = 100 militares), e a proporção de respostas sim foi de 20% (20 dos 100). Calcular o n amostral que bem representará a população de estudo, para a margem de erro adotada.

Dado que: n1= 100 z²( � /2)= (1,96) ² pois (1 – �=95%) p = 0,2 q = 0,8 N = INFINITA e² = (0,03) ²

(1,96) ² . 0,2 . 0,8 .N n = (0,03) ²

n = 683 militares Portanto necessitaríamos entrevistar mais 583 militares (683 – 100)

EXEMPLO 3.3.2: Um pesquisador está interessado em estimar a proporção de militares que faz uso do protweb em suas OM. Para isto, amostrou 80 militares de um cadastro de N = 400, cujas funções poderiam ser otimizadas pelo uso da ferramenta, consultando-os por telefone, e verificando que 30 faziam uso diário do protweb. Determine o tamanho da amostra necessária para estimar esta proporção com 90% de confiança, e com erro um máximo de 4% em relação à proporção populacional.

Dado que: n1= 30 z²( � /2)= (1,64) ² pois (1-�=90%) p = 30/80 = 0,375 q = 0,625 N = 400 e² = (0,04) ²

(1,64) ² . 0,375 . 0,625 . 400 n = (0,04)² . (400 – 1) + (1,64)² . 0,375 . 0,625 . 400

n = 119 militares Portanto necessitaríamos entrevistar mais 119 militares (199 – 80)

Page 51: Domingues 2005 - Estatística Aplicada as Ciências Militares

51

EXEMPLO 3.3.3: Um pesquisador está interessado em estimar a proporção de militares que faz uso do protweb nas OM da Vila Militar do Rio de Janeiro (N= 400 militares). Não sendo possível realizar uma pré-amostragem, e não existindo estudo anterior que lhe permitisse estimar o valor de p, foi obrigado a considerar p = 0,5 (ou seja, 50% dos militares faz uso e 50% não faz uso do protweb). Determine o tamanho da amostra necessária para estimar esta proporção com 90% de confiança, e com erro um máximo de 4% em relação à proporção populacional.

Dado que: n1= ---- z²( � /2)= (1,64) ² pois (1-�=90%) p = 0,5 q = 0,5 N = 400 e² = (0,04)²

(1,64) ² . 0,5. 0,5 . 400 n = (0,04) ² . 399 +(1,64) ² . 0,5. 0,5.400

n = 352,78 = 353 militares Portanto’, seria necessário entrevistar 353 militares. Notemos a diferença em relação ao estudo que foi realizado com pré-amostragem. Por

nao haver uma primeira estimativa quanto à proporção esperada, uma amostra muito maior é requerida (353 > 199)

Page 52: Domingues 2005 - Estatística Aplicada as Ciências Militares

52

Page 53: Domingues 2005 - Estatística Aplicada as Ciências Militares

53

Capítulo 4 Probabilidade

Embora o cálculo das probabilidades pertença ao campo da Matemática, sua inclusão neste manual se justifica pelo fato de a maioria dos fenômenos de que trata a Estatística ser de natureza aleatória ou probabilística. Conseqüentemente, o conhecimento dos aspectos fundamentais do cálculo de probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial.

Procuramos resumir aqui os conhecimentos julgados necessários para termos um

ponto de apoio em nossos primeiros passos no caminho da Estatística Inferencial. Esses passos serão incrementados no capítulo seguinte, que trata da conceituação de variável aleatória e de suas principais distribuições de probabilidades.

4.1 EXPERIMENTO ALEATÓRIO

Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação

“ é provável que o meu time ganhe a partida de hoje” pode resultar: a. que, apesar do favoritismo, ele perca; b. que, como pensamos, ele ganhe; e c. que ele empate. No entanto, o resultado final depende do acaso. Fenômenos como esse são chamados

fenômenos aleatórios ou experimentos aleatórios, que são aqueles que, mesmo repetidos várias vezes, sob condições semelhantes, apresentam resultados imprevisíveis.

4.1.1 Espaço Amostral (S)

A cada experimento correspondem, em geral, um conjunto de vários resultados possíveis que recebe o nome de espaço amostral (S).

EXEMPLO 4.1.1: Ao lançarmos uma moeda, há dois resultados possíveis: ocorrer

cara ou ocorrer coroa. Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6. Os dois experimentos citados anteriormente têm os seguintes espaços amostrais: a. Lançamento de uma moeda:

S = {Ca, Co}

b. Lançamento de um dado:

S = {1, 2, 3, 4, 5, 6}.

Page 54: Domingues 2005 - Estatística Aplicada as Ciências Militares

54

EXEMPLO 4.1.2: Do mesmo modo, como em dois lançamentos sucessivos de uma moeda podemos obter cara nos dois lançamentos, ou cara no primeiro e coroa no segundo, ou coroa no primeiro e cara no segundo, ou coroa nos dois lançamentos, o espaço amostral é:

S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}.

Cada um dos elementos de S recebe o nome de ponto amostral.

2 � S � 2 é um ponto amostral de S.

4.1.2 Eventos Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento

aleatório (os eventos são denotados por letras arábicas maiúsculas). Assim, qualquer que seja E, se E � S (E está contido em S), então E é um evento de

S, da seguinte forma:

a. Se E = S, E é chamado evento certo (com probabilidade 1 ou 100%). b. Se E � S e E é um conjunto unitário, E é chamado evento elementar. c. Se E = ø, E é chamado evento impossível. EXEMPLO 4.1.3 No lançamento de um dado, onde S = {l, 2, 3, 4, 5, 6}, temos:

a. A = {2, 4, 6} � S; logo; A é um evento de S. b. B = {l, 2, 3, 4, 5, 6} � S; logo, B é um evento certo de S (B = S). c. C = {4} � S; logo, C é um evento elementar de S.

d. D = ø � S; logo, D é um evento impossível de S. Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser

definidos pelas sentenças: a. “ Obter um número par na face superior.” b. “ Obter um número menor ou igual a 6 na face superior.” c. “ Obter o número 4 na face superior.” d. “ Obter um número maior que 6 na face superior.”

4.2 PROBABILIDADE DE SUCESSO DE UM EVENTO

Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável.

Chamamos de probabilidade de um evento A (A � S) o número real P(A), tal que:

P(A)= n(A) n(S)

Onde: n(A) é o número de elementos de A; n(S) é o número de elementos de S.

Page 55: Domingues 2005 - Estatística Aplicada as Ciências Militares

55

EXEMPLO 4.2.1 Considerando o lançamento de uma moeda e o evento A “ obter cara” , temos:

Sendo: S = {Ca, Co} � n(S) = 2 A = {Ca} � n(A) = 1

P(A)= 1 2

Ou seja, a probabilidade de se obter cara no lançamento de uma moeda é de 1/2 ou 50,00%.

EXEMPLO 4.2.2 Considerando o lançamento de um dado, calcular a

probabilidade do evento A “ obter um número par na face superior” : Sendo: S = {1, 2, 3, 4, 5, 6}� n(S) = 6 B = {2, 4, 6} � n(A) = 3

P(B)= 3 6

Ou seja, a probabilidade de se obter um número par na face superior de um dado lançado é de 1/2 ou 50,00%.

EXEMPLO 4.2.3 Considerando o lançamento de um dado, vamos calcular a

probabilidade do evento B “ obter um número menor ou igual a 6 na face superior” : Sendo: S = {1, 2, 3, 4, 5, 6} � n(S) = 6 C = {1, 2, 3, 4, 5, 6} � n{B) = 6

P(C)= 6 6

Ou seja, a probabilidade de se obter um número menor ou igual a 6 na face superior de um dado lançado é de 1 ou 100,00% (a probabilidade do evento certo é igual a 1).

EXEMPLO 4.2.4 Considerando o lançamento de um dado, vamos calcular a

probabilidade do evento B “ obter um número menor ou igual a 6 na face superior” : Sendo: S = {1, 2, 3, 4, 5, 6} � n(S) = 6 D = = ø � n(D) = 0

P(D)= 0 6

Ou seja, a probabilidade de se obter um número maior que 6 na face superior de um dado lançado é de 0 ou 0,00% (a probabilidade do evento impossível é igual a zero).

4.2.1 Eventos Complementares

Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele

ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação:

p + q = 1 � q = 1 – p

Page 56: Domingues 2005 - Estatística Aplicada as Ciências Militares

56

EXEMPLO 4.2.4 Se a probabilidade de se realizar um evento e p = 1/5. Calcular a probabilidade de que ele não ocorra.

q = 1 – p q = 1 – 1/5

q = 4/5

EXEMPLO 4.2.5: Sabemos que a probabilidade de tirar o valor 4 no lançamento de um dado é: p = 1/6.Logo, a probabilidade de não tirar o valor 4 no lançamento de um dado é q = 5/6

4.2.2 Eventos Independentes

Dizemos que dois eventos são independentes quando a realização ou a não-realização

de um dos eventos não afeta a probabilidade da realização do outro e vice-versa.

EXEMPLO 4.2.6: Ao lançarmos dois dados, o resultado obtido em um deles independe do resultado obtido no outro.

Se dois eventos são independentes, a probabilidade de que eles se realizem

simultaneamente é igual ao produto das probabilidades de realização dos dois eventos. Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por:

P(1;2) = p1 . p2 EXEMPLO 4.2.7: Considerando o lançamento de dois dados, calcular a

probabilidade do evento D “ obter o número 1 no primeiro dado e o número 3 no segundo dado” .

Sendo: p1 = 1/ 6 p2 = 1/ 6

1 1 1 P(1;2) =

6 .

6 =

36

Ou seja, a probabilidade de se obter o número 1 no primeiro dado e o número 3 no

segundo dado, lançados ao mesmo tempo, é de 1/36 ou 2,78%.

4.2.3 Eventos Mutuamente Exclusivos

Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento “ tirar cara” e o evento “ tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.

Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se

realize é igual à soma das probabilidades de que cada um deles se realize:

P(1;2) = p1 + p2

Page 57: Domingues 2005 - Estatística Aplicada as Ciências Militares

57

EXEMPLO 4.2.8: Considerando o lançamento de um dado, calcular a probabilidade do evento E “ obter o número 2 ou o número 3” :

Sendo: p1 = 1/ 6 p2 = 1/ 6

1 1 1 P(1;2) =

6 +

6 =

3 Ou seja, a probabilidade de se obter o número 2 ou o número 3 no lançamento de um

dado é de 1/3 ou 33,33%. EXEMPLO 4.2.9: Considerando o lançamento de um dado, vamos calcular a

probabilidade do evento E “ obter o número 1 ou o número 6” : Sendo: p1 = 1/ 6 p2 = 1/ 6

1 1 1 P(1;2) =

6 +

6 =

3 4.3 EXERCÍCIOS DE PROBABILIDADE

1) Qual a probabilidade de sair o ás de ouro quando retiramos uma carta de um baralho

(52 cartas)? Como só há um ás de ouros, o número de elementos do evento é 1, logo:

p = 1/52

2) Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho? Como há 4 reis, o número de elementos do evento é 4; logo:

p = 4/52 = 1/13

3) Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a. A probabilidade dessa peça ser defeituosa, temos:

p = 4/12 = 1/3

b. A probabilidade de essa peça não ser defeituosa. Sendo este evento e o anterior complementares, temos: a1

p =1 – \4/12 = 2/3

4) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. O evento é formado pelos elementos (1, 4), (2, 3), (3, 2) e (4, 1). Como o número de

elementos de S (resultados possíveis) é 36, temos:

Page 58: Domingues 2005 - Estatística Aplicada as Ciências Militares

58

Sendo: n(A)=4 n(S)=36

p = 4/36 = 1/9 5) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro

baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de copas?

Sendo: pR = 4/ 52 = 1/ 13 p5 = 1/52

1 1 1 P(1;2) =

13 .

52 =

676 6) Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5

bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde?

Temos: p1 = 3/9 = 1/ 3 p2= 2/8 = ¼ p3 = 4/9 Como os três eventos são independentes e simultâneos, vem:

1 1 4 1 P(1;2) = 3 . 4 . 9 = 27

7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus?

A probabilidade de sair o ás de espada na primeira carta é:

pA = 1/52

Após a retirada da primeira carta, restam 51 cartas no baralho, já que a carta retirada não foi reposta. Assim, a probabilidade de a segunda carta ser o rei de paus é:

PR = 1/51

Como esses eventos são independentes, temos:

1 1 1 P(1;2) = 52 . 51 = 2652

Page 59: Domingues 2005 - Estatística Aplicada as Ciências Militares

59

Capítulo 5 Modelos Teóricos de Probabilidade

Este capítulo apresenta os principais modelos teóricos de distribuição de probabilidade, aos quais um experimento aleatório pode ser enquadrado.

5.1 DEFINIÇÕES DE PROBABILIDADE

Existem três conceitos básicos de probabilidade: clássica, freqüencialista e

personalística. Sua escolha depende da natureza das variáveis e da situação em que está envolta a

característica populacional de interesse.

5.1.1 Probabilidade Clássica Aplica-se às situações em que os resultados que compõem o espaço amostral são

equiprováveis (ocorrem com a mesma regularidade), sendo sua probabilidade de sucesso definida por:

n(ai) P(ai)= N

Onde: n(ai) = número de casos favoráveis à realização de ai; e N = o número total de casos possíveis. EXEMPLO 5.1.1: Um experimento consiste no lançamento de uma moeda e na

observação da face superior. Determine o espaço amostral do experimento e a função de probabilidades.

Se a moeda não for viciada, os elementos que compõem o espaço amostral são

equiprováveis (S = {Ca, Co}). Usando o conceito clássico de probabilidades avaliamos:

P(Ca) = 1/2 ou 50% e P(Co) = 1/2 ou 50%

Portanto, a função de probabilidade neste caso é:

xi Ca Co 1 1 F(xi) = P(xi) 2 2

EXEMPLO 5.1.2: O experimento consiste no lançamento de um dado e na observação da face superior. Determine o espaço amostral do experimento e a função de probabilidade.

Page 60: Domingues 2005 - Estatística Aplicada as Ciências Militares

60

O espaço amostral do experimento S = {1, 2, 3, 4, 5, 6}.

1 1 1 1 1 1 P(1) 6 ; P(2) 6 ; P(3) 6 ; P(4) 6 ; P(5) 6 ; e P(6) 6

Usando o conceito clássico de probabilidades, a função de probabilidade é definida por:

xi 1 2 3 4 5 6 1 1 1 1 1 1 F(xi) = P(xi) 6 6 6 6 6 6

5.1.2 Probabilidade Freqüencialista

Aplica-se às situações em que os resultados que compõem o espaço amostral não são equiprováveis, ou seja, quando não se conhece a regularidade dos resultados. Este processo baseia-se na evolução da freqüência relativa do resultado à medida que o número de repetições do experimento cresce.

lim P(xi)= n�� fri(xi)

EXEMPLO 5.1.3: O experimento consiste no lançamento de duas moedas e na observação do número de caras obtidas neste lançamento. Determine o espaço amostral e a função de probabilidade.

O espaço amostral do experimento é S = {0, 1, 2}.

Moeda 1 Moeda 2 Número de Ca fri Co Co 0 ¼ Co Ca 1 ¼ Ca Co 1 ¼ Ca Ca 2 ¼

Note que os resultados não são equiprováveis

1 1 1 1 1 fr0 = 4 ; fr1 = 4 + 4 = 2 ; e fr2 = 4

Usando o conceito de probabilidade freqüencialista, a função de probabilidade é definida por:

xi 0 1 2 lim 1 1 1 F(xi) = n�� fri(xi) 4 2 4

EXEMPLO 5.1.4: Um experimento consiste no lançamento de dois dados e na

observação da soma dos pontos das faces superiores. Determine o espaço amostral do experimento e a função de probabilidade.

Page 61: Domingues 2005 - Estatística Aplicada as Ciências Militares

61

O espaço amostral do experimento é S = {2, 3, 4, 5, 6, 7, 8, 9. 10, 11, 12}. Estes resultados não são equiprováveis e, embora haja regularidade dos resultados, esta não pode ser avaliada pelo processo clássico. Como o experimento pode ser facilmente repetido, utilizaremos o processo freqüencialista.

(Dado 1;Dado 2) Soma das faces fri (1;1) 2 1/36 (1;2); (2;1) 3 2/36 (1;3); (2;2); (3;1) 4 3/36 (1;4); (2;3); (3;2); (4;1) 5 4/36 (1;5); (2;4); (3;3); (4;2); (5;1) 6 5/36 (1;6); (2;5); (3;4); (4;3); (5;2); (6;1) 7 6/36 (2;6); (3;5); (4;4); (5;3); (6;2) 8 5/36 (3;6); (4;5); (5;4); (6;3) 9 4/36 (4;6); (5;5); (6;4) 10 3/36 (5;6); (6;5) 11 2/36 (6;6) 12 1/36

Logo, a função de probabilidade é definida por:

xi 2 3 4 5 6 7 8 9 10 11 12 lim 1 2 3 4 5 6 5 4 3 2 1 F(xi) = n�� fri(xi)

36 36 36 36 36 36 36 36 36 36 36

EXEMPLO 5.1.5: Um experimento consiste em selecionar ao acaso um Pelotão e observar o número de soldados punidos no mês de julho. Determine o espaço amostral do experimento e a função de probabilidade.

O espaço amostral do experimento é S = {0, 1, 2, 3, ...}. Estes resultados não são equiprováveis e, embora haja regularidade dos resultados,

esta regularidade não pode ser avaliada pelo processo clássico.Como o experimento pode ser facilmente repetido, recorremos ao conceito freqüencialista de probabilidades.

Vejamos como calcular a probabilidade do primeiro resultado. Os demais podem ser

obtidos exatamente da mesma forma. Selecionamos inicialmente 10 Pelotões de um Comando Militar de Área e verificamos

3 de Pelotões com 0 soldados punidos no mês de julho, logo a freqüência relativa será:

fr0 =30% Aumentamos o número de Pelotões para 20 e verificamos 5 de Pelotões com 0

soldados punidos no mês de julho, logo a freqüência relativa será:

fr0 =25%

Aumentamos sucessivamente o número de Pelotões para 30, 40, 50, 100, sempre recalculando a freqüência relativa de Pelotões com 0 soldados punidos no mês de julho.

Desta forma, obtemos uma seqüência de valores para a freqüência relativa de Pelotões

com 0 soldados punidos no mês de julho que convergirá para um valor real c.

Page 62: Domingues 2005 - Estatística Aplicada as Ciências Militares

62

n 10 20 30 40 50 100 � lim F(xi) = n�� fri(0) 30,0% 25,0% 23,3% 22,5% 20,0% 20,0% c = 20,0%

isto é:

lim P(0)= n�� fri(0) = c

Diremos então que a probabilidade de um pelotão não possuir soldados punidos no mês de julho é:

P(0) = c = 20,00%

Este procedimento pode ser adotado em todos os casos onde o conceito clássico de probabilidades é aplicado. No entanto, é um processo mais caro, mais demorado e mais trabalhoso. 5.1.3 Probabilidade Personalística

Há situações em que os resultados do experimento não ocorrem com mesma regularidade e não existe a possibilidade de repeti-lo sucessivamente, ou seja, não se pode aplicar nem a forma clássica, nem a forma freqüencialista de probabilidades.

Nesta situação, devemos socorrer-nos de um especialista neste tipo de experimento,

para que ele nos dê sua opinião pessoal acerca do valor da probabilidade de cada resultado. Este é um processo subjetivo de avaliação de probabilidades.

EXEMPLO 5.1.6: Um experimento consiste em verificar se o tempo de resposta de

um ofício que chegou na OM excede 5 dias. Determine o espaço amostral e a função de probabilidade associada.

O espaço amostral do experimento é S = {excede, não excede}. A regularidade destes resultados não pode ser avaliada pelo conceito clássico de

probabilidade, e a repetição do experimento neste caso não é um processo eficiente devido diferença entre as naturezas dos ofícios recebidos.

Só nos resta a possibilidade de usar o processo personalista de probabilidade.

Devemos consultar um especialista no assunto que irá avaliar a probabilidade de o ofício receber resposta em menos de 5 dias. 5.2 VARIÁVEL ALEATÓRIA

Suponhamos um espaço amostral S, e que, a cada ponto amostral seja atribuído um número. Fica, então, definida uma função chamada variável aleatória (indicada por uma letra maiúscula), sendo seus valores indicados por letras minúsculas.

EXEMPLO 5.2.1: Sendo o espaço amostral relativo ao “ lançamento simultâneo de duas moedas” igual a 4 resultados possíveis {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)} e X o evento “ número de caras” , a cada ponto amostral podemos associar um número para x, de acordo com a Tab. 13.

Page 63: Domingues 2005 - Estatística Aplicada as Ciências Militares

63

Tabela 13 - Resultados possíveis do lançamento simultâneo de 2 moedas.

Ponto amostral x (Ca, Ca) 2 (Ca, Co) 1 (Co, Ca) 1 (Co, Co) 0

total 4 5.3 DISTRIBUIÇÃO DE PROBABILIDADE

Seja X uma variável aleatória que pode assumir os valores x1, x2, x3, ... ,xn, a cada valor xi correspondem pontos do espaço amostral. Associamos, então, a cada valor xi a probabilidade fri de ocorrência de tais pontos no espaço amostral.

Assim, temos: � fri = 1

Dizemos então que os valores x1, x2, x3,...,xn, e suas correspondentes fr1, fr2, fr3,..., frn, definem uma distribuição de probabilidade.

Deste modo, da Tab. 13, podemos escrever a Tab. 14:

Tabela 14 - Verificação das freqüências em que aparece o resultado cara Ponto amostral x P(X)=fri

(Ca, Ca) 2 1/2 .1/2=1/4 (Ca, Co) 1 1/2 .1/2=1/4 (Co, Ca) 1 1/2 .1/2=1/4 (Co, Co) 0 1/2 .1/2=1/4

total 4 1 Verifique que os pontos amostrais (Ca, Co) e (Co, Ca) apresentam cara uma vez, de

forma que a probabilidade de sair cara uma vez é 1/4 + 1/4 = 2/4.

Logo, podemos escrever a Tab. 14, conforme sua distribuição de probabilidades, de acordo com a Tab. 15:

Tabela 15 - Verificação das freqüências em que aparece o resultado cara.

Número de caras fri 2 1/4 1 2/4 0 1/4 � fri 1

Ao definirmos uma distribuição de probabilidade, estabelecemos uma correspondência

unívoca entre os valores da variável aleatória X e os valores da variável P. Esta correspondência define uma função; os valores xi (i = 1, 2 n) formam o domínio da função, e os valores Pi (i = 1, 2, 3, ..., n) o seu conjunto imagem.

Essa função, assim definida, é denominada função probabilidade representada por:

f(x) = P(X = xi)

Page 64: Domingues 2005 - Estatística Aplicada as Ciências Militares

64

A função P(X = xi) determina a distribuição de probabilidade da variável aleatória X. EXEMPLO 5.3.1: Ao lançarmos um dado, a variável aleatória X, definida por

“ pontos de um dado” , pode tomar os valores 1, 2, 3, ..., 6. Como a cada um destes valores está associada uma e uma só probabilidade de realização e �P(xi) = 1, fica definida uma função de probabilidade, da qual resulta a distribuição de probabilidade descrita na Tab. 16:

Tabela 16 - Distribuição de probabilidade do lançamento de um dado.

X P(X) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 � P(X)= 1

5.4 MODELOS TEÓRICOS DISCRETOS DE PROBABILIDADE

Quando aplicamos a Estatística na resolução de problemas administrativos, verificamos que muitos problemas apresentam as mesmas características, o que nos permite estabelecer um modelo teórico para a determinação da solução destes problemas.

Os componentes principais de um modelo estatístico teórico são: a. Os possíveis valores que a variável aleatória X pode assumir; b. A função de probabilidade associada à variável aleatória X; c. O valor esperado da variável aleatória X; e d. A variância e o desvio-padrão da variável aleatória X.

5.4.1 Distribuição de Bernoulli Se uma variável aleatória X só pode assumir os valores 0 ou 1 (sim ou não) com p(x =

0) = q e p(x = 1) = p com p + q = 1, então diremos que a variável aleatória X admite distribuição de Bernoulli.

Descrição do Modelo a. Os possíveis valores que a variável X pode assumir são 0 e 1; b. A função de probabilidade associada à variável aleatória X é f(x=0) = q e f(x=1) = p.

c. O valor esperado da variável aleatória X é: �(X ) = p.

d. A variância da variável aleatória X é: �2(X) = p.q ; e e. O desvio-padrão da variável aleatória X é: �(X) = p.q EXEMPLO 5.4.1: No lançamento de uma moeda, a variável aleatória X anota o

número de caras obtidas. Determine a média, a variância e o desvio-padrão da variável aleatória X.

O espaço amostral do experimento é S = {0 e 1}

Page 65: Domingues 2005 - Estatística Aplicada as Ciências Militares

65

Portanto, a função de probabilidade neste caso é:

xi 0 1 1 1 F(xi) 2 2

Logo:

�(X ) = p = 1/2

�2(X) = p.q = 1/2 . 1/2 = 1/4.

�(X) = p.q = 1/2 . 1/2 = 1/4 = 1/2

EXEMPLO 5.4.2: Uma carta é retirada de um baralho de 52 cartas. A variável aleatória X anota o numero de reis obtidas nesta retirada. Determine a média, a variância e o desvio-padrão da variável aleatória X.

O espaço amostral do experimento é S = {0 e 1} Portanto, a função de probabilidade neste caso é:

xi 0 1 48 4 F(xi) 52 52

Logo:

�(X ) = p = 4/52 = 1/13

�2(X) = p.q = 48/52 . 4/52 = 12/169.

�(X) = p.q = 48/52 . 4/52 = 12 / 13

5.4.2 Distribuição Binomial

Quando realizamos um experimento qualquer, em uma única tentativa, a probabilidade

de realização de um evento (sucesso) é p, e a probabilidade de não-realização desse mesmo evento (insucesso) é 1 - p = q. Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e independentes. A probabilidade de que um evento se realize k vezes nas provas é dada pela função:

n! f(X) = P(X = k) = k! (n – k)! . pk . qn-k

Onde: P(X = k) é a probabilidade de que o evento se realize k vezes em n provas; p é a probabilidade de que o evento se realize em uma só prova (sucesso); q é a probabilidade de que o evento não se realize no decurso dessa prova

(insucesso); e n! é o coeficiente binomial de n sobre k. k! (n- k)! Essa função, denominada lei binomial, define a distribuição binomial, que tem as

Page 66: Domingues 2005 - Estatística Aplicada as Ciências Militares

66

seguintes características: a. O experimento deve ser repetido, nas mesmas condições, um número finito de

vezes (n). b. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve

afetar os resultados das sucessivas. c. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e

insucesso. d. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q =

1- p) do insucesso manter-se-ão constantes. Descrição do Modelo a. Os possíveis valores que a variável X pode assumir são S = {0, 1 , 2, 3, ...}; b. Como dito, a função de probabilidade associada à variável aleatória X é:

n! f(X) = P(X = k) = k! (n – k)! . pk . qn-k

c. O valor esperado da variável aleatória X é: �(X ) = n.p.

d. A variância da variável aleatória X é: �2(X) = n.p.q ; e e. O desvio-padrão da variável aleatória X é: �(X) = n. p.q EXEMPLO 5.4.3: Uma moeda é lançada 5 vezes seguidas e independentes. Calcule

a probabilidade de serem obtidas 5 caras nessas 5 provas. Pela lei binomial, podemos escrever: Sendo: n = 5 k = 3 p = 1/2 q = 1/2

5! f(X) = P(X = k) = 3! (5 – 3)! . 0,53 . 0,55 - 3

P(X = 3) = 5/16

EXEMPLO 5.4.4: Dois times de vôlei, A e B, jogam entre si 6 vezes. Encontre a

probabilidade de o time A ganhar 4 jogos. Sendo: n = 6 k = 4 p = 1/3 q = 2/3

Page 67: Domingues 2005 - Estatística Aplicada as Ciências Militares

67

6! f(X) = P(X = 4) = 4! (6 – 4)! . p4 . q6 - 4

P(X = 4) = 20/243

5.4.3 Distribuição de Poisson

Uma variável aleatória admite distribuição de Poisson se: a. Os possíveis valores que a variável X pode assumir são S = {0, 1 , 2, 3, ...}; b. Como dito, a função de probabilidade associada à variável aleatória X é:

e-� . (�)k P(x=k) = K!

c. O valor esperado da variável aleatória X é: �(X ) = �;

d. A variância da variável aleatória X é: �2(X) = �; e e. O desvio-padrão da variável aleatória X é: �(X) = � . Uma aplicação imediata deste modelo ocorre quando uma variável aleatória X admite

distribuição binomial com n de repetições ( n > 30 ) e com a probabilidade p de sucesso muito pequena ( n < 0,05 ).

EXEMPLO 5.4.5: Uma máquina produz 9 peças defeituosas a cada 1.000. Calcule

a probabilidade de um lote com 200 peças conter 8 peças defeituosas. Pelo modelo Binomial: Sendo: n = 200 k = 8 p = 0,009 q = 0,991

200! P(X = 8) = 8! (200 – 8)! . 0,0098 . 0,991192

P(X = 8) = 0,00042

Pelo modelo de Poisson: Sendo: n = 200 k = 8 p = 0,009 � = n . p = 200 .0,009 = 1,8

e-1,8 . (1,8)8 P(x=k) = 8!

P(X = 8) = 0,00045

Page 68: Domingues 2005 - Estatística Aplicada as Ciências Militares

68

EXEMPLO 5.4.6: Uma máquina produz 1 munição com defeito a cada 200. Se o número de munições defeituosas admite distribuição de Poisson, calcule a probabilidade de1 caixa com 50 munições conter dois estojos com defeito.

Sendo: n = 50 k = 2 p = 0,005 � = n . p = 50 .0,005 = 0,25

e-0,25 . (0,25)2 P(x=k) = 2!

P(X = 8) = 0,048675

Além da utilização para o cálculo aproximado da Distribuição Binomial, a Distribuição de Poisson, tem vasta aplicação em problemas tipo: fila de espera; controle de estoques; controle de qualidade; etc. 5.5 MODELOS TEÓRICOS CONTÍNUOS DE PROBABILIDADE 5.5.1 Distribuição Normal - Curva Normal

Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição normal descrita na Fig. 19.

Figura 19 - Aspecto gráfico de uma distribuição normal.

Para uma perfeita compreensão da distribuição normal, observe a Fig. 19 e procure

visualizar as seguintes propriedades: a. A variável aleatória X pode assumir todo e qualquer valor real; b. A representação gráfica da distribuição normal é uma curva em forma de sino,

simétrica em torno da média (X), que recebe o nome de curva normal ou de Gauss; c. A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa

área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real; d. A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se

indefinidamente do eixo das abscissas sem, contudo, alcançá-lo; e e. Como a curva é simétrica em torno da X, a probabilidade de ocorrer valor maior

X

Page 69: Domingues 2005 - Estatística Aplicada as Ciências Militares

69

do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5. Escrevemos: P(xi > X) = P(xi < X) = 0,5.

Quando temos em mãos uma variável aleatória com distribuição normal, nosso

principal interesse é obter a probabilidade dessa variável aleatória assumir um valor em um determinado intervalo.

EXEMPLO 5.5.1: Seja X a variável aleatória que representa os diâmetros dos

cartuchos de 9mm produzidos por certa máquina, supondo que essa variável tenha distribuição normal com média X = 9 mm e desvio padrão S = 0,04 mm. Pode haver interesse em conhecer a probabilidade de um cartucho ter um diâmetro com valor entre 9 e 9,05 mm

É fácil notar que essa probabilidade, indicada pó P(9 < xi < 9,05), correspondente à

área hachurada na Fig. 20.

Figura 20 - Probabilidade de xi encontrar-se entre 9mm e 9,05mm.

O cálculo direto dessa probabilidade exige um conhecimento de Matemática mais avançado do que aquele que dispomos no curso de 2° grau. Entretanto, podemos contornar facilmente esse problema. Basta aceitar, sem demonstração, que, se X é uma variável aleatória com distribuição normal de média X e desvio padrão S, então a variável Z tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio padrão 1.

xi – X Z = S

As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas, não havendo necessidade de serem calculadas. O ANEXO E contém uma tabela de distribuição normal reduzida, que nos dá a probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor Zcrit, isto é:

P(0 < Z < Zcrit)

Temos, então, que se X é uma variável aleatória com distribuição normal de média X e desvio padrão S, pode-se escrever:

xi – X P(X< X < x) = P(0 < Z < z), com Z = S

Voltemos, então, ao nosso problema. Queremos calcular P(9 < X < 9,05). Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a x = 9,05 (x = 9 � z = 0, pois X = 9). Temos, então:

9 9,05

Page 70: Domingues 2005 - Estatística Aplicada as Ciências Militares

70

9,05 – 9 Z = 0,04

Z = 1,25 Sendo:

P(9 < X < 9,05) = P(0 < X < 1,25)

Procuremos, agora, na Tabela Z (ANEXO E) o valor de Z = 1,25. Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos, na primeira linha, o valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever:

P(0 < Z < 1,25) = 0,3944

Assim, a probabilidade de uma munição 9mm, fabricada por essa máquina, apresentar um diâmetro entre a média 9mm e o valor x1 = 9,05mm é 0,3944.

Escrevemos, então:

P(9 < X < 9,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%

EXEMPLO 5.5.2: Determine as probabilidades:

a. P( -1,25 < Z < 0)

A probabilidade procurada corresponde à parte hachurada da figura:

Sabemos que: P(0 < Z < 1,25) = 0,3944

Pela simetria da curva, temos: P( – 1,25 < Z< 0) = P(0 <Z < 1,25) = 0,3944

b. P(- 0,5 < Z < 1,48)

A probabilidade procurada corresponde à parte hachurada da figura:

Temos que P( – 0,5 < Z < 1,48) = P(- 0,5 < Z < 0)+ P( 0 < Z < 1,48)

Como: P( – 0,5 < Z< 0) = P(0 <Z < 0,5) = 0,1915 P( 0 < Z< 1,48) = 0,4306

Logo: P( – 0,5 < Z < 1,48) =0,1915 +0,4306 = 0,6221

c. P(0,8 < Z < 1,23) A probabilidade procurada corresponde à parte hachurada da figura:

Temos que P( 0,8 < Z < 1,23) = P( 0 < Z < 1,23) - P( 0 < Z < 0,8)

- 1,25 0

- 0,5 0 1,48

Page 71: Domingues 2005 - Estatística Aplicada as Ciências Militares

71

Como: P( 0 < Z< 1,23 ) = 0,2881 P( 0 < Z< 0,8) = 0,1026

Logo: P( 0,8 < Z < 1,23) = 0,2881 -0,1026 = 0,1855

d. P(Z > 0,6)

A probabilidade procurada corresponde à parte hachurada da figura:

Temos que P( Z > 0,6 ) = P( Z > 0) - P( 0 < Z < 0,6)

Como: P( Z > 0) = 0,5 e P( 0 < Z < 0,6) = 0,2258

Logo: P( Z > 0,6 ) = 0,5 – 0,2258 = 0,2742

e. P(Z < 0,92)

A probabilidade procurada corresponde à parte hachurada da figura:

Temos que P( Z < 0,92 ) = P( Z < 0) + P( 0 < Z < 0,92)

Como: P( Z < 0) = 0,5 e P( 0 < Z < 0,92) = 0,3212

Logo: P( Z > 0,6 ) = 0,5 + 0,3212 = 0,8212

EXEMPLO 5.5.3: Admitindo-se que 500 alunos de um curso de pós-graduação

estão distribuídos normalmente em torno de um grau final de curso 8,5 e com desvio padrão de 0,8, e em se querendo selecionar 10% destes alunos para realizarem um curso de aperfeiçoamento, que nota deveria ser o ponto de corte para a seleção?

Devemos inicialmente determinar os valores da variável de distribuição reduzida. Assim:

Temos que Zcrit deve conter todos os valores menores que o ponto de corte que é de 10,00%, logo, devemos encontrar o valor do Zi que represente 40% dos valores maiores que a média (0,4000) Por interpolação:

Zcrit = 1,28 . 40,00% / 39,97% Zcrit = 1,2810

Como:

xcrit – X Zcrit = S Logo:

xcrit = 1,2810 . 0,8 + 8,5= 9,5248

0,8 0 1,23

0

0,92 0

Zcrit 0

0,6

Page 72: Domingues 2005 - Estatística Aplicada as Ciências Militares

72

Page 73: Domingues 2005 - Estatística Aplicada as Ciências Militares

73

Capítulo 6 Erro, Significância, Tamanho do Efeito e Poder Estatístico

Em uma investigação científica é comum que o pesquisador questione quais as chances de um determinado fenômeno acontecer, para tal, utiliza-se dos conceitos de probabilidade.

Um primeiro conceito é o de probabilidade subjetiva ou probabilidade personalística

que está relacionado ao nível de conhecimento que dispusemos acerca de uma determinada variável.

Quais são as chances de que chova? Ouvimos um meteorologista dizer que a

probabilidade de chuva é de 90/o, e deduzimos que existe 90% de chances de chover onde estamos.

Um segundo conceito envolve o limite da freqüência relativa. Para ilustrar, suponha

que joguemos uma moeda 100 vezes, o número de caras esperado seria de 50 caras. No entanto, ao realizarmos o experimento obtivermos 45, então fri = 0,45. Jogando 1000 vezes, esperaríamos 500 caras, entretanto, podemos obter 490 caras, fri = 0,490. Se jogarmos 100000, e obtivéssemos 49995 caras, fri =0,49995. Note que, quanto maior o valor de n, o limite da freqüência relativa tende a probabilidade real do evento ocorrer, ou seja, 0,5.

Um terceiro conceito é o chamado probabilidade estatística relacionado com

estimativas calculadas por meio de experiências e testes relacionados a um determinado parâmetro populacional que se deseja inferir.

Em um teste estatístico, extraímos uma amostra de uma população de sujeitos e

eventos. Usamos afirmativas de probabilidade para descrever a confiança que depositamos nos achados estatísticos. Freqüentemente, encontramos um teste estatístico seguido pelo enunciado da probabilidade tal como p < 0,05. Mas o que significa este valor?

Para melhor compreendermos o significado do p-valor (p), passaremos a abordar os

principais conceitos relativos às hipóteses estatísticas aos erros estatísticos, à significância, ao poder, e à força dos testes estatísticos.

6.1 HIPÓTESES ESTATÍSTICAS

O teste de hipótese é uma regra de decisão para aceitar (ou rejeitar) uma hipótese de estudo com base nos elementos amostrais, possibilitando ao investigador verificar se as possíveis generalizações resultantes dos dados da pesquisa são devidas ao acaso, ou aos tratamentos dispensados às variáveis de estudo.

Page 74: Domingues 2005 - Estatística Aplicada as Ciências Militares

74

Com base em suas conjecturas sobre o fenômeno, ou em função de informações teóricas, o pesquisador formula as chamadas de hipóteses estatísticas, em suas formas nula ou alternativa.

A hipótese nula (Ho) expressa uma igualdade. Postula não existir diferença entre as

médias, tratamentos ou distribuições, pois as amostras foram retiradas da mesma população; portanto, qualquer diferença dever-se-ia ao acaso. Quando a hipótese nula é aceita, não é possível generalizar os resultados para a população.

A hipótese alternativa (H1 ou Ha) expressa uma desigualdade. Afirma existir uma

verdadeira e significativa diferença entre as populações comparadas, constituindo-se na hipótese da pesquisa, que geralmente é uma predição deduzida da teoria.

EXEMPLO 6.1.1: A altura média do soldado brasileiro é de 1,60 m.

Ho: � = 1,60m

H1: � 1,60m; ou H1: � < 1,60m e H2: � > 1,60m

EXEMPLO 6.1.2.: Soldados de cavalaria apresentam um melhor resultado no TAT

em relação aos soldados de artilharia.

Ho: �cav = �art

H1: �cav > �art EXEMPLO 6.1.3: A proporção de reprovados em um Concurso é maior que 50%.

Ho: p < 0,5

H1: p > 0,5

No entanto, devido ao fato de que a decisão será baseada em estimativas fornecidas pela amostra, fica evidente que, devido às condições de incerteza, o pesquisador estará sujeito a erros ao decidir.

Os testes de hipótese dimensionam a probabilidade (risco) de se estar cometendo

algum tipo de erro, fornecendo alguma segurança para a tomada de decisão acerca de aceitar, ou rejeitar uma hipótese estatística.

6.2 TIPOS DE ERROS ESTATÍSTICOS

Existem dois possíveis tipos de erros, quando realizamos um teste estatístico para se aceitar ou rejeitar Ho. Podemos rejeitar Ho, quando ela é verdadeira, ou aceitar Ho, quando ela é falsa.

O erro de rejeitar Ho, sendo Ho verdadeira, é denominado Erro tipo I, sendo sua

probabilidade designada por �. Por outro lado, o erro de se aceitar Ho, sendo Ho falsa, é denominado Erro tipo II,

sendo sua probabilidade designada por .

Page 75: Domingues 2005 - Estatística Aplicada as Ciências Militares

75

O Quad. 4 é chamado de Quadro da Verdade, apresentando os erros tipo I e II. Note que aceitar uma hipótese nula verdadeira, ou rejeitar uma falsa é a decisão correta.

Realidade Decisão Ho é verdadeira Ho é falsa

Aceitação Não houve erro Erro tipoI

( � )

Rejeição Erro tipoII

( ) Não houve erro

Quadro 4 - Quadro da verdade

6.2.1 Erro Tipo I - Alfa (�)

Em pesquisa, o resultado do teste estatístico é comparado a uma tabela de

probabilidade, para aquele modelo teórico de distribuição de probabilidades, a qual lhe dirá qual a chance de ocorrência daquele valor.

Antes do inicio de um experimento deve-se de estipular a probabilidade do Erro Tipo

I que se está disposto a cometer, estabelecendo � a priori. Se � é estabelecido em 0,05, então, em 100 experimentos realizados, uma hipótese nula verdadeira de não-diferença ou de não relação entre as variáveis, seria rejeitada somente em 5 ocasiões. Embora as chances do erro ainda existam, o experimentador as especificou exatamente pelo estabelecimento de alfa antes do estudo.

EXEMPLO 6.2.1: Em um estudo do efeito de um remédio para o câncer, o

experimentador pode não querer aceitar a hipótese nula de “ nenhum efeito” , se existe alguma chance da droga fazer efeito. Assim, o experimentador pode estabelecer um alfa de 0,30 sempre, embora as chances de acontecer um erro tipo I possam ser aumentadas. O experimentador está garantindo que a droga tem todas as oportunidades de mostrar sua efetividade. Por outro lado, estabelecer um alfa de 0,001 diminui enormemente as chances do erro tipo I ocorrer.

Não podemos dizer onde estabelecer o alfa; entretanto, podemos dizer que os níveis

0,05 ou 0,01 (as probabilidades de os achados não serem devidos ao acaso e sim aos tratamentos são, respectivamente, de 5 em 100, e de 1 em 100) são amplamente utilizados na comunidade científica. Se o alfa for movido para cima ou para baixo, certifique-se de justificar a razão.

Mesmo quando os experimentadores estabelecem o alfa em um nível específico (p.

ex., 0,05) antes da pesquisa, eles freqüentemente relatam o p-valor para os efeitos específicos do estudo no nível que ocorreu (p. ex., p = 0,012). Não há nada de errado com este procedimento, na medida em que estão somente demonstrando em que grau o nível de probabilidade excedeu o nível especificado (afinal 0,012 < 0,05).

Uma abordagem mais adequada pode ser a de relatar o nível exato de probabilidade (p.

ex., p = 0,024) associado com o teste estatístico. Então avaliaremos o significado da diferença ou relação. Usando a informação estatística (significância ou significado), o pesquisador deve interpretar os resultados dentro da teoria e hipóteses que foram formuladas. Em vez de tomar uma decisão somente estatística, esta abordagem coloca a responsabilidade da tomada de

Page 76: Domingues 2005 - Estatística Aplicada as Ciências Militares

76

decisão onde ela deve estar, ou seja, no pesquisador que colocou o estudo em um modelo teórico, e que considerou as pesquisas relacionadas ao seu objeto de estudo.

6.2.2 Erro Tipo II - Beta (�)

Embora a magnitude do erro tipo I seja especificada pelo alfa, podemos também cometer o erro tipo II, cuja magnitude é determinada por beta (). Observando a Fig. 21, podemos notar a sobreposição da distribuição de escores na variável dependente para X (distribuição da amostragem se a hipótese nula é verdadeira) e Y (distribuição da amostragem se a hipótese nula é falsa).

Figura 21. Áreas de distribuição do erro tipo II

Pela especificação do alfa, indicamos que a média de Y (dado uma certa distribuição)

deve ser em uma distância especificada da média de X antes da hipótese nula ser rejeitada. Entretanto, se a média de Y localiza-se em algum lugar entre a média de X e o Y especificado, pode-se estar cometendo um erro tipo II (�); isto é, não rejeitar a hipótese nula quando, de fato, existe uma diferença verdadeira. Como podemos ver, existe uma relação entre alfa e beta, a medida que alfa é diminui, beta torna-se maior.

Obviamente, o pesquisador deseja reduzir ao mínimo as probabilidades dos dois tipos

de erros. A redução simultânea dos erros poderá ser alcançada pelo aumento do tamanho da amostra. Para um mesmo n, a probabilidade de se incorrer em um Erro tipo II aumenta à medida que diminui a probabilidade do Erro tipo I, e vice-versa.

Para compreender o relacionamento dos erros e suas dimensões, vamos idealizar uma

configuração a partir de um exemplo. EXEMPLO 6.2.2: Sabendo-se a variância da população vale 9, e que foi retirada de

uma amostra de 36 elementos, testar:

Ho: � = 25

H1: � > 25

Para valores de � próximos de 25 a hipótese Ho poderá ser aceita. Como H1: � >25,

devemos ter um limite crítico à direita para valores de X.

1 -

X Y

Distribuição da amostragem

sob Ho

Distribuição da amostragem

se Ho é falsa

Page 77: Domingues 2005 - Estatística Aplicada as Ciências Militares

77

A área hachurada à direita de Xcrit corresponde à probabilidade de rejeitar Ho, quando

Ho: � = 25 é verdadeira. Essa área representa a probabilidade de cometer o Erro tipo I, ou seja, a área representa o risco �.

Para encontrar o limite crítico(Xcrit) pode-se atribuir valores para �, padronizando-se a

distribuição normal das médias das possíveis médias amostrais, utilizando-se para tal a distribuição Z, como explicado a seguir:

Para � = 0,05, Z=1,64

Xcrit – � Z =

� / n Logo:

Xcrit = � + Z . � / n

Xcrit = 25 + 1,645 . 3/ 36

Xcrit = 25,823

Assim, a regra de decisão para Ho será:

Rejeitar Ho, quando Xcrit > 25,823

Aceitar Ho, quando Xcrit < 25,823 Observando o gráfico acima, é fácil constatar que existe uma grande probabilidade de

aceitar Ho: � = 25 (95%) e pouca probabilidade (apenas 5%) de rejeitar Ho � = 25.

Região de Aceitação Para Ho: � = 25

Região de Rejeição Para Ho: � = 25

� = 25 Xcrit

Região de Aceitação Para Ho: � = 25

Região de Rejeição Para Ho: � = 25

� = 25 25,823

� = 0,05

Xcrit

RA RC

RA RC

Page 78: Domingues 2005 - Estatística Aplicada as Ciências Militares

78

Ora, quando se aceita uma hipótese Ho pode-se estar cometendo o Erro tipo II (aceitar Ho, quando Ho é falsa). No exemplo, essa probabilidade pode ser de 95% quando Ho: � = 25 for falsa, fato extremamente preocupante. Por outro lado, têm-se apenas 5% de chances para rejeitar Ho.

No entanto, quando se rejeita Ho, pode-se estar cometendo o Erro tipo I (rejeitar Ho

quando Ho é verdadeira). Como a probabilidade neste caso é relativamente baixa (5%), a decisão de rejeitar Ho é muito mais segura do que a decisão de aceitar Ho.

6.2.3 Lógica do teste de significância

Fixando �, pode-se determinar a probabilidade p de cometer o Erro tipo II. Para o

cálculo de , é preciso admitir outros valores para, já que seu valor original é considerado falso.

(1) Atribuir baixos valores para � (geralmente de 1% a 10%). (2) Formular Ho com a pretensão de rejeitá-la (daí o nome “ hipótese nula”). (3) Se o teste indicar a rejeição de Ho, tem-se um indicador mais seguro para a decisão. (4) Caso o teste indique a aceitação de Ho, diz-se que, com o nível de significância

(�), não se pode rejeitar Ho. No EXEMPLO 6.2.3, Ho: � = 25 seria falso, ou seja, em realidade � > 25. Ora, essa

suposição corresponde a uma infinidade de possíveis valores para � (25,2; 25,5; 26, 27...). Para cada um desses valores podemos determinar o valor de p condicionando à

hipótese admitida. Assim, para um valor qualquer, � > 25, temos a seguinte configuração para o Erro tipo II.

Fixando-se � = 0,05, para valores de Xcrit próximos de 25, temos elevados índices

para . Observando-se o gráfico, quando �1 = 25,823, temos a seguinte probabilidade:

25,823 – 25,823 P(/ �1 = 25,823) = P(X < 25,823/ �1 = 25,823) = P Z =

3 / 36 = 0

Região de Aceitação Para Ho: � = 25

Região de Rejeição Para Ho: � = 25

� = 25 25,823 �1

Page 79: Domingues 2005 - Estatística Aplicada as Ciências Militares

79

Consultando a Tabela Z verifica-se que, para um valor de Z = 0, a área correspondente sob uma distribuição normal é de 0,50, ou seja, 50% .

Logo, a probabilidade de cometer-se um Erro tipo II () é de 50%.

P(/ �1 = 25,823) = 0,5 = 50% Esse valor crescerá à medida que os valores de �1 forem menores que 21,64. Fixando � = 0,05

25,823 - 26 P(/ �1 = 26) = P(X < 25,823/ �1 = 26) = P Z =

3 / 36 = -0,36 = 0,3594

25,823 – 25,5

P(/ �1 = 25,5) = P(X < 25,823/ �1 = 25,5) = P Z = 3 / 36

= 0,646 = 0,7401

25,823 – 25

P(/ �1 = 25) = P(X < 25,823/ �1 = 25) = P Z = 3 / 36

= 1,645 = 0,95

Assim: H0 = � = �1 1 – 25 0,9500 0,05 25,5 0,7401 0,2599 25,823 0,5000 0,5000 26,00 0,3594 0,6406

Ao formular-se hipóteses próximas à hipótese original (� = 25), os valores de são

elevados, diminuindo à medida que o valor de Xcrit se afasta do valor testado. Não é comprometedor ter-se elevados valores de para hipóteses próximas da original.

Dizer que há um erro de 0,7401 (74,01%) de aceitar Ho: � = 25, quando na realidade

Ho: � = 25,5, não é um resultado preocupante, pois estamos aceitando 25, quando o verdadeiro pode ser 25,5. A diferença de 0,5 (erro absoluto) não é tão preocupante.

Quando os valores alternativos (�i) afastam-se do valor da hipótese original as

probabilidades de erros () diminuem, atenuando as preocupações do pesquisador. Quanto à aplicação dos testes de hipóteses a resultados de pesquisas empíricas,

considera-se apenas a probabilidade de cometer o Erro tipo I. Para testar a hipótese nula, formulada com o propósito de verificar a possibilidade de rejeitar H0 com base nos dados amostrais, admite-se � (nível de significância do teste) entre 1% e 10%, pois a indicação de rejeição de H0, com baixo risco, implica em uma melhor decisão.

Page 80: Domingues 2005 - Estatística Aplicada as Ciências Militares

80

6.3 CURVA CARACTERÍSTICA DE OPERAÇÃO (CCO) A Curva Característica de Operação expressa o comportamento do erro em função

das diversas hipóteses alternativas feitas para Ho, fixando-se um nível de probabilidade denominado nível de significância do teste.

A CCO do EXEMPLO 6.2.3 seria dada por:

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

Admitindo-se � constante, quanto maior for o tamanho da amostra menor será o erro

, conforme apresentado abaixo:

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

25 25,5 26 25,8 26,5

�i

n1 n2

n3

n1 < n2 < n3

Page 81: Domingues 2005 - Estatística Aplicada as Ciências Militares

81

Uma alternativa às Curvas Características de Operação é a construção das Curvas de Poder do Teste, ou Curvas de Força do Teste, em que a força do teste: (1 – ) é obtida em função dos valores atribuídos à hipótese H0, conforme tratado mai s adiante.

6.4 SIGNIFICADO OU TAMANHO DO EFEITO

Além de reportar a significância dos resultados, estudiosos precisam se preocupar com o significado dos resultados em suas pesquisas. O significado da diferença entre duas médias pode ser estimado de várias formas, uma em particular que tem chamado muita atenção recentemente: o tamanho do efeito, que pode ser calculado pela fórmula:

TE = (M1 – M2 )/ S

Esta fórmula subtrai a média de um grupo (M1) da média do segundo grupo (M2), e divide a diferença pelo desvio-padrão. Desta forma, a diferença entre as médias é colocada na métrica comum chamada de “ unidades de desvio-padrão” , e sua relação com o significado dos resultados pode ser mensurado, segundo Cohen (1969), conforme o quadro abaixo:

Relação Significado TE < 0,2

0,2< TE <0,8 TE > 0,8

pequeno moderado

grande

Quadro 5 - Classificação quanto ao Tamanho do Efeito.

6.5 PODER

Poder é a probabilidade de rejeitar a hipótese nula quando esta é falsa (p. ex.,

detectando uma diferença real), ou a probabilidade de tomar a decisão correta. Ter poder na análise estatística é importante porque aumenta as chances de rejeitar a hipótese nula falsa. É claro que, até certo ponto, na pesquisa comportamental, a hipótese nula é sempre falsa.

O que este enunciado reflete é que em pesquisa comportamental as médias dos dois

grupos nunca são as mesmas. Assim, se suficientes sujeitos são obtidos (uma forma de obter poder), quaisquer duas médias podem ser declaradas significativamente diferentes.

As questões mais interessantes em pesquisa comportamental são: a. O quanto uma diferença é importante na teoria e/ou na prática? b. Quantos sujeitos são necessários para declarar uma diferença importante como

significante? Entendendo o conceito de poder, pode-se responder às duas questões. Se um

pesquisador pode identificar o tamanho de um importante efeito por meio de pesquisas prévias, ou simplesmente estimar um tamanho do efeito (p. ex., 0,5 é um TE moderado, também chamado delta, �), estabelecer quanto de poder é aceitável (p. ex., uma estimativa comum em ciência comportamental é 0,8), então o tamanho da amostra necessário para o estudo pode ser estimado.

Page 82: Domingues 2005 - Estatística Aplicada as Ciências Militares

82

As Figuras 22 e 23 oferecem uma visão da relação entre o tamanho da amostra, (eixo y), o poder (eixo x), e o tamanho do efeito (curva TE), quando alfa é 0,05 ou 0,01.

EXEMPLO 6.5.1 No planejamento de um estudo, o investigador tem dois grupos, que serão randomicamente formados, mas não sabe quantos sujeitos são necessários para cada grupo a fim de identificar uma diferença significativa entre os tratamentos. Entretanto, existem vários estudos relacionados e o investigador calculou um TE médio = 0,70 favorecendo o grupo experimental nos resultados desses estudos.

O investigador decide estabelecer � = 0,05 e quer proteger em 4 vezes o nível de

alfa (assim, = 0,20) porque Cohen (1988) sugeriu que em ciências comportamentais, a seriedade do erro do tipo I para o tipo II deverá ter a razão de 1 para 4 (0,05 x 4 = 0,20). Uma vez que o poder é 1 - (1,0 - 0,2 = 0,8), então o poder é estabelecido em 0,8 (freqüentemente recomendado como poder adequado em pesquisa comportamental, Green, 1991, p. 502).

Figura 22 - Curva do tamanho do efeito para �= 0,05, teste bicaudal.

Figura 23 - Curva do tamanho do efeito para � = 0,01, teste bicaudal.

Quando as informações prévias são conhecidas (�, TE e poder), então o número de

sujeitos necessários em cada um dos dois grupos pode ser estimado da Fig. 22 Deve-se ler a

TE=0,7

TE=0,3

TE=0,2

TE=0,4

TE=0,5

TE=0,6

TE=0,8

500

400

300

200

100

50

0,4 0,3 0,5 0,6 0,9 0,7 0,8

500

400

300

TE=0,6

TE=0,3

TE=0,2

TE=0,4

TE=0,5

TE=0,7

TE=0,8

200

100

50

0,3 0,4 0,5 0,6 0,9 0,7 0,8

Poder

Poder

n para cada grupo

n para cada grupo

Page 83: Domingues 2005 - Estatística Aplicada as Ciências Militares

83

curva TE 0,70 por onde atravessa o eixo x (poder) em 0,8, e então, ler através do eixo y (tamanho da amostra) e observar que 30 sujeitos serão necessários para cada grupo.

Conforme o número de sujeitos em cada grupo é reduzido, o poder é reduzido (dado o mesmo TE). Analisando a Fig. 23 (alfa = 0,01), nota-se que para o mesmo nível de poder (0,8) e TE (0,70), o número de sujeitos necessários aumenta de 30 (como na Fig. 22, onde alfa 0,05) para 50.

Pode-se verificar, que para um alfa mais rigoroso (p. ex., 0,05 a 0,01), um maior

número de sujeitos é requerido para detectar uma diferença significativa.

Page 84: Domingues 2005 - Estatística Aplicada as Ciências Militares

84

Page 85: Domingues 2005 - Estatística Aplicada as Ciências Militares

85

Capítulo 7

Inferência Estatística

O principal objetivo da inferência estatística é obter informações sobre uma população, com base em elementos amostrais, para aplicá-las à resolução de problemas práticos. Como as populações são caracterizadas por medidas numéricas descritivas, denominadas parâmetros, a estatística diz respeito à realização de inferências sobre esses parâmetros populacionais desconhecidos.

Os parâmetros populacionais típicos são: - a média (�); - o desvio padrão (�); e - a proporção (p) de determinado evento populacional. Os métodos para realizar inferências a respeito dos parâmetros pertencem a duas

categorias: - estimação: determinação de estimativas dos parâmetros populacionais; e - teses de hipóteses: tomada de decisão relativa ao valor de um parâmetro.

7.1 ESTIMATIVA POR PONTO A estimativa por ponto consiste em, com base em dados amostrais, calcular-se um

valor da estimativa de um parâmetro populacional. Assim: - o valor da média amostral (X) constitui uma estimativa do parâmetro (�); - o valor do desvio padrão amostral (S) constitui uma estimativa do parâmetro (�), e - o valor da freqüência relativa amostral (fri) constitui uma estimativa do parâmetro

(p) de um determinado evento populacional. EXEMPLO 7.1.1 Uma amostra aleatória de 300 candidatos à Escola Preparatória

de Cadetes do Exército, de um total de 200.000, revelou nota média amostral de 6,0 no concurso.

Logo: X = 6,0 é uma estimativa por ponto da verdadeira nota média (�) dos 200.000

candidatos. 7.2 ESTIMATIVA POR INTERVALO

Uma estimativa por intervalo consiste em, com base em dados amostrais, calcular-se

um intervalo determinado por dois números, que se espera contenha o valor do parâmetro populacional (�) com dado nível de confiança ou probabilidade (1 – �) = 90%, 95%, 97,5%...

Quanto menor for o intervalo, maior será o grau de precisão da inferência realizada, e as estimativas dessa natureza são denominadas de intervalos de confiança (IC).

Page 86: Domingues 2005 - Estatística Aplicada as Ciências Militares

86

EXEMPLO 7.2.1 O intervalo [1,59m; 1,64m] contém a altura média dos soldados de uma Brigada, com nível de confiança de 90%;

EXEMPLO 7.2.2 Com 95% de confiança, pode-se afirmar que o intervalo [2%;

4%] contém a proporção de aprovados na EsAO com média final de curso acima de 9,0; EXEMPLO 7.2.3 O intervalo [0,001 mm; 0,002 mm] contém o desvio padrão do

calibre de munições produzidas por uma determinada máquina, com 97,5% de confiança. Quando se constrói um intervalo de confiança é importante atentar para o risco do erro

tipo I (�). Se o nível de confiança é de 90%, o risco do erro da inferência estatística será de 10% (� = 0,1). Logo, se construíssemos 100 intervalos, baseados em 100 amostras de tamanhos iguais, poderíamos esperar que 90 desses intervalos (90% deles) iriam conter o parâmetro populacional sob estudo, enquanto 10 intervalos (10% deles) não iriam conter o parâmetro.

EXEMPLO 7.2.4 Tomando-se 10 amostras aleatórias de 10 soldados de uma Brigada, construir o IC que contém a altura média dos soldados da Brigada.

Amostras

1 2 3 4 5 6 7 8 9

10 �

Alturas

Figura 24 – Intervalo de Confiança para � a partir de 10 amostras de tamanho n (p=0,9) Os segmentos horizontais representam os 10 intervalos amostrais, e a reta vertical

representa a localização do parâmetro �. Nota-se que o parâmetro é fixo, e que a localização do intervalo varia de amostra para amostra. Por conseguinte, diz-se que a “ probabilidade do intervalo [1,59; 1,64] conter o parâmetro � é de 90%” , já que em 9 amostras � está contido. Note que não é possível afirmar que “ existe “ 90% de probabilidade de � pertencer ao intervalo [1,59; 1,64]” , já que � é fixo, e o intervalo é aleatório. Na prática, somente um intervalo é construído por meio da amostra aleatória obtida.

7.3 INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL QUANDO A VARIÂNCIA É CONHECIDA

Como dito, o estimador de � é X. E a distribuição de probabilidade de X é dada por:

1,57 1,58 1,59 1,60 1,61 1,62 1,63 1,64 1,65 1,66

Page 87: Domingues 2005 - Estatística Aplicada as Ciências Militares

87

- para populações infinitas

�² X d N � ; n

- para populações finitas.

�² N – n X d N � ; n N – 1 Assim, para o caso de populações infinitas, a variável normal padronizada de X será:

X - � Z =

� / n Fixando um nível de confiança (1 – �) temos:

Ou seja:

P(– Z�/2 < Zi < Z�/2 ) = 1 – �

Substituindo o valor de Zi:

X - � P – Z�/2 <

� / n < Z�/2 = 1 – �

Resolvendo as duas inequações para �, temos o intervalo de confiança para a média

populacional ( � ), quando a variância ( �2 ) é conhecida para populações infinitas:

P X – Z�/2 �/ n < � < X + Z�/2 �/ n = 1 – �

Page 88: Domingues 2005 - Estatística Aplicada as Ciências Militares

88

Para a determinação do IC deve-se proceder da seguinte forma: (1) Fixar �, e determinar o Zcrit com o auxílio da Tabela Z. (2) Determinar a Região de Aceitação (RA) e a Região de Rejeição (RC), por meio do

valor do Zcrit. (3) Construir o IC com os valores da média amostral (X), do desvio-padrão

populacional (�) e do tamanho da amostra (ni).

EXEMPLO 7.3.1 O número de flexões de braço realizados por soldados é tal que � = 5. Foram amostrados aleatoriamente 100 soldados em todo o pais, obtendo-se uma média de flexões de braço igual a 25. Construir um intervalo de confiança para a verdadeira média nacional de flexões de braço com um nível de confiança de 95%.

Solução: (1) Fixando � = 0,05, encontra-se Zcrit = 1,960 (2) Determinando RA e RC por meio do Zcrit:

(3) Construindo o IC: Dado que: � = 5 n = 100 X = 25 � = 0,05 Zcrit = 1,960 Logo:

P 25 – 1,96 . 5/ 100 < � < 25 + 1,96 . 5/ 100 = 95%

P(24,02 < � < 25,98) = 95%

2,5% 2,5%

-1,960 1,960

Page 89: Domingues 2005 - Estatística Aplicada as Ciências Militares

89

(4) Conclusão:

A interpretação desse resultado pode ser expressa por uma das duas maneiras:

- “ O intervalo [24,02; 25,98] contém o número médio de flexões de braço executado por soldados do Exército Brasileiro, com 95% de confiança” ; ou

- “ Com 95% de confiança o intervalo [24,02; 25,98] contém o número médio de flexões de braço executado por soldados do Exército Brasileiro” .

Resolvendo as duas inequações para �, temos o intervalo de confiança para a média

populacional ( � ), quando a variância ( �2 ) é conhecida para populações finitas:

� N – n � N – n P X – Z�/2 n

N – 1 < � < X + Z�/2

n

N – 1 = 1 – �

Para a determinação do IC deve-se proceder da seguinte forma:

(1) Fixar �, e determinar o Zcrit com o auxílio da Tabela Z. (2) Determinar RA e RC por meio do valor do Zcrit. (3) Construir o IC com os valores da média amostral (X), do desvio-padrão

populacional ( � ), do tamanho da população (N) e do tamanho da amostra (ni).

EXEMPLO 7.3.2 O consumo de combustível por viaturas 5 ton é tal que � = 1 Km/l. Foram amostradas aleatoriamente 100 viaturas das 1000 de uma Divisão de Exército, obtendo-se uma média de consumo de combustível de 5 Km/l. Construir um intervalo de confiança para o verdadeiro consumo médio de combustível com um nível de confiança de 90%.

Solução: (1) Fixando � = 0,1, encontra-se Zcrit = 1,645. (2) Determinando RA e RC por meio do Zcrit:

5% 5%

-1,645 1,645

Page 90: Domingues 2005 - Estatística Aplicada as Ciências Militares

90

(4) Construindo o IC: Dado que: � = 1 N = 1000 n = 100 X = 5 � = 0,1 Zcrit = 1,645 Logo:

1 1000 – 100 1 1000 – 100

P 5 – 1,645 . 100

. 1000 – 1

< � < 5 + 1,645 100

. 1000 – 1

= 90%

P(4,844 < � < 5,156) = 90%

(5) Conclusão:

A interpretação desse resultado pode ser expressa por uma das duas maneiras:

- “ O intervalo [4,844; 5,156] contém o consumo médio de combustível das viaturas 5 ton da DE, com 90% de confiança” ; ou

- “ Com 90% de confiança o intervalo [4,844; 5,156] contém consumo médio de combustível das viaturas 5 ton da DE” .

7.4 INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL QUANDO A VARIÂNCIA É DESCONHECIDA

É possível construir-se intervalos de confiança para a média quando dispõe-se de

pequenas amostras, mas não se conhece o valor do desvio padrão populacional (�). No entanto, é necessário que a população de onde foi extraída a amostra aleatória tenha distribuição normal.

Como não se conhece � é preciso substituí-lo por S (desvio padrão amostral) que,

contrariamente a �, é uma variável aleatória. Daí se ter o quociente entre duas variáveis aleatórias, X e S.

Como visto no Capítulo 5, o estimador:

X - �

S / n tem distribuição t de Student com (n – 1) graus de liberdade

Fixando um nível de confiança (1 – �), temos:

Page 91: Domingues 2005 - Estatística Aplicada as Ciências Militares

91

Ou seja:

P( –t�/2 < ti < t �/2) = 1 – � Substituindo o valor de t, e resolvendo as inequações para �, obtemos o intervalo para

a média, quando a variância populacional (� 2) é desconhecida, para populações infinitas:

P X – t�/2 �/ n < � < X + t�/2 �/ n = 1 – �

Para a determinação do IC deve-se proceder da seguinte forma:

(1) Fixar �, e determinar o tcrit com o auxílio da Tabela t (ANEXO F), com (n – 1)

graus de liberdade. (2) Determinar RA e RC, por meio do valor do tcrit. (3) Construir o IC com os valores da média amostral (X), do desvio-padrão amostral

(S) e do tamanho da amostra (ni).

EXEMPLO 7.4.1 Escolhendo uma amostra aleatória de 30 cartuchos 7,62mm (produzidos por uma determinada máquina) obteve-se as seguintes estimativas:

X = 7,62mm S = 0,012mm Considerando que o diâmetro dos cartuchos produzidos provém de uma distribuição

normal, construir um intervalo de confiança para a média do diâmetro dos cartuchos produzidos pela máquina ao nível de 95%.

Solução: (1) Fixando � = 0,05, e determinando o tcrit gl = (30 – 1) = gl = 29

�/2 �/2

–t�/2 t�/2 ti

Page 92: Domingues 2005 - Estatística Aplicada as Ciências Militares

92

t29;0,05 = 2,045 (2) Determinando RA e RC, por meio do valor do tcrit.

(3) Construindo o IC com os valores da média amostral (X), do desvio-padrão

amostral (S) e do tamanho da amostra (ni). Dado que: X = 7,62 S = 0,012 n = 10 � = 0,05 t29;0,05 = 2,045 Logo:

P (7,62 – 2,045 . 0,012/ 10 < � < 7,62 + 2,045 . 0.012/ 10) = 95%

P(7,612 < � < 7,628) = 95%

(4) Conclusão: O intervalo [7,612; 7,628] contém a verdadeira média com 95% de confiança. Para os casos de populações finitas, substituindo o valor de t, e resolvendo as

inequações para �, obtemos o intervalo para a média, quando a variância populacional (� 2) é desconhecida:

S N – n S N – n P X – t�/2 n

N – 1

< � < X + t�/2 n

N – 1 = 1 – �

Para a determinação do IC deve-se proceder da seguinte forma:

(1) Fixar �, e determina-se o tcrit com o auxílio da Tabela t com (n – 1) graus de

liberdade,

2,5% 2,5%

-2,045 2,045

Page 93: Domingues 2005 - Estatística Aplicada as Ciências Militares

93

(2) Determinar RA e RC, por meio do valor do tcrit. (3) Construir o IC com os valores da média amostral (X), do desvio-padrão amostral

(S), do tamanho da população (N) e do tamanho da amostra (ni).

EXEMPLO 7.4.2 Escolhendo uma amostra aleatória dos graus obtidos por Cap CAO 2º ano da EsAO, em uma determinada avaliação, os dados dispuseram-se da seguinte forma:

Sujeitos 1 2 3 4 5 6 7 8 9 10 X S

Grau 8 8 8 7 6 9 9 10 6 7 7,8 1,32 Considerando que os graus obtidos provem de uma distribuição normal, construir um

intervalo de confiança para a média ao nível de 95%. Solução: (1) Fixando � = 0,05, determina-se o tcrit

gl = (10 – 1) = gl = 9

t9;0,05 = 2,226

(2) Determinando RA e RC, por meio do valor do tcrit.

(3) Construindo o IC com os valores da média amostral (X), do desvio-padrão

amostral (S) e do tamanho da amostra (ni). Dado que:

X = 7,8 S = 1,32 N = 400 n = 10 � = 0,05 t 9; 005 = 2,226

2,5% 2,5%

2,226 2,226

Page 94: Domingues 2005 - Estatística Aplicada as Ciências Militares

94

1,32 400 – 10 1,32 400 – 10 P 7,8 – 2,226 10

400 – 1 < � < 7,8 – 2,226

10

400 – 1 = 95%

P(7,39 < � < 8,21) = 95%

(4) Conclusão: O intervalo [7,39; 8,21] contém a verdadeira média com 95% de confiança.

7.5 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA Como visto na seção 7.1, o estimador de �2 é S2, e S2 tem distribuição Qui-Quadrado

[S2(n – 1)/ � 2 ] com (n – 1) graus de liberdade, a exceção de constantes. Ou seja:

S2(n-1) �

2n-1 d

�² Admitindo-se que a população de onde foi extraída a amostra tenha distribuição

normal, pode-se construir o intervalo:

Ou seja:

P( �2inf < � 2

n-1 < �2

sup ) = 1 – � Substituindo o valor de � 2

n-1 e resolvendo as duas inequações para �², obtém-se o intervalo:

S2(n-1) S2(n-1) P

�2

sup < �² <

�2

inf = 1 – �

�2

sup

RC RA

�/2

1 - �

�2

f (�2)

RC

�2

inf

�/2

=

Page 95: Domingues 2005 - Estatística Aplicada as Ciências Militares

95

Para a determinação do IC deve-se proceder da seguinte forma: (1) Fixar �, e determinar os �2

inf e o �2sup com o auxílio da Tabela � 2 com (n – 1)

graus de liberdade, (2) Determinar RA e RC, por meio do valor dos � 2

crit (3) Construir o IC com os valores da variância amostral (S2) e do tamanho da amostra

(ni).

EXEMPLO 7.5.1 Retirando-se, de uma distribuição normal, uma amostra aleatória com n = 20 e S²=4. Construir um IC para a variância populacional ao nível de 90%.

Solução: (1) Fixando � = 0,1, determinamos os �2

inf e o �2sup

gl = (20 – 1) = gl = 19

� 2

19;0,95 = 10,117 e � 219;0,05 = 30,144

(2) Determinando RA e RC, por meio dos valores dos � 2crit

(3) Construindo o IC Dado que: S2 = 4 n = 20 � = 0,15 �

219;0,95 = 10,117

� 2

19;0,05 = 30,144 4(20 – 1) 4(20 – 1)

P 30,144

< �² < 10,117

= 90%

P(2,524 < �² < 7,512) = 90%

Assim, podemos afirmar que o intervalo [2,524; 7,512] contém a verdadeira variância populacional com 90% de confiança.

30,144

RC RA

5%

�2

f (�2)

RC

10,117

5%

Page 96: Domingues 2005 - Estatística Aplicada as Ciências Militares

96

7.6 INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO Admitindo que a distribuição de probabilidade populacional de onde se extraiu a

amostra seja normal, o intervalo de confiança aproximado para o desvio padrão (�) é dado pela raiz quadrada do IC para a variância (�²), sendo a distribuição Qui-Quadrado é tomada com (n – 1) graus de liberdade.

Assim: S2(n-1) S2(n-1)

P �

2sup

< � < �

2inf

= 1 – �

EXEMPLO 7.6.1 Com os dados do EXEMPLO 7.5.1, construir o IC para o

desvio padrão populacional. Solução: (1) Fixando � = 0,1, determinamos os �2

inf e o �2sup

gl = (20 – 1) = gl = 19

� 2

19;0,95 = 10,117 e � 219;0,05 = 30,144

(2) Determinando RA e RC, por meio dos valores dos � 2crit

(3) Construir o IC com os valores da variância amostral (S2) e do tamanho da amostra (ni).

Dado que: S2 = 4 n = 20 � = 0,1 �

219;0,95 = 10,117

� 2

19;0,05 = 30,144

4(20 – 1) 4(20 – 1) P

30,144 < � <

10,117 = 90%

30,144

RC RA

5%

�2

f (�2)

RC

10,117

5%

Page 97: Domingues 2005 - Estatística Aplicada as Ciências Militares

97

P(1,589 < � < 2,741) = 90%

Assim, podemos afirmar que o intervalo [1,589; 2,741] contém verdadeiro desvio padrão populacional com 90% de confiança.

7.7 INTERVALO DE CONFIANÇA PARA A PROPORÇÃO

Para amostras suficientemente grandes (n > 30), a distribuição amostral de fr = p= xi/ni

é aproximadamente normal com média p, isto é: �f = p e desvio padrão dado por:

p(1 – p) �(f) =

n

Onde: fr = freqüência relativa dos sucessos = p = estimador de p p = verdadeira proporção populacional de “ sucessos” xi = numero de “ sucessos” na amostra ni = tamanho da amostra Para grandes amostras:

fr – p

p(1 – p)

Zi =

n

Fixando um nível de confiança de (1 – �), temos:

Substituindo o valor de Zi e resolvendo as duas inequações para p, temos:

p(1 – p) p(1 – p) P fr – Z�/2

ni

< p < fr + Z�/2

ni = 1 – �

^

^

�/2 �/2

-Z�/2 -Z�/2 Zi

Page 98: Domingues 2005 - Estatística Aplicada as Ciências Militares

98

Para grandes amostras podemos substituir p, do radicando, por f, obtendo o IC para a proporção populacional de um determinado evento:

fr (1 – fr) fr (1 – fr) P fr – Z�/2

ni

< p < fr + Z�/2

ni = 1 – �

EXEMPLO 7.7.1 Examinando-se uma amostra aleatória de 500 graus obtidos por

candidatos ao Concurso da ESA foram encontrados 200 graus abaixo de 5. Com 95% de confiança, desejamos construir um intervalo para a verdadeira proporção de candidatos que não atingiram o grau 5.

Solução: (1) Calcula-se a freqüência relativa de graus abaixo de 5

fr = 200/500 = 0,4

Fixando � = 0,05, por meio de fr determina-se o Zcrit

Zcrit = 1,960

(2) Determina-se RA e RC, por meio do valor do Zcrit

(3) Constrói-se o IC com os valores da freqüência relativa (fr), do tamanho da

amostra (ni), e do Zcrit. Dado que: fr = 0,4 n = 500 � = 0,05 Zcrit = 1,960 Substituindo os valores na fórmula:

0,4 (1 – 0,4r) 0,4 (1 – 0,4r) P 0,4 – 1,96 500 < p < 0,4 + 1,96 500 = 1 – �

2,5% 2,5%

-1,960 1,960

Page 99: Domingues 2005 - Estatística Aplicada as Ciências Militares

99

P(0,3571 < � < 0,4429) = 95%

Assim, podemos afirmar que o intervalo [0,3571; 0,4429] contém a verdadeira proporção de candidatos que obtiveram grau inferior a 5 no Concurso da ESA.

Para o caso de populações finitas:

fr (1 – fr) N – n fr (1 – fr) N – n P fr – Z�/2 . n

N – 1 < � < fr + Z�/2 . n N – 1 = 1 – �

Embora se aceite que n>30 suporta a idéia de “ amostra suficientemente grande” , uma

regra prática para se verificar se o tamanho da amostra pode assim ser considerado é aplicar a fórmula:

fr (1 – fr) fr + 2 . n

A amostra será “ suficientemente grande” se o intervalo resultante não contiver os

valores “ 0” ou “ 1” .

Page 100: Domingues 2005 - Estatística Aplicada as Ciências Militares

100

Page 101: Domingues 2005 - Estatística Aplicada as Ciências Militares

101

Capítulo 8 Testes paramétricos de hipóteses

Ao invés de calcular uma estimativa pontual ou por intervalo do parâmetro, conforme exposto no Capítulo 7, é possível admitir-se um valor hipotético para um parâmetro populacional, e com base nas informações de uma amostra realizar um teste estatístico para tomar uma decisão (aceitar ou rejeitar o valor hipotético).

No entanto, devido ao fato de que a decisão será baseada em estimativas fornecidas

pela amostra, fica evidente que, devido às condições de incerteza, o pesquisador estará sujeito a erros ao decidir. Os testes de hipótese dimensionam a probabilidade (risco) de se estar cometendo algum tipo de erro, fornecendo alguma segurança para a tomada de decisão acerca de aceitar, ou rejeitar uma hipótese estatística.

Neste capítulo, serão apresentados os testes referentes aos parâmetros da população.

Trata-se de uma suposição quanto ao valor de um parâmetro populacional, ou quanto à natureza da distribuição de probabilidade de uma variável populacional.

Como descrito no Capítulo 6, o teste de significância considera apenas o erro �, e o

procedimento para sua realização pode ser resumido nos seguintes passos: (1) Enunciar as hipóteses H0 e H1; (2) Fixar o limite do erro � e identificar a variável do teste; (3) Com o auxilio das tabelas estatísticas, considerando � e a variável do teste,

determinar a RC (região crítica) e a RA (região de aceitação) para H0; (4) Com os dados amostrais, calcular o valor da variável do teste; e (5) Concluir pela aceitação ou rejeição de H0, comparando o valor obtido no passo (4)

com o valor crítico para a RA. O Teste t e as Razões F são utilizados ao longo deste capítulo para determinar se

grupos são significativamente diferentes, determinando a força da associação entre as variáveis independentes e dependentes, e estabelecendo a amplitude desta diferença.

O uso das Distribuições t e F pressupõe quatro condições: (1) As distribuições devem ser feitas a partir de populações distribuídas normalmente; (2) As observações devem representar amostras aleatórias das populações; (3) O numerador e o denominador são estimativas da mesma variância da população; e

Page 102: Domingues 2005 - Estatística Aplicada as Ciências Militares

102

(4) O numerador e o denominador das razões F (ou t) são independentes.

8.1 TESTE DE SIGNIFICÂNCIA PARA MÉDIAS POPULACIONAIS

Procedimento:

(1) Enunciar as hipóteses

H0: � = �0 H1: uma das alternativas:

a) � �0 ; b) � < �0 ; ou c) � > �0

(2) Fixar �. Admitindo-se �2 desconhecida, a variável do teste será a t de Student, com gl = (ni – 1).

(3) Determinam-se RA e RC por meio do tcrit (4) Cálculo do valor da variável t:

X - � tcalc=

S / n Onde: X = média amostral

� = valor da hipótese nula S = desvio padrão amostral n = tamanho da amostra (5) Conclusão:

a) Se t�/2 < tcalc < t�/2,não se pode rejeitar H0.

Se t�/2 > tcalc > t�/2, rejeita-se H0.

b) Se tcalc < t�,não se pode rejeitar H0.

Se tcalc > t�, rejeita-se H0.

b) Se tcalc > t�,não se pode rejeitar H0.

Se tcalc < t�, rejeita-se H0.

EXEMPLO 8.1.1: Os registros dos últimos anos da EsAO atestam que os Cap CAO

obtiveram uma nota média igual a 8,0 em uma determinada avaliação formativa. Admitindo-se que �2 é desconhecida, testar, ao nível de significância � = 0,05 a hipótese de que a média de uma nova turma é a mesma das turmas anteriores, baseado no resultado obtido por uma amostra aleatória de 20 Cap CAO, cuja média foi igual a 7,8 e o desvio padrão igual a 0,5.

Page 103: Domingues 2005 - Estatística Aplicada as Ciências Militares

103

Solução: (1) Enunciando as hipóteses

H0: � = �0

H1: � �0

(2) Fixando �, e calculando o tcrit com gl = (n – 1).

� = 0,05 gl = (n – 1) = 20 – 1 =19

t19;0,05 = 2,093 (3) Determinando RA e RC por meio do tcrit ,.

(4) Cálculo do valor da variável t: X - �

tcalc= S / n

7,8 – 8,0

tcalc= 0,5/ 20

tcalc= 1,789

(5) Conclusão: Como t�/2 < tcalc < t�/2 (-2,093 < 1,789 < 2,093), não se pode rejeitar H0, concluindo-se

que, a um nível de significância � = 0,05, que as médias não são significativamente diferentes.

Note que está conclusão não quer dizer que as médias são necessariamente iguais.

2,5% 2,5%

-2,093 2,093

Page 104: Domingues 2005 - Estatística Aplicada as Ciências Militares

104

8.2 TESTE DE SIGNIFICÂNCIA PARA VARIÂNCIAS POPULACIONAIS

Procedimento: (1) Enunciar as hipóteses

H0: �2 = �0

2

H1: uma das alternativas:

a) �2 �0

2; b) �2 > �0

2; ou c) �2 < �0

2

(2) Fixar � e escolher a variável Qui-Quadrado com gl = (ni – 1) (3) Determinar RA e RC por meio do �2

crit

a) �2 �0

2

b) �2

> �02

c) �2 < �0

2

f (�2)

�/2

�2

RC

f (�2)

f (�2)

�/2

�2

�2

RC

RC

RC

RA

RA

RA

�2

crit

�2

inf

�2

crit

�2

sup

Page 105: Domingues 2005 - Estatística Aplicada as Ciências Militares

105

(4) Cálculo do valor da variável

(n -1)S2 �

2calc=

�02

Onde: n = tamanho da amostra S2 = variância amostral

�02 = valor da hipótese nula

(5) Conclusão a) Se �2

inf < �2calc < �2

sup,não se pode rejeitar H0. Se �2

calc > �2sup ou �2

calc < �2inf, rejeita-se H0.

b) Se �2calc < �2

sup,não se pode rejeitar H0. Se �2

calc > �2sup, rejeita-se H0.

b) Se �2calc > �2

inf,não se pode rejeitar H0. Se �2

calc < �2inf, rejeita-se H0.

EXEMPLO 8.2.1: Deseja-se testar a hipótese de que a variância de uma população

com distribuição normal é menor que 25, admitindo � = 0,10. Para tanto, foi selecionada uma amostra aleatória de 25 elementos obtendo-se S2 = 20.

Solução:

(1) Enunciando as hipóteses

H0: �2 > 25

H1: �2 < 25 (teste de significância unicaudal à esquerda)

(2) Fixando �, e calculando o �2inf t com gl = (n – 1)

� = 0,1 gl = n – 1 = 25 – 1= 24 �

224;01 = 15,7

(3) Determinando RC e RA por meio do �2inf

�2 15,7

RA

f (�2) �=10%

RC

Page 106: Domingues 2005 - Estatística Aplicada as Ciências Militares

106

(4) Cálculo do valor da variável:

(25 – 1)20 �

2calc= 25

�2

calc= 19,2

(5) Como �2calc > �2

inf (19,2 > 15,7) não se pode rejeitar H0 : �2 = 25 ao nível de

significância de 10%. 8.3 TESTE DE SIGNIFICÂNCIA PARA A IGUALDADE ENTRE DUAS VARIÂNCIAS POPULACIONAIS

Procedimento:

(1) Enunciar as hipóteses

H0: �12 = �2

2

H1: �12 �2

2

(2) Fixar �, e escolher a variável F com gl = (n1 – 1) por meio da Tabela F (ANEXO G)

(3) Determinar RA e RC por meio do Fcrit.

(4) Cálculo do valor da variável F.

S12 F= S22

Onde: S1

2 e S12 são as variâncias amostrais, respectivamente, das duas populações

S12 é a maior variância.

(5) Conclusão: Se Fcalc < Fcrit, não se pode rejeitar H0.

Se Fcalc > Fcrit, rejeita-se H0, concluindo-se, com risco �, que as variâncias são diferentes.

f (F)

F

RC RA

Fcrit

1 – �

Page 107: Domingues 2005 - Estatística Aplicada as Ciências Militares

107

EXEMPLO 8.3.1: Foram avaliados 100 documentos desde o protocolo de entrada até seu despacho final. Ambos entraram pelo protweb e pelo estafeta. Os documentos via estafeta apresentaram uma variância de 256 (horas de processamento). Os documentos que tramitaram pelo protweb apresentaram uma variância de 100. Sendo � = 0,05, podemos concluir que as variâncias são diferentes para as duas vias de processamento?

Solução: (1) Enunciando as hipóteses

H0: �12 = �2

2

H1: �12 �2

2 (2) Fixando �, e determinando o Fcrit

� = 0,05 gln = n1 – 1 = 100 – 1 = 99 no numerador, gld = n2 – 1 = 100 – 1 = 99 no denominador. F99:99 = 1,39

(3) Determinar RA e RC por meio do Fcrit

(4) Cálculo do valor da variável F

S12 Fcalc= S22

256 Fcalc= 100

Fcalc= 2,56

(5) Conclusão

Como Fcalc > Fcrit (2,56 > 1,39), rejeita-se H0, concluindo, com risco � = 0,05, que as variâncias são diferentes.

f (F)

5%

F

RC RA

1,39

Page 108: Domingues 2005 - Estatística Aplicada as Ciências Militares

108

8.4 TESTE DE SIGNIFICÂNCIA PARA IGUALDADE ENTRE DUAS MÉDIAS POPULACIONAIS (VARIÂNCIAS CONHECIDAS)

Procedimento:

(1) Enunciar as hipóteses

H0: �1 = � 2 ou �1 – � 2 = d

H1: � 1 � 2 ou �1 – � 2 d

Onde d é a diferença admitida entre as médias, podendo se testar as desigualdades “ <” ou “ >” .

(2) Fixar � e verificar o valor do Zcrit (3) Determinar RA e RC por meio do Zcrit

(4) Cálculo do valor da variável:

( X1 – X2) – d Zcalc= �1

2 �22

n1 +

n2 (5) Conclusão: Se – Z�/2 < Zcalc < Z�/2, não se pode rejeitar H0. Se Zcalc > Z�/2 ou Zcalc < – Z�/2, rejeita-se H0, concluindo-se, com risco �, que há

diferença entre as médias. EXEMPLO 8.4.1: Um fabricante de pneus produz dois tipos de pneumáticos para

Vtr 1 ½ ton. Para o tipo 1, �12 = 4000 Km, e para o tipo 2 �2

2 = 5000 Km. Um centro de avaliação testou 50 pneus do tipo 1 e 50 do tipo 2, obtendo médias de duração X1 = 40000 Km e X2 = 42000 Km dos respectivos tipos. Adotando um risco � de 5%, teste a hipótese de que a vida média dos dois tipos de pneus é a mesma.

Page 109: Domingues 2005 - Estatística Aplicada as Ciências Militares

109

Solução: (1) Enunciando as hipóteses

H0: �1 = � 2

H1: � 1 �

(2) Fixando �, e determinando o Zcrit

� = 0,05

Zcrit = 1,960

(3) Determinando RA e RC por meio do Zcrit :

(4) Cálculo do valor da variável:

( 40000 – 42000) - 0 Zcalc= 4000 5000 50

+ 50

Zcalc= – 149,07 (5) Como Zcalc < – Z�/2 ( – 149,07 < – 1,960), rejeita-se H0, concluindo-se com risco de

5%, que as vidas médias dos pneus são diferentes.

8.5 TESTE DE SIGNIFICÂNCIA PARA IGUALDADE ENTRE DUAS MÉDIAS POPULACIONAIS (VARIÂNCIAS DESCONHECIDAS, MAS ADMITIDAS IGUAIS)

Procedimento:

(1) Enunciar as hipóteses

H0: �1 = � 2 ou �1 – � 2 = d

H1: � 1 � 2 ou �1 – � 2 d

Onde d é a diferença admitida entre as médias, podendo se testar as desigualdades “ <” ou “ >” .

(2) Fixar � e verificar o valor do tcrit com gl = n1 +n2 – 2

2,5% 2,5%

-1,960 1,960

Page 110: Domingues 2005 - Estatística Aplicada as Ciências Militares

110

(3) Determinar RA e RC por meio do tcrit.

(4) Cálculo do valor da variável:

( X1 – X2) - d tcalc= n1 + n2 S2

n1 . n2 Onde:

(n1 – 1) S12 + (n2 – 1) S2

2 S2=

n1 +n2 – 2

(5) Conclusão:

Se – t�/2 < tcalc < t�/2, não se pode rejeitar H0.

Se tcalc > t�/2 ou tcalc < – t�/2, rejeita-se H0, concluindo-se, com risco �, que há diferença entre as médias.

EXEMPLO 8.5.1: Dois tipos de pneus para Vtr 1 ½ ton foram testados por um

centro de avaliação por meio de amostras aleatórias (n1 = 50 e n2 = 40). Para o tipo 1, a duração média foi de X1 = 40000 com S1

2 = 3500 Km, e para o tipo 2 X1 = 38000 com S22 =

3800 Km. Adotando um risco � de 5%, teste a hipótese de que a vida média dos dois tipos de pneus é a mesma.

Solução: (1) Enunciando as hipóteses

H0: �1 = � 2

H1: � 1 �

(2) Fixando �, e determinando o tcrit

� = 0,05

gl = (n1 – n2) – 2 = 50 +40 – 2 = 88

t88;0,05 = 1,987

Note que buscamos o valor de �/2 na Tabela t com 88 gl, pois o teste é bi-caudal.

�/2 �/2

-t�/2 t�/2 ti

Page 111: Domingues 2005 - Estatística Aplicada as Ciências Militares

111

(3) Determinando RA e RC por meio do tcrit :

(4) Cálculo do valor da variável

(50 – 1) 3500 + (40 – 1) 3800 S2=

50 +40 – 2

S2= 3632, 95

(40000 – 38000) – 0 tcalc=

50 + 40

3632, 95

50 . 40

tcalc= 12,234

(5) Conclusão:

Como tcalc > t�/2 (12,234 > 1,987), rejeita-se H0, concluindo-se, com risco de 5%, que as vidas médias dos pneus são diferentes.

8.6 TESTE DE SIGNIFICÂNCIA PARA PROPORÇÕES POPULACIONAIS

Procedimento:

(1) Enunciar as hipóteses

H0: p = p0

H1: uma das alternativas:

a) p p0; b) p > p0; ou c) p < p0

(2) Fixar � e verificar o valor do Zcrit

2,5% 2,5%

-1,987 1,987 t

Page 112: Domingues 2005 - Estatística Aplicada as Ciências Militares

112

(3) Determinar RA e RC por meio do Zcrit

a) p p0

b) p > p0

c) p < p0

(4) Cálculo da variável Z:

fr – p0

p0(1 – p0)

Zcalc=

n Onde: fr = freqüência relativa do evento na amostra p0(1 – p0) = valor da hipótese nula n = tamanho da amostra

(5) Conclusão:

a) Se –Z�/2 < Zcalc < Z�/2,não se pode rejeitar H0. Se Zcalc > Z�/2 ou Zcalc < –Z�/2, rejeita-se H0. b) Se Zcalc < Z�,não se pode rejeitar H0. Se Zcalc > Z�, rejeita-se H0. c) Se Zcalc > –Z�/2,não se pode rejeitar H0. Se Zcalc < –Z�/2 rejeita-se H0.

RC RC

�/2 �/2

RA

RC

RA

RC

Z�

Z�/2 Z�/2 Z

Z

Z

Z�

RA

Page 113: Domingues 2005 - Estatística Aplicada as Ciências Militares

113

EXEMPLO 8.6.1: As condições de mortalidade de uma região são tais que a proporção de nascidos que sobrevivem até 60 anos é de 60% (0,60). Testar essa hipótese, ao nível de 5%, se em 1.000 nascimentos amostrados aleatoriamente, verificaram-se 530 sobreviventes até 60 anos.

Solução: (1) Enunciando as hipóteses

H0: �1 = � 2

H1: � 1 �

(2) Fixando �, e determinando o Zcrit

� = 0,05

Zcrit = 1,960

(3) Determinam-se RA e RC por meio do Zcrit

(4) Cálculo da variável Z:

f – p0

p0(1 – p0)

Zcalc=

n

0,53 – 0,60

0,60 (1 – 0,60) Zcalc=

1000

Zcalc= - 4,52

(5) Conclusão

Como Zcalc < Zcrit (– 4,52 < – 1,96) rejeita-se H0, concluindo-se, com risco de 5%, que a proporção de nascidos que sobrevivem até 60 anos é diferente de 60%.

2,5% 2,5%

-1,96 1,96 Zi

Page 114: Domingues 2005 - Estatística Aplicada as Ciências Militares

114

Page 115: Domingues 2005 - Estatística Aplicada as Ciências Militares

115

Capítulo 9 Análise de variância

No capítulo anterior, foram apresentados testes paramétricos verificar a igualdade entre duas médias (testes t e z), duas variâncias (testes F e �2) ou duas proporções (teste z). Quando necessitamos testar a igualdade entre K médias (K > 2, sendo a variável é intervalar no mínimo intervalar), podemos utilizar a Análise da Variância (ANOVA), verificando a influência de um ou mais fatores sobre uma determinada variável dependente.

Desenvolvido por Físher, a ANOVA é um método estatístico que verifica se fatores ou

tratamentos (variáveis independentes) produzem mudanças sistemáticas em alguma variável de interesse (variável dependente), por meio de teste de igualdade de médias.

9.1 ANOVA SIMPLES (ONE-WAY OU COM ÚNICO FATOR)

O conceito de análise de variância (ANOVA) simples é uma extensão do teste t

independente, que permite a avaliação da igualdade entre as médias de dois ou mais grupos, sendo estes níveis da mesma variável independente.

Trata-se de um método estatístico, em que amostras aleatórias independentes são

retiradas de k populações normais (k > 2) com médias �1, �2, ..., �k, cujas variâncias são supostamente iguais (�1

2 = �22 = ... = �k

2). As amostras podem ser de tamanhos diferentes, sendo o número total de observações da experiência igual a ni = n1 + n2 + ... + nk.

Lógica da ANOVA

Deve-se fazer uma partição da soma total dos quadrados, variação total(Qt), em tantas parcelas quantas forem as variáveis independentes (fatores).

Qt= � � (xij – X)2 Onde:

i= 1,2,...,k (tratamentos)

j = 1, 2,..., nj, (elementos das amostras)

X = média geral

Pode-se demonstrar que cada uma das variâncias das variáveis independentes (somas

de quadrados divididas por uma constante apropriada) é um estimador justo (imparcial) de �2, quando essas variáveis não têm influências sobre a variável de estudo, ou seja, H0 é

i=1 j=1

k ni

Page 116: Domingues 2005 - Estatística Aplicada as Ciências Militares

116

verdadeira. Por outro lado, a variância do erro é um estimador justo (imparcial) de �2, sendo H0 verdadeira ou falsa.

A comparação das variâncias é detectada com o uso de um teste F para igualdade entre

duas variâncias. Se a estimativa da variável independente for significativamente grande, o teste F rejeitará a hipótese de nenhum efeito provocado pela variável independente, fornecendo uma evidência de que o fator correspondente tem influência sobre a variável de estudo.

No caso de uma variável independente (um fator), �2 poderá ser estimada de três

maneiras:

Variância total;

Variância devida aos tratamentos; e

Variância devida aos erros.

Variância Total (St

2) Para o cálculo da variância total, os k tratamentos são considerados como uma única

amostra de tamanho n. O quociente entre a variação total e os respectivos graus de liberdade (gl= n – 1) expressa a variância. St

2 será um estimador justo de �2, se H0 é verdadeira, caso contrário irá superestimá-la.

� �

(xij – X)2

Qt

St

2= n – 1

=

n – 1

Fórmula prática:

Qt St2= n-1

Onde:

� � xij Qt =

� � xij

2 – C

e

C=

n Variância Devida aos Tratamentos (Se

2) Para o cálculo da variância devida aos tratamentos, são considerados os desvios entre

as médias dos k tratamentos e a média geral, ponderados pelos respectivos graus de liberdade (gl = k – 1). Se

2 será um estimador justo de �2, se H0 é verdadeira, caso contrário irá superestimá-la.

� �

(Xij – X)2

Qe

Se

2= k – 1

=

k – 1

i=1

k

j=1

ni

i=1

k

j=1

ni

i=1

k

j=1

ni

i=1

k

j=1

ni 2

Page 117: Domingues 2005 - Estatística Aplicada as Ciências Militares

117

Fórmula prática:

Qe �

xij

Se2=

k – 1 onde

Qe =

ni Variância Devida aos Erros (Sr

2) A terceira maneira de estimar a variância comum será por meio da média aritmética

das Si2 de cada uma das k amostras, ponderada pelos respectivos graus de liberdade (gl = n –

k). Assim, Se2 será um estimador justo de �2, sendo H0 verdadeira ou não.

� �

(xij – Xi)2

Qr

Sr

2= n – k

=

n – k

Fórmula prática:

Qt Sr2= n – 1

Onde:

� � xij Qt =

� � xij

2 – C

e

C=

n A variação total é igual à soma da variação entre tratamentos e a variação residual

(Qt = Qe + Qr) e suas respectivas variâncias (St2, Se

2, e Sr2) tem distribuição �2 com (n – 1),

(k – 1) e (n – k) graus de liberdade, ou seja:

�2n – 1 = �2

k – 1 – �2n – k

Essa condição é necessária e suficiente para que �2

k – 1 e �2n – k sejam independentes.

�2

k – 1 Qe k – 1 k – 1 Se

2 �2

n – k Qr Sr2 F=

n – k

=

n – k

=

Os graus de liberdade para a distribuição F são fornecidos por (k – 1) no numerador e

(n – k) no denominador, e o quociente F (Fcalc) será utilizado para testar H0. Quanto mais próximo de 1 maior a probabilidade de se aceitar H0. No entanto, quanto maior for o valor de F, maior será a indicação da rejeição de H0, concluindo-se, com risco �, que o fator considerado tem influência sobre a variável dependente.

j=1

ni

j=1

k

i=1

k

j=1

ni

j=1

ni

i=1

k – C

2

i=1

k

j=1

ni

Page 118: Domingues 2005 - Estatística Aplicada as Ciências Militares

118

Para proceder a ANOVA deve-se: (1) Enunciar as hipóteses

H0: �1 = �2 = ... = �k (as médias dos k tratamentos são iguais)

H1: pelo menos duas médias são diferentes.

(2) Dispor os dados de acordo com a tabela a seguir:

Tratamentos Elementos amostrais 1 2 ... ki

1 x11 x21 ... xk1 2 x12 x22 ... xk2 ... ... ... ... ... nj x1nj x2nj ... xkinj

Total

Soma � x1nj � x2nj ... � xkinj � � xij

(3) Calcular a constante C

� � xij C=

n (4) Calcular a variação total

Qt =

� � xij

2 – C

(5) Calcular a variação entre tratamentos

xij

Qe =

� ni

(6) Calcular a variação residual

Qr = Qt – Qe

(7) Construir o Quadro de Análise de Variância obtendo-se o Fcalc

Fontes de variação Soma dos quadrados

Graus de liberdade

Quadrados médios Teste F

Qe Entre tratamentos Qe k – 1 Se2= k – 1

Se2

Qt - Qe Dentro das amostras (residual)

Qr = Qt - Qe n – k Sr

2= n – k

Fcalc = Sr

2

Total Qt n – 1 – –

i=1

k

j=1

ni 2

i=1

k

j=1

ni

– C i=1

k j=1

n

i=1

k

j=1

ni

Page 119: Domingues 2005 - Estatística Aplicada as Ciências Militares

119

(8) Determinar RA e RC por meio do Fcrit obtido na Tabela F

gln = k – 1 (graus de liberdade do numerador)

gld = n – k (graus de liberdade do denominador)

(9) Conclusão:

Se Fcalc < Fcrit, não se pode rejeitar H0, concluindo, com risco �, que o fator não tem influência sobre a variável dependente.

Se Fcalc > Fcrit, rejeita-se H0, concluindo, com risco �, que o fator tem influência sobre a variável dependente.

EXEMPLO 9.1.1: Deseja-se inferir se o fato de pertencer a um determinado

pelotão de uma SU tem influencia no desempenho do soldado no exercício de flexão de braço. Para tal foram selecionados aleatoriamente 10 soldados de cada pelotão e registrado seu resultado no 1º TAF. Verificar, ao nível de 5%, se o desempenho médio dos pelotões foram diferentes.

Solução:

(1) Enunciando as hipóteses

H0: �1 = �2 = �3 (as médias dos 3 pelotões são iguais)

H1: pelo menos duas médias são diferentes.

(2) Apresentando os dados

Pelotões Elementos amostrais 1 2 3

1 20 24 26 2 22 25 26 3 24 26 29 4 26 27 29 5 28 28 32 6 30 29 32 7 32 30 35 8 34 31 35 9 36 32 38

10 38 33 38

Total

Soma 290 285 320 895

f (F)

F

RC RA

Fcrit

Page 120: Domingues 2005 - Estatística Aplicada as Ciências Militares

120

(3) Calcular a constante C 895 2 C= 30

C = 26700,83

(4) Calcular a variação total Qt =

� � xij

2 – C

� � xij2 = 202 + 222 + 242 +...+382 = 27365

Logo:

Qt = 27365 – 26700,83

Qt = 664,17

(5) Calcular a variação entre tratamentos

xij

Qe =

� ni

(290)2 (285)2 (320)2 Qe = 10 + 10 + 10 – 26700,83

Qe = 71,67

(6) Calcular a variação residual

Qr = Qt – Qe

Qr = 664,17 – 71,67

Qr = 592,5

(7) Construir o Quadro de Análise de Variância obtendo-se o Fcalc

Fontes de variação Soma dos quadrados

Graus de liberdade

Quadrados médios Teste F

71,67 Entre tratamentos 71,67 3 – 1 = 2 2 = 35,835 35,835

592,5 Dentro das amostras (residual) 592,5 30 – 3 = 27 27

= 21,944 Fcalc =

21,944

Total 664,17 30 – 1 = 29 – Fcalc = 1,63 (8) Determinar RA e RC por meio do Fcrit obtido na Tabela F F2:27 = 3,35

i=1

k

j=1

ni

– C i=1

k j=1

n

i=1

k

j=1

ni

Page 121: Domingues 2005 - Estatística Aplicada as Ciências Militares

121

(9) Conclusão:

Como Fcalc < Fcrit, (1,61 < 3,35) não se pode rejeitar H0, concluindo, com risco �=0,05, que o fator (pertencer a um determinado pelotão) não tem influência sobre a variável dependente (número de flexões de braço).

EXEMPLO 9.1.2: Deseja-se inferir se um determinado pelotão teve uma

significativa melhora na performance da corrida de 12 minutos ao longo dos 3 TAF do ano de instrução (note que se deseja inferir se a repetição do treinamento executado influencia o desempenho na corrida, este é o caso de ANOVA simples com medidas repetidas) Para tal foram selecionados aleatoriamente 10 soldados do pelotão e registrados seus resultados no 1º, 2º e 3º TAF. Verificar, ao nível de 5%, se o desempenho médio dos soldados foram diferentes ao longo do ano.

Solução: (1) Enunciando as hipóteses

H0: �1 = �2 = �3 (as médias dos soldados são iguais)

H1: pelo menos duas médias são diferentes.

(2) Apresentando os dados

Resultado na Corrida de 12 minutos Elementos amostrais 1º TAF 2º TAF 3º TAF

1 2,0 2,4 2,6 2 2,2 2,6 3,0 3 2,4 2,6 3,1 4 2,6 2,7 3,1 5 2,8 2,9 3,2 6 3,0 3,2 3,3 7 3,2 3,3 3,5 8 3,2 3,3 3,5 9 3,3 3,4 3,5

10 3,3 3,4 3,5

Total

Soma 28,0 29,8 32,3 90,1

f (F)

5%

F

RC RA

3,35

Page 122: Domingues 2005 - Estatística Aplicada as Ciências Militares

122

(3) Calcular a constante C 90,1 2 C= 30

C = 270,60

(4) Calcular a variação total Qt =

� � xij

2 – C

� � xij2 = 2,02 + 2,22 + 2,42 +...+3,52 = 275,69

Logo:

Qt = 275,69 – 270,60

Qt = 5,0897

(5) Calcular a variação entre tratamentos

xij

Qe =

� ni

(290)2 (285)2 (320)2 Qe = 10 + 10 + 10 – 270,60

Qe = 0,9327

(6) Calcular a variação residual

Qr = Qt – Qe

Qr = 5,0897 – 0,9327

Qr = 4,157

(7) Construindo o Quadro de Análise de Variância e obtendo o Fcalc

Fontes de variação Soma dos quadrados

Graus de liberdade

Quadrados médios Teste F

1,512 Entre tratamentos 1,512 3 – 1 = 2 2 = 0,756 0,756

3,82 Dentro das amostras (residual) 3,82 30 – 3 = 27 27

= 0,142 Fcalc =

0,142

Total 5,332 30 – 1 = 29 – Fcalc = 5,32 (8) Determinar RA e RC por meio do Fcrit obtido na Tabela F F2:27 = 3,35

i=1

k

j=1

ni

– C i=1

k j=1

n

i=1

k

j=1

ni

Page 123: Domingues 2005 - Estatística Aplicada as Ciências Militares

123

(9) Conclusão:

Como Fcalc > Fcrit, (5,32 < 3,35) rejeita-se H0, concluindo, com risco �=0,05, que a repetição do fator treinamento tem influência sobre a o desempenho médio dos pelotões na corrida de 12 minutos.

Para verificar-se quais médias foram diferentes, deve-se aplicar um teste de acompanhamento (post-hoc), conforme apresentado ao final deste capítulo.

9.2 ANOVA DUPLA (TWO-WAY OU COM DOIS FATORES)

A ANOVA two-way é um modelo estatístico aplicado a projetos em blocos aleatórios (b blocos e k tratamentos), onde os tratamentos são distribuídos aleatoriamente em cada bloco, aparecendo uma vez por bloco.

Este teste verifica se os dados apresentam evidência suficiente de haver uma diferença

entre as médias dos k tratamentos, e entre as respostas médias dos blocos, ou seja, blocos e tratamentos são duas variáveis independentes qualitativas (dois fatores). Conseqüentemente, a variação total (Qt) poderá ser subdividida em três parcelas:

Variação entre os tratamentos (Qe);

Variação devida aos blocos (Qb); e

Variação devida aos erros ou residual(Qr).

Assim:

Qt = Qe+ Qb + Qr Onde:

Qt =

� � xij

2 – C

xij

Qe = �

b

xij

Qb = �

k

i=1

k

j=1

b

j=1

b

i=1

k – C

2

i=1

k

j=1

b – C

2

f (F)

5%

F

RC RA

3,35

Page 124: Domingues 2005 - Estatística Aplicada as Ciências Militares

124

Qr = Qt – Qb – Qe Para proceder a ANOVA deve-se:

(1) Enunciar as hipóteses

Para testar a hipótese de influência do fator Tratamentos:

H0: �1 = �2 = ... = �k (as médias dos k tratamentos são iguais)

H1: pelo menos duas médias são diferentes.

Para testar a hipótese de influência do fator Blocos:

H0: �1 = �2 = ... = �b (as médias dos b blocos são iguais)

H1: pelo menos duas médias são diferentes.

(2) Dispor os dados de acordo com a tabela a seguir:

Tratamentos Blocos 1 2 ... ki

Total

1 x11 x21 ... xk1 � xki1 2 x12 x22 ... xk2 � xki2 ... ... ... ... ... ... bj x1bj x2bj ... xkibj � xkibj

Soma � x1bj � x2bj ... � xkibj � � xij

(3) Calcular a constante C

� � xij C=

n (4) Calcular a variação total

Qt =

� � xij

2 – C

(5) Calcular a variação entre tratamentos

xij

Qe =

� k

(6) Calcular a variação entre blocos

xij

Qb = �

b (7) Calcular a variação residual

Qr = Qt – Qb – Qe

i=1

k

j=1

b 2

i=1

k

j=1

b

– C

j=1

b i=1

n

– C

2

i=1

k j=1

n

i=1

k

j=1

bi

2

Page 125: Domingues 2005 - Estatística Aplicada as Ciências Militares

125

(8) Construir o Quadro de Análise de Variância obtendo-se o Fcalc para cada hipótese testada

Fontes de variação Soma dos quadrados

Graus de liberdade

Quadrados médios Teste F

Qe Se2

Tratamentos Qe k – 1 Se2=

k – 1

Fecalc = Sr

2

Sb2= Qb Sb

2 Blocos Qb

b – 1

b – 1

Fbcalc = Sr

2

Qr Residual Qr n – k – b + 1 Sr

2= n – k – b + 1

Total Qt n – 1 –

(9) Determinar RA e RC por meio do Fcrit obtido na Tabela F

Para Fecalc

gln = k – 1 (graus de liberdade do numerador)

gld = n – k – b + 1 (graus de liberdade do denominador)

Para Fbcalc

gln = b – 1 (graus de liberdade do numerador)

gld = n – k – b + 1 (graus de liberdade do denominador)

Para Fecalc Para Fbcalc

(10) Conclusões:

Para testar a hipótese de influência do fator Tratamentos:

Se Fecalc < Fecrit, não se pode rejeitar H0, concluindo, com risco �, que o fator não tem influência sobre a variável dependente.

Se Fecalc > Fecrit, rejeita-se H0, concluindo, com risco �, que o fator tem influência sobre a variável dependente.

Para testar a hipótese de influência do fator Blocos:

Se Fbcalc < Fbcrit, não se pode rejeitar H0, concluindo, com risco �, que o fator não tem influência sobre a variável dependente.

Se Fbcalc > Fbcrit, rejeita-se H0, concluindo, com risco �, que o fator tem influência sobre a variável dependente.

f (F)

F RC RA

Fecrit

f (F)

F

RC RA

Fbcrit

Page 126: Domingues 2005 - Estatística Aplicada as Ciências Militares

126

EXEMPLO 9.2.1: Durante a IIB, três SU exerceram didáticas diferentes (tratamentos) na instrução de seus soldados. Deseja-se inferir se o fato de pertencer a um determinado pelotão (blocos) de uma determinada SU,tem influencia no desempenho do soldado no exame seletivo para o Curso de Formação de Cabos (CFC). Para tal, foram registrados os resultados médios de cada pelotão no exame. Verificar, ao nível de 5%, se o desempenho médio das SU foi diferente (o que indicaria que a didática empregada influencia o resultado no exame), e se o desempenho médio dos pelotões foi diferente (o que indicaria que o desempenho do Cmt Pel, como instrutor, influencia o resultado no exame). Deve-se observar que o fator inteligência do soldado não é uma variável interveniente devido à aleatoriedade do processo de seleção e distribuição dos soldados pelas SU.

Solução: (1) Enunciando as hipóteses

Para testar a hipótese de influência do fator Didática:

H0: �1 = �2 = �3 (as médias dos resultados das SU são iguais)

H1: �1 �2; �1 �3; �2 �3; ou �1 �2 �3 (pelo menos duas médias são diferentes)

Para testar a hipótese de influência do fator Instrutor:

H0: �1 = �2 = �3 (as médias dos b blocos são iguais) H1: pelo menos duas médias são diferentes.

(2) Dispondo os dados de acordo com a tabela a seguir:

Didática (SU) Pelotões (Instrutor) 1 2 3 Total

1 8,5 7,0 7,2 22,7 2 8,4 6,7 6,8 21,9 3 8,0 6,8 6,5 21,3

Soma 24,9 20,5 20,5 65,9

(3) Calculando a constante C 65,9 2 C= 9

C = 482,5

(4) Calculando a variação total Qt =

� � xij

2 – C

Qt = (8,52 + 8,42 + 8,02 + 7,02 + 6,72 + 6,82 + 7,22 + 6,82 + 6,52 ) – 482,5

Qt = 4,77

(5) Calculando a variação entre tratamentos

xij

Qe =

� k

– C i=1

k j=1

n

i=1

k

j=1

b

2

Page 127: Domingues 2005 - Estatística Aplicada as Ciências Militares

127

24,92 20,52 20,52 Qe = 3 + 3 + 3 – 482,5

Qe = 4,34

(6) Calculando a variação entre blocos

xij

Qb = �

b

22,72 21,92 21,32 Qb = 3 + 3 + 3 – 482,5

Qb = 0,36

(7) Calculando a variação residual

Qr = Qt – Qb – Qe

Qr = 4,77 – 4,34 – 0,36

Qr = 0,07

(8) Construindo o Quadro de Análise de Variância obtendo-se o Fcalc para cada hipótese testada

Fontes de variação Soma dos quadrados

Graus de liberdade

Quadrados médios Teste F

4,77 2,385 Tratamentos 4,77 3 – 1 Se

2= 2

Fecalc= 0,0175 =136,29

Sb2= 4,34 2,17

Blocos 4,34 3 – 1

2

Fbcalc= 0,0175

=124,00

0,07 Residual 0,07 9 – 3 – 3 + 1 Sr

2= 4

Total 0,36 9 – 1 –

(9) Determinando RA e RC por meio do Fcrit obtido na Tabela F Para Fecalc F3,4 = 9,98 Para Fbcalc F3,4 = 9,98

Para Fecalc Para Fbcalc

j=1

b i=1

n

f (F)

F RC RA

9,98

– C

2

f (F)

F

RC RA

9,98

Page 128: Domingues 2005 - Estatística Aplicada as Ciências Militares

128

(10) Conclusões:

Para testar a hipótese de influência do fator Tratamentos:

Como Fecalc > Fecrit, (136,29 > 9,98) rejeita-se H0, concluindo, com risco �, que o fator Didática tem influência sobre a variável dependente (resultado no exame seletivo para o CFC).

Para testar a hipótese de influência do fator Blocos:

Como Fbcalc > Fbcrit, (124, > 9,98) rejeita-se H0, concluindo, com risco �, que o fator Desempenho do Instrutor tem influência sobre a variável dependente (resultado no exame seletivo para o CFC).

Note que o teste é capaz de discriminar se um determinado fator tem influência sobre uma variável dependente, porém não indica quais médias são diferentes entre si. Para verificar-se quais médias foram diferentes e indicar qual tratamento ou bloco gerou alterações na variável dependente, deve-se aplicar um teste de acompanhamento ou post-hoc, que será tratado mais adiante neste capítulo.

9.3 ANOVA FATORIAL (EXPERIMENTO COM DOIS FATORES E REPETIÇÕES)

A ANOVA fatorial é um modelo estatístico utilizado no caso de haver mais de uma

observação para cada célula (interseção dos níveis – tratamentos e blocos dos dois fatores), admitindo-se Oi observações para cada célula. Neste sentido, os dados são dispostos em um quadro da seguinte forma:

ki tratamentos dispostos em colunas; bj blocos dispostos em linhas; ol observações para cada célula (interação entre linhas e colunas); e n = klo. Conseqüentemente, a variação total (Qt) poderá ser subdividida em quatro parcelas: Variação entre os tratamentos (Qe); Variação devida aos blocos (Qb); e Variação devida às interações (Qi); e Variação devida aos erros ou residual(Qr).

Assim: Qt = Qe+ Qb + Qi + Qr

Onde:

Qt = � � � xij2 – C

� � xijl Qe = � b

– C

� � xijl Qb = � b

– C

i=1

k

j=1

b

l=1

o

2

j=1

b

i=1

k j=1

o

j=1

k

i=1

b j=1

o 2

Page 129: Domingues 2005 - Estatística Aplicada as Ciências Militares

129

� xijl Qr = � � � xijl2 – � �

o

Qi = Qt – Qe – Qb– Qr

Para proceder a ANOVA deve-se: (1) Enunciar as hipóteses

Para testar a hipótese de influência do fator Tratamentos:

H0: �1 = �2 = ... = �k (as médias dos k tratamentos são iguais) H1: pelo menos duas médias são diferentes.

Para testar a hipótese de influência do fator Blocos:

H0: �1 = �2 = ... = �b (as médias dos b blocos são iguais) H1: pelo menos duas médias são diferentes.

Para testar a hipótese de influência do fator Interação (blocos x tratamentos):

H0: �1 = �2 = ... = �i (as médias dos b blocos dentro dos k tratamentos são iguais) H1: pelo menos duas médias são diferentes. (2) Dispor os dados de acordo com a tabela a seguir:

Tratamentos

1 2 ... ki Blocos 1 ... ol � 1 ... ol � ... 1 ... ol �

Total

1 x111 ... x11o x11o x211 ... x21o x21o ... xk11 ... xk1o xk1o xi1l 2 x121 ... x12o x12o x221 ... x22o x22o ... xk21 ... xk2o xk2o xi2l ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... bj x1b1 ... x1bo x1bo x2b1 ... x2bo x2bo ... xk11 ... xkbo xkbo xijl

Soma – x1jl – x2jl ... – xijl � � � xijl

(3) Calcular a constante C

� � � xij

C = klo

(4) Calcular a variação total

Qt = � � � xij2 – C

(5) Calcular a variação entre tratamentos

� � xijl Qe = � b

– C

2

l=1

o

i=1

k

j=1

b

l=1

o

i=1

k

j=1

b

i=1

k

j=1

b

l=1

o

i=1

k

j=1

b

l=1

o 2

i=1

k

j=1

b

l=1

o

2

j=1

b

i=1

k l=1

o

Page 130: Domingues 2005 - Estatística Aplicada as Ciências Militares

130

(6) Calcular a variação entre blocos

� � xijl Qb = � b

– C

(7) Calcular a variação residual

� xijl Qr = � � � xijl2 – � �

o (8) Calcular a variação devido à interação (repetições)

Qi = Qt – Qe – Qb – Qr

(9) Construir o Quadro de Análise de Variância obtendo-se o Fcalc para cada hipótese testada

Fontes de variação

Soma dos quadrados

Graus de liberdade

Quadrados médios Teste F

Qe Se2

Tratamentos Qe k – 1 Se2=

k – 1

Fecalc = Sr

2

Qb Sb2

Blocos Qb b – 1 Sb2=

b – 1

Fbcalc = Sr

2

Qi Si2

Interação Qi (k – 1)( b – 1) Si2=

(k – 1)( b – 1)

Ficalc = Sr

2

Qr Residual Qr kb(o – 1) Sr

2= kb(o – 1)

Total Qt n – 1 –

(10) Determinar RA e RC por meio do Fcrit obtido na Tabela F Para Fecalc gln = k – 1 (graus de liberdade do numerador) gld = kb(o – 1) (graus de liberdade do denominador) Para Fbcalc gln = b – 1 (graus de liberdade do numerador) gld = kb(o – 1) (graus de liberdade do denominador) Para Ficalc gln = (k – 1)( b – 1) (graus de liberdade do numerador) gld = kb(o – 1) (graus de liberdade do denominador)

Para Fecalc Para Fbcalc Para Ficalc

f (F)

F

RA

Fecrit

2

l=1

o

i=1

k

j=1

b

l=1

o

i=1

k

j=1

b

2

j=1

b

i=1

k l=1

o

RC RC RC

f (F)

F

RA

Fbcrit

f (F)

F RA

Ficrit

Page 131: Domingues 2005 - Estatística Aplicada as Ciências Militares

131

(11) Conclusões:

Para testar a hipótese de influência do fator Tratamentos:

Se Fecalc < Fecrit, não se pode rejeitar H0, concluindo, com risco �, que o fator não tem influência sobre a variável dependente.

Se Fecalc > Fecrit, rejeita-se H0, concluindo, com risco �, que o fator tem influência sobre a variável dependente.

Para testar a hipótese de influência do fator Blocos:

Se Fbcalc < Fbcrit, não se pode rejeitar H0, concluindo, com risco �, que o fator não tem influência sobre a variável dependente.

Se Fbcalc > Fbcrit, rejeita-se H0, concluindo, com risco �, que o fator tem influência sobre a variável dependente.

Para testar a hipótese de influência das Repetições:

Se Ficalc < Ficrit, não se pode rejeitar H0, concluindo, com risco �, que as repetições tem influência sobre a variável dependente.

Se Fialc > Ficrit, rejeita-se H0, concluindo, com risco �, que as repetições tem influência sobre a variável dependente.

EXEMPLO 9.3.1: Durante o ano de instrução, três SU utilizaram a corrida

intervalada em diferentes níveis de volume [(tratamentos (3, 4 ou 5 vezes por semana)] para otimizar o desempenho de seus soldados na corrida de 12 minutos do TAF. Os pelotões foram comandados, respectivamente, por um Aspirante a Oficial, um 2º Tenente, e um 1º Tenente [blocos (experiência do instrutor)] Verificar, ao nível de 5%, se:

a) existe alguma relação entre o volume de treinamento e o resultado da SU;

b) existe alguma relação entre a experiência do instrutor e o resultado do Pel; e

c) existe interação entre o volume de treinamento e a experiência do instrutor.

Solução:

(1) Enunciando as hipóteses Para testar a hipótese de influência do fator Tratamentos:

H0: �1 = �2 = �3 (as médias das 3 SU são iguais) H1: pelo menos duas médias são diferentes. O que indicaria que o volume de

treinamento tem influência sobre o desempenho na corrida.

Para testar a hipótese de influência do fator Blocos:

H0: �1 = �2 = �3 (as médias dos Pel são iguais) H1: pelo menos duas médias são diferentes. O que indicaria que a experiência do

instrutor tem influência sobre o desempenho na corrida.

Para testar a hipótese de influência do fator Interação (blocos x tratamentos):

H0: �1 = �2 = ... = �i (as médias dos b blocos dentro dos k tratamentos são iguais) H1: pelo menos duas médias são diferentes. O que indicaria existe interação entre o

volume de treinamento e a experiência do instrutor.

Page 132: Domingues 2005 - Estatística Aplicada as Ciências Militares

132

(2) Os resultados médios dos Pel nos 1º, 2º e 3º TAF estão apresentados a seguir:

Volume de treinamento (vezes por semana) 3 4 5

TAF TAF TAF Experiência do Instrutor

1º 2º 1º � 1º 2º 3º � 1º 2º 3º � Total

Asp Of 2,70 2,75 2,80 8,25 2,75 2,85 2,95 8,55 2,90 3,00 3,10 9 25,80 2º Ten 2,75 2,80 2,85 8,4 2,9 2,95 3,00 8,85 3,00 3,10 3,20 9,3 26,55 1º Ten 2,8 2,85 2,90 8,55 3,0 3,05 3,10 9,15 3,10 3,20 3,30 9,6 27,30

Soma – 25,2 – 26,55 – 27,9 79,65

Resultados em 1000 metros.

(3) Calculando a constante C

� � � xij

C = klo

79,652 C = 27

C = 234,97

(4) Calculando a variação total

Qt = � � � xij2 – C

Qt = (2,702 + 2,752 + 2,802 + 2,752 + 2,852 + 2,952 ... + 3,302 ) – 234,97

Qt = 0,6425

(5) Calculando a variação entre tratamentos

� � xijl Qe = � b

– C

25,202 + 26,552 + 27,92 Qe = 9 – 234,97

Qe = 0,4025

(6) Calculando a variação entre blocos

� � xijl Qb = � b

– C

25,802 + 26,552 + 27,302 Qe = 9 – 234,97

Qe = 0,1225

(7) Calculando a variação residual

� xijl Qr = � � � xijl2 – � �

o

i=1

k

j=1

b

l=1

o 2

i=1

k

j=1

b

l=1

o

2

j=1

b

i=1

k l=1

o

2

l=1

o

i=1

k

j=1

b

l=1

o

i=1

k

j=1

b

2

j=1

b

i=1

k l=1

o

Page 133: Domingues 2005 - Estatística Aplicada as Ciências Militares

133

8,252 8,482 8,552 9,602 Qr = (2,702 + 2,752 + 2,802 ... + 3,302) – 3 + 3 + 3 +...+ 3

Qr = 0,1050

(8) Calculando a variação devido à interação (repetições)

Qi = Qt – Qe – Qb– Qr

Qi = 0,6425 – 0,4025 – 0,1225 – 0,1050

Qi = 0,0125

(9) Construindo o Quadro de Análise de Variância

Fontes de variação SQ GL QM Teste F

0,4025 0,210 Tratamentos 0,4025 3 – 1 Se

2= 2

Fecalc= 0,005833 = 36,00

0,1225 0,06125 Blocos 0,1225 3 – 1 Sb

2= 2

Fbcalc= 0,005833 = 10,49

0,0125 0,003125 Interação 0,0125 (3 – 1)(3 – 1) Si

2= 4

Ficalc= 0,005833 = 0,54

0,1050 Residual 0,1050 3 . 3(3 – 1) Sr

2= 18

Total 0,6425 27 – 1 –

(10) Determinando RA e RC por meio do Fcrit obtido na Tabela F

Para Fecalc gln = 3 – 1 = 2 gld = 3 . 3(3 – 1) = 18

F2;18 = 3,55

Para Fbcalc gln = 3 – 1 = 2 gld = 3 . 3(3 – 1) = 18

F2;18 = 3,55

Para Ficalc gln = (3 – 1) (3 – 1) = 4 gld = 3 . 3(3 – 1) = 18

F4;18 = 2,93

Para Fecalc Para Fbcalc Para Ficalc

f (F)

5%

F

RA

3,55

RC RC RC

f (F)

5%

F RA

3,55

f (F)

5%

F RA

2,93

Page 134: Domingues 2005 - Estatística Aplicada as Ciências Militares

134

(11) Conclusões:

Para testar a hipótese de influência do fator Tratamentos:

Como Fecalc > Fecrit (36,00> 3,55), rejeita-se H0, concluindo, com risco de 5%, que o fator volume de treinamento tem influência sobre o desempenho dos pelotões na corrida de 12 minutos.

Para testar a hipótese de influência do fator Blocos:

Como Fbcalc > Fecrit (10,49 > 3,55), rejeita-se H0, concluindo, com risco de 5%, que o fator experiência do instrutor tem influência sobre o desempenho dos pelotões na corrida de 12 minutos.

Para testar a hipótese de influência das Repetições:

Como Ficalc < Ficrit (0,54 > 2,93), não se pode rejeitar H0, concluindo, com risco de 5%, que as repetições (interação entre volume de treinamento e experiência do instrutor) não tem influência sobre o desempenho dos pelotões na corrida de 12 minutos.

9.4 TESTE DE SCHEFFÉ (COMO POST-HOC) Como dito anteriormente, a ANOVA é um teste estatístico capaz de discriminar se um

determinado fator tem influência sobre uma variável dependente, porém não indica quais médias são diferentes entre si, sendo necessário a aplicação de um teste de acompanhamento ou post-hoc.

O teste de Scheffé é um post-hoc rigoroso, capaz de identificar quais médias são

diferentes entre si, ao nível de significância adotado, da seguinte forma: Anova com um Fator:

1 1 XA – XB > Sr2(k – 1) nA + nB F�[(k -1);(n-k)

Anova com dois Fatores:

Para as Colunas:

2(k – 1) 1 1 XA – XB > Sr2 L nA + nB F�[(k -1);(k-1)(L-1)]

Para as Linhas:

2(k – 1) 1 1 XA – XB > Sr2 K nA + nB F�[(L -1);(k-1)(L-1)]

Anova com dois Fatores e repetições:

Para as Colunas:

2(k – 1) 1 1 XA – XB > Sr2 RL nA + nB F�[(k -1);kL (R-1)]

Page 135: Domingues 2005 - Estatística Aplicada as Ciências Militares

135

Para as Linhas:

2(k – 1) 1 1 XA – XB > Sr2 RK nA + nB F�[(L -1);kL (R-1)]

EXEMPLO 9.4.1: Conforme apresentado no EXEMPLO 9.1.1, existe influência

da repetição do treinamento sobre o desempenho do pelotão na corrida de 12 minutos. Resta então verificar quais médias (ou quais resultados no TAF) foram diferentes entre si. Neste sentido comparamos as médias de cada repetição por meio da formula apresentada para Teste de Scheffé para Anova com um Fator:

Sendo:

X1ºTAF = 2,80 ; n = 10

X2ºTAF = 2,98 ; n = 10

X3ºTAF = 3,23 ; n = 10

Sr2 =0,142 ; F0,05[(k -1);(n -k)= F2:27 = 3,35

Então:

Entre X1ºTAF e X2ºTAF

1 1 2,80 – 2,98 > 0,142(3 – 1) 10 + 10 3,35)

0,18 < 0,19028

Como a diferença entre as médias do 1º e do 2º TAF é menor que a diferença calculada (0,18 < 0,19028) conclui-se que não existe diferença entre elas, ou seja os resultados médios do pelotão na corrida de 12 minutos entre o 1º e do 2º TAF não foram diferentes, ao nível de � = 0,05.

Entre X1ºTAF e X3ºTAF

1 1 2,80 – 3,23 > 0,142(3 – 1) 10 + 10 3,35)

0,43 > 0,19028

Como a diferença entre as médias do 1º e do 3º TAF é maior que a diferença calculada (0,43 > 0,19028) conclui-se que existe diferença entre elas, ou seja os resultados médios do pelotão na corrida de 12 minutos entre o 1º e do 2º TAF foram diferentes, ao nível � = 0,05.

Para: X2ºTAF versus X3ºTAF

1 1 2,98 – 3,23 > 0,142(3 – 1) 10 + 10 3,35)

0,25 > 0,19028

Page 136: Domingues 2005 - Estatística Aplicada as Ciências Militares

136

Como a diferença entre as médias do 1º e do 3º TAF é maior que a diferença calculada (0,25 > 0,19028) conclui-se que existe diferença entre elas, ou seja os resultados médios do pelotão na corrida de 12 minutos entre o 1º e do 2º TAF foram diferentes, ao nível � = 0,05.

O teste de Scheffé nos permite concluir que o treinamento provocou um aumento

significativo das performances na corrida de 12 minutos a partir do 3º TAF. Para inferir-se a magnitude desta influência pode-se recorrer ao teste , dado pela seguinte fórmula:

[Fcalc (k – 1) – (k – 1)]

2= [Fcalc (k – 1) + (N – k) + 1]

[5,32 (3 – 1) – (3 – 1)] 2= [5,32 (3 – 1) + (30 – 3) + 1]

2= 0,2246

Assim, 2 indica que 22,46% da variação total do desempenho na corrida de 12 minutos é explicado (ou resultado) da aplicação do treinamento.

Reunindo-se as estatísticas, pode-se afirmar que o treinamento (tratamento) foi significativo F2;27 = 5,32, p<0,05, e responsável por uma proporção significativa da variância no desempenho da corrida de 12 minutos ( 2 = 22,46).

EXEMPLO 9.4.2: Conforme apresentado no EXEMPLO 9.2.1, existe influência de ambos os fatores, Didática e Desempenho do Instrutor, sobre a variável dependente (resultado no exame seletivo para o CFC). Resta então verificar quais médias foram diferentes entre si, comparando em um primeiro momento as didáticas e em um segundo momento os instrutores. Neste sentido, deve-se aplicar o teste de acompanhamento por meio das fórmula apresentadas para o Teste de Scheffé para Anova com dois Fatores:

Sendo: Para as Colunas:

2(k – 1) 1 1 XA – XB > Sr2 L nA + nB F�[(k -1);(k-1)(L-1)]

Onde:

X Did1 = 8,33 ; n = 3

X Did2 = 6,83 ; n = 3

X Did3 = 6,83 ; n = 3

Sr2 =0,0175 ; F�[(k -1);(k-1)(L-1)]= F3:4 = 9,98

Então:

Entre X Did1 e X Did2

2(3 – 1) 1 1 8,33 – 6,83 > 0,0175 3 3 + 3 9,98

Page 137: Domingues 2005 - Estatística Aplicada as Ciências Militares

137

1,5 > 0,16

Como a diferença entre as médias da SU1 e SU2 é maior que a diferença calculada (1,5> 0,16) conclui-se que existe diferença entre elas, ou seja os resultados médios da SU que utilizou a didática 1 foram melhores que os da SU que utilizou a didática 2, ao nível � = 0,05.

Entre X Did1 e X Did3

2(3 – 1) 1 1 8,33 – 6,83 > 0,0175 3 3 + 3 9,98

1,5 > 0,16

Como a diferença entre as médias da SU1 e SU3 é maior que a diferença calculada (1,5> 0,16) conclui-se que existe diferença entre elas, ou seja os resultados médios da SU que utilizou a didática 1 foram melhores que os da SU que utilizou a didática 3, ao nível � = 0,05.

Entre X Did2 e X Did3

2(3 – 1) 1 1 6,33 – 6,83 > 0,0175 3 3 + 3 9,98

0 < 0,16

Como a diferença entre as médias da SU2 e SU3 é menor que a diferença calculada (0<0,16) conclui-se que não existe diferença entre elas, ou seja os resultados médios da SU que utilizou a didática 2 não foram diferentes que os da SU que utilizou a didática 3, ao nível � = 0,05.

Page 138: Domingues 2005 - Estatística Aplicada as Ciências Militares

138

Page 139: Domingues 2005 - Estatística Aplicada as Ciências Militares

139

Capítulo 10

Testes Não-Paramétricos para 2 grupos

Os testes não-paramétricos, também chamados provas livres de distribuição, são particularmente úteis quando não se dispõe de parâmetros populacionais, ou não é possível fazer suposições quanto ao modelo de distribuição de probabilidade da população que se está estudando, sendo prioritariamente adaptáveis aos estudos que envolvem variáveis com níveis de mensuração nominal e ordinal, bem como à investigação de pequenas amostras. Esses testes são recomendados:

- para análises de resultados de experimentos com dados emparelhados;

- para verificar se variáveis são independentes ou relacionadas; e

- para o tratamento estatístico de dados oriundos de tabelas com dupla entrada.

10.1 TESTE QUI-QUADRADO PARA ADEQUAÇÃO DO AJUSTAMENTO

Consideremos um experimento aleatório � realizado n vezes, onde E1, E2, ..., EK, são

K eventos associados a �. Sejam Fo1, Fo2, ..., FoK as freqüências observadas para cada um dos K eventos considerados, e Fe1, Fe2, ..., FeK as freqüências esperadas, ou freqüências teóricas dos K eventos considerados, deseja-se realizar um teste estatístico para verificar se há adequação de ajustamento entre as freqüências observadas e as freqüências esperadas. Isto é, se as discrepâncias (Foi – Fei), i = 1, 2, ..., K são devidas ao acaso, ou se de fato existe diferença significativa entre as freqüências.

Para a realização do Teste Qui-Quadrado deve-se proceder da seguinte forma:

(1) Enunciar as hipóteses

H0: Foi = Fei (não existem discrepâncias entre Foi e Fei)

H1: Foi Fei (existem discrepâncias entre Foi e Fei)

(2) Fixar � e escolher a variável Qui-Quadrado ( �2 ) com gl = (K – 1) , por meio da Tabela �2(ANEXO J).

(3) Determinar a Região Crítica ou de rejeição (RC) e a Região de Aceitação (RA), por meio do �2

crit.

Page 140: Domingues 2005 - Estatística Aplicada as Ciências Militares

140

(4) Cálculo do valor da variável:

(Foi – Fei)2 �2 = � Fei

(5) Conclusão:

Se �2calc < �2

crit não se pode rejeitar H0, ou seja, as freqüências observadas e esperadas não podem ser consideradas discrepantes.

Se �2calc > �2

crit rejeita-se H0, concluindo, com risco � que há discrepâncias entre as freqüências observadas e esperadas. Ou seja, não há adequação do ajustamento.

EXEMPLO 10.1.1: Em 100 lances de uma moeda observaram-se 65 coroas e 35

caras. Teoricamente, se a moeda fosse honesta esperar-se-ia que 50% dos resultados fosse cara e 50% coroa.

Eventos Cara Coroa

Fo 35 65

Fe 50 50

(1) Enunciando as hipóteses

H0: Foi = Fei (a moeda é honesta)

H1: Foi � Fei (a moeda não é honesta)

(2) Fixando � e escolhendo a variável �2 com gl = K – 1

� = 0,05

gl = 2 – 1 = 1

�20,05;1 =3,84

K

i=1

�2

crit

RC RA

1 – �

�2

f (�2)

Page 141: Domingues 2005 - Estatística Aplicada as Ciências Militares

141

(3) Determinando RC e RA por meio do �2crit

(4) Cálculo do valor da variável

(Foi —Fei)2 (35 – 50)2 (65-50) 2

�2 calc = � Fei

= 50 + 50

�2 calc = 9

(5) Conclusão:

Como �2calc > �2

crit (9 > 3,84) rejeitamos H0, concluindo, com risco � = 0,05 que a moeda não é honesta.

EXEMPLO 10.1.2: Deseja-se testar se o índice de indisponibilidade das viaturas de

uma determinada OM está igualmente distribuído durante os bimestres do ano de instrução. Neste sentido foram levantados os seguintes dados:

Bimestres

Eventos 1º 2º 3º 4º 5º 6º

Fo 12% 5% 7% 4% 8% 12%

Fe 6% 6% 6% 6% 6% 6% (1) Enunciando as hipóteses H0 e H1:

H0: Foi = Fei (o índice de indisponibilidade é igual ao longo do ano)

H1: Foi � Fei (o índice de indisponibilidade é diferente ao longo do o ano)

(2) Fixando � e escolhendo a variável �2 com gl = K – 1

� = 0,05

gl = 6 – 1 = 5

�25;0,05 = 11,071

(3) Determinando RC e RA por meio do �2crit

3,84

RC RA

5%

�2

f (�2)

2

i=1

Page 142: Domingues 2005 - Estatística Aplicada as Ciências Militares

142

(4) Cálculo do valor da variável:

�2

calc = 13,67 (5) Conclusão:

Como �2calc > �2

crit (13,67 > 11,07) rejeitamos H0, concluindo, com risco � = 0,05 que existem diferenças entre os índices de indisponibilidade de viaturas na OM ao longo do ano.

Consultando-se novamente a Tabela �2 pode-se notar que não seria possível rejeitar-se H0 a um nível de significância de � = 0,01, pois o �2

crit = 15,086.

Observe que a estatística fornece uma ferramenta para a tomada da decisão quanto às diferenças entre os bimestres. A explicação do porquê destas discrepâncias deve ser embasada pela teoria que gerou a formulação das hipóteses testadas.

10.2 TESTE QUI-QUADRADO PARA INDEPENDÊNCIA OU ASSOCIAÇÃO

O teste Qui-Quadrado pode ser empregado para estudar a associação, ou dependência,

entre duas variáveis. A representação das Fo é dada por uma tabela de dupla entrada chamada Tabela de Contingência, e o cálculo das Fe fundamenta-se na definição de independência estatística entre dois eventos, ou seja, diz-se que X e Y são independentes se a distribuição conjunta de probabilidades de (Y,X) é igual ao produto das distribuições marginais de probabilidades de X e Y.

p(xi, yi) = p(xi) . p(yj)

Este teste é aconselhável quando o tamanho da amostra é razoavelmente grande, e deve ser aplicado com maior cuidado se existirem freqüências esperadas menores do que 5 (Fe < 5). Nesses casos, a solução é juntar classes adjacentes.

(12 – 6)2 (5 - 6) 2 (7 - 6) 2 (4 - 6) 2 (8 - 6) 2 (12 - 6) 2 �2

calc = 6 + 6 + 6 + 6 + 6 + 6

11,071

RC RA

5%

�2

f (�2)

Page 143: Domingues 2005 - Estatística Aplicada as Ciências Militares

143

Quando uma das variáveis possui níveis que contemplam todas as categorias da população (por exemplo, variável sexo: masculino e feminino, não sendo possível outra modalidade), diz-se que o teste é de homogeneidade.

Para realização do teste de independência entre duas variáveis, deve-se proceder da seguinte forma:

(1) Enunciar as hipóteses H0 e H1:

H0: Foij = Feij (as variáveis são independentes, ou as variáveis não estão associadas)

H1: Foij � Feij (as variáveis são dependentes, ou as variáveis estão associadas)

H1 afirmará que as freqüências observadas e esperadas são discrepantes (2) Fixar � e escolher a variável �2 com gl = (L - 1) (C - 1), onde:

L = número de linhas da tabela de contingência, e

C = número de colunas

(3) Determinar RC e RA por meio do �2crit

(4) Calcular o valor da variável:

(Foij – Feij)2

�2 = � � Feij Onde

(total marginal da linha) (total marginal da coluna) Feij = (total de observações) 5) Conclusão:

Se �2calc < �2

crit não podemos rejeitar H0, ou seja, não se pode dizer que as variáveis sejam dependentes, pois as Foij não diferem significativamente das Feij.

�2

crit

RC RA

1 – �

�2

f (�2)

L

i=1

C

j=1

Page 144: Domingues 2005 - Estatística Aplicada as Ciências Militares

144

Se �2calc > �2

crit rejeitamos H0, concluindo, com risco �, que as variáveis são dependentes, ou estão associadas.

EXEMPLO 10.2.1: Deseja-se testar, ao nível de 5%, se há dependência entre o

resultado de uma avaliação diagnóstica no CAO 1ª Fase e o Curso a que pertence o aluno de uma determinada turma de aperfeiçoamento. Para tanto os dados referentes às avaliações foram dispostos na tabela a seguir.

Curso

Grau Inf Cav Art Eng Int Com Mat Bel

Total marginal

8,0-10,0 10 10 30 20 20 10 10 110 6,0-8,0 80 30 30 20 20 10 10 200 4,0-6,0 50 10 10 10 10 10 10 110 Total

marginal 140 50 70 50 50 30 30 420

(1) Enunciando as hipóteses

H0: Foi = Fei (o resultado na avaliação independe do curso)

H1: Foi � Fei (o resultado na avaliação depende do curso) (2) Fixando � e escolhendo �2

crit com gl = (L – 1) (C – 1) � =0,05 L = 3 C = 7 gl = (3 – 1) (7 – 1) = 12 �2

0,05;12 = 21,026 (3) Determinando RC e RA por meio do �2

crit

21,026

RC RA

5%

�2

f (�2)

Page 145: Domingues 2005 - Estatística Aplicada as Ciências Militares

145

(4) Cálculo do valor da variável:

Curso Grau Inf Cav Art Eng Int Com Mat

Bel

Total marginal

8,0-10,0 110.140 420

110.50 420

110.70 420

110.50 420

110.50 420

110.30 420

110.30 420 110

6,0-8,0 200.140 420

200.50 420

200.70 420

200.50 420

200.50 420

200.30 420

200.30 420 200

4,0-6,0 110.140 420

110.50 420

110.70 420

110.50 420

110.50 420

110.30 420

110.30 420 120

Total marginal 140 50 70 50 50 30 30 420

Quadro das freqüências esperadas (Feij)

Curso Grau Inf Cav Art Eng Int Com Mat

Bel

Total marginal

8,0-10,0 36,667 13,095 18,333 13,095 13,095 7,857 7,857 110 6,0-8,0 66,667 23,810 33,333 23,810 23,810 14,286 14,286 200 4,0-6,0 36,667 13,095 18,333 13,095 13,095 7,857 7,857 120 Total

marginal 140 50 70 50 50 30 30 420

Logo:

(Foij – Feij)2 Cursos

Feij � �2

Inf (10 – 36,667)² = 19,395 36,667

(80 – 66,667)² = 2,667 66,667

(50 – 36,667)² = 4,848 36,667 26,91

Cav (10 - 13,095)² = 0,732 13,095

(30 - 23,810)² = 1,609 23,810

(10 - 13,095)² = 0,732 13,095 3,073

Art (30 - 18,333)² = 4,425 18,333

(30 - 33,333)² = 0,333 33,333

(10 - 18,333)² = 3,788 18,333 8,546

Eng (20 - 13,095)² = 3,641 13,095

(20 - 23,810)² = 0,610 23,810

(10 - 13,095)² = 0,732 13,095 4,983

Int (20 - 13,095)² = 3,641 13,095

(20 - 23,810)² = 0,610 23,810

(10 - 13,095)² = 0,732 13,095 4,983

Com (10 – 7,857)² = 0,586 7,857

(10 – 14,286)² = 1,286 14,286

(10 – 7,857)² = 0,586 7,857 2,458

Mat Bel (10 – 7,857)² = 0,586 7,857

(10 – 14,286)² = 1,286 14,286

(10 – 7,857)² = 0,586 7,857 2,458

�2calc = 53,411

(5) Conclusão:

Como �2calc > �2

crit (53,411 > 21,026), rejeitamos H0, concluindo, com risco � = 0,05, que o resultado na avaliação diagnóstica depende do Curso do Aluno.

Page 146: Domingues 2005 - Estatística Aplicada as Ciências Militares

146

Consultando-se novamente a Tabela �2 pode-se notar que seria possível rejeitar H0 a um nível de significância de � <0,005, pois o �2

crit = 28,299, Observe que a estatística fornece uma ferramenta para a tomada da decisão quanto à

dependência entre as variáveis. Para determinarmos o quanto pertencer a um determinado Curso influencia o resultado na avaliação diagnóstica, seria necessária a aplicação de um teste de acompanhamento (post-hoc) conforme abordado mais à frente.

10.3 TESTE QUI-QUADRADO PARA TABELAS (2 X 2)

O teste para tabelas de contingência (2X2) é um caso particular do teste Qui-

Quadrado, sendo utilizado para análise de variáveis com dois níveis de mensuração (dicotômicas).

Conforme apresentado no quadro a seguir, os Grupos I e II podem ser dois grupos

independentes quaisquer, tais como: experimental e controle; efetivo variável e efetivo profissional; oficiais e praças; etc. Os cabeçalhos indicados com os sinais “ –” e “ +” constituem duas classificações quaisquer: aprovados e reprovados; concorda e discorda; etc.

A hipótese a ser testada é a de que dois grupos diferem em relação à determinada

característica.

Grupos - + Total

I A B A+B II C D C+D

Total A+C B+D N

A fórmula para o cálculo do Qui-Quadrado de uma tabela (2 x 2) (com a correção de

Yates para Fe < 5) é dada por:

N ( |AD - BC| – N/2)2 �²calc=

(A +B)(C +D)(A +C)(B +D) Note que com gl = 1 pois:

gl = (L – 1) (C – 1) = (2 – 1) (2 – 1) = 1 EXEMPLO 10.3.1: Um pesquisador deseja inferir, ao nível de 5%, se o hábito de

praticar esportes depende do gênero do oficial QCO, ou seja, se homens e mulheres diferem quanto ao habito de se exercitar, e, para tanto, entrevistou aleatoriamente 150 militares. Os resultados estão apresentados no quadro abaixo:

Praticam esporte? Segmento Sim Não Total

Masculino 70 30 100 Feminino 20 30 50

Total 90 60 150

Page 147: Domingues 2005 - Estatística Aplicada as Ciências Militares

147

Solução: (1) Enunciando as hipóteses

H0: Foi = Fei (não há relação entre o gênero e o hábito de praticar esporte, ou, o hábito de praticar esportes não depende do gênero do militar)

H1: Foi � Fei (existe relação entre o gênero do militar e o hábito de praticar esportes)

(2) Fixando � e escolhendo �2

crit com gl = 1 � = 0,05 �2

0,05;1 = 3,84 (3) Determinando RC e RA por meio do �2

crit

(4) Calcular o valor da variável:

N ( |AD - BC| – N/2)2 �2

calc = (A +B)(C +D)(A +C)(B +D)

150 ( |70.30 – 30.20| – 150/2)2

�2calc =

(70 + 30)(30 + 20)(70 + 20)(20 + 30)

304593750 �2

calc = 22500000

�2calc = 13,54

(5) Conclusão

Como �2calc > �2

crit (13,54 > 3,84), rejeita-se H0, sendo possível afirmar, ao nível de significância de 5%, que existe relação entre o gênero e o hábito de praticar esportes.

3,84

RC RA

5%

�2

f (�2)

Page 148: Domingues 2005 - Estatística Aplicada as Ciências Militares

148

10.4 TESTE DA MEDIANA O teste da mediana é semelhante ao teste Qui-Quadrado para tabelas (2 x 2) e fornece

informações sobre a probabilidade de dois grupos independentes, não necessariamente do mesmo tamanho, provenham de populações com a mesma mediana, podendo ser aplicado sempre que os escores dos dois grupos sejam apresentados pelo menos em escala ordinal.

Para realização do teste deve-se proceder da seguinte forma:

(1) Enunciar as hipóteses

H0: MdI = MdII (não há diferença entre as medianas dos dois grupos).

H1: MdI MdII (as medianas são diferentes).

(2) Fixar � e escolher o �2

crit com gl = 1. (3) Determinar RA e RC por meio do �2

crit.

(4) Calcular o do valor da variável, para tal deve-se.

(a) Determinar a mediana do grupo combinado, isto é, a mediana de todos os escores das duas amostras.

(b) Montar uma tabela de contingência (2X2):

Critério Grupo I Grupos II Total Escores acima da

mediana combinada A B A+B

Escores acima da mediana combinada C D C+D

Total A+C B+D N

(c) Aplicar a fórmula:

N ( |AD – BC| – N/2)2 �2

calc = (A +B)(C +D)(A +C)(B +D)

�2

crit

RC RA

1 – �

�2

f (�2)

Page 149: Domingues 2005 - Estatística Aplicada as Ciências Militares

149

(5) Conclusão:

Se �2calc < �2

crit não se pode rejeitar H0, concluindo que as medianas não são diferentes.

Se �2calc > �2

crit rejeitamos H0, concluindo, com risco �, que as medianas são diferentes.

O teste da mediana não é adequado quando temos n1 + n2 < 20.

EXEMPLO 10.4.1: Alunos da disciplina Estatística de dois Cursos da EsAO X e Y,

obtiveram as seguintes notas finais:

Curso X 2 4 5 5 6 6 7 7 7 8 8 9 9 10 10 Curso Y 2 3 3 3 4 5 5 6 6 8

Testar, ao nível de significância de 2,5%, a hipótese de igualdade entre as medianas

das notas para os dois cursos. Solução: (1) Enunciando as hipóteses

H0: MdI = MdII (não há diferença entre as notas medianas dos dois grupos).

H1: MdI MdII (as notas medianas são diferentes).

(2) Fixando � e escolhendo o �2

crit com gl = 1.

� = 0,025 �2

0,025;1 = 5,02 (3) Determinar RA e RC por meio do �2

crit.

5,02

RC RA

2,5%

�2

f (�2)

Page 150: Domingues 2005 - Estatística Aplicada as Ciências Militares

150

(4) Cálculo do valor da variável �2 (a) Mediana do grupo combinado:

Notas 2 3 4 5 6 7 8 9 10

fi 2 3 2 4 4 3 3 2 2 Fi 2 5 7 11 15 18 21 23 25 13º

n + 1 25 + 1 Md= 2 = 2 = 13º elemento

Md = 6

(b) Tabela de contingência:

Critério Curso X Curso Y Total Escores acima da

mediana combinada 10 5 15

Escores acima da mediana combinada 2 8 10

Total 12 13 25 (c) Aplica-se a fórmula:

N ( |AD – BC| – N/2)2 �2

calc = (A +B)(C +D)(A +C)(B +D)

25 ( |10 . 8 – 5 . 2| – 25/2)2

�2calc =

(15)(10)(12)(13)

82656,25 �2

calc = 23400

�2calc = 3,53

(5) Conclusão:

Se �2calc < �2

crit (3,53 < 5,02) não se pode rejeitar H0, concluindo que as medianas não são diferentes ao nível de 2,5%.

10.5 TESTE DE MANN-WHITNEY

O teste de Mann-Whitney (U) pode ser utilizado como uma alternativa ao teste

paramétrico para igualdade de médias (teste t), pois não exige nenhuma hipótese sobre as distribuições populacionais e suas variâncias, permitindo testar se duas amostras

Page 151: Domingues 2005 - Estatística Aplicada as Ciências Militares

151

independentes foram retiradas de populações com médias iguais. Esse teste pode ser aplicado para variáveis intervalares ou ordinais. Para realização do teste deve-se proceder da seguinte forma:

(1) Enunciar as hipóteses

H0: X1 = X2 (não há diferença entre os grupos).

H1: X1 X2 (há diferença entre os grupos).

(2) Fixar � e verificar o valor do Zcrit por meio da Tabela Z. Para ni < 10 consultar a

Tabela U para pequenas amostras (ANEXO L). (3) Determinam-se RA e RC por meio do Zcrit

(4) Ordenar as observações Considerar n1 o número de casos do grupo com menor quantidade de observações, e

n2 o número de casos do grupo com maior quantidade de observações, ordenando-os de forma crescente (rank – Ri).

Atribuir ao escore que algebricamente for menor o primeiro posto, prosseguindo até

n= n1 + n2. Às observações empatadas deve-se atribuir a média dos postos correspondentes. (5) Calcular o somatório das ordenações (Ri) e escolher a menor soma entre R1 e R2

R1 = soma dos postos do grupo n1

R2 = soma dos postos do grupo n2 (6) Calcular uma das estatísticas, de acordo com o menor Ri

n1 + n2 U1= n1 . n2 + 2 – R1

ou

n1 + n2 U2= n1 . n2 + 2 – R2

Page 152: Domingues 2005 - Estatística Aplicada as Ciências Militares

152

(7) Calcular o valor de Zcalc :

U – ( n1 . n2 )/2 Zcalc= n1 . n2 (n1 + n2+1) 12

No caso de haver uma amostra com menos de 10 elementos, consultar a Tabela U para pequenas amostra.

(9) Conclusão:

Se – Z�/2 < Zcalc < Z�/2, não se pode rejeitar H0.

Se Zcalc > Z�/2 ou Zcalc < –Z�/2, rejeita-se H0, concluindo-se, com risco �, que há diferença entre os grupos.

No caso de pequenas amostras rejeita-se H0 sempre que um dos valores de R estiver

enquadrado no Intervalo de Confiança apresentado na Tabela U.

EXEMPLO 10.5.1: Verifique, ao nível de 5%, se os resultados no Tiro de Ação Reflexa (TAR) de dois Grupos de Combate (GC) X e Y são diferentes.

GC Impactos dos integrantes X 9 7 6 7 8 5 9 4 7 8 Y 5 3 4 6 7 5 8 9 5 6

(1) Enunciando as hipóteses

H0: X1 = X2 (não há diferença entre os resultados dos GC no TAR)

H1: X1 X2 (há diferença entre os resultados dos GC no TAR)

(2) Fixando � e verificando o valor do Zcrit.

� = 0,05

Zcrit = 1,960

(3) Determinando RA e RC de acordo com o Zcrit

2,5% 2,5%

1,960 1,960

Page 153: Domingues 2005 - Estatística Aplicada as Ciências Militares

153

(4) Ordenando as observações

GC X Y

Impactos R1 Impactos R2 4 2,5 3 1 5 5,5 4 2,5 6 9 5 5,5 7 12,5 5 5,5 7 12,5 5 5,5 7 12,5 6 9 8 16 6 9 8 16 7 12,5 9 19 8 16 9 19 9 19

�= 125,5 88

(5) Cálculo do somatório das ordenações e escolha do menor Ri R1 = 125,5 e R2 = 88, como R2 < R1, escolher R2 para o cálculo da estatística U. (6) Cálculo da estatística U.

10 + 102 U2= 10 . 10 + 2 – 88

U2= 67

(7) Cálculo da variável Z:

U – ( n1 . n2 )/2 Zcalc= n1 . n2 (n1 + n2 + 1) 12

67 – ( 10 .10 )/2 Zcalc= 10 . 10 (10 + 10+1) 12

Zcalc = 1,285

(8) Conclusão:

Como – Z�/2 < Zcalc < Z�/2, ( – 1,960 < 1,285 < 1,960), não se pode rejeitar H0,ou seja, não é possível afirmar que os grupos tiveram desempenhos diferentes no TAR.

EXEMPLO 10.5.2: Verifique, ao nível de 10%, se os resultados no Tiro de Ação Reflexa (TAR) das duas Esquadras de um GC são diferentes.

Esquadra Impactos 1 9 7 6 7 8 2 5 3 4 6

Page 154: Domingues 2005 - Estatística Aplicada as Ciências Militares

154

Solução:

(1) Enunciando as hipóteses

H0: X1 = X2 (não há diferença entre os resultados das esquadras no TAR).

H1: X1 X2 (há diferença entre os resultados das esquadras no TAR).

(2) Fixando � = 0,10, com o auxílio da Tabela U para amostras pequenas, lê-se a

coluna 4 e a linha 5 encontrando o Intervalo de Confiança

IC4;5 = [12 – 28]

(3) Determinando RA e RC por meio do IC4;5

(4) Calcular o somatório das ordenações (Ri):

Esquadras 1 2

Impactos R1 Impactos R2 6 4,5 3 1 7 6,5 4 2 7 6,5 5 3 8 8 6 4,5 9 9 - -

�= 34,5 10,5 R1 = 34,5 e R2 = 10,5.

(5) Conclusão:

Considera-se que duas médias são diferentes entre si quando o Ri dos grupos não estiver contido no IC.

Como R1 e R2 não se encontram dentro do IC para igualdade entre as médias, rejeitamos H0. concluindo que o desempenho da esquadra 1 foi melhor que o da esquadra 2 pois X1 > X2 (7,4 > 4,5).

Note que, mesmo que � = 0,05 seria possível rejeitar H0, pois IC4;5 = [11 – 29]

5% 5%

12 28

Page 155: Domingues 2005 - Estatística Aplicada as Ciências Militares

155

10.6 TESTE DOS SINAIS PARA DOIS GRUPOS RELACIONADOS O Teste dos Sinais (para dados emparelhados) pode ser utilizado quando o mesmo

indivíduo é submetido a duas medidas chamadas: antes e depois, ou pré e pós-tratamento, sendo aplicado em situações em que se deseja determinar se duas condições são diferentes (antes de depois da IIB, entre o 1º e o 2º TAF, etc).

A variável de estudo poderá estar nas escalas nominal, ordinal ou intervalar. É um

teste bem simples e seu nome deve-se ao fato de que os valores da escala são substituídos pelos sinais “ +” e “ -” , dependendo da tendência positiva ou negativa que se queira mensurar. Onde não houver alteração de tendência atribui-se o valor “ 0” (zero), descartando-se o indivíduo.

A lógica deste teste está em investigar se as tendências “ +” e “ –” podem (ou não)

serem consideradas iguais (p1 = p2), concluindo se um determinado tratamento (variável independente) fez efeito (ou não) sobre o desempenho do sujeito (variável dependente).

Procedimento: (1) Enunciar as hipóteses

H0: p1 = p2 (não há diferença entre os resultados pré e pós, ou seja, o tratamento não

surtiu efeito). H1: p1 p2 (há diferença entre os resultados pré e pós, ou seja, o tratamento surtiu

efeito). (2) Fixar �, e determinar o Zcrit com o auxílio da Tabela Z (para n >25), ou utilizar a

Distribuição Binomial se n < 25. (3) Determinar RA e RC por meio do Zcrit.

(4) Calcular o valor da variável Z, quando n > 25.

y – np Zcalc= npq

Page 156: Domingues 2005 - Estatística Aplicada as Ciências Militares

156

Onde: y = número de sinais “ +” n = tamanho da amostra (descontados os empates) p = 0,5 e q = 1 – p = 0,5, pois estamos testando a hipótese de igualdade entre as

proporções.

(5) Conclusões:

Se – Z�/2 < Zcalc < Z�/2, não se pode rejeitar H0. Se Zcalc > Z�/2 ou Zcalc < – Z�/2, rejeita-se H0, concluindo-se, com risco �, que há

diferença entre os grupos (medidas), ou seja que existe diferença entre as condições pré e pós. EXEMPLO 10.6.1: Deseja-se verificar ao nível de 5% se os 80 recrutas de uma

determinada SU apresentaram melhora significativa na corrida entre o 1º e o 2º TAF, concluindo um determinado treinamento fez efeito ou não na condição física dos sujeitos.

Comparando os resultados do 1º TAF (pré) com o 2º TAF (pós) obtém-se a seguinte

quadro:

Melhoram a menção “+”

Não mudaram de menção “0”

Pioraram a menção “–”

40 20 20 Solução:

(1) Enunciando as hipóteses

H0: p1 = p2 (não há diferença entre os resultados da corrida no 1º e no 2º TAF, ou seja, o treinamento não surtiu efeito).

H1: p1 < p2 (o resultado da corrida no 2º TAF foi maior que no 1º TAF, ou seja, o treinamento surtiu efeito).

(2) Fixando �= 0,05, e determinar o Zcrit com o auxílio da Tabela Z.

Zcrit = 1,960 (3) Determinando RA e RC de acordo com o Zcrit .

5%

Z 1,960

Page 157: Domingues 2005 - Estatística Aplicada as Ciências Militares

157

Observe que, devido ao enunciado de H1, optamos por um teste uni-caudal à direita, por termos a esperança estatística de que o treinamento executado entre os TAF surtiu um efeito positivo no desempenho dos sujeitos. Caso esperássemos uma piora no desempenho o teste deveria ser unicaudal à esquerda, e se a hipótese afirmasse alteração no desempenho na corrida, sem esperarmos algum sentido, o teste deveria ser bi-caudal.

(4) Calculando o valor da variável Z. Como estamos verificando a hipótese de igualdade entre a proporções de soldados que

melhorou seu resultado e soldados que pioraram seu resultado p = 0,5, logo q = 1 – p = 0,5. y – np

Zcalc= npq

40 – 60(0,5)

Zcalc= 60(0,5)(0,5)

Zcalc=2,582

(5) Conclusão: Como Zcalc > Zcrit, rejeitamos H0, concluindo, com risco de 5%, que o treinamento

melhorou o desempenho dos soldados na corrida entre o 1º e o 2º TAF.

10.7 TESTE DE WILCOXON - DOIS GRUPOS RELACIONADOS O teste de Wilcoxon é uma extensão do teste dos sinais, que leva em consideração a

magnitude das diferenças (pré-pós) para cada par de medidas, o que o torna mais informativo.

Para aplicarmos o teste é preciso: a. determinar para cada par a diferença (di) entre os dois escores; b. atribuir postos (colocar em ordem crescente) a todas as diferenças,

desconsiderando-se os sinais. No caso de empate, atribuir a média dos pontos empatados; c. identificar cada posto pelo sinal “ +“ ou “ -“ , segundo a diferença que ele representa; d. determinar a estatística T (menor das somas de postos de mesmo sinal); e e. abater do n o número de zeros, isto é, os pares em que di = 0.

Procedimento: (1) Enunciar as hipóteses

H0: p1 = p2 (não há diferença entre os resultados pré e pós, ou seja, o tratamento não

surtiu efeito). H1: p1 p2 (há diferença entre os resultados pré e pós, ou seja, o tratamento surtiu

efeito).

Page 158: Domingues 2005 - Estatística Aplicada as Ciências Militares

158

(2) Fixar � e determinar o Zcrit por meio da Tabela Z (para n >25), ou utilizar a Tabela W (ANEXO M) n < 25.

(3) Determinando RA e RC

(4) Calcular o valor da variável Z, quando n > 25.

T – n(n+1)/4

Zcalc= n(n+1)(2n+1) 24

Onde

T = menor das somas de postos de mesmo sinal

n = número de sujeitos

(5) Conclusões: Se – Z�/2 < Zcalc < Z�/2, não se pode rejeitar H0. Se Zcalc > Z�/2 ou Zcalc < – Z�/2, rejeita-se H0, concluindo-se, com risco �, que há

diferença entre os grupos (medidas), ou seja que existe diferença entre as condições pré e pós.

EXEMPLO 10.7.1: Um grupo de 30 soldados foi submetido a um treinamento muscular visando aumentar o número de flexões de braço. Teste, ao nível de 5%, a hipótese de que não houve um aumento significativo na performance dos sujeitos.

Solução (1) Enunciando as hipóteses H0 e H1:

H0: p1 = p2 (não há diferença entre os resultados pré e pós, ou seja, o treinamento não surtiu efeito).

H1: p1 p2 (há diferença entre os resultados pré e pós, ou seja, o treinamento surtiu efeito).

(2) Fixando � = 0,05, e determina-se o Zcrit com o auxílio da Tabela Z.

Zcrit = 1,960

Page 159: Domingues 2005 - Estatística Aplicada as Ciências Militares

159

(3) Determinando RA e RC

(4) Cálculo do valor da variável Z.

Número de flexões de braço Soldados

Antes depois di Ordenação

Menor soma por postos de mesmo sinal

T 1 20 19 -1 -4 4 2 22 30 8 20 3 23 29 6 14,5 4 22 30 8 20 5 22 23 1 4 6 23 24 1 4 7 24 30 6 14,5 8 22 22 0 - 9 23 20 -3 -9 9

10 24 22 -2 -8 8 11 25 30 5 11 12 25 25 0 - 13 25 30 5 11 14 23 30 7 17,5 15 22 29 7 17,5 16 23 33 10 24 17 24 33 9 22 18 23 33 10 24 19 23 23 0 - 20 25 33 8 20 21 22 21 -1 -4 4 22 26 26 0 - 23 27 33 6 14,5 24 23 22 -1 -4 4 25 22 33 11 26 26 23 33 10 24 27 23 24 1 4 28 24 30 6 14,5 29 25 30 5 11 30 23 22 -1 -4 4

Média 23,3 27,4 - - T = 31

2,5% 2,5%

–1,960 1,960

Page 160: Domingues 2005 - Estatística Aplicada as Ciências Militares

160

T – n(n+1)/4 Zcalc= n(n+1)(2n+1) 24

33 – 30(30+1)/4

Zcalc= 30(30+1)(2.30+1) 24

Zcalc= 4,103

(5) Conclusões:

Como Zcalc > Z�/2 (4,103>1,960) rejeita-se H0, concluindo-se, com risco de 5%, que o treinamento surtiu efeito, visto que o desempenho dos soldados, em média, aumentou (23,3<27,4).

Page 161: Domingues 2005 - Estatística Aplicada as Ciências Militares

161

Capítulo 11

Testes Não-Paramétricos para 3 ou mais grupos independentes

Como visto no Capítulo 9, a Análise da Variância (ANOVA) é uma técnica

paramétrica utilizada para testar se diversas amostras independentes provêm da mesma população. No entanto, as suposições para o seu uso exigem que as observações tenham sido extraídas, independentemente, de populações normalmente distribuídas com a mesma variância, e ainda, que a mensuração da variável de estudo seja no mínimo intervalar.

Se o pesquisador entende que tais suposições não são características dos dados de seu problema, deve utilizar-se das técnicas não-paramétricas para decidir se diversas variáveis (três ou mais) independentes podem ser consideradas procedentes da mesma população. Como os valores amostrais quase sempre são diferentes, o problema é determinar se as discrepâncias observadas sugerem realmente diferenças entre populações, ou se são apenas variações casuais esperadas entre amostras aleatórias da mesma população.

Nesta seção, serão apresentados testes para comprovar a significância de diferenças entre três ou mais grupos independentes de amostras, ou seja, para comprovar a hipótese de nulidade de que as amostras independentes tenham sido extraídas da mesma população, ou de populações idênticas.

11.1 TESTE QUI-QUADRADO

O teste Qui-Quadrado para três ou mais grupos independentes é uma extensão direta da prova Qui-Quadrado para duas amostras independentes, apresentadas nas seções 10.1, 10.2 e 10.3.

11.2 TESTE DA MEDIANA

O teste da mediana para três ou mais grupos independentes, não necessariamente do mesmo tamanho, pode ser aplicado do mesmo modo como apresentado na seção 10.4. A variável de estudo poderá ter nível de mensuração ordinal ou intervalar.

EXEMPLO 11.2.1: Alunos da disciplina Estatística de três Cursos da EsAO X, Y e V, obtiveram as seguintes notas finais:

Curso X 2 4 5 5 6 6 7 7 7 8 8 9 9 10 10 Curso Y 2 3 3 3 4 5 5 6 6 8 Curso V 5 6 6 6 7 8 8 8 8 9

Teste, ao nível de significância de 5%, a hipótese de igualdade entre as medianas das

notas para os três cursos.

Page 162: Domingues 2005 - Estatística Aplicada as Ciências Militares

162

Solução: (1) Enunciando as hipóteses

H0: MdX = MdY = MdV (não há diferença entre as notas medianas dos três Cursos).

H1: MdX MdY MdV (as notas medianas são diferentes).

(2) Fixando � e escolhendo o �2crit com gl =K – 1

� = 0,05 gl = 3 – 1 = 2 �2

2; 0,05 = 5,99

(3) Determinar RA e RC por meio do �2crit

(4) Como o teste para a igualdade de medianas apóia-se em um teste Qui-Quadrado,

deve-se calcular o valor da variável �2para tabelas (3 x 2), da seguinte forma:

(a) Determinar o valor da mediana do grupo combinado:

Notas 2 3 4 5 6 7 8 9 10 fi 2 3 2 5 7 4 7 3 2 Fi 2 5 7 12 19 23 30 33 35 18º

n + 1 35 + 1 Md= 2 = 2 = 18º elemento

Md = 6

(b) Preencher a Tabela de contingência:

Curso X Curso Y Curso V Critério Fo Fe Fo Fe Fo Fe Total

Escores acima da mediana combinada 9 6,8 1 4,6 6 4,6 16

Escores iguais ou abaixo da mediana combinada 6 8,2 9 5,4 4 5,4 19

Total 15 10 10 35

5,99

RC RA

5%

�2

f (�2)

Page 163: Domingues 2005 - Estatística Aplicada as Ciências Militares

163

(c) Cálculo do valor da variável �2:

(Foi – Fei)2 �2

calc = � Fei

(9 – 6,8)2 (6 – 8,2) 2 (1 – 4,6) 2 (9 – 5,4) 2 (6 – 4,6) 2 (4 – 5,4) 2 �2

calc= 6,8 + 8,2 + 4,6 + 5,4 + 4,6 + 5,4

�2calc = 12,621

(5) Conclusão: Como �2

calc > �2crit (12,621>5,99), rejeitamos H0, concluindo, com risco de 5%, que as

notas medianas não são iguais para os três cursos.

11.3 TESTE KRUSKAL-WALLIS

Trata-se de teste extremamente útil para decidir se K amostras (K > 2) independentes provêm de populações com médias iguais, podendo ser aplicado para variáveis ordinais ou intervalares.

Para aplicarmos o teste é preciso:

a. Dispor, em ordem crescente, as observações de todos os K grupos, atribuindo-lhes postos de 1 a n. Caso haja empates, atribuir o posto médio.

b. Determinar o valor da soma dos postos (Ri )para cada um dos K grupos.

Procedimento:

(1) Enunciar as hipóteses

H0: X1 = X2 = ... = Xi (as médias dos K grupos são iguais).

H1: X1 X2 ... Xi (pelo menos uma das médias dos K grupos é diferente).

(2) Fixar �, e determinar o �2crit com gl= K – 1

(3) Determinar RA e RC por meio do �2

crit

�2

crit

RC RA

1 - �

�2

f (�2)

Page 164: Domingues 2005 - Estatística Aplicada as Ciências Militares

164

(4) Calcular o valor do �2,chamado, neste caso, de estatística “ H” :

12 (Ri)2 H = n(n+1) � ni – 3(n+1)

(5) Conclusão:

Se H < �2crit, não se pode H0.

Se H > �2crit,rejeitamos H0, concluindo, com risco �, que há diferença entre as médias

dos K grupos.

EXEMPLO 13.3.1: Testar, ao nível de 5%, a hipótese da igualdade dos resultados

médios obtidos no TAR por GC de 3 diferentes OM. Note que o teste pretende verificar se existe igualdade na instrução ministrada pelas diferentes OM, o que poderá ser confirmado caso os resultados médios no TAR não puderem ser considerados diferentes.

Solução: Confecção do quadro de ordenação dos grupos:

GC1 GC2 GC3 Impactos Ordenação Impactos Ordenação Impactos Ordenação

5 3 5 3 7 16 5 3 5 3 7 16 5 3 6 8,5 7 16 6 8,5 6 8,5 8 23,5 6 8,5 6 8,5 8 23,5 6 8,5 7 16 8 23,5 7 16 7 16 9 27,5 7 16 7 16 9 27,5 7 16 8 23,5 10 29,5 8 23,5 8 23,5 10 29,5

X1 = 6,2 R1 = 106 X2 = 6,5 R2 = 126,5 X3 = 8,3 R3 = 232,5 R1 = 10,6 R2 = 12,65 R3 = 23,25 (1) Enunciando as hipóteses

H0: X1 = X2 = X3 (as médias dos 3 GC são iguais).

H1: X1 X2 = X3 (pelo menos uma das médias é diferente, ou seja, o adestramento foi diferente).

(2) Fixando � = 0,05,e determinando o �2crit para gl = K – 1

� = 0,05

gl = (K – 1) = (3 – 1) = 2

�2crit = 5,99

K

i=1

Page 165: Domingues 2005 - Estatística Aplicada as Ciências Militares

165

(3) Determinando RA e RC por meio do �2crit

(4) Cálculo da estatística “ H” :

12 (Ri)2 H = n(n+1) � ni – 3(n+1)

12 (106) 2 (126,5) 2 (232,5) 2 H = 30(30+1) . 10 + 10 + 10 – 3(30+1)

H = 11,73

(5) Conclusão:

Como H > �2crit (11,73>5,99), rejeitamos H0, concluindo, com risco de 5%, que há

diferença entre os resultados médios obtidos no TAR.

Note que o teste é capaz de discriminar a existência ou não de diferenças significativas entre grupos. No entanto, o aspecto mais relevante da investigação está na identificação de quais grupos foram diferentes entre si. Para tal deve-se realizar um teste de acompanhamento (post-hoc), da seguinte forma:

(1) Identificar quantas possibilidades de comparação são possíveis, utilizando a fórmula:

C = K(K – 1)/2 Logo:

C = 3(3 – 1)/2 = 3

(2) Estabelecer o nível de confiança para cada comparação, utilizando a técnica de Bonferroni, que consiste em dividir o nível � pelo número de comparações possíveis.

� = 0,05/3 = 0,017

(3) Consultar a Tabela Z e encontrar o Zcrit correspondente

�= 0,017

Zcrit = 2,39

5,99

RC RA

5%

�2

f (�2)

K

i=1

Page 166: Domingues 2005 - Estatística Aplicada as Ciências Militares

166

(4) Calcular o erro padrão (EP) de diferença entre duas amostras

EP = [N(N+1)/12] . (1/n1 + n2) Onde:

N = ao tamanho total da amostra

n = tamanho dos grupos que estão sendo comparados

Logo: Para GC1 X GC2:

EP1,2 = [30(30+1)/12] . (1/10 + 1/10) EP1,2= 3,973

Para GC1 X GC3: EP1,3 = [30(30+1)/12] . (1/10 + 1/10) EP1,3= 3,973

Para GC2 X GC3: EP2,3 = [30(30+1)/12] . (1/10 + 1/10) EP2,3= 3,973

(5) Calcular o intervalo de confiança por meio da fórmula:

IC = (R1 – R2). Zcrit . EP

Onde: R = ordenação média do grupo

IC Grupos Cálculo do Intervalo de Confiança Mínimo Máximo GC1 X GC2 IC1,2 = (10,6 – 12,65) + 2,39 . 3,973 – 11,56 7,45 GC1 X GC3 IC1,3 = (10,6 – 23,25) + 2,39 . 3,973 – 22,16* – 3,15* GC2 X GC3 IC2,3 = (12,65 – 23,25) + 2,39 . 3,973 – 20,10* – 1,10*

*Uma comparação é considerada estatisticamente significativa quando o IC não inclui o valor “0” (zero) Logo, os grupos que apresentaram diferença significativa foram os grupos GC1 X GC3

e GC2 X GC3 . Tal análise nos permite inferir que os resultados obtidos no TAR pelos sujeitos do GC3 são significativamente diferentes dos obtidos pelos GC1 e GC3 G, e ainda, que não existem diferenças entre os GC1 e GC2 .

Poderíamos ainda afirmar que os GC1 e GC2 possuem um mesmo nível de

adestramento em relação ao TAR (6,2 = 6,5), e que o GC3 apresenta um nível mais elevado de adestramento, quando comparado aos demais (8,3 > 6,2 = 6,5).

11.4 ANOVA TWO-WAY DE FRIEDMAN POR ORDENAÇÕES

O teste de Friedman é análogo à ANOVA de medidas repetidas aplicado na estatística paramétrica (apresentado no Capítulo XX). Trata-se de um teste extremamente útil para decidir se K medidas repetidas (K>2) de uma mesma amostra possuem médias iguais ou não, podendo ser aplicado para variáveis ordinais ou intervalares.

Page 167: Domingues 2005 - Estatística Aplicada as Ciências Militares

167

Para aplicarmos o teste é preciso:

a) Ordenar em ordem crescente as K medidas repetidas para cada sujeito, atribuindo-lhes postos de 1 a K. Caso haja empates, atribuir o posto médio.

b) Determinar o valor da soma das ordenações (Oi)para cada uma das K medidas.

Procedimento:

(1) Enunciar as hipóteses

H0: X1 = X2 = ... =Xi (as médias das K medidas não são diferentes)

H1: X1 X2 = ... =Xi (pelo menos uma média é diferentes das demais)

(2) Fixar �, e determinar o �2

crit para gl= K – 1 (3) Determinar RA e RC por meio do �2

crit

(4) Calcular o valor do �2

�2calc = [ 12 / NK(K+1) ] . [ �(�O)² ] - 3N(K+1)

Onde:

N = o total de sujeitos

K = número de medidas

�(�O)² = somatório das somas das ordenações ao quadrado

(5) Conclusão:

Se �2calc < �2

crit, não se pode H0.

Se �2calc > �2

crit, rejeitamos H0, concluindo, com risco �, que há diferença entre as médias das K medidas.

�2crit

RC RA

1 - �

�2

f (�2)

Page 168: Domingues 2005 - Estatística Aplicada as Ciências Militares

168

EXEMPLO 11.4.1: Testar, ao nível de 1%, a hipótese da igualdade entre os resultados médios obtidos na corrida do TAF, por um GC, considerados os 3 TAF de um ano de instrução. Note que o teste pretende medir se existe evolução no resultado da corrida, devido ao treinamento físico desenvolvido durante o ano.

Confecção do quadro de ordenação das medidas:

1º TAF 2º TAF 3º TAF Sujeitos Resultado Oi Resultado Oi Resultado Oi 1 2700 1 2800 2 3000 3 2 2700 1,5 2700 1,5 2900 3 3 2700 1 2800 2 3000 3 4 2800 1,5 2800 1,5 3000 3 5 2700 1 2900 2 3000 3 6 2600 1 2800 2 3000 3 7 2700 1 2800 2,5 2800 2,5 8 2800 1,5 2800 1,5 3000 3 9 2900 1 3000 2 3100 3

10 2900 1 3000 2 3200 3 X1 = 2750 � O1 = 11,5 X2 = 2840 � O2 = 19,0 X3 = 3000 � O3 = 29,5 (1) Enunciando as hipóteses

H0: X1 = X2 = ... =Xi (as médias das 3 medidas não são diferentes)

H1: X1 X2 = ... =Xi (pelo menos uma média é diferentes das demais)

(2) Fixando �, e determinando o �2

crit com gl = K – 1 � = 0,01 gl =(3 – 1) = 2 �2

2; 0,01 = 9,210 (3) Determinar RA e RC a partir do �2

crit

9,21

RC RA

1%

�2

f (�2)

Page 169: Domingues 2005 - Estatística Aplicada as Ciências Militares

169

(4) Calcular o valor do �2:

�2calc = [ 12 / N.K(K+1) ] . [ �(�O)² ] – 3N(K+1)

�2calc = [ 12 / 10.3(3+1) ] . [(11,5)² . (19,0)² . (29,5)²] – 3. 10(3+1)

�2calc = 16,35

(5) Conclusão: Como �2

calc > �2crit (16,35>9,21), rejeitamos H0, concluindo, com risco de 1%, que há

diferença entre os resultados médios obtidos no TAR. Para identificarmos quais grupos foram diferentes entre si, aplicamos o post-hoc: (1) Identificando as possibilidades de comparação

C = K(K – 1)/2

C = 3(3 – 1)/2 = 3

(2) Estabelecendo o nível de confiança para cada comparação

� = 0,05/3= 0,017 (3) Consultar a Tabela Z e encontrar o Zcrit correspondente

� = 0,017

Zcrit = 2,39

(4) Calcular o erro padrão (EP) de diferença entre duas amostras

EP = [N(N+1)/12] . (1/n1 + n2) Onde:

N = ao tamanho total da amostra

n = tamanho dos grupos que estão sendo comparados

Para GC1 X GC2:

EP1,2 = [30(30+1)/12] . (1/10 + 1/10) EP1,2= 3,973 Para GC1 X GC3:

EP1,3 = [30(30+1)/12] . (1/10 + 1/10) EP1,3= 3,973 Para GC2 X GC3:

EP2,3 = [30(30+1)/12] . (1/10 + 1/10) EP2,3= 3,973

Page 170: Domingues 2005 - Estatística Aplicada as Ciências Militares

170

(5) Calcular o intervalo de confiança, pela fórmula:

IC = (�O1 – �O2) . Zcrit . EP

Onde:

R = ordenação média do grupo

IC Grupos Cálculo do Intervalo de Confiança Mínimo Máximo GC1 X GC2 IC1,2 = (11,5 – 19,0) + 2,39 . 3,973 - 16,995 1,995 GC1 X GC3 IC1,3 = (11,5 – 29,5) + 2,39 . 3,973 - 27,495* -8,505* GC2 X GC3 IC2,3 = (19,0– 29,5) + 2,39 . 3,973 - 19,995* -1,005*

*Uma comparação é considerada estatisticamente significativa quando o IC não inclui o valor “0” (zero) Logo, os grupos que apresentaram diferença significativa foram os grupos GC1 X GC3

e GC2 X GC3 . Tal análise nos permite inferir que os resultados obtidos no 3º TAF foram melhores que no 1º e 2º TAF (3000 > 2840 = 2750), e ainda que não houve diferença significativa entre os resultados do 1º e 2º TAF (2750 = 2840). Conclui-se que o treinamento provocou mudanças significativas nas performances dos soldados.

A amplitude de tal mudança pode ser verificada, de forma bem simples, por meio da

fórmula:

Xpós – Xpré v =

Xpré Onde:

v = percentual de variação entre os momentos

Xpós = media pós-tratamento

Xpré = média pré-tratamento

Logo: Do 1º para o 3º TAF:

3000 – 2750 v =

2750

v = 0,0909 = 9,09%

Do 2º para o 3º TAF:

3000 – 2840 v =

2840

v = 0,0563 = 5,63%

Neste sentido, é possível afirmar que o treinamento realizado provocou um aumento de 9,09% no desempenho médio dos soldados na corrida de 12 minutos entre o 1º e o 3º TAF.

Page 171: Domingues 2005 - Estatística Aplicada as Ciências Militares

171

Capítulo 12 Correlação e Regressão

Este capítulo discute brevemente vários tipos de correlação, a significância dos coeficientes correlacionais, bem como o uso de correlações para previsões, incluindo as correlações parciais.

A correlação é uma técnica estatística utilizada para determinar o relacionamento

entre duas ou mais variáveis. Freqüentemente um pesquisador está interessado no grau de relacionamento entre variáveis. A correlação pode envolver duas variáveis (correlação simples), tais como o relacionamento entre a altura e o peso, como também três ou mais variáveis (correlação múltipla), como quando alguém investiga o relacionamento entre um critério (variável dependente) tal como força muscular e duas ou mais variáveis determinantes (variáveis independentes), como o peso corporal, porcentagem de gordura, resistência muscular. 12.1 COEFICIENTE DE CORRELAÇÃO DE PEARSON

O coeficiente de correlação de Pearson (r) é um valor quantitativo do relacionamento entre duas ou mais variáveis, podendo variar entre 0,00 (correlação nula) e 1,00 (correlação perfeita) tanto na direção positiva quanto na negativa. Portanto, – 1,00 < r < +1,00. Nesse tipo de correlação, existe uma variável critério (ou dependente) e uma variável preditora (ou independente).

O r pode ser calculado pela fórmula:

De acordo com a força da relação entre as variáveis, a correlação pode ser positiva,

negativa ou nula. Quando os escores de cada par ordenado são plotados em um gráfico de dispersão, formam uma elipse, que quanto mais próxima de uma reta, mais perfeita será a correlação entre as variáveis, conforme as Fig. 25a e Fig. 25c. Quando virtualmente não existe relação entre variáveis, a correlação tende a 0,00. Isso denota independência entre os grupos de escores, que não exibem um padrão discernível, conforme a Fig. 25b.

CORRELAÇÃO POSITIVA

40557085

100115130145

20 30 40 50 60 70

X

Y

CORRELAÇÃO NULA

40557085

100115130145

20 30 40 50 60 70

X

Y

CORRELAÇÃO NEGATIVA

40557085

100115130145

20 30 40 50 60 70X

Y

Figura 25a – Correlação positiva Figura 25b – Correlação nula Figura 25c – Correlação negativa

r = n�XY – (�X) . (�Y)

n�X² – (�X)² n�Y² – (�Y)²

Page 172: Domingues 2005 - Estatística Aplicada as Ciências Militares

172

Uma correlação positiva existe, quando uma pequena quantidade da variável X é associada com uma pequena quantidade da variável Y , e uma grande quantidade da variável X é associada com uma grande quantidade da variável Y.

EXEMPLO 12.1.1: A Tab. 20 apresenta o cálculo de r para as variáveis: peso

corporal (X) e força muscular (Y).

Tabela 20 – Cálculo do coeficiente de correlação de Pearson.

i Peso (X)

Força (Y) XY X² Y² Cálculo de r

1 30 58 1740 900 3364 Sendo: 2 32 68 2176 1024 4624 n = 16 3 34 65 2210 1156 4225 X = 720 e (X)²= 518400 4 36 78 2808 1296 6084 Y = 1473 e (Y)²= 2169729 5 38 80 3040 1444 6400 XY = 68998 6 40 76 3040 1600 5776 �X² = 33760 7 42 92 3864 1764 8464 �Y² = 141231 8 44 90 3960 1936 8100 9 46 100 4600 2116 10000 16. 68998 – 720. 1473 10 48 98 4704 2304 9604

r = 16. 33760 – 518400 16. 141231 – 2169729

11 50 103 5150 2500 10609 12 52 104 5408 2704 10816 1103968 – 1060560 13 54 114 6156 2916 12996

r = 540160 – 518400 2259696 – 2169729

14 56 112 6272 3136 12544 15 58 115 6670 3364 13225 43408 16 60 120 7200 3600 14400

r = 147,5127 . 299,945 = 720 1473 68998 33760 141231 r = 0,98107

A Fig. 26 é uma ilustração gráfica da correlação positiva (r = 0,98107) quase perfeita.

CORRELAÇÃO ENTRE FORÇA MUSCULAR E PESO CORPORAL

40557085

100115130145

20 30 40 50 60 70

Kg

Lb

Figura 26 – Gráfico de dispersão da relação força muscular X peso corporal.

O peso corporal e a força muscular estão correlacionados positivamente nos sujeitos

mais pesados, já que esses são geralmente mais fortes do que os mais leves. A correlação não é perfeita porque encontramos sujeitos mais leves que são mais fortes do que sujeitos mais pesados, como por exemplo os sujeitos: 2 e 3; 5 e 6; 7 e 8; 9 e 10; 13 e 14.

X=45

X=92,1

r=

n�XY – (�X).( �Y)

n�X² – (�X)² n�Y² – (�Y)²

Page 173: Domingues 2005 - Estatística Aplicada as Ciências Militares

173

Uma correlação negativa existe, quando uma pequena quantidade da variável X é associada com uma grande quantidade da variável Y , e uma grande quantidade da variável X é associada com uma pequena quantidade da variável Y.

EXEMPLO 12.1.2: A Tab.21 apresenta o cálculo de r para as variáveis: peso

corporal (X) e flexão na barra (Y).

Tabela 21 – Cálculo do coeficiente de correlação de Pearson.

i Peso (X)

Flexões (Y) XY X² Y² Cálculo de r

1 50 20 1000 2500 400 Sendo: 2 55 18 990 3025 324 n = 16 3 60 16 960 3600 256 X = 1400e (X)²= 1960000 4 65 15 975 4225 225 Y = 154 e (Y)²= 23716 5 70 14 980 4900 196 XY = 11350 6 75 13 975 5625 169 �X² = 131000 7 80 12 960 6400 144 �Y² = 2018 8 85 10 850 7225 100 9 90 8 720 8100 64 16. 11350 – 1400. 154 10 95 7 665 9025 49 r = 16. 131000– 1960000 16. 2018 – 23716 11 100 6 600 10000 36 12 105 5 525 11025 25 181600 – 215600 13 110 4 440 12100 16 r = 2096000 – 1960000 32288 – 23716 14 115 3 345 13225 9 15 120 2 240 14400 4 – 34000 16 125 1 125 15625 1

r = 368,782 . 92,585 = 1400 154 11350 131000 2018 r = – 0,99579

A Fig. 27 é uma ilustração gráfica da correlação positiva (r = – 0,99579) quase perfeita.

CORRELAÇÃO ENTRE PESO CORPORAL E FLEXÕES NA BARRA

0369

12151821

45 55 65 75 85 95 105 115 125

Kg

Nr

Figura 27 – Gráfico de dispersão da relação peso corporal X flexões na barra.

A flexão na barra é executada pela suspensão do peso corporal até o queixo passar

acima da barra, desta forma, o peso corporal pode fornecer uma tendência, indicando freqüentemente que pessoas mais pesadas tendem a executar um número menor de barras do que as pessoas mais leves.

n�XY – (�X).( �Y) r = n�X² – (�X)² n�Y² – (�Y)²

X=87,5

X=9,6

Page 174: Domingues 2005 - Estatística Aplicada as Ciências Militares

174

12.2 CORRELAÇÃO E CAUSA

Uma correlação entre duas variáveis não significa, necessariamente, que uma variável causa a outra. Por exemplo, podemos citar um estudo que pretendesse verificar a relação entre o posto/graduação de militares e seu desempenho no tiro prático de pistola. Muito provavelmente encontraríamos capitães com muito bons resultados e recrutas com péssimos resultados. Pesquisadores inexperientes (ou desatentos) talvez concluíssem que quanto maior o posto/graduação, melhor seria o resultado no teste de tiro prático de pistola. Desta forma, bastaria que promovêssemos todos os recrutas ao posto de coronel para que só houvesse excelentes atiradores de pistola no Exército (parece lógico?!).

Não se pretende dizer que uma variável não possa ser a causa de outra, mas que não se

pode inferir somente com o resultado de uma correlação. No exemplo ilustrativo acima, dever-se-ia levar em consideração outras variáveis que provavelmente tenham correlação com o resultado do tiro, tais como: experiência do atirador (quanto mais se pratica melhor tende a ser o resultado) e o “ nervosismo” do atirador (com a prática prolongada o atirador tende a ficar menos nervoso durante a performance, melhorando seu resultado). A única forma de demonstrar uma causa é com um experimento no qual uma variável independente pode ser manipulada para produzir um efeito, e as variáveis intervenientes podem ser controladas.

Além de se verificar o valor de r, e se é positivo ou negativo, deve-se entender o que

significa, em termos de ser alto ou baixo, satisfatório ou insatisfatório.

12.3 INTERPRETAÇÃO DE “ r”

Existem muitas formas de se interpretar o r, sendo um dos critérios sua significância (confiabilidade), que representa a probabilidade de obter-se uma relação similar se o estudo fosse repetido n vezes.

O nível significância pode ser estabelecido por meio de cálculos matemáticos ou,

simplesmente, consultando a Tabela r (ANEXO H). Para tal, deve-se selecionar o nível desejado, tais como 0,05 ou 0,01, e ler a tabela de acordo com os graus de liberdade (gl) adequados [gl são baseados no número de sujeitos (n) corrigidos para tendências amostrais (2 variáveis)], que, para r, gl= n – 2 .

EXEMPLO 12.3.1: No EXEMPLO 12.1.2, correlação entre o peso corporal e as

flexões na barra (r = – 0,99579), os graus de liberdade são n – 2 = 16 – 2 = 14, (onde n refere-se ao número de pares de escores). Ao ler-se a Tabela r no gl 14, vemos que é necessária uma correlação de 0,4863 para a significância de um teste bi-caudal no nível 0,5 (e 0,5742 no nível 0,01). Logo se pode concluir que uma correlação de r = – 0,98107 é significante.

A correlação necessária para um determinado nível de significância diminui com o

aumento do número de sujeitos, logo, coeficientes de correlação muito baixos podem ser significantes para uma amostra ampla de sujeitos. No nível 0,05, uma correlação de 0,4227 é significante com 20 gl, r = 0,2500 é significante com 60 gl, e 0,1946 é significante com 100 gl. Por outro lado, uma maior correlação é exigida para a significância no nível 0,01 do que no nível 0,05.

O nível 0,05 significa que se 100 experimentos fossem conduzidos, assumiria-se a

possibilidade de se rejeitar a hipótese nula (de que não existe relação), pelo acaso, somente

Page 175: Domingues 2005 - Estatística Aplicada as Ciências Militares

175

em 5 das 100 ocasiões. No nível 0,01, esperasse cometer este erro somente uma vez a cada 100 experimentos devido ao acaso. Logo, o teste de significância no nível 0,01 é mais preciso do que no nível 0,05, e, portanto, uma correlação maior é exigida para a significância no nível 0,01.

A Estatística pode responder se os efeitos são confiáveis, e se eles são significantes. O

critério mais comumente usado para a interpretação de r, conforme sua significância, é o coeficiente de determinação (r2), que indica a porção da variação total em uma medida que pode ser explicada, ou devida à variação na outra medida.

Para uma correlação de 0,70 entre duas variáveis, apenas cerca da metade (49%) da

variação (ou influências) em um teste é associada com a outra. Se r = 0,80, então 64% da performance em um teste são associados com, ou explicados pelos, fatores envolvidos na performance do outro teste.

A variação não explicada (1,0 – r2) refere-se à variação em uma variável (dependente)

que não ocorre em função da manipulação da outra variável (independente). Com uma correlação de 0,70, existe 49% de variação comum (explicada), e 51% (1,00 - 0,702) de variação de erro (não explicada). Quando se utiliza o coeficiente de determinação para interpretar os coeficientes de correlação, fica evidente que uma relação mais substancial é necessária para explicar uma grande quantidade de variação comum. A Tabela 22 apresenta a relação entre o coeficiente de correlação e as variações explicadas e não explicadas um breve exemplo

Tabela 22 – Relação entre r e as variações explicadas e não explicadas

Variação r Explicada Não Explicada 0,900 81% 19% 0,800 64% 36% 0,700 49% 51% 0,600 36% 64% 0,500 25% 75% 0,400 16% 84% 0.300 9% 91%

O tamanho comparativo das correlações devidas ao coeficiente de determinação também pode ser observado. Uma correlação de 0,90 não é simplesmente três vezes maior do que uma correlação de 0,30, mas sim, nove vezes maior (0,30² = 0,09, ou 9%, e 0,90²= 0,81, ou 81%).

12.4 TRANSFORMAÇÃO “ Z” DO “ r”

Um pesquisador pode estar interessado em determinar a média de duas ou mais

correlações. É estatisticamente insuficiente tentar calcular a média dos coeficientes por eles mesmos, porque a distribuição de amostras dos coeficientes de correlação não é normal, pois quanto maior for a correlação mais desviada se torna a distribuição.

O método mais satisfatório de aproximação da normalidade de uma distribuição de

amostras de relações lineares é pela transformação dos r para valores Z (transformação Z de

Page 176: Domingues 2005 - Estatística Aplicada as Ciências Militares

176

Fisher). Tal procedimento envolve o uso de logaritmos naturais. Todavia, não necessitamos utilizar a fórmula de Fisher para calcular as transformações, basta utilizar a Tabela para transformação de r para z, localizando o valor Z correspondente para qualquer coeficiente de correlação em particular.

Suponha, por exemplo, que obtivemos correlações entre a distância percorrida e a

freqüência cardíaca durante a corrida do TAF (correr-caminhar por 12 minutos) em quatro grupos de sujeitos de diferentes de idades. Para combinarmos essas correlações de amostras a fim de se obter uma estimativa válida e confiável da relação entre essas duas variáveis, deve-se proceder conforme a Tab. 23.

Tabela 23 Cálculo da média dos coeficientes de correlação (transformação Z).

Grupo etário n r Z n – 3 Z com peso 18-25 33 0,700 0,867 30 26,010 26-33 35 0,835 1,204 32 38,528 34-40 34 0,770 1,020 31 31,620 41-47 35 0,735 0,929 32 29,728

�= 125 125,886

Passos da utilização dos valores Z para o cálculo da correlação média.

a. converter cada correlação para um valor Z utilizando a Tabela para transformação de r para z (ANEXO I);

b. contrapesar os valores Z multiplicando-os pelos graus de liberdade para cada amostra, que nesse processo é n – 3;

c. somar os valores contrapesados de Z; d. calcular a média do valor Z dividindo-se pela amostra total [�(n – 3)]: 125,886/125

= 1,007; e e. converter o valor médio do Z contrapesado a uma correlação média consultando-se

novamente a Tabela para transformação de r para z, Z = 1,007 o r médio é 0,765. A transformação Z é também utilizada para os testes estatísticos (tais como aqueles

para a significância do coeficiente de correlação) e para determinar a significância da diferença entre dois coeficientes de correlação. Alguns autores afirmam que para calcular a média das correlações pela transformação Z, deve-se primeiro estabelecer que não existem diferenças significativas entre as correlações testadas.

Uma comparação de diferenças poderia ser feita utilizando um teste qui-quadrado

para os valores de Z com contrapeso (o qui-quadrado é uma técnica não-paramétrica discutida no volume 2). 12.5 REGRESSÃO LINEAR

Um dos propósitos da correlação pode ser a previsão. Sempre que se deseja estudar

determinada variável dependente (sobre a qual deseja-se fazer uma estimativa) , em função de uma variável independente, utiliza-se uma equação de predição (regressão) baseada na correlação entre X e Y. Quanto mais alta for a relação entre as duas variáveis, mais precisamente poder-se-á prever Y a partir de X.

Page 177: Domingues 2005 - Estatística Aplicada as Ciências Militares

177

Geralmente utilizam-se as fórmulas abaixo descritas para o cálculo da linha de melhor ajustamento (reta de regressão)

Y= a+bX

Sendo: a = Xy – bXx b = r (Sy/Sx)

Onde: Y = variável dependente (critério) a = o ponto de intersecção b = a inclinação da linha de regressão X = variável independente (preditor) Xy e Sy = média e desvio padrão de y Xx e Sx= média e desvio padrão de x r = correlação entre X e Y

Quadro 6 – Fórmula da regressão linear

A letra a da fórmula de regressão indica a intersecção da linha de regressão no eixo y. Em outras palavras, a é o valor de Y quando X = 0. A inclinação da linha (b) significa a quantidade de mudança em Y que acompanha uma mudança de 1 unidade de X.

Utilizando os dados da Tab. 20, peso corporal (X) e força muscular (Y).onde a

correlação entre o peso corporal (X) e força muscular (Y) foi r = 0,98107. As médias e os desvios-padrão são os seguintes:

Sendo: Y= a+bX Medida Peso Força Onde: b = r (Sy/Sx)= 0,98107 . (19,361/9,522)

X 45,00 92,06 b = 1,995 S 9,522 19,361 a = Xy – bXx = 92,06 - 1,995 . 45,00 r 0,98107 0,98107 a = 2,285 Logo : Y = 2,285 + 1,995.X

Quadro 7 – Cálculo da equação de regressão linear

Para qualquer peso corporal (X), podemos calcular o escore de força muscular (Y) predito. Por exemplo, um sujeito pesando 100 Kg teria um escore Y (força predita):

Y = 2,285 + 1,995 . X = 2,285 + 1,995 . 100 Y = 201,785 Quando prevemos a força muscular a partir do peso corporal a correlação (r =

0,98107) é menor do que 1,00, ou seja a correlação não é perfeita. Deste modo é possível dizer que existe um erro na estimativa de Y a partir de X, o qual chamaremos de erro de predição. 12.6 LINHA DE MELHOR AJUSTAMENTO E ERRO DE PREDIÇÃO

A Fig. 26 mostra que a dispersão dos escores de peso e força não forma uma linha

reta, mas sim uma elipse. Conseqüentemente, devemos calcular uma linha de melhor ajustamento para prever Y a partir dos escores X. Para tal pode-se eleger um escore X alto (60Kg), e um baixo (30kg) e aplicamos a fórmula de predição. Para um peso corporal de 60kg, prediz-se Y = 2,285 + 1,995 . 60= 121,99. Para um peso corporal de 30Kg, predize-se Y= 2,285 + 1,995 . 30 = 62,14.

Page 178: Domingues 2005 - Estatística Aplicada as Ciências Militares

178

Deve-se então, plotar esses dois valores previstos no gráfico de dispersão e conectá-los

com uma linha reta. Essa linha passa pela intersecção das médias X e Y A Fig. 28 mostra essa linha de melhor ajustamento. Desta forma, pode-se notar que os escores não se situam na linha reta, mas em torno da mesma. Quanto mais próximo da perfeição estiver o nível de correlação entre as variáveis X e Y, mais próximos da linha de melhor ajustamento estarão os escores plotados.

CORRELAÇÃO ENTRE FORÇA MUSCULAR E PESO CORPORAL

0

20

40

60

80

100

120

0 20 40 60 80 100 120Kg

Kg

Figura 28 – Regressão linear da relação força muscular X peso corporal.

Na construção dessa linha de melhor ajustamento, selecionamos um alto peso corporal

(60) e um peso corporal baixo (30) e predizemos seus valores Y Quando examinamos seus valores Y reais, vemos que existe algum erro na predição. O escore de força previsto para o sujeito de 60kg foi de 121,99Kg, mas ele obteve apenas 120Kg, uma diferença de -1,99Kg. Ao mesmo tempo, esperava-se que o sujeito de 30Kg obtivesse 62,14Kg no dinamômetro, e na verdade ele obteve 58Kg, uma diferença de – 4,14Kg. Essas diferenças entre o escore Y previsto e o real representam erros de predição e são chamados de escores residuais. Se computássemos todos os escores residuais, a média seria zero e o desvio-padrão seria o erro de predição padrão, ou erro de estimativa padrão (Sy.x).

Uma forma mais simples de se obter o erro de predição padrão é utilizar a fórmula

Sy.x = Sy 1-r²

Sendo: Sy.x = erro de predição padrão Sy = desvio padrão de Y r = correlação entre X e Y

Quadro 24 – Fórmula do erro de predição padrão (Sy.x).

O erro de predição padrão é interpretado da mesma forma que o desvio-padrão. O

valor predito (força) de um sujeito, mais ou menos o erro de estimativa padrão, ocorrerá aproximadamente 68 vezes em 100.

X=45

X=92,1

a= (0; 2,285)

Page 179: Domingues 2005 - Estatística Aplicada as Ciências Militares

179

Para o exemplo utilizado até o presente momento, um sujeito de 50Kg teria uma força predita de Y = 2,285 + 1,995.50 = 102,04 Kg mais ou menos o erro de predição.

Sendo: Sy.x = Sy 1-r²

Onde:

Sy = 19,361 e r = 0,98107

Logo: Sy.x = 19,361 1 - 0,981072 Sy.x = 19,361 . .013759

Sy.x= 2,66

Quadro 8 – Cálculo de Sy.x para força muscular X peso corporal.

Ao medirmos a força muscular de um sujeito de 50Kg, provavelmente encontraremos

uma força muscular variando:

entre 99.38 Kg e 104,70 Kg (Y + Sy.x ) em 68,26% dos casos; entre 96,72 Kg e 107,36 Kg (Y + 2Sy.x ) em 95,44% dos casos; e entre 94,06 Kg e 110,02 Kg (Y + 3Sy.x ) em 99,74% dos casos.

Este intervalo é chamado de “ amplitude de predição” Quanto maior a correlação,

menor será o erro de predição. Além disso, quanto menor o desvio padrão do critério, menor será o erro.

12.7 CORRELAÇÃO PARCIAL

Quando existe pouca ou nenhuma correlação entre duas variáveis X e Y, que não seja

causada por sua dependência comum a uma terceira variável Z, a correlação entre X e Y é algumas vezes equivocada, e pode ser difícil de interpretar.

Por exemplo, em uma ampla faixa etária (18 a 47 anos), a correlação entre duas

variáveis como resultado no tiro prático de pistola dos sujeitos e seu posto/graduação será, quase certamente, positiva e provavelmente alta, em função do fator experiência no esporte (anos de prática) com o qual elas estão altamente correlacionadas.

Na verdade, a correlação pode diminuir muito se a variabilidade causada pelas

diferenças de experiência for eliminada, podendo-se controlar esse fator por meio de duas formas: selecionar apenas sujeitos da mesma idade, ou eliminar-se os efeitos da idade estatisticamente mantendo-a constante. O símbolo para a correlação parcial é r12,3 o qual significa a correlação entre as variáveis 1 e 2 com a variável 3 mantida constante

Lembremos novamente a correlação entre o resultado do tiro prático de pistola e o

posto/graduação do sujeito. Esse é um exemplo de correlação espúria, o que significa que a correlação entre as duas variáveis é devida à influência comum de uma outra variável (experiência no esporte). Quando o efeito da terceira variável (experiência) é removido, a correlação entre o resultado do tiro prático de pistola e o posto/graduação diminui ou desaparece completamente.

Chamaremos as três variáveis a seguir: 1 = resultado no tiro prático de pistola, 2 =

posto /graduação, e 3 = experiência (anos de prática). Logo, r12.3 é a correlação parcial entre as variáveis 1 e 2, com 3 sendo mantida constante. Podemos ajustar alguns coeficientes de correlação entre três variáveis: r12 = 0,765; r13 = 0,880; e r23 = 0,850.

Page 180: Domingues 2005 - Estatística Aplicada as Ciências Militares

180

r12 – r1.3 . r2.3 Sendo: r12.3 = 1 – r13² 1 – r23²

Logo: Onde: 0,765 – 0,880 . 0,850 r12 = 0,765 Correlação entre 1 e 2 r12.3 = 1 – 0,880² 1– 0,850²

r13 = 0,880 Correlação entre 1 e 3 0,765 – 0,748

r23 = 0,850 Correlação entre 2 e 3 r12.3 =

0,2256 0,2775 0,017

r12.3 = 0,47497 . 0,52678

r12.3 = 0,068

Quadro 9 – Fórmula e cálculo da correlação parcial.

Pode-se notar que a correlação entre o resultado do tiro prático de pistola e o

posto/graduação cai à cerca de zero quando a experiência do atirador é isolada. A correlação parcial é principalmente utilizada no desenvolvimento de equações de regressão múltipla com duas ou mais variáveis preditoras.

12.8 REGRESSÃO MÚLTIPLA

A regressão múltipla consiste em uma variável dependente (usualmente um critério de

algum tipo) e duas ou mais variáveis preditoras (variáveis independentes), tendo em vista que o uso de mais de uma variável preditora, usualmente aumenta a precisão da predição. Caso se desejasse predizer a capacidade de um atirador dever-se-ia analisar a correlação de várias habilidades inerentes ao tiro para se predizer a sua performance com o decorrer dos anos de prática, ou seja utilizando vários preditores ao invés de apenas um.

O coeficiente de correlação múltipla (R) indica a relação entre um critério e o

somatório dos pesos suas variáveis preditoras. Segue-se então que R2 representa a quantidade de variância do critério que é explicada pela associação/combinação dos preditores (mesmo conceito do coeficiente de determinação r2). Ao utilizarmos R, desejamos encontrar a combinação de variáveis que fornecerá a predição mais precisa do critério, portanto é importante saber o quanto cada um dos mecanismos de predição contribui para a variação total explicada, encontrando as variáveis que melhor reduzirão os erros de predição. Existem vários métodos de regressão múltipla. Neste manual abordaremos apenas as mais comumente utilizadas, a regressão múltipla progressiva, a regressão múltipla regressiva,o método do R2

máximo e o método de regressão gradativa O método de regressão múltipla progressiva consiste em adicionarmos,

progressivamente, uma nova variável preditora. A primeira variável selecionada deve ser aquela com a maior correlação com o critério. As variáveis selecionadas produzem cumulativamente a soma residual mínima de quadrados, significando que a soma residual de quadrados constitui erro. Algumas vezes o pesquisador irá determinar um nível de probabilidade para entrada, como 0,05 ou 0,01. Dessa forma, as variáveis são acrescentadas até que elas não possam mais aumentar de forma significativa a predição do critério. Sempre que duas variáveis possa estar medindo a mesma coisa, a inclusão de ambas não é melhor do que utilizar apenas uma.

Page 181: Domingues 2005 - Estatística Aplicada as Ciências Militares

181

Após o primeiro passo, a seleção de variáveis adicionais é determinada pelo efeito combinado, não apenas pelo efeito aditivo. Em outras palavras, o processo leva em consideração as inter-relações entre as variáveis X. Após cada variável X ser introduzida, o processo identifica qual das variáveis preditoras restantes explicará a maior quantidade de variação inexplicada. As variáveis devem ser introduzidas conforme a sua importância e o processo termina quando não existe mais uma contribuição significativa para a predição.

No método de regressão múltipla regressiva, as variáveis independentes são

eliminadas por sua falta de importância. Inicia-se com todas as variáveis independentes e exclui-se aquelas que não contribuem significativamente para a predição do critério. Determina-se um nível de probabilidade para entrada, como 0,05 ou 0,01, e as variáveis que não alcançam o nível de significância, são excluídas.

O R2 máximo é o método no qual o chamado melhor de todos os modelos possíveis de

urna única variável é selecionado, assim como o melhor modelo de duas variáveis, o melhor modelo de três variáveis e assim por diante, até um critério predeterminado que termina quando o cálculo é alcançado.

O método de regressão gradativa é um procedimento de regressão similar à seleção

progressiva exceto pelo fato de que a cada passo todas as variáveis independentes são avaliadas para se verificar se cada uma continua contribuindo para a predição. Se uma variável independente não contribui, ela é então excluída (removida) da combinação linear.

A equação de predição da regressão múltipla segue o modelo de regressão de duas

variáveis (Y = a + bX), diferindo apenas na existência de mais de uma variável X, conforme a equação:

Y = a+ b1X1+ b2X2+...+biXi A premissa básica em uma regressão múltipla é a mesma que na regressão linear

simples, ou seja, o tamanho da correlação entre as variáveis de estudo. Quanto maior a correlação, mais precisa será a predição. Todavia, uma limitação da predição relaciona-se com a generalização das constatações, pois as equações de regressão desenvolvidas por uma amostra, freqüentemente perdem em precisão quando aplicadas a outras amostras, o que chamamos de redução. O termo especificidade de população também se relaciona a esse fenômeno, pois ao buscarmos uma maior precisão por meio de procedimentos de seleção das variáveis preditoras (o que reforça as características específicas da amostra), tornamos mais difícil a generalização dos achados para outras populações.

Os resultados de uma fórmula de predição para adolescentes provavelmente perderiam

muita precisão se aplicada em adultos. Assim, o pesquisador deve selecionar cuidadosamente uma amostra em relação à população para a qual os resultados deverão ser generalizados.

Em estudos de previsão, quanto maior a amostra, mais provavelmente ela representará

a população da qual foi retirada. Um grande problema com pequenas amostras em estudos de regressão múltipla é que a correlação pode ser espuriamente alta. Existe uma relação direta entre a correlação, e a razão entre o número de sujeitos versus o número de variáveis. O grau no qual o valor esperado de R2 excederá zero quando é zero na população depende de dois fatores: o tamanho da amostra (n) e o número de variáveis (k). Ao selecionarmos o número de sujeitos de uma amostra devemos tomar o cuidado de observar a razão R2 = k – 1 / n – 1. Por fim, é recomendável manter-se uma razão de 10 sujeitos ou mais para cada variável.

Page 182: Domingues 2005 - Estatística Aplicada as Ciências Militares

182

Page 183: Domingues 2005 - Estatística Aplicada as Ciências Militares

183

Capítulo 13 Distribuições Amostrais

Os conceitos abordados a seguir formam uma ponte entre a Estatística Descritiva e a

Estatística Indutiva e sua compreensão é fundamental para o entendimento de como se constroem os métodos de análise estatística e interpretação dos dados.

Para tal, é preciso supor que as amostras tratadas são representativas das populações,

sendo obtidas por amostragem aleatória simples. Neste sentido, todos os seus n elementos fornecerão valores aleatórios da variável de interesse.

Ao retirarmos uma amostra aleatória de uma população, estaremos considerando cada

valor da amostra como um valor de uma variável aleatória cuja distribuição de probabilidade é a mesma da população (se a amostragem for com reposição, ou a população for infinita, todos os valores da amostra terão a mesma distribuição de probabilidade).

Em conseqüência da aleatoriedade dos valores da amostra, qualquer quantidade

calculada em função dos elementos da amostra também será uma variável aleatória, e a estes valores calculados denominaremos estatísticas.

Veremos a seguir algumas distribuições amostrais que terão grande utilização nos

capítulos seguintes. Para tal, a fim de diferenciarmos os símbolos relativos aos parâmetros populacionais dos símbolos relativos às medidas da amostra, adotaremos as seguintes notações:

� = média de uma população, ou seja, da distribuição de probabilidades da variável de interesse na população;

�2 = variância populacional; �X = média da distribuição amostral da estatística X; e �

2X = variância da distribuição amostral das médias (X).

13.1 DISTRIBUIÇÃO AMOSTRAL DE X

Dada uma população infinita (ou a amostragem feita com reposição), resulta que os

diversos valores da amostra podem ser considerados valores de variáveis aleatórias independentes, com a mesma distribuição de probabilidade da população.

Consideremos as seguintes propriedades da média: a. Multiplicando os valores de uma variável aleatória por uma constante, a média fica

multiplicada por essa constante, e b. A média de uma soma de variáveis aleatórias é igual à soma das médias dessas

variáveis.

Page 184: Domingues 2005 - Estatística Aplicada as Ciências Militares

184

Não é difícil imaginar que, retiradas infinitas amostras de diferentes tamanhos de uma população infinita, ou sendo a amostragem feita com reposição, a média em torno da qual devem variar os possíveis valores da estatística X é a própria média � da população. Ou seja, a média das médias das infinitas amostras será igual a média da população.

1 1 1 �X = n [ �(X1) + �(X2) + ... + �(Xn) ] = n [ � + � + ... + � ] = n n� = �

Consideremos agora as seguintes propriedades da variância: a. Multiplicando os valores de uma variável aleatória por uma constante, a variância

fica multiplicada pelo quadrado dessa constante; e b. A variância de uma soma de variáveis aleatórias independentes é igual à soma das

variâncias.

Desse modo:

1 �

2X = n [�2

(X1) + �2 (X2) + ... + �2

(Xn) ]

Ou seja:

1 1 �2

�2X =

n2 [�2 + �2 + ... + �2 ] =

n2 n �2 = n

Note que a variância com que se dispersam os possíveis valores da estatística X é n vezes menor que a variância da população de onde é retirada a amostra. Isso se deve à própria essência do processo aleatório, que faz com que haja, dentro da amostra, uma natural compensação entre valores mais elevados e valores mais baixos, produzindo valores de i que tendem a ser tanto mais próximos de �, quanto maior o tamanho da amostra n.

Para populações infinitas:

� �X =

n

Para populações finitas:

� N – n �X =

n .

N – 1

Onde: N = número de elementos da população e o fator Note que o fator tende à unidade quando o tamanho da população tende ao infinito. Se a distribuição da população for normal, a distribuição amostral das médias será

também normal para qualquer tamanho de amostra.

N – n N – 1 = fator de correção para população finita

2

Page 185: Domingues 2005 - Estatística Aplicada as Ciências Militares

185

Figura 29 - Distribuição amostral de X – população normal. Se a distribuição da população não for normal, mas a amostra for suficientemente

grande, a distribuição amostral das médias será aproximadamente normal, pois os valores resultarão da soma de um número grande de variáveis aleatórias independente (essa conclusão é extensível ao caso de amostragem sem reposição de populações finitas, porém razoavelmente grandes).

Figura 30 - Distribuição amostral de X – população não-normal e amostra suficientemente grande. 13.2 DISTRIBUIÇÕES AMOSTRAIS DE fi E fri

Consideremos a freqüência fi com que foi observada alguma característica na amostra,

dizemos que fi é uma estatística, pois é determinada em função dos elementos da amostra. Seja p a probabilidade de ocorrência de sucesso para cada elemento amostral, se a população é infinita ou a amostragem é feita com reposição, p é constante para todos os elementos da amostra, e os resultados observados para todos eles serão independentes.

Nessas condições, a distribuição amostral de freqüência será uma distribuição

binomial de parâmetros n e p em que:

� (fi) = n . p

�2(fi) = np(1 – p)

Pela aplicação das propriedades a. e c., a freqüência relativa fri, terá média e variância:

fi 1 1 � (fri) = � n = n �(fi) = n np = p

fi 1 1 p(1 – p) �

2(fri) = �2 n = n2 �2(fi) = n2 np(1 – p) = n

Distribuição amostral de X

Distribuição populacional

� �X =

n

X, X

Distribuição amostral de X

Distribuição populacional

� �X =

n

X, X

Page 186: Domingues 2005 - Estatística Aplicada as Ciências Militares

186

Quanto maior o valor de n, o limite da freqüência relativa tende a probabilidade real do evento ocorrer. Note que o tipo de distribuição de fri contínua sendo uma distribuição binomial, cujos possíveis valores foram comprimidos entre 0 e 1 com intervalos de 1/n, ao invés de variarem de 0 a n segundo os números naturais, o que ocorre na distribuição binomial propriamente dita.

Sendo a amostra suficientemente grande, podemos aproximar as distribuições de fi e fri por distribuições normais de mesma média e mesmo desvio-padrão Para efeito de aproximação, pode-se considerar que uma amostra é suficientemente grande se:

np > 5 e n(1 – p)> 5 13.3 DISTRIBUIÇÃO AMOSTRAL DE S2 — DISTRIBUIÇÕES �2

A distribuição amostral das variâncias S2(x) está relacionada às distribuições qui-

quadrado (�2), conforme segue:. Dado que

xi – � �2

v = � �

= � Zi2

Onde:

xi = valores aleatórios independentemente retirados de uma população normal � = média populacional; � = desvio-padrão populacional com distribuição �2 com v graus de liberdade; e Zi = valores da variável normal reduzida. Substituindo � por X a estatística S2(x) tem distribuição �2 com n – 1 graus de

liberdade.

� xi – X �2

n-1 = �

2 = � Zi

2

Note que, a exceção de uma constante, a variância de uma amostra extraída de população normal, distribui-se conforme uma distribuição �2 com n – 1 graus de liberdade com média:

�2 �

2 � (S2) = n – 1

�( �2n-1 ) =

n – 1 (n – 1) = �2

E variância:

�4 �

4 2�4 �

2 (S2) = (n – 1)2

�2 ( �2

n-1 ) = (n – 1)2

2(n – 1) = n – 1

i=1

v 2

i=1

v

2

i=1

v i=1

v

Page 187: Domingues 2005 - Estatística Aplicada as Ciências Militares

187

13.5 DISTRIBUIÇÕES t DE STUDENT Suponhamos que, a partir de uma amostra de n valores retirados de uma população

normal de média � e desvio-padrão �, fosse definida a estatística

X – � Z = � / n

Como dito na seção 13.1, a distribuição amostral das médias é normal, com média � e desvio-padrão � / n, .

No entanto, quando não se dispõe do parâmetro populacional �, uma solução é a

substituição de � por S, no entanto, ao utilizarmos o desvio-padrão da amostra, obteremos uma estatística cuja distribuição não mais é normal. De fato, conforme mostrou Student, a estatística t distribui-se simetricamente, com média 0, porém não normalmente.

X – � t = S(x) / n

Quanto maior o n da amostra, mais próximo do parâmetro � deve estar a estatística S(x). Logo, as correspondentes distribuições t aproximam-se da normal reduzida com n – 1 graus de liberdade.

A Fig. 31 procura ilustrar comparativamente uma distribuição t e a distribuição normal

reduzida z. Vemos que uma distribuição t genérica é mais alongada que a normal reduzida.

Figura 31 - Distribuição t e distribuição normal reduzida

A Tabela t (ANEXO F) fornece valores de t em função dos diversos graus de

liberdade v e de probabilidades notáveis, correspondentes à cauda à direita da respectiva distribuição.

EXEMPLO 13.5.1: Entrando na Tabela t com a probabilidade p = 0,025 e v = 50, lemos o valor t50 = 2,009. Isso significa, dada a simetria das distribuições t, que:

P(t50 > 2,009) = P(t50 < – 2,009) = 0,025.

0

Z t

Z,t

Page 188: Domingues 2005 - Estatística Aplicada as Ciências Militares

188

Note-se que:

t50 = 2,009 = t� = 1,960.

E que:

t� = Z = 1,960.

13.6 DISTRIBUIÇÕES F DE SNEDECOR

Suponhamos que duas amostras independentes retiradas de populações normais

forneçam variâncias amostrais S1 e S2, e que desejamos conhecer a distribuição amostral do quociente S1/S2 Isso será possível através do conhecimento das distribuições F de Snedecor.

Define-se a variável F com v1 graus de liberdade no numerador e v2 graus de liberdade

no denominador, ou, simplesmente, Fv1;v2 por:

�2 v1 / v1 Fv1;v2=

�2 v2 / v2

Evidentemente, a definição geral precedente engloba uma família de distribuições de

probabilidade para cada par de valores (v1 , v2). A Tabela F (ANEXO G) apresenta os valores da variável F que determinam caudas à direita com probabilidades 0,1; 0,05; 0,25; 0,005 e 0,001, fornecidos para diversos pares de valores de v1 e v2.

EXEMPLO 13.5.1: Se entrarmos na Tabela F (para � = 5%) com v1 = 5 e v2 = 20,

encontraremos o valor Fcrit = 2,71. Isso quer dizer que, na distribuição F com 5 graus de liberdade no numerador e 20 graus de liberdade no denominador, a probabilidade de se obter um valor aleatório superior a 2,71 é igual a 5%, conforme esquematizado na Fig. 32.

Figura 32 - Distribuição F de Snedecor

Imaginemos agora que de duas populações normais com mesma variância (ou, o que seria equivalente, de uma mesma população normal), sejam extraídas duas amostras independentes com n1 e n2 elementos, e tomemos o quociente S1/S2 das variâncias dessas amostras. A distribuição amostral desse quociente será uma distribuição Fn1 – 1, n2 – 1 , pois:

S21 [�2 / (n1 – 1) ]�2

n1 - 1 �2n1 - 1 / (n1 – 1)

S22

= [�2 / (n2 – 1) ]�2n2 - 1

= �2

n2 - 1 / (n2 – 1) = Fn1 – 1, n2 – 1

~

f (F)

5%

F5,20

RC RA

2,71

Page 189: Domingues 2005 - Estatística Aplicada as Ciências Militares

189

ANEXOS

Page 190: Domingues 2005 - Estatística Aplicada as Ciências Militares

190

ANEXO A – ESTATÍSTICA DESCRITIVA

Os quadros abaixo indicam os tipos de técnicas estatísticas que podem ser aplicadas para a descrição geral de conjuntos de dados.

DISTRIBUIÇÃO NORMAL - ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de

Amostras Escala

Numérica Análises Aplicáveis Gráficos Aplicáveis

Uma ou Mais

Ordinal, Intervalar ou

Razão

Média, Moda, Desvio Padrão, Coeficiente de Variação, Intervalo de Confiança, Mínimo, Primeiro Quartil, Mediana,

Terceiro Quartil, Máximo, Série Temporal*.

Histograma, Box & Whiskers, Gráfico de Séries, Ogiva (Função

de Distribuição).

* Quando uma das variáveis registradas for o tempo.

DISTRIBUIÇÃO NÃO-NORMAL - ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de

Amostras Escala

Numérica Análises Aplicáveis Gráficos Aplicáveis

Uma ou Mais

Ordinal, Intervalar ou

Razão

Média, Moda, Desvio Padrão, Coeficiente de Variação, Intervalo de Confiança, Mínimo, Primeiro Quartil, Mediana, Terceiro Quartil, Máximo,

Série Temporal*.

Histograma, Box & Whiskers, Gráfico de

Séries, Ogiva (Função de Distribuição).

Uma ou Mais Nominal Freqüências, Série Temporal*. Pictograma, Gráfico de

Séries. * Quando uma das variáveis registradas for o tempo.

Page 191: Domingues 2005 - Estatística Aplicada as Ciências Militares

191

ANEXO B – COMPARAÇÕES ENTRE AMOSTRAS Os quadros abaixo indicam as técnicas estatísticas que podem ser aplicadas para a

comparação entre os parâmetros de dois ou mais grupos de dados.

DISTRIBUIÇÃO NORMAL - ESTATÍSTICA INFERENCIAL Tipo de Relação N° de Amostras Tipo de Escala Análises Aplicáveis

Duas Amostras Intervalar ou Razão Teste t de Student Pareado Pareadas Três ou Mais

Amostras Intervalar ou Razão ANOVA c/ Medidas Repetidas

Duas Amostras Intervalar ou Razão Teste t de Student Não-Pareadas Três ou Mais

Amostras Intervalar ou Razão ANOVA c/ Grupos Independentes

* Variável com apenas dois valores ou duas categorias (variável binária).

DISTRIBUIÇÃO NÃO-PARAMÉTRICA - ESTATÍSTICA INFERENCIAL Tipo de Relação N° de Amostras Tipo de Escala Análises Aplicáveis

Duas Amostras Ordinal, Intervalar ou Razão

Teste de Friedman, Sign-Test, Wilcoxon Matched-Pairs Test

Duas Amostras Nominal Dicotômica* Teste de McNemar

Três ou Mais Amostras

Ordinal, Intervalar ou Razão ANOVA de Friedman

Pareadas

Três ou Mais Amostras Nominal Teste Q de Cochran

Duas Amostras Ordinal, Intervalar ou Razão

Teste Mann-Whitney U, Wald-Wolfowitz Runs Test,

Kolmogorov-Smirnov Two-Sample Test

Duas Amostras Nominal Teste de Qui-Quadrado (Homogeneidade)

Três ou Mais Amostras

Ordinal, Intervalar ou Razão ANOVA de Kruskal-Wallis

Não-Pareadas

Três ou Mais Amostras Nominal Teste de Qui-Quadrado

* Variável com apenas dois valores ou duas categorias (variável binária).

Page 192: Domingues 2005 - Estatística Aplicada as Ciências Militares

192

ANEXO C – RELAÇÃO ENTRE VARIÁVEIS

Os quadros abaixo indicam as técnicas analíticas e os procedimentos gráficos aplicáveis quando para verificar a existência e/ou caracterizar as relações entre duas ou mais variáveis.

DISTRIBUIÇÃO NORMAL - ESTATÍSTICA DESCRITIVA E GRÁFICOS

N° de Variáveis Tipo de Escala Análises Aplicáveis Gráficos

Aplicáveis

Duas Intervalar e/ou Razão Correlação de Pearson,

Regressão Linear Simples.

Diagrama de Dispersão (X,Y).

Três ou Mais Intervalar e/ou Razão Regressão Múltipla

Diagrama Previsão vs. Observação

Três ou Mais Intervalar e/ou Razão

Regressão Linear Múltipla, Regressão

Não-Linear ---

Três ou Mais

Nominal Dicotômica* (Variável-Resposta) e/ou Nominal e/ou

Ordinal e/ou Intervalar e/ou Razão Regressão Logística ---

* Variável com apenas dois valores ou duas categorias (variável binária).

DISTRIBUIÇÃO NÃO-NORMAL - ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de

Variáveis Tipo de Escala Análises Aplicáveis Gráficos Aplicáveis

Duas Ordinal e/ou Intervalar e/ou Razão Correlação de Spearman.

Diagrama de Dispersão (X,Y).

Duas Nominal Teste de Qui-Quadrado. --- Três ou

Mais Ordinal e/ou Intervalar e/ou Razão Correlação Partial Rank de Kendall

Diagrama de Dispersão (X,Y).

Três ou Mais Nominal Análise Discriminante ---

Três ou Mais Intervalar e/ou Razão

Regressão Linear Múltipla, Regressão

Não-Linear ---

Três ou Mais

Nominal Dicotômica* (Variável-Resposta) e/ou Nominal e/ou

Ordinal e/ou Intervalar e/ou Razão Regressão Logística ---

* Variável com apenas dois valores ou duas categorias (variável binária).

Page 193: Domingues 2005 - Estatística Aplicada as Ciências Militares

193

ANEXO D – TABELA DE NÚMEROS ALEATÓRIOS

57720039848441796771402113975649865408932968745483 28805351590993988758702771771706320278621674696517 92591852873048869748352518887403629838586586424103 90381291743019758907506415597188137495305278301175 80911694675860820666904756184645111235324550411343 22017031329691927540165429727499009597610098243007 56241004302046299053531105844121647919762951626066 79449262029686643000945669302059878735442250977819 53996645088978507753372577412762380223576201416035 18928735885505213651392850146685793019797266643145 53085896630561257022504128966266436306630132798522 03588029287689511824888946474859192987031033996712 27078188656949980028047051300147189733218582454324 05210859010622249891811755446616077307661012317858 40361327843082333639694205586461123389278952667193 54602528858820001059610536613372010119016110512091 71516340767111737352373160458892734371280498090248 61020181739260667358533442682638340327449604466593 82559313463095265506961765917239799612495280632699 89985414217413576819862860894733152628774538480808 00998484146795137758901450794273633106604340125504 62415078204805884352980319939203049725849595036331 94279069246809921186076383193299511555710927026700 44892928843628251582877418972576106326760226745328 97307695332110542695666552049936584803089363581796 39165804448015595983909554668184396085388866333569 60781103266750340961313020769366308351093383647605 03192347628957779133884760593754394877674985384391 41285267562539599665513690322239330522990339979699 77549850392537425297100356049281668670014889558210 28634161916424838137344883279638716973067750256460 74244885401233596750149814264279791352896978804471 00240337964668750532421663332897263647277365383446 05414769694536167118955197220413239658600369487983 62698497974723665156130869115275592686818043009892

Page 194: Domingues 2005 - Estatística Aplicada as Ciências Militares

194

ANEXO E – ÁREA SUBTENDIDA PELA CURVA NORMAL – TABELA Z

z 0 1 2 3 4 5 6 7 8 9 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0398 0438 0478 0517 0557 0596 0636 0675 0714 0754 0,2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141 0,3 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517 0,4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879 0,5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224 0.6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549 0,7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852 0,8 2881 2910 2939 2867 2996 3023 3051 3078 3106 3133 9,0 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389 1,0 3413 3438 3461 3485 3508 3531 3554 3577 3599 3621 1,1 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830 1,2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015 1,3 4032 4049, 4066 4082 4099 4115 4131 4147 4162 4177 1,4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319 1,5 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441 1,6 4452 4463 4474 4484 4496 4505 4515 4525 4535 4545 1,7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4633 1,8 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706 1,9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767 2,0 4772 4778 4783 4788 4793 4798 4803 4808 4812 4817 2,1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857 2,2 4861 4864 4868 4871 4875 4878 4881 4884 4887 4890 2,3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916 2,4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936 2,5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952 2,6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964 2,7 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974 2,8 4974 4975 4976 4977 4977 4978 4979 4979 4980 4981 2,9 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986 3,0 4987 4987 4987 4988 4988 4989 4989 4989 4990 4990 3,1 4990 4991 4991 4991 4992 4992 4992 4992 4993 4993 3,2 4993 4993 4994 4994 4994 4994 4994 4995 4995 4995 3,3 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997 3,4 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998 3,5 4998 4998 4998 4998 4998 4998 4998 4998 4998 4998 3,6 4998 4998 4999 4999 4999 4999 4999 4999 4999 4999 3,7 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999 3,8 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

Page 195: Domingues 2005 - Estatística Aplicada as Ciências Militares

195

ANEXO F – TABELA PARA O TESTE t

� v

0,200 t0.800

0,150 t0.850

0,100 t0.900

0,050 t0.950

0,025 t0.975

0,020 t0.980

0,015 t0.985

0,010 t0.990

0,005 t0.995

1 1,37638 1,96261 3,07768 6,31375 12,70615 15,89447 21,20505 31,82096 63,65590 2 1,06066 1,38621 1,88562 2,91999 4,30266 4,84873 5,64280 6,96455 9,92499 3 0,97847 1,24978 1,63775 2,35336 3,18245 3,48191 3,89606 4,54071 5,84085 4 0,94096 1,18957 1,53321 2,13185 2,77645 2,99853 3,29763 3,74694 4,60408 5 0,91954 1,15577 1,47588 2,01505 2,57058 2,75651 3,00288 3,36493 4,03212 6 0,90570 1,13416 1,43976 1,94318 2,44691 2,61224 2,82893 3,14267 3,70743 7 0,89603 1,11916 1,41492 1,89458 2,36462 2,51675 2,71457 2,99795 3,49948 8 0,88889 1,10815 1,39682 1,85955 2,30601 2,44899 2,63381 2,89647 3,35538 9 0,88340 1,09972 1,38303 1,83311 2,26216 2,39844 2,57381 2,82143 3,24984

10 0,87|906 1,09306 1,37218 1,81246 2,22814 2,35931 2,52749 2,76377 3,16926 11 0,87553 1,08767 1,36343 1,79588 2,20099 2,32814 2,49067 2,71808 3,10582 12 0,87261 1,08321 1,35622 1,78229 2,17881 2,30272 2,46070 2,68099 3,05454 13 0,87015 1,07947 1,35017 1,77093 2,16037 2,28160 2,43585 2,65030 3,01228 14 0,86805 1,07628 1,34503 1,76131 2,14479 2,26378 2,41490 2,62449 2,97685 15 0,86624 1,07353 1,34061 1,75305 2,13145 2,24854 2,39701 2,60248 2,94673 16 0,86467 1,07114 1,33676 1,74588 2,11990 2,23536 2,38155 2,58349 2,92079 17 0,86328 1,06903 1,33338 1,73961 2,10982 2,22384 2,36805 2,56694 2,89823 18 0,86205 1,06717 1,33039 1,73406 2,10092 2,21370 2,35618 2,55238 2,87844 19 0,86095 1,06551 1,32773 1,72913 2,09302 2,20470 2,34565 2,53948 2,86094 20 0,85996 1,06402 1,32534 1,72472 2,08596 2,19666 2,33625 2,52798 2,84534 21 0,85907 1,06267 1,32319 1,72074 2,07961 2,18943 2,32779 2,51765 2,83137 22 0,85827 1,06145 1,32124 1,71714 2,07388 2,18289 2,32016 2,50832 2,81876 23 0,85753 1,06034 1,31946 1,71387 2,06865 2,17696 2,31323 2,49987 2,80734 24 0,85686 1,05932 1,31784 1,71088 2,06390 2,17155 2,30692 2,49216 2,79695 25 0,85624 1,05838 1,31635 1,70814 2,05954 2,16659 2,30113 2,48510 2,78744 26 0,85567 1,05752 1,31497 1,70562 2,05553 2,16203 2,29581 2,47863 2,77872 27 0,85514 1,05673 1,31370 1,70329 2,05183 2,15782 2,29092 2,47266 2,77068 28 0,85465 1,05599 1,31253 1,70113 2,04841 2,15394 2,28638 2,46714 2,76326 29 0,85419 1,05530 1,31143 1,69913 2,04523 2,15033 2,28218 2,46202 2,75639 30 0,85377 1,05466 1,31042 1,69726 2,04227 2,14697 2,27827 2,45726 2,74998 35 0,85201 1,05202 1,30621 1,68957 2,03011 2,13316 2,26219 2,43772 2,72381 40 0,85070 1,05005 1,30308 1,68385 2,02107 2,12291 2,25027 2,42326 2,70446 45 0,84968 1,04852 1,30065 1,67943 2,01410 2,11500 2,24109 2,41212 2,68959 50 0,84887 1,04729 1,29871 1,67591 2,00856 2,10872 2,23378 2,40327 2,67779 60 0,84765 1,04547 1,29582 1,67065 2,00030 2,09936 2,22292 2,39012 2,66027 70 0,84679 1,04417 1,29376 1,66692 1,99444 2,09273 2,21523 2,38080 2,64790 80 0,84614 1,04319 1,29222 1,66413 1,99007 2,08778 2,20949 2,37387 2,63870 90 0,84563 1,04244 1,29103 1,66196 1,98667 2,08394 2,20504 2,36850 2,63157

100 0,84523 1,04184 1,29008 1,66023 1,98397 2,08088 2,20150 2,36421 2,62589 110 0,84490 1,04134 1,28930 1,65882 1,98177 2,07839 2,19860 2,36072 2,62127 120 0,84463 1,04093 1,28865 1,65765 1,97993 2,07631 2,19620 2,35783 2,61742 140 0,84420 1,04029 1,28763 1,65581 1,97706 2,07306 2,19244 2,35328 2,61140 160 0,84387 1,03980 1,28686 1,65443 1,97490 2,07063 2,18962 2,34988 2,60690 180 0,84362 1,03943 1,28627 1,65336 1,97323 2,06874 2,18743 2,34724 2,60341 200 0,84342 1,03913 1,28580 1,65251 1,97189 2,06723 2,18569 2,34513 2,60063

0,84198 1,03697 1,28240 1,64638 1,96234 2,05643 2,17319 2,33008 2,58075

Page 196: Domingues 2005 - Estatística Aplicada as Ciências Militares

196

ANEXO G – TABELA PARA TESTE F: DE [1,12] A [1,5] 1 2 3 4 5 6 7 8 9 10 11 12

1 0.100 39.864 49.500 53.593 55.833 57.240 58.204 58.906 59.439 59.857 60.195 60.473 60.705 1 0.050 161.446 199.499 215.707 224.583 230.160 233.988 236.767 238.884 240.543 241.882 242.981 243.905 1 0.025 647.793 799.482 864.151 899.599 921.835 937.114 948.203 956.643 963.279 968.634 973.028 976.725 1 0.010 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 1 0.005 16212 19997 21614 22501 23056 23440 23715 23924 24091 24222 24334 24427 1 0.001 405312 499725 540257 562668 576496 586033 593185 597954 602245 605583 608444 610352

2 0.100 8.526 9.000 9.162 9.243 9.293 9.326 9.349 9.367 9.381 9.392 9.401 9.408 2 0.050 18.513 19.000 19.164 19.247 19.296 19.329 19.353 19.371 19.385 19.396 19.405 19.412 2 0.025 38.506 39.000 39.166 39.248 39.298 39.331 39.356 39.373 39.387 39.398 39.407 39.415 2 0.010 98.502 99.000 99.164 99.251 99.302 99.331 99.357 99.375 99.390 99.397 99.408 99.419 2 0.005 198.503 199.012 199.158 199.245 199.303 199.332 199.361 199.376 199.390 199.390 199.419 199.419 2 0.001 998.378 998.843 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309

3 0.100 5.538 5.462 5.391 5.343 5.309 5.285 5.266 5.252 5.240 5.230 5.222 5.216 3 0.050 10.128 9.552 9.277 9.117 9.013 8.941 8.887 8.845 8.812 8.785 8.763 8.745 3 0.025 17.443 16.044 15.439 15.101 14.885 14.735 14.624 14.540 14.473 14.419 14.374 14.337 3 0.010 34.116 30.816 29.457 28.710 28.237 27.911 27.671 27.489 27.345 27.228 27.132 27.052 3 0.005 55.552 49.800 47.468 46.195 45.391 44.838 44.434 44.125 43.881 43.685 43.525 43.387 3 0.001 167.056 148.488 141.095 137.079 134.576 132.830 131.608 130.618 129.861 129.221 128.755 128.319

4 0.100 4.545 4.325 4.191 4.107 4.051 4.010 3.979 3.955 3.936 3.920 3.907 3.896 4 0.050 7.709 6.944 6.591 6.388 6.256 6.163 6.094 6.041 5.999 5.964 5.936 5.912 4 0.025 12.218 10.649 9.979 9.604 9.364 9.197 9.074 8.980 8.905 8.844 8.794 8.751 4 0.010 21.198 18.000 16.694 15.977 15.522 15.207 14.976 14.799 14.659 14.546 14.452 14.374 4 0.005 31.332 26.284 24.260 23.154 22.456 21.975 21.622 21.352 21.138 20.967 20.824 20.705 4 0.001 74.127 61.249 56.170 53.435 51.718 50.524 49.651 48.996 48.472 48.050 47.701 47.410

5 0.100 4.060 3.780 3.619 3.520 3.453 3.405 3.368 3.339 3.316 3.297 3.282 3.268 5 0.050 6.608 5.786 5.409 5.192 5.050 4.950 4.876 4.818 4.772 4.735 4.704 4.678 5 0.025 10.007 8.434 7.764 7.388 7.146 6.978 6.853 6.757 6.681 6.619 6.568 6.525 5 0.010 16.258 13.274 12.060 11.392 10.967 10.672 10.456 10.289 10.158 10.051 9.963 9.888 5 0.005 22.785 18.314 16.530 15.556 14.939 14.513 14.200 13.961 13.772 13.618 13.491 13.385 5 0.001 47.177 37.122 33.200 31.083 29.751 28.835 28.165 27.649 27.241 26.914 26.645 26.419

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 197: Domingues 2005 - Estatística Aplicada as Ciências Militares

197

Continuação do ANEXO G – TABELA PARA TESTE F: DE [1,12] A [6,10] 1 2 3 4 5 6 7 8 9 10 11 12

6 0.100 3.776 3.463 3.289 3.181 3.108 3.055 3.014 2.983 2.958 2.937 2.920 2.905 6 0.050 5.987 5.143 4.757 4.534 4.387 4.284 4.207 4.147 4.099 4.060 4.027 4.000 6 0.025 8.813 7.260 6.599 6.227 5.988 5.820 5.695 5.600 5.523 5.461 5.410 5.366 6 0.010 13.745 10.925 9.780 9.148 8.746 8.466 8.260 8.102 7.976 7.874 7.790 7.718 6 0.005 18.635 14.544 12.917 12.028 11.464 11.073 10.786 10.566 10.391 10.250 10.133 10.034 6 0.001 35.507 27.001 23.705 21.922 20.802 20.031 19.463 19.030 18.688 18.412 18.183 17.990

7 0.100 3.589 3.257 3.074 2.961 2.883 2.827 2.785 2.752 2.725 2.703 2.684 2.668 7 0.050 5.591 4.737 4.347 4.120 3.972 3.866 3.787 3.726 3.677 3.637 3.603 3.575 7 0.025 8.073 6.542 5.890 5.523 5.285 5.119 4.995 4.899 4.823 4.761 4.709 4.666 7 0.010 12.246 9.547 8.451 7.847 7.460 7.191 6.993 6.840 6.719 6.620 6.538 6.469 7 0.005 16.235 12.404 10.883 10.050 9.522 9.155 8.885 8.678 8.514 8.380 8.270 8.176 7 0.001 29.246 21.690 18.772 17.197 16.207 15.520 15.018 14.634 14.330 14.083 13.879 13.708

8 0.100 3.458 3.113 2.924 2.806 2.726 2.668 2.624 2.589 2.561 2.538 2.519 2.502 8 0.050 5.318 4.459 4.066 3.838 3.688 3.581 3.500 3.438 3.388 3.347 3.313 3.284 8 0.025 7.571 6.059 5.416 5.053 4.817 4.652 4.529 4.433 4.357 4.295 4.243 4.200 8 0.010 11.259 8.649 7.591 7.006 6.632 6.371 6.178 6.029 5.911 5.814 5.734 5.667 8 0.005 14.688 11.043 9.597 8.805 8.302 7.952 7.694 7.496 7.339 7.211 7.105 7.015 8 0.001 25.415 18.494 15.829 14.392 13.484 12.858 12.398 12.045 11.767 11.540 11.352 11.194

9 0.100 3.360 3.006 2.813 2.693 2.611 2.551 2.505 2.469 2.440 2.416 2.396 2.379 9 0.050 5.117 4.256 3.863 3.633 3.482 3.374 3.293 3.230 3.179 3.137 3.102 3.073 9 0.025 7.209 5.715 5.078 4.718 4.484 4.320 4.197 4.102 4.026 3.964 3.912 3.868 9 0.010 10.562 8.022 6.992 6.422 6.057 5.802 5.613 5.467 5.351 5.257 5.178 5.111 9 0.005 13.614 10.107 8.717 7.956 7.471 7.134 6.885 6.693 6.541 6.417 6.314 6.227 9 0.001 22.857 16.387 13.901 12.560 11.714 11.129 10.697 10.368 10.106 9.894 9.719 9.570

10 0.100 3.285 2.924 2.728 2.605 2.522 2.461 2.414 2.377 2.347 2.323 2.302 2.284 10 0.050 4.965 4.103 3.708 3.478 3.326 3.217 3.135 3.072 3.020 2.978 2.943 2.913 10 0.025 6.937 5.456 4.826 4.468 4.236 4.072 3.950 3.855 3.779 3.717 3.665 3.621 10 0.010 10.044 7.559 6.552 5.994 5.636 5.386 5.200 5.057 4.942 4.849 4.772 4.706 10 0.005 12.827 9.427 8.081 7.343 6.872 6.545 6.303 6.116 5.968 5.847 5.746 5.661 10 0.001 21.038 14.905 12.553 11.283 10.481 9.926 9.517 9.204 8.956 8.754 8.587 8.446

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981

Page 198: Domingues 2005 - Estatística Aplicada as Ciências Militares

198

Continuação do ANEXO G – TABELA PARA TESTE F: DE [1,12] A [11,15]

1 2 3 4 5 6 7 8 9 10 11 12

11 0.100 3.225 2.860 2.660 2.536 2.451 2.389 2.342 2.304 2.274 2.248 2.227 2.209 11 0.050 4.844 3.982 3.587 3.357 3.204 3.095 3.012 2.948 2.896 2.854 2.818 2.788 11 0.025 6.724 5.256 4.630 4.275 4.044 3.881 3.759 3.664 3.588 3.526 3.474 3.430 11 0.010 9.646 7.206 6.217 5.668 5.316 5.069 4.886 4.744 4.632 4.539 4.462 4.397 11 0.005 12.226 8.912 7.600 6.881 6.422 6.102 5.865 5.682 5.537 5.418 5.320 5.236 11 0.001 19.687 13.812 11.561 10.346 9.579 9.047 8.655 8.355 8.116 7.923 7.762 7.625

12 0.100 3.177 2.807 2.606 2.480 2.394 2.331 2.283 2.245 2.214 2.188 2.166 2.147 12 0.050 4.747 3.885 3.490 3.259 3.106 2.996 2.913 2.849 2.796 2.753 2.717 2.687 12 0.025 6.554 5.096 4.474 4.121 3.891 3.728 3.607 3.512 3.436 3.374 3.321 3.277 12 0.010 9.330 6.927 5.953 5.412 5.064 4.821 4.640 4.499 4.388 4.296 4.220 4.155 12 0.005 11.754 8.510 7.226 6.521 6.071 5.757 5.524 5.345 5.202 5.085 4.988 4.906 12 0.001 18.645 12.973 10.805 9.633 8.892 8.378 8.001 7.711 7.480 7.292 7.136 7.005

13 0.100 3.136 2.763 2.560 2.434 2.347 2.283 2.234 2.195 2.164 2.138 2.116 2.097 13 0.050 4.667 3.806 3.411 3.179 3.025 2.915 2.832 2.767 2.714 2.671 2.635 2.604 13 0.025 6.414 4.965 4.347 3.996 3.767 3.604 3.483 3.388 3.312 3.250 3.197 3.153 13 0.010 9.074 6.701 5.739 5.205 4.862 4.620 4.441 4.302 4.191 4.100 4.025 3.960 13 0.005 11.374 8.186 6.926 6.233 5.791 5.482 5.253 5.076 4.935 4.820 4.724 4.643 13 0.001 17.815 12.313 10.209 9.073 8.355 7.856 7.489 7.206 6.982 6.799 6.647 6.519

14 0.100 3.102 2.726 2.522 2.395 2.307 2.243 2.193 2.154 2.122 2.095 2.073 2.054 14 0.050 4.600 3.739 3.344 3.112 2.958 2.848 2.764 2.699 2.646 2.602 2.565 2.534 14 0.025 6.298 4.857 4.242 3.892 3.663 3.501 3.380 3.285 3.209 3.147 3.095 3.050 14 0.010 8.862 6.515 5.564 5.035 4.695 4.456 4.278 4.140 4.030 3.939 3.864 3.800 14 0.005 11.060 7.922 6.680 5.998 5.562 5.257 5.031 4.857 4.717 4.603 4.508 4.428 14 0.001 17.142 11.779 9.730 8.622 7.922 7.436 7.078 6.802 6.583 6.404 6.256 6.130

15 0.100 3.073 2.695 2.490 2.361 2.273 2.208 2.158 2.119 2.086 2.059 2.037 2.017 15 0.050 4.543 3.682 3.287 3.056 2.901 2.790 2.707 2.641 2.588 2.544 2.507 2.475 15 0.025 6.200 4.765 4.153 3.804 3.576 3.415 3.293 3.199 3.123 3.060 3.008 2.963 15 0.010 8.683 6.359 5.417 4.893 4.556 4.318 4.142 4.004 3.895 3.805 3.730 3.666 15 0.005 10.798 7.701 6.476 5.803 5.372 5.071 4.847 4.674 4.536 4.424 4.329 4.250 15 0.001 16.587 11.340 9.335 8.253 7.567 7.091 6.741 6.471 6.256 6.081 5.935 5.812

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 199: Domingues 2005 - Estatística Aplicada as Ciências Militares

199

Continuação do ANEXO G – TABELA PARA TESTE F: DE [1,12] A [16,20]

1 2 3 4 5 6 7 8 9 10 11 12

16 0.100 3.048 2.668 2.462 2.333 2.244 2.178 2.128 2.088 2.055 2.028 2.005 1.985 16 0.050 4.494 3.634 3.239 3.007 2.852 2.741 2.657 2.591 2.538 2.494 2.456 2.425 16 0.025 6.115 4.687 4.077 3.729 3.502 3.341 3.219 3.125 3.049 2.986 2.934 2.889 16 0.010 8.531 6.226 5.292 4.773 4.437 4.202 4.026 3.890 3.780 3.691 3.616 3.553 16 0.005 10.576 7.514 6.303 5.638 5.212 4.913 4.692 4.521 4.384 4.272 4.179 4.099 16 0.001 16.120 10.970 9.006 7.944 7.272 6.805 6.460 6.195 5.984 5.812 5.668 5.547

17 0.100 3.026 2.645 2.437 2.308 2.218 2.152 2.102 2.061 2.028 2.001 1.978 1.958 17 0.050 4.451 3.592 3.197 2.965 2.810 2.699 2.614 2.548 2.494 2.450 2.413 2.381 17 0.025 6.042 4.619 4.011 3.665 3.438 3.277 3.156 3.061 2.985 2.922 2.870 2.825 17 0.010 8.400 6.112 5.185 4.669 4.336 4.101 3.927 3.791 3.682 3.593 3.518 3.455 17 0.005 10.384 7.354 6.156 5.497 5.075 4.779 4.559 4.389 4.254 4.142 4.050 3.971 17 0.001 15.722 10.658 8.727 7.683 7.022 6.562 6.224 5.962 5.754 5.584 5.443 5.324

18 0.100 3.007 2.624 2.416 2.286 2.196 2.130 2.079 2.038 2.005 1.977 1.954 1.933 18 0.050 4.414 3.555 3.160 2.928 2.773 2.661 2.577 2.510 2.456 2.412 2.374 2.342 18 0.025 5.978 4.560 3.954 3.608 3.382 3.221 3.100 3.005 2.929 2.866 2.814 2.769 18 0.010 8.285 6.013 5.092 4.579 4.248 4.015 3.841 3.705 3.597 3.508 3.434 3.371 18 0.005 10.218 7.215 6.028 5.375 4.956 4.663 4.445 4.276 4.141 4.030 3.938 3.860 18 0.001 15.380 10.390 8.487 7.460 6.808 6.355 6.021 5.763 5.557 5.390 5.251 5.132

19 0.100 2.990 2.606 2.397 2.266 2.176 2.109 2.058 2.017 1.984 1.956 1.932 1.912 19 0.050 4.381 3.522 3.127 2.895 2.740 2.628 2.544 2.477 2.423 2.378 2.340 2.308 19 0.025 5.922 4.508 3.903 3.559 3.333 3.172 3.051 2.956 2.880 2.817 2.765 2.720 19 0.010 8.185 5.926 5.010 4.500 4.171 3.939 3.765 3.631 3.523 3.434 3.360 3.297 19 0.005 10.073 7.093 5.916 5.268 4.853 4.561 4.345 4.177 4.043 3.933 3.841 3.763 19 0.001 15.081 10.157 8.280 7.265 6.622 6.175 5.845 5.591 5.387 5.222 5.084 4.967

20 0.100 2.975 2.589 2.380 2.249 2.158 2.091 2.040 1.999 1.965 1.937 1.913 1.892 20 0.050 4.351 3.493 3.098 2.866 2.711 2.599 2.514 2.447 2.393 2.348 2.310 2.278 20 0.025 5.871 4.461 3.859 3.515 3.289 3.128 3.007 2.913 2.837 2.774 2.721 2.676 20 0.010 8.096 5.849 4.938 4.431 4.103 3.871 3.699 3.564 3.457 3.368 3.294 3.231 20 0.005 9.944 6.987 5.818 5.174 4.762 4.472 4.257 4.090 3.956 3.847 3.756 3.678 20 0.001 14.819 9.953 8.098 7.096 6.461 6.019 5.692 5.440 5.239 5.075 4.939 4.823

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 200: Domingues 2005 - Estatística Aplicada as Ciências Militares

200

Continuação do ANEXO G – TABELA PARA TESTE F: DE [1,12] A [21,25]

1 2 3 4 5 6 7 8 9 10 11 12

21 0.100 2.961 2.575 2.365 2.233 2.142 2.075 2.023 1.982 1.948 1.920 1.896 1.875 21 0.050 4.325 3.467 3.072 2.840 2.685 2.573 2.488 2.420 2.366 2.321 2.283 2.250 21 0.025 5.827 4.420 3.819 3.475 3.250 3.090 2.969 2.874 2.798 2.735 2.682 2.637 21 0.010 8.017 5.780 4.874 4.369 4.042 3.812 3.640 3.506 3.398 3.310 3.236 3.173 21 0.005 9.829 6.891 5.730 5.091 4.681 4.393 4.179 4.013 3.880 3.771 3.680 3.602 21 0.001 14.586 9.773 7.938 6.947 6.318 5.881 5.557 5.308 5.109 4.946 4.811 4.696 22 0.100 2.949 2.561 2.351 2.219 2.128 2.060 2.008 1.967 1.933 1.904 1.880 1.859 22 0.050 4.301 3.443 3.049 2.817 2.661 2.549 2.464 2.397 2.342 2.297 2.259 2.226 22 0.025 5.786 4.383 3.783 3.440 3.215 3.055 2.934 2.839 2.763 2.700 2.647 2.602 22 0.010 7.945 5.719 4.817 4.313 3.988 3.758 3.587 3.453 3.346 3.258 3.184 3.121 22 0.005 9.727 6.806 5.652 5.017 4.609 4.322 4.109 3.944 3.812 3.703 3.612 3.535 22 0.001 14.381 9.612 7.796 6.814 6.191 5.758 5.437 5.190 4.993 4.832 4.698 4.583 23 0.100 2.937 2.549 2.339 2.207 2.115 2.047 1.995 1.953 1.919 1.890 1.866 1.845 23 0.050 4.279 3.422 3.028 2.796 2.640 2.528 2.442 2.375 2.320 2.275 2.236 2.204 23 0.025 5.750 4.349 3.750 3.408 3.183 3.023 2.902 2.808 2.731 2.668 2.615 2.570 23 0.010 7.881 5.664 4.765 4.264 3.939 3.710 3.539 3.406 3.299 3.211 3.137 3.074 23 0.005 9.635 6.730 5.582 4.950 4.544 4.259 4.047 3.882 3.750 3.642 3.551 3.474 23 0.001 14.195 9.469 7.669 6.696 6.078 5.649 5.331 5.085 4.889 4.730 4.596 4.483 24 0.100 2.927 2.538 2.327 2.195 2.103 2.035 1.983 1.941 1.906 1.877 1.853 1.832 24 0.050 4.260 3.403 3.009 2.776 2.621 2.508 2.423 2.355 2.300 2.255 2.216 2.183 24 0.025 5.717 4.319 3.721 3.379 3.155 2.995 2.874 2.779 2.703 2.640 2.586 2.541 24 0.010 7.823 5.614 4.718 4.218 3.895 3.667 3.496 3.363 3.256 3.168 3.094 3.032 24 0.005 9.551 6.661 5.519 4.890 4.486 4.202 3.991 3.826 3.695 3.587 3.497 3.420 24 0.001 14.028 9.340 7.554 6.589 5.977 5.551 5.235 4.991 4.797 4.638 4.505 4.393 25 0.100 2.918 2.528 2.317 2.184 2.092 2.024 1.971 1.929 1.895 1.866 1.841 1.820 25 0.050 4.242 3.385 2.991 2.759 2.603 2.490 2.405 2.337 2.282 2.236 2.198 2.165 25 0.025 5.686 4.291 3.694 3.353 3.129 2.969 2.848 2.753 2.677 2.613 2.560 2.515 25 0.010 7.770 5.568 4.675 4.177 3.855 3.627 3.457 3.324 3.217 3.129 3.056 2.993 25 0.005 9.475 6.598 5.462 4.835 4.433 4.150 3.939 3.776 3.645 3.537 3.447 3.370 25 0.001 13.877 9.222 7.451 6.493 5.885 5.462 5.148 4.906 4.713 4.555 4.423 4.311

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 201: Domingues 2005 - Estatística Aplicada as Ciências Militares

201

Continuação do ANEXO G – TABELA PARA TESTE F: DE [1,12] A [26,30]

1 2 3 4 5 6 7 8 9 10 11 12

26 0.100 2.909 2.519 2.307 2.174 2.082 2.014 1.961 1.919 1.884 1.855 1.830 1.809 26 0.050 4.225 3.369 2.975 2.743 2.587 2.474 2.388 2.321 2.265 2.220 2.181 2.148 26 0.025 5.659 4.265 3.670 3.329 3.105 2.945 2.824 2.729 2.653 2.590 2.536 2.491 26 0.010 7.721 5.526 4.637 4.140 3.818 3.591 3.421 3.288 3.182 3.094 3.021 2.958 26 0.005 9.406 6.541 5.409 4.785 4.384 4.103 3.893 3.730 3.599 3.492 3.402 3.325 26 0.001 13.739 9.117 7.357 6.406 5.802 5.381 5.070 4.829 4.637 4.480 4.349 4.238

27 0.100 2.901 2.511 2.299 2.165 2.073 2.005 1.952 1.909 1.874 1.845 1.820 1.799 27 0.050 4.210 3.354 2.960 2.728 2.572 2.459 2.373 2.305 2.250 2.204 2.166 2.132 27 0.025 5.633 4.242 3.647 3.307 3.083 2.923 2.802 2.707 2.631 2.568 2.514 2.469 27 0.010 7.677 5.488 4.601 4.106 3.785 3.558 3.388 3.256 3.149 3.062 2.988 2.926 27 0.005 9.342 6.489 5.361 4.740 4.340 4.059 3.850 3.687 3.557 3.450 3.360 3.284 27 0.001 13.613 9.019 7.271 6.326 5.726 5.308 4.998 4.759 4.568 4.412 4.281 4.170

28 0.100 2.894 2.503 2.291 2.157 2.064 1.996 1.943 1.900 1.865 1.836 1.811 1.790 28 0.050 4.196 3.340 2.947 2.714 2.558 2.445 2.359 2.291 2.236 2.190 2.151 2.118 28 0.025 5.610 4.221 3.626 3.286 3.063 2.903 2.782 2.687 2.611 2.547 2.494 2.448 28 0.010 7.636 5.453 4.568 4.074 3.754 3.528 3.358 3.226 3.120 3.032 2.959 2.896 28 0.005 9.284 6.440 5.317 4.698 4.300 4.020 3.811 3.649 3.519 3.412 3.322 3.246 28 0.001 13.497 8.930 7.193 6.253 5.657 5.241 4.933 4.695 4.505 4.349 4.219 4.109

29 0.100 2.887 2.495 2.283 2.149 2.057 1.988 1.935 1.892 1.857 1.827 1.802 1.781 29 0.050 4.183 3.328 2.934 2.701 2.545 2.432 2.346 2.278 2.223 2.177 2.138 2.104 29 0.025 5.588 4.201 3.607 3.267 3.044 2.884 2.763 2.669 2.592 2.529 2.475 2.430 29 0.010 7.598 5.420 4.538 4.045 3.725 3.499 3.330 3.198 3.092 3.005 2.931 2.868 29 0.005 9.230 6.396 5.276 4.659 4.262 3.983 3.775 3.613 3.483 3.376 3.287 3.211 29 0.001 13.391 8.848 7.121 6.186 5.592 5.179 4.873 4.636 4.447 4.292 4.162 4.053

30 0.100 2.881 2.489 2.276 2.142 2.049 1.980 1.927 1.884 1.849 1.819 1.794 1.773 30 0.050 4.171 3.316 2.922 2.690 2.534 2.421 2.334 2.266 2.211 2.165 2.126 2.092 30 0.025 5.568 4.182 3.589 3.250 3.026 2.867 2.746 2.651 2.575 2.511 2.458 2.412 30 0.010 7.562 5.390 4.510 4.018 3.699 3.473 3.305 3.173 3.067 2.979 2.906 2.843 30 0.005 9.180 6.355 5.239 4.623 4.228 3.949 3.742 3.580 3.451 3.344 3.255 3.179 30 0.001 13.293 8.773 7.054 6.125 5.534 5.122 4.817 4.582 4.393 4.239 4.110 4.001

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 202: Domingues 2005 - Estatística Aplicada as Ciências Militares

202

Continuação do ANEXO G – TABELA PARA TESTE F: DE [1,12] A [40,]

1 2 3 4 5 6 7 8 9 10 11 12

40 0.100 2.835 2.440 2.226 2.091 1.997 1.927 1.873 1.829 1.793 1.763 1.737 1.715 40 0.050 4.085 3.232 2.839 2.606 2.449 2.336 2.249 2.180 2.124 2.077 2.038 2.003 40 0.025 5.424 4.051 3.463 3.126 2.904 2.744 2.624 2.529 2.452 2.388 2.334 2.288 40 0.010 7.314 5.178 4.313 3.828 3.514 3.291 3.124 2.993 2.888 2.801 2.727 2.665 40 0.005 8.828 6.066 4.976 4.374 3.986 3.713 3.509 3.350 3.222 3.117 3.028 2.953 40 0.001 12.609 8.251 6.595 5.698 5.128 4.731 4.436 4.207 4.024 3.874 3.749 3.643

60 0.100 2.791 2.393 2.177 2.041 1.946 1.875 1.819 1.775 1.738 1.707 1.680 1.657 60 0.050 4.001 3.150 2.758 2.525 2.368 2.254 2.167 2.097 2.040 1.993 1.952 1.917 60 0.025 5.286 3.925 3.343 3.008 2.786 2.627 2.507 2.412 2.334 2.270 2.216 2.169 60 0.010 7.077 4.977 4.126 3.649 3.339 3.119 2.953 2.823 2.718 2.632 2.559 2.496 60 0.005 8.495 5.795 4.729 4.140 3.760 3.492 3.291 3.134 3.008 2.904 2.817 2.742 60 0.001 11.973 7.768 6.171 5.307 4.757 4.372 4.086 3.865 3.687 3.542 3.419 3.315

120 0.100 2.748 2.347 2.130 1.992 1.896 1.824 1.767 1.722 1.684 1.652 1.625 1.601 120 0.050 3.920 3.072 2.680 2.447 2.290 2.175 2.087 2.016 1.959 1.910 1.869 1.834 120 0.025 5.152 3.805 3.227 2.894 2.674 2.515 2.395 2.299 2.222 2.157 2.102 2.055 120 0.010 6.851 4.787 3.949 3.480 3.174 2.956 2.792 2.663 2.559 2.472 2.399 2.336 120 0.005 8.179 5.539 4.497 3.921 3.548 3.285 3.087 2.933 2.808 2.705 2.618 2.544 120 0.001 11.380 7.321 5.781 4.947 4.416 4.044 3.767 3.552 3.379 3.237 3.118 3.016

0.100 2.706 2.303 2.084 1.945 1.847 1.774 1.717 1.670 1.632 1.599 1.571 1.546 100000 0.050 3.842 2.996 2.605 2.372 2.214 2.099 2.010 1.939 1.880 1.831 1.789 1.752 100000 0.025 5.024 3.689 3.116 2.786 2.567 2.408 2.288 2.192 2.114 2.048 1.993 1.945 100000 0.010 6.635 4.605 3.782 3.319 3.017 2.802 2.640 2.511 2.408 2.321 2.248 2.185 100000 0.005 7.880 5.299 4.280 3.715 3.350 3.091 2.897 2.745 2.621 2.519 2.433 2.359 100000 0.001 10.828 6.909 5.422 4.617 4.103 3.743 3.475 3.266 3.098 2.959 2.843 2.743

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 203: Domingues 2005 - Estatística Aplicada as Ciências Militares

203

Continuação do ANEXO G – TABELA PARA TESTE F: DE [13, ] A [1,5]

13 14 15 16 17 18 19 20 25 30 40 60 120

1 0.100 60.902 61.073 61.220 61.350 61.465 61.566 61.658 61.740 62.055 62.265 62.529 62.794 63.061 63.328 1 0.050 244.690 245.363 245.949 246.466 246.917 247.324 247.688 248.016 249.260 250.096 251.144 252.196 253.254 254.313 1 0.025 979.839 982.545 984.874 986.911 988.715 990.345 991.800 993.081 998.087 1001 1006 1010 1014 1018 1 0.010 6126 6143 6157 6170 6181 6191 6201 6209 6240 6260 6286 6313 6340 6366 1 0.005 24505 24572 24632 24684 24728 24766 24803 24837 24959 25041 25146 25254 25358 25466 1 0.001 612259 614166 616074 617027 617981 618935 619888 620842 623703 626087 628471 631332 634193 636578

2 0.100 9.415 9.420 9.425 9.429 9.433 9.436 9.439 9.441 9.451 9.458 9.466 9.475 9.483 9.491 2 0.050 19.419 19.424 19.429 19.433 19.437 19.440 19.443 19.446 19.456 19.463 19.471 19.479 19.487 19.496 2 0.025 39.421 39.427 39.431 39.436 39.439 39.442 39.446 39.448 39.458 39.465 39.473 39.481 39.489 39.498 2 0.010 99.422 99.426 99.433 99.437 99.441 99.444 99.448 99.448 99.459 99.466 99.477 99.484 99.491 99.499 2 0.005 199.419 199.419 199.434 199.449 199.449 199.449 199.449 199.449 199.449 199.478 199.478 199.478 199.492 199.507 2 0.001 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309 999.309

3 0.100 5.210 5.205 5.200 5.196 5.193 5.190 5.187 5.184 5.175 5.168 5.160 5.151 5.143 5.134 3 0.050 8.729 8.715 8.703 8.692 8.683 8.675 8.667 8.660 8.634 8.617 8.594 8.572 8.549 8.527 3 0.025 14.305 14.277 14.253 14.232 14.213 14.196 14.181 14.167 14.115 14.081 14.036 13.992 13.947 13.902 3 0.010 26.983 26.924 26.872 26.826 26.786 26.751 26.719 26.690 26.579 26.504 26.411 26.316 26.221 26.125 3 0.005 43.270 43.172 43.085 43.008 42.939 42.881 42.826 42.779 42.590 42.466 42.310 42.150 41.990 41.829 3 0.001 127.940 127.649 127.358 127.126 126.951 126.718 126.573 126.427 125.845 125.438 124.972 124.448 123.982 123.458

4 0.100 3.886 3.878 3.870 3.864 3.858 3.853 3.848 3.844 3.828 3.817 3.804 3.790 3.775 3.761 4 0.050 5.891 5.873 5.858 5.844 5.832 5.821 5.811 5.803 5.769 5.746 5.717 5.688 5.658 5.628 4 0.025 8.715 8.684 8.657 8.633 8.611 8.592 8.575 8.560 8.501 8.461 8.411 8.360 8.309 8.257 4 0.010 14.306 14.249 14.198 14.154 14.114 14.079 14.048 14.019 13.911 13.838 13.745 13.652 13.558 13.463 4 0.005 20.603 20.515 20.438 20.371 20.311 20.258 20.211 20.167 20.003 19.892 19.751 19.611 19.469 19.325 4 0.001 47.163 46.944 46.755 46.595 46.450 46.319 46.202 46.100 45.693 45.431 45.082 44.747 44.398 44.049

5 0.100 3.257 3.247 3.238 3.230 3.223 3.217 3.212 3.207 3.187 3.174 3.157 3.140 3.123 3.105 5 0.050 4.655 4.636 4.619 4.604 4.590 4.579 4.568 4.558 4.521 4.496 4.464 4.431 4.398 4.365 5 0.025 6.488 6.456 6.428 6.403 6.381 6.362 6.344 6.329 6.268 6.227 6.175 6.123 6.069 6.015 5 0.010 9.825 9.770 9.722 9.680 9.643 9.609 9.580 9.553 9.449 9.379 9.291 9.202 9.112 9.021 5 0.005 13.293 13.215 13.146 13.086 13.033 12.985 12.942 12.903 12.756 12.656 12.530 12.402 12.274 12.144 5 0.001 26.223 26.055 25.910 25.782 25.670 25.568 25.477 25.393 25.080 24.869 24.600 24.331 24.062 23.785

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 204: Domingues 2005 - Estatística Aplicada as Ciências Militares

204

Continuação do ANEXO G – TABELA PARA TESTE F: DE [13, ] A [6,10]

13 14 15 16 17 18 19 20 25 30 40 60 120

6 0.100 2.892 2.881 2.871 2.863 2.855 2.848 2.842 2.836 2.815 2.800 2.781 2.762 2.742 2.722 6 0.050 3.976 3.956 3.938 3.922 3.908 3.896 3.884 3.874 3.835 3.808 3.774 3.740 3.705 3.669 6 0.025 5.329 5.297 5.269 5.244 5.222 5.202 5.184 5.168 5.107 5.065 5.012 4.959 4.904 4.849 6 0.010 7.657 7.605 7.559 7.519 7.483 7.451 7.422 7.396 7.296 7.229 7.143 7.057 6.969 6.880 6 0.005 9.950 9.878 9.814 9.758 9.709 9.664 9.625 9.589 9.451 9.358 9.241 9.122 9.001 8.879 6 0.001 17.826 17.684 17.557 17.451 17.353 17.266 17.189 17.120 16.851 16.673 16.444 16.214 15.982 15.745

7 0.100 2.654 2.643 2.632 2.623 2.615 2.607 2.601 2.595 2.571 2.555 2.535 2.514 2.493 2.471 7 0.050 3.550 3.529 3.511 3.494 3.480 3.467 3.455 3.445 3.404 3.376 3.340 3.304 3.267 3.230 7 0.025 4.628 4.596 4.568 4.543 4.521 4.501 4.483 4.467 4.405 4.362 4.309 4.254 4.199 4.142 7 0.010 6.410 6.359 6.314 6.275 6.240 6.209 6.181 6.155 6.058 5.992 5.908 5.824 5.737 5.650 7 0.005 8.097 8.028 7.968 7.915 7.868 7.826 7.788 7.754 7.623 7.534 7.422 7.309 7.193 7.076 7 0.001 13.561 13.435 13.324 13.228 13.140 13.064 12.995 12.931 12.693 12.529 12.325 12.118 11.909 11.696

8 0.100 2.488 2.475 2.464 2.454 2.446 2.438 2.431 2.425 2.400 2.383 2.361 2.339 2.316 2.293 8 0.050 3.259 3.237 3.218 3.202 3.187 3.173 3.161 3.150 3.108 3.079 3.043 3.005 2.967 2.928 8 0.025 4.162 4.130 4.101 4.076 4.054 4.034 4.016 3.999 3.937 3.894 3.840 3.784 3.728 3.670 8 0.010 5.609 5.559 5.515 5.477 5.442 5.412 5.384 5.359 5.263 5.198 5.116 5.032 4.946 4.859 8 0.005 6.938 6.872 6.814 6.763 6.718 6.678 6.641 6.608 6.482 6.396 6.288 6.177 6.065 5.951 8 0.001 11.059 10.943 10.841 10.752 10.672 10.601 10.537 10.479 10.259 10.108 9.919 9.728 9.532 9.333

9 0.100 2.364 2.351 2.340 2.330 2.320 2.312 2.305 2.298 2.272 2.255 2.232 2.208 2.184 2.159 9 0.050 3.048 3.025 3.006 2.989 2.974 2.960 2.948 2.936 2.893 2.864 2.826 2.787 2.748 2.707 9 0.025 3.831 3.798 3.769 3.744 3.722 3.701 3.683 3.667 3.604 3.560 3.505 3.449 3.392 3.333 9 0.010 5.055 5.005 4.962 4.924 4.890 4.860 4.833 4.808 4.713 4.649 4.567 4.483 4.398 4.311 9 0.005 6.153 6.089 6.032 5.983 5.939 5.899 5.864 5.832 5.708 5.625 5.519 5.410 5.300 5.188 9 0.001 9.443 9.333 9.239 9.153 9.079 9.012 8.952 8.898 8.689 8.547 8.368 8.186 8.002 7.813

10 0.100 2.269 2.255 2.244 2.233 2.224 2.215 2.208 2.201 2.174 2.155 2.132 2.107 2.082 2.055 10 0.050 2.887 2.865 2.845 2.828 2.812 2.798 2.785 2.774 2.730 2.700 2.661 2.621 2.580 2.538 10 0.025 3.583 3.550 3.522 3.496 3.474 3.453 3.435 3.419 3.355 3.311 3.255 3.198 3.140 3.080 10 0.010 4.650 4.601 4.558 4.520 4.487 4.457 4.430 4.405 4.311 4.247 4.165 4.082 3.996 3.909 10 0.005 5.589 5.526 5.471 5.422 5.379 5.340 5.306 5.274 5.153 5.071 4.966 4.859 4.750 4.639 10 0.001 8.325 8.220 8.129 8.048 7.977 7.913 7.856 7.803 7.604 7.469 7.297 7.122 6.944 6.763

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 205: Domingues 2005 - Estatística Aplicada as Ciências Militares

205

Continuação do ANEXO G – TABELA PARA TESTE F: DE [13, ] A [11,15]

13 14 15 16 17 18 19 20 25 30 40 60 120

11 0.100 2.193 2.179 2.167 2.156 2.147 2.138 2.130 2.123 2.095 2.076 2.052 2.026 2.000 1.972 11 0.050 2.761 2.739 2.719 2.701 2.685 2.671 2.658 2.646 2.601 2.570 2.531 2.490 2.448 2.405 11 0.025 3.392 3.359 3.330 3.304 3.282 3.261 3.243 3.226 3.162 3.118 3.061 3.004 2.944 2.883 11 0.010 4.342 4.293 4.251 4.213 4.180 4.150 4.123 4.099 4.005 3.941 3.860 3.776 3.690 3.603 11 0.005 5.165 5.103 5.049 5.001 4.959 4.921 4.886 4.855 4.736 4.654 4.551 4.445 4.337 4.226 11 0.001 7.510 7.409 7.321 7.243 7.175 7.113 7.058 7.008 6.815 6.684 6.517 6.348 6.175 5.999

12 0.100 2.131 2.117 2.105 2.094 2.084 2.075 2.067 2.060 2.031 2.011 1.986 1.960 1.932 1.904 12 0.050 2.660 2.637 2.617 2.599 2.583 2.568 2.555 2.544 2.498 2.466 2.426 2.384 2.341 2.296 12 0.025 3.239 3.206 3.177 3.152 3.129 3.108 3.090 3.073 3.008 2.963 2.906 2.848 2.787 2.725 12 0.010 4.100 4.052 4.010 3.972 3.939 3.910 3.883 3.858 3.765 3.701 3.619 3.535 3.449 3.361 12 0.005 4.836 4.775 4.721 4.674 4.632 4.595 4.561 4.530 4.412 4.331 4.228 4.123 4.015 3.904 12 0.001 6.892 6.795 6.709 6.634 6.567 6.507 6.454 6.405 6.217 6.090 5.928 5.763 5.593 5.420

13 0.100 2.080 2.066 2.053 2.042 2.032 2.023 2.014 2.007 1.978 1.958 1.931 1.904 1.876 1.846 13 0.050 2.577 2.554 2.533 2.515 2.499 2.484 2.471 2.459 2.412 2.380 2.339 2.297 2.252 2.206 13 0.025 3.115 3.082 3.053 3.027 3.004 2.983 2.965 2.948 2.882 2.837 2.780 2.720 2.659 2.596 13 0.010 3.905 3.857 3.815 3.778 3.745 3.716 3.689 3.665 3.571 3.507 3.425 3.341 3.255 3.165 13 0.005 4.573 4.513 4.460 4.413 4.372 4.334 4.301 4.270 4.153 4.073 3.970 3.866 3.758 3.647 13 0.001 6.409 6.315 6.231 6.158 6.093 6.034 5.982 5.934 5.751 5.626 5.467 5.305 5.138 4.967

14 0.100 2.037 2.022 2.010 1.998 1.988 1.978 1.970 1.962 1.933 1.912 1.885 1.857 1.828 1.797 14 0.050 2.507 2.484 2.463 2.445 2.428 2.413 2.400 2.388 2.341 2.308 2.266 2.223 2.178 2.131 14 0.025 3.012 2.979 2.949 2.923 2.900 2.879 2.861 2.844 2.778 2.732 2.674 2.614 2.552 2.487 14 0.010 3.745 3.698 3.656 3.619 3.586 3.556 3.529 3.505 3.412 3.348 3.266 3.181 3.094 3.004 14 0.005 4.359 4.299 4.247 4.201 4.159 4.122 4.089 4.059 3.942 3.862 3.760 3.655 3.547 3.436 14 0.001 6.023 5.930 5.848 5.776 5.713 5.655 5.603 5.557 5.377 5.254 5.098 4.938 4.773 4.604

15 0.100 2.000 1.985 1.972 1.961 1.950 1.941 1.932 1.924 1.894 1.873 1.845 1.817 1.787 1.755 15 0.050 2.448 2.424 2.403 2.385 2.368 2.353 2.340 2.328 2.280 2.247 2.204 2.160 2.114 2.066 15 0.025 2.925 2.891 2.862 2.836 2.813 2.792 2.773 2.756 2.689 2.644 2.585 2.524 2.461 2.395 15 0.010 3.612 3.564 3.522 3.485 3.452 3.423 3.396 3.372 3.278 3.214 3.132 3.047 2.959 2.869 15 0.005 4.181 4.122 4.070 4.024 3.983 3.946 3.913 3.883 3.766 3.687 3.585 3.480 3.372 3.260 15 0.001 5.707 5.615 5.535 5.464 5.401 5.345 5.294 5.249 5.071 4.950 4.796 4.638 4.475 4.307

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 206: Domingues 2005 - Estatística Aplicada as Ciências Militares

206

Continuação do ANEXO G – TABELA PARA TESTE F: DE [13, ] A [16,20]

13 14 15 16 17 18 19 20 25 30 40 60 120

16 0.100 1.968 1.953 1.940 1.928 1.917 1.908 1.899 1.891 1.860 1.839 1.811 1.782 1.751 1.718 16 0.050 2.397 2.373 2.352 2.333 2.317 2.302 2.288 2.276 2.227 2.194 2.151 2.106 2.059 2.010 16 0.025 2.851 2.817 2.788 2.761 2.738 2.717 2.698 2.681 2.614 2.568 2.509 2.447 2.383 2.316 16 0.010 3.498 3.451 3.409 3.372 3.339 3.310 3.283 3.259 3.165 3.101 3.018 2.933 2.845 2.753 16 0.005 4.031 3.972 3.920 3.875 3.834 3.797 3.764 3.734 3.618 3.539 3.437 3.332 3.224 3.112 16 0.001 5.443 5.353 5.275 5.205 5.143 5.087 5.037 4.992 4.817 4.697 4.545 4.388 4.226 4.060

17 0.100 1.940 1.925 1.912 1.900 1.889 1.879 1.870 1.862 1.831 1.809 1.781 1.751 1.719 1.686 17 0.050 2.353 2.329 2.308 2.289 2.272 2.257 2.243 2.230 2.181 2.148 2.104 2.058 2.011 1.960 17 0.025 2.786 2.753 2.723 2.697 2.673 2.652 2.633 2.616 2.548 2.502 2.442 2.380 2.315 2.248 17 0.010 3.401 3.353 3.312 3.275 3.242 3.212 3.186 3.162 3.068 3.003 2.920 2.835 2.746 2.653 17 0.005 3.903 3.844 3.793 3.747 3.707 3.670 3.637 3.607 3.492 3.412 3.311 3.206 3.097 2.984 17 0.001 5.221 5.132 5.055 4.986 4.924 4.869 4.820 4.775 4.602 4.484 4.332 4.177 4.016 3.850

18 0.100 1.916 1.900 1.887 1.875 1.864 1.854 1.845 1.837 1.805 1.783 1.754 1.723 1.691 1.657 18 0.050 2.314 2.290 2.269 2.250 2.233 2.217 2.203 2.191 2.141 2.107 2.063 2.017 1.968 1.917 18 0.025 2.730 2.696 2.667 2.640 2.617 2.596 2.576 2.559 2.491 2.445 2.384 2.321 2.256 2.187 18 0.010 3.316 3.269 3.227 3.190 3.158 3.128 3.101 3.077 2.983 2.919 2.835 2.749 2.660 2.566 18 0.005 3.793 3.734 3.683 3.637 3.597 3.560 3.527 3.498 3.382 3.303 3.201 3.096 2.987 2.873 18 0.001 5.031 4.943 4.866 4.798 4.738 4.683 4.634 4.590 4.418 4.301 4.151 3.996 3.836 3.670

19 0.100 1.894 1.878 1.865 1.852 1.841 1.831 1.822 1.814 1.782 1.759 1.730 1.699 1.666 1.631 19 0.050 2.280 2.256 2.234 2.215 2.198 2.182 2.168 2.155 2.106 2.071 2.026 1.980 1.930 1.878 19 0.025 2.681 2.647 2.617 2.591 2.567 2.546 2.526 2.509 2.441 2.394 2.333 2.270 2.203 2.133 19 0.010 3.242 3.195 3.153 3.116 3.084 3.054 3.027 3.003 2.909 2.844 2.761 2.674 2.584 2.489 19 0.005 3.696 3.638 3.587 3.541 3.501 3.464 3.432 3.402 3.287 3.208 3.106 3.000 2.891 2.776 19 0.001 4.867 4.780 4.703 4.636 4.576 4.522 4.474 4.430 4.259 4.143 3.994 3.840 3.680 3.514

20 0.100 1.875 1.859 1.845 1.833 1.821 1.811 1.802 1.794 1.761 1.738 1.708 1.677 1.643 1.607 20 0.050 2.250 2.225 2.203 2.184 2.167 2.151 2.137 2.124 2.074 2.039 1.994 1.946 1.896 1.843 20 0.025 2.637 2.603 2.573 2.547 2.523 2.501 2.482 2.464 2.396 2.349 2.287 2.223 2.156 2.085 20 0.010 3.177 3.130 3.088 3.051 3.018 2.989 2.962 2.938 2.843 2.778 2.695 2.608 2.517 2.421 20 0.005 3.611 3.553 3.502 3.457 3.416 3.380 3.348 3.318 3.203 3.123 3.022 2.916 2.806 2.691 20 0.001 4.723 4.638 4.562 4.495 4.435 4.382 4.334 4.290 4.121 4.005 3.856 3.703 3.544 3.378

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 207: Domingues 2005 - Estatística Aplicada as Ciências Militares

207

Continuação do ANEXO G – TABELA PARA TESTE F: DE [13, ] A [21,25]

13 14 15 16 17 18 19 20 25 30 40 60 120

21 0.100 1.857 1.841 1.827 1.815 1.803 1.793 1.784 1.776 1.742 1.719 1.689 1.657 1.623 1.586 21 0.050 2.222 2.197 2.176 2.156 2.139 2.123 2.109 2.096 2.045 2.010 1.965 1.916 1.866 1.812 21 0.025 2.598 2.564 2.534 2.507 2.483 2.462 2.442 2.425 2.356 2.308 2.246 2.182 2.114 2.042 21 0.010 3.119 3.072 3.030 2.993 2.960 2.931 2.904 2.880 2.785 2.720 2.636 2.548 2.457 2.360 21 0.005 3.536 3.478 3.427 3.382 3.342 3.305 3.273 3.243 3.128 3.049 2.947 2.841 2.730 2.614 21 0.001 4.597 4.512 4.437 4.371 4.311 4.258 4.211 4.167 3.999 3.884 3.736 3.583 3.424 3.258

22 0.100 1.841 1.825 1.811 1.798 1.787 1.777 1.768 1.759 1.726 1.702 1.671 1.639 1.604 1.567 22 0.050 2.198 2.173 2.151 2.131 2.114 2.098 2.084 2.071 2.020 1.984 1.938 1.889 1.838 1.783 22 0.025 2.563 2.528 2.498 2.472 2.448 2.426 2.407 2.389 2.320 2.272 2.210 2.145 2.076 2.003 22 0.010 3.067 3.019 2.978 2.941 2.908 2.879 2.852 2.827 2.733 2.667 2.583 2.495 2.403 2.306 22 0.005 3.469 3.411 3.360 3.315 3.275 3.239 3.206 3.176 3.061 2.982 2.880 2.774 2.663 2.546 22 0.001 4.486 4.401 4.326 4.260 4.201 4.149 4.101 4.058 3.891 3.776 3.628 3.476 3.317 3.151

23 0.100 1.827 1.811 1.796 1.784 1.772 1.762 1.753 1.744 1.710 1.686 1.655 1.622 1.587 1.549 23 0.050 2.175 2.150 2.128 2.109 2.091 2.075 2.061 2.048 1.996 1.961 1.914 1.865 1.813 1.757 23 0.025 2.531 2.497 2.466 2.440 2.416 2.394 2.374 2.357 2.287 2.239 2.176 2.111 2.041 1.968 23 0.010 3.020 2.973 2.931 2.894 2.861 2.832 2.805 2.780 2.686 2.620 2.536 2.447 2.354 2.256 23 0.005 3.408 3.351 3.300 3.255 3.215 3.179 3.146 3.116 3.001 2.922 2.820 2.713 2.602 2.484 23 0.001 4.386 4.301 4.227 4.162 4.103 4.051 4.004 3.961 3.794 3.680 3.533 3.380 3.222 3.055

24 0.100 1.814 1.797 1.783 1.770 1.759 1.748 1.739 1.730 1.696 1.672 1.641 1.607 1.571 1.533 24 0.050 2.155 2.130 2.108 2.088 2.070 2.054 2.040 2.027 1.975 1.939 1.892 1.842 1.790 1.733 24 0.025 2.502 2.468 2.437 2.411 2.386 2.365 2.345 2.327 2.257 2.209 2.146 2.080 2.010 1.935 24 0.010 2.977 2.930 2.889 2.852 2.819 2.789 2.762 2.738 2.643 2.577 2.492 2.403 2.310 2.211 24 0.005 3.354 3.296 3.246 3.201 3.161 3.125 3.092 3.062 2.947 2.868 2.765 2.658 2.546 2.428 24 0.001 4.296 4.212 4.139 4.074 4.015 3.963 3.916 3.873 3.707 3.593 3.447 3.295 3.136 2.969

25 0.100 1.802 1.785 1.771 1.758 1.746 1.736 1.726 1.718 1.683 1.659 1.627 1.593 1.557 1.518 25 0.050 2.136 2.111 2.089 2.069 2.051 2.035 2.021 2.007 1.955 1.919 1.872 1.822 1.768 1.711 25 0.025 2.476 2.441 2.411 2.384 2.360 2.338 2.318 2.300 2.230 2.182 2.118 2.052 1.981 1.906 25 0.010 2.939 2.892 2.850 2.813 2.780 2.751 2.724 2.699 2.604 2.538 2.453 2.364 2.270 2.170 25 0.005 3.304 3.247 3.196 3.152 3.111 3.075 3.043 3.013 2.898 2.819 2.716 2.609 2.496 2.377 25 0.001 4.216 4.132 4.059 3.994 3.936 3.884 3.837 3.794 3.629 3.515 3.369 3.217 3.058 2.891

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 208: Domingues 2005 - Estatística Aplicada as Ciências Militares

208

Continuação do ANEXO G – TABELA PARA TESTE F: DE [13, ] A [26,30]

13 14 15 16 17 18 19 20 25 30 40 60 120

26 0.100 1.790 1.774 1.760 1.747 1.735 1.724 1.715 1.706 1.671 1.647 1.615 1.581 1.544 1.504 26 0.050 2.119 2.094 2.072 2.052 2.034 2.018 2.003 1.990 1.938 1.901 1.853 1.803 1.749 1.691 26 0.025 2.452 2.417 2.387 2.360 2.335 2.314 2.294 2.276 2.205 2.157 2.093 2.026 1.954 1.878 26 0.010 2.904 2.857 2.815 2.778 2.745 2.715 2.688 2.664 2.569 2.503 2.417 2.327 2.233 2.132 26 0.005 3.259 3.202 3.151 3.107 3.067 3.031 2.998 2.968 2.853 2.774 2.671 2.563 2.450 2.330 26 0.001 4.142 4.059 3.986 3.922 3.864 3.812 3.765 3.723 3.558 3.445 3.299 3.147 2.987 2.819

27 0.100 1.780 1.764 1.749 1.736 1.724 1.714 1.704 1.695 1.660 1.636 1.603 1.569 1.531 1.491 27 0.050 2.103 2.078 2.056 2.036 2.018 2.002 1.987 1.974 1.921 1.884 1.836 1.785 1.731 1.672 27 0.025 2.429 2.395 2.364 2.337 2.313 2.291 2.271 2.253 2.183 2.133 2.069 2.002 1.930 1.853 27 0.010 2.872 2.824 2.783 2.746 2.713 2.683 2.656 2.632 2.536 2.470 2.384 2.294 2.198 2.097 27 0.005 3.218 3.161 3.110 3.066 3.026 2.990 2.957 2.927 2.812 2.733 2.630 2.522 2.408 2.287 27 0.001 4.075 3.993 3.920 3.856 3.798 3.747 3.700 3.658 3.493 3.380 3.234 3.083 2.923 2.755

28 0.100 1.771 1.754 1.740 1.726 1.715 1.704 1.694 1.685 1.650 1.625 1.592 1.558 1.520 1.478 28 0.050 2.089 2.064 2.041 2.021 2.003 1.987 1.972 1.959 1.906 1.869 1.820 1.769 1.714 1.654 28 0.025 2.409 2.374 2.344 2.317 2.292 2.270 2.251 2.232 2.161 2.112 2.048 1.980 1.907 1.829 28 0.010 2.842 2.795 2.753 2.716 2.683 2.653 2.626 2.602 2.506 2.440 2.354 2.263 2.167 2.064 28 0.005 3.180 3.123 3.073 3.028 2.988 2.952 2.919 2.890 2.775 2.695 2.592 2.483 2.369 2.247 28 0.001 4.014 3.932 3.859 3.795 3.738 3.687 3.640 3.598 3.434 3.321 3.176 3.024 2.864 2.695

29 0.100 1.762 1.745 1.731 1.717 1.705 1.695 1.685 1.676 1.640 1.616 1.583 1.547 1.509 1.467 29 0.050 2.075 2.050 2.027 2.007 1.989 1.973 1.958 1.945 1.891 1.854 1.806 1.754 1.698 1.638 29 0.025 2.390 2.355 2.325 2.298 2.273 2.251 2.231 2.213 2.142 2.092 2.028 1.959 1.886 1.807 29 0.010 2.814 2.767 2.726 2.689 2.656 2.626 2.599 2.574 2.478 2.412 2.325 2.234 2.138 2.034 29 0.005 3.145 3.088 3.038 2.993 2.953 2.917 2.885 2.855 2.740 2.660 2.557 2.448 2.333 2.210 29 0.001 3.958 3.876 3.804 3.740 3.683 3.632 3.585 3.543 3.380 3.267 3.121 2.970 2.810 2.640

30 0.100 1.754 1.737 1.722 1.709 1.697 1.686 1.676 1.667 1.632 1.606 1.573 1.538 1.499 1.456 30 0.050 2.063 2.037 2.015 1.995 1.976 1.960 1.945 1.932 1.878 1.841 1.792 1.740 1.683 1.622 30 0.025 2.372 2.338 2.307 2.280 2.255 2.233 2.213 2.195 2.124 2.074 2.009 1.940 1.866 1.787 30 0.010 2.789 2.742 2.700 2.663 2.630 2.600 2.573 2.549 2.453 2.386 2.299 2.208 2.111 2.006 30 0.005 3.113 3.056 3.006 2.961 2.921 2.885 2.853 2.823 2.708 2.628 2.524 2.415 2.300 2.176 30 0.001 3.907 3.825 3.753 3.689 3.632 3.581 3.535 3.493 3.330 3.217 3.072 2.920 2.760 2.589

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 209: Domingues 2005 - Estatística Aplicada as Ciências Militares

209

Continuação do ANEXO G – TABELA PARA TESTE F: DE [13, ] A [40, ]

13 14 15 16 17 18 19 20 25 30 40 60 120

40 0.100 1.695 1.678 1.662 1.649 1.636 1.625 1.615 1.605 1.568 1.541 1.506 1.467 1.425 1.377 40 0.050 1.974 1.948 1.924 1.904 1.885 1.868 1.853 1.839 1.783 1.744 1.693 1.637 1.577 1.509 40 0.025 2.248 2.213 2.182 2.154 2.129 2.107 2.086 2.068 1.994 1.943 1.875 1.803 1.724 1.637 40 0.010 2.611 2.563 2.522 2.484 2.451 2.421 2.394 2.369 2.271 2.203 2.114 2.019 1.917 1.805 40 0.005 2.888 2.831 2.781 2.737 2.697 2.661 2.628 2.598 2.482 2.401 2.296 2.184 2.064 1.932 40 0.001 3.551 3.471 3.400 3.338 3.282 3.232 3.186 3.145 2.984 2.872 2.727 2.574 2.410 2.233

60 0.100 1.637 1.619 1.603 1.589 1.576 1.564 1.553 1.543 1.504 1.476 1.437 1.395 1.348 1.292 60 0.050 1.887 1.860 1.836 1.815 1.796 1.778 1.763 1.748 1.690 1.649 1.594 1.534 1.467 1.389 60 0.025 2.129 2.093 2.061 2.033 2.008 1.985 1.964 1.944 1.869 1.815 1.744 1.667 1.581 1.482 60 0.010 2.442 2.394 2.352 2.315 2.281 2.251 2.223 2.198 2.098 2.028 1.936 1.836 1.726 1.601 60 0.005 2.677 2.620 2.570 2.526 2.486 2.450 2.417 2.387 2.270 2.187 2.079 1.962 1.834 1.689 60 0.001 3.226 3.147 3.078 3.017 2.962 2.912 2.867 2.826 2.667 2.555 2.409 2.252 2.082 1.891

120 0.100 1.580 1.562 1.545 1.530 1.516 1.504 1.493 1.482 1.440 1.409 1.368 1.320 1.265 1.193 120 0.050 1.803 1.775 1.750 1.728 1.709 1.690 1.674 1.659 1.598 1.554 1.495 1.429 1.352 1.254 120 0.025 2.014 1.977 1.945 1.916 1.890 1.866 1.845 1.825 1.746 1.690 1.614 1.530 1.433 1.311 120 0.010 2.282 2.234 2.191 2.154 2.119 2.089 2.060 2.035 1.932 1.860 1.763 1.656 1.533 1.381 120 0.005 2.479 2.423 2.373 2.328 2.288 2.251 2.218 2.188 2.069 1.984 1.871 1.747 1.606 1.431 120 0.001 2.928 2.851 2.783 2.723 2.668 2.620 2.575 2.534 2.375 2.262 2.113 1.950 1.767 1.544

0.100 1.524 1.505 1.487 1.471 1.457 1.444 1.432 1.421 1.375 1.342 1.295 1.240 1.169 1.008 100000 0.050 1.720 1.692 1.666 1.644 1.623 1.604 1.587 1.571 1.506 1.459 1.394 1.318 1.222 1.010 100000 0.025 1.903 1.866 1.833 1.803 1.776 1.752 1.729 1.709 1.626 1.566 1.484 1.388 1.269 1.012 100000 0.010 2.130 2.082 2.039 2.000 1.965 1.934 1.905 1.878 1.773 1.697 1.592 1.473 1.325 1.015 100000 0.005 2.294 2.237 2.187 2.142 2.101 2.064 2.031 2.000 1.877 1.789 1.669 1.533 1.364 1.016 100000 0.001 2.656 2.581 2.514 2.454 2.400 2.351 2.307 2.266 2.105 1.990 1.835 1.660 1.447 1.020

Baseado em Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.

Page 210: Domingues 2005 - Estatística Aplicada as Ciências Militares

210

ANEXO H – VALORES CRÍTICOS DOS COEFICIENTES DE CORRELAÇÃO(TABELA r )

Nível de significância para teste caudal 0,05 0,025 0,01 0,005 0,0005 Nível de significância para teste bicaudal v (n – 2) 0,10 0,05 0,02 0,01 0,001

1 2 3 4 5

6 7 8 9

10

11 12 13 14 15

16 17 18 19 20

25 30 35 40 45

50 60 70 80 90

100

0,9877 0,9969 0,9995 0,9999 1,0000 0,9000 0,9500 0,9800 0,9900 0,9990 0,8054 0,8783 0,9343 0,9587 0,9912 0,7293 0,8114 0,8822 0,9172 0,9741 0,6694 0,7545 0,8329 0,8745 0,9507

0,6215 0,7067 0,7887 0,8343 0,9249 0,5822 0,6664 0,7498 0,7977 0,8982 0,5494 0,6319 0,7155 0,7646 0,8721 0,5214 0,6021 0,6851 0,7348 0,8471 0,4973 0,5760 0,6581 0,7079 0,8233

0,4762 0,5529 0,6339 0,6835 0,8010 0,4575 0,5324 0,6120 0,6614 0,7800 0,4409 0,5139 0,5923 0,6411 0,7603 0,4259 0,4973 0,5742 0,6226 0,7420 0,4124 0,4821 0,5577 0,6055 0,7246

0,4000 0,4683 0,5425 0,5897 0,7084 0,3887 0,4555 0,5285 0,5751 0,6932 0,3783 0,4438 0,5155 0,5614 0,6787 0,3687 0,4329 0,5034 0,5487 0,6652 0,3598 0,4227 0,4921 0,5368 0,6524

0,3233 0,3809 0,4451 0,4869 0,5974 0,2960 0,3494 0,4093 0,4487 0,5541 0,2746 0,3246 0,3810 0,4182 0,5189 0,2573 0,3044 0,3578 0,3932 0,4896 0,2428 0,2875 0,3384 0,3721 0,4648

0,2306 0,2732 0,3218 0,3541 0,4433 0,2108 0,2500 0,2948 0,3248 0,4078 0,1954 0,2319 0,2737 0,3017 0,3799 0,1829 0,2172 0,2565 0,2830 0,3568 0,1726 0,2050 0,2422 0,2673 0,3375 0,1638 0,1946 0,2301 0,2540 0,3211

Page 211: Domingues 2005 - Estatística Aplicada as Ciências Militares

211

ANEXO I – TABELA PARA TRANSFORMAÇÃO DE r PARA Z

r Z r Z r Z r Z r Z

0,000 0,000 0,200 0,203 0,400 0,424 0,600 0,693 0,800 1,099 0,005 0,005 0,205 0,208 0,405 0,430 0,605 0,701 0,805 1,113 0,010 0,010 0,210 0,213 0,410 0,436 0,610 0,709 0,810 1,127 0,015 0,015 0,215 0,218 0,415 0,442 0,615 0,717 0,815 1,142 0,020 0,020 0,220 0,224 0,420 0,448 0,620 0,725 0,820 1,157 0,025 0,025 0,225 0,229 0,425 0,454 0,625 0,733 0,825 1,172 0,030 0,030 0,230 0,234 0,430 0,460 0,630 0,741 0,830 1,188 0,035 0,035 0,235 0,239 0,435 0,466 0,635 0,750 0,835 1,204 0,040 0,040 0,240 0,245 0,440 0,472 0,640 0,758 0,840 1,221 0,045 0,045 0,245 0,250 0,445 0,478 0,645 0,767 0,845 1,238 0,050 0,050 0,250 0,255 0,450 0,485 0,650 0,775 0,850 1,256 0,055 0,055 0,255 0,261 0,455 0,491 0,655 0,784 0,855 1,274 0,060 0,060 0,260 0,266 0,460 0,497 0,660 0,793 0,860 1,293 0,065 0,065 0,265 0,271 0,465 0,504 0,665 0,802 0,865 1,313 0,070 0,070 0,270 0,277 0,470 0,510 0,670 0,811 0,870 1,333 0,075 0,075 0,275 0,282 0,475 0,517 0,675 0,720 0,875 1,354 0,080 0,080 0,280 0,288 0,480 0,523 0,680 0,829 0,880 1,376 0,085 0,085 0,285 0,293 0,485 0,530 0,685 0,838 0,885 1,398 0,090 0,090 0,290 0,299 0,490 0,536 0,690 0,848 0,890 1,422 0,095 0,095 0,295 0,304 0,495 0,543 0,695 0,858 0,895 1,447 0,100 0,100 0,300 0,310 0,500 0,549 0,700 0,867 0,900 1,472 0,105 0,105 0,305 0,315 0,505 0,556 0,705 0,877 0,905 1,499 0,110 0,110 0,310 0,321 0,510 0,563 0,710 0,887 0,910 1,528 0,115 0,116 0,315 0,326 0,515 0,570 0,715 0,897 0,915 1,557 0,120 0,121 0,320 0,332 0,520 0,576 0,720 0,908 0,920 1,589 0,125 0,126 0,425 0,337 0,525 0,583 0,725 0,918 0,925 1,623 0,130 0,131 0,330 0,343 0,530 0,590 0,730 0,929 0,930 1,658 0,135 0,136 0,335 0,348 0,535 0,597 0,735 0,940 0,935 1,697 0,140 0,141 0,340 0,354 0,540 0,604 0,740 0,950 0,940 1,738 0,145 0,146 0,345 0,360 0,545 0,611 0,745 0,962 0,945 1,783 0,150 0,151 0,350 0,365 0,550 0,618 0,750 0,973 0,950 1,832 0,155 0,156 0,355 0,371 0,555 0,626 0,755 0,984 0,955 1,886 0,600 0,161 0,360 0,377 0,560 0,633 0,760 0,996 0,960 1,946 0,165 0,167 0,365 0,383 0,565 0,640 0,765 1,008 0,965 2,014 0,170 0,172 0,370 0,388 0,570 0,648 0,770 1,020 0,970 2,092 0,175 0,177 0,375 0,394 0,575 0,655 0,775 1,033 0,975 2,185 0,180 0,182 0,380 0,400 0,580 0,662 0,780 1,045 0,980 2,298 0,185 0,187 0,385 0,406 0,585 0,670 0,785 1,058 0,985 2,443 0,190 0,192 0,390 0,412 0,590 0,678 0,790 1,071 0,990 2,647 0,195 0,198 0,395 0,418 0,595 0,685 0,795 1,085 0,995 2,994

Page 212: Domingues 2005 - Estatística Aplicada as Ciências Militares

212

ANEXO J – DISTRIBUIÇÃO QUI-QUADRADO [1-40]

� v

0.995 0.975 0.9 0.5 0.1 0.05 0.025 0.01 0.005 0.001

1 0.000 0.001 0.016 0.455 2.706 3.841 5.024 6.635 7.879 10.827 2 0.010 0.051 0.211 1.386 4.605 5.991 7.378 9.210 10.597 13.815 3 0.072 0.216 0.584 2.366 6.251 7.815 9.348 11.345 12.838 16.266 4 0.207 0.484 1.064 3.357 7.779 9.488 11.143 13.277 14.860 18.466 5 0.412 0.831 1.610 4.351 9.236 11.070 12.832 15.086 16.750 20.515 6 0.676 1.237 2.204 5.348 10.645 12.592 14.449 16.812 18.548 22.457 7 0.989 1.690 2.833 6.346 12.017 14.067 16.013 18.475 20.278 24.321 8 1.344 2.180 3.490 7.344 13.362 15.507 17.535 20.090 21.955 26.124 9 1.735 2.700 4.168 8.343 14.684 16.919 19.023 21.666 23.589 27.877

10 2.156 3.247 4.865 9.342 15.987 18.307 20.483 23.209 25.188 29.588 11 2.603 3.816 5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264 12 3.074 4.404 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909 13 3.565 5.009 7.041 12.340 19.812 22.362 24.736 27.688 29.819 34.527 14 4.075 5.629 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124 15 4.601 6.262 8.547 14.339 22.307 24.996 27.488 30.578 32.801 37.698 16 5.142 6.908 9.312 15.338 23.542 26.296 28.845 32.000 34.267 39.252 17 5.697 7.564 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791 18 6.265 8.231 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312 19 6.844 8.907 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819 20 7.434 9.591 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314 21 8.034 10.283 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796 22 8.643 10.982 14.041 21.337 30.813 33.924 36.781 40.289 42.796 48.268 23 9.260 11.689 14.848 22.337 32.007 35.172 38.076 41.638 44.181 49.728 24 9.886 12.401 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179 25 10.520 13.120 16.473 24.337 34.382 37.652 40.646 44.314 46.928 52.619 26 11.160 13.844 17.292 25.336 35.563 38.885 41.923 45.642 48.290 54.051 27 11.808 14.573 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475 28 12.461 15.308 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892 29 13.121 16.047 19.768 28.336 39.087 42.557 45.722 49.588 52.335 58.301 30 13.787 16.791 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702 31 14.458 17.539 21.434 30.336 41.422 44.985 48.232 52.191 55.002 61.098 32 15.134 18.291 22.271 31.336 42.585 46.194 49.480 53.486 56.328 62.487 33 15.815 19.047 23.110 32.336 43.745 47.400 50.725 54.775 57.648 63.869 34 16.501 19.806 23.952 33.336 44.903 48.602 51.966 56.061 58.964 65.247 35 17.192 20.569 24.797 34.336 46.059 49.802 53.203 57.342 60.275 66.619 36 17.887 21.336 25.643 35.336 47.212 50.998 54.437 58.619 61.581 67.985 37 18.586 22.106 26.492 36.336 48.363 52.192 55.668 59.893 62.883 69.348 38 19.289 22.878 27.343 37.335 49.513 53.384 56.895 61.162 64.181 70.704 39 19.996 23.654 28.196 38.335 50.660 54.572 58.120 62.428 65.475 72.055 40 20.707 24.433 29.051 39.335 51.805 55.758 59.342 63.691 66.766 73.403

Page 213: Domingues 2005 - Estatística Aplicada as Ciências Militares

213

Continuação do ANEXO J – DISTRIBUIÇÃO QUI-QUADRADO [41-80]

� v

0.995 0.975 0.9 0.5 0.1 0.05 0.025 0.01 0.005 0.001

41 21.421 25.215 29.907 40.335 52.949 56.942 60.561 64.950 68.053 74.744 42 22.138 25.999 30.765 41.335 54.090 58.124 61.777 66.206 69.336 76.084 43 22.860 26.785 31.625 42.335 55.230 59.304 62.990 67.459 70.616 77.418 44 23.584 27.575 32.487 43.335 56.369 60.481 64.201 68.710 71.892 78.749 45 24.311 28.366 33.350 44.335 57.505 61.656 65.410 69.957 73.166 80.078 46 25.041 29.160 34.215 45.335 58.641 62.830 66.616 71.201 74.437 81.400 47 25.775 29.956 35.081 46.335 59.774 64.001 67.821 72.443 75.704 82.720 48 26.511 30.754 35.949 47.335 60.907 65.171 69.023 73.683 76.969 84.037 49 27.249 31.555 36.818 48.335 62.038 66.339 70.222 74.919 78.231 85.350 50 27.991 32.357 37.689 49.335 63.167 67.505 71.420 76.154 79.490 86.660 51 28.735 33.162 38.560 50.335 64.295 68.669 72.616 77.386 80.746 87.967 52 29.481 33.968 39.433 51.335 65.422 69.832 73.810 78.616 82.001 89.272 53 30.230 34.776 40.308 52.335 66.548 70.993 75.002 79.843 83.253 90.573 54 30.981 35.586 41.183 53.335 67.673 72.153 76.192 81.069 84.502 91.871 55 31.735 36.398 42.060 54.335 68.796 73.311 77.380 82.292 85.749 93.167 56 32.491 37.212 42.937 55.335 69.919 74.468 78.567 83.514 86.994 94.462 57 33.248 38.027 43.816 56.335 71.040 75.624 79.752 84.733 88.237 95.750 58 34.008 38.844 44.696 57.335 72.160 76.778 80.936 85.950 89.477 97.038 59 34.770 39.662 45.577 58.335 73.279 77.930 82.117 87.166 90.715 98.324 60 35.534 40.482 46.459 59.335 74.397 79.082 83.298 88.379 91.952 99.608 61 36.300 41.303 47.342 60.335 75.514 80.232 84.476 89.591 93.186 100.887 62 37.068 42.126 48.226 61.335 76.630 81.381 85.654 90.802 94.419 102.165 63 37.838 42.950 49.111 62.335 77.745 82.529 86.830 92.010 95.649 103.442 64 38.610 43.776 49.996 63.335 78.860 83.675 88.004 93.217 96.878 104.717 65 39.383 44.603 50.883 64.335 79.973 84.821 89.177 94.422 98.105 105.988 66 40.158 45.431 51.770 65.335 81.085 85.965 90.349 95.626 99.330 107.257 67 40.935 46.261 52.659 66.335 82.197 87.108 91.519 96.828 100.554 108.525 68 41.714 47.092 53.548 67.335 83.308 88.250 92.688 98.028 101.776 109.793 69 42.493 47.924 54.438 68.334 84.418 89.391 93.856 99.227 102.996 111.055 70 43.275 48.758 55.329 69.334 85.527 90.531 95.023 100.425 104.215 112.317 71 44.058 49.592 56.221 70.334 86.635 91.670 96.189 101.621 105.432 113.577 72 44.843 50.428 57.113 71.334 87.743 92.808 97.353 102.816 106.647 114.834 73 45.629 51.265 58.006 72.334 88.850 93.945 98.516 104.010 107.862 116.092 74 46.417 52.103 58.900 73.334 89.956 95.081 99.678 105.202 109.074 117.347 75 47.206 52.942 59.795 74.334 91.061 96.217 100.839 106.393 110.285 118.599 76 47.996 53.782 60.690 75.334 92.166 97.351 101.999 107.582 111.495 119.850 77 48.788 54.623 61.586 76.334 93.270 98.484 103.158 108.771 112.704 121.101 78 49.581 55.466 62.483 77.334 94.374 99.617 104.316 109.958 113.911 122.347 79 50.376 56.309 63.380 78.334 95.476 100.749 105.473 111.144 115.116 123.595 80 51.172 57.153 64.278 79.334 96.578 101.879 106.629 112.329 116.321 124.839

Page 214: Domingues 2005 - Estatística Aplicada as Ciências Militares

214

Continuação do ANEXO J – DISTRIBUIÇÃO QUI-QUADRADO [81-120]

� v

0.995 0.975 0.9 0.5 0.1 0.05 0.025 0.01 0.005 0.001

81 51.969 57.998 65.176 80.334 97.680 103.010 107.783 113.512 117.524 126.084 82 52.767 58.845 66.076 81.334 98.780 104.139 108.937 114.695 118.726 127.324 83 53.567 59.692 66.976 82.334 99.880 105.267 110.090 115.876 119.927 128.565 84 54.368 60.540 67.876 83.334 100.980 106.395 111.242 117.057 121.126 129.802 85 55.170 61.389 68.777 84.334 102.079 107.522 112.393 118.236 122.324 131.043 86 55.973 62.239 69.679 85.334 103.177 108.648 113.544 119.414 123.522 132.276 87 56.777 63.089 70.581 86.334 104.275 109.773 114.693 120.591 124.718 133.511 88 57.582 63.941 71.484 87.334 105.372 110.898 115.841 121.767 125.912 134.746 89 58.389 64.793 72.387 88.334 106.469 112.022 116.989 122.942 127.106 135.977 90 59.196 65.647 73.291 89.334 107.565 113.145 118.136 124.116 128.299 137.208 91 60.005 66.501 74.196 90.334 108.661 114.268 119.282 125.289 129.490 138.437 92 60.815 67.356 75.100 91.334 109.756 115.390 120.427 126.462 130.681 139.667 93 61.625 68.211 76.006 92.334 110.850 116.511 121.571 127.633 131.871 140.894 94 62.437 69.068 76.912 93.334 111.944 117.632 122.715 128.803 133.059 142.118 95 63.250 69.925 77.818 94.334 113.038 118.752 123.858 129.973 134.247 143.343 96 64.063 70.783 78.725 95.334 114.131 119.871 125.000 131.141 135.433 144.566 97 64.878 71.642 79.633 96.334 115.223 120.990 126.141 132.309 136.619 145.789 98 65.693 72.501 80.541 97.334 116.315 122.108 127.282 133.476 137.803 147.009 99 66.510 73.361 81.449 98.334 117.407 123.225 128.422 134.641 138.987 148.230

100 67.328 74.222 82.358 99.334 118.498 124.342 129.561 135.807 140.170 149.449 101 68.146 75.084 83.267 100.334 119.589 125.458 130.700 136.971 141.351 150.666 102 68.965 75.946 84.177 101.334 120.679 126.574 131.838 138.134 142.532 151.884 103 69.785 76.809 85.087 102.334 121.769 127.689 132.975 139.297 143.712 153.100 104 70.606 77.672 85.998 103.334 122.858 128.804 134.111 140.459 144.891 154.314 105 71.428 78.536 86.909 104.334 123.947 129.918 135.247 141.620 146.069 155.527 106 72.251 79.401 87.821 105.334 125.035 131.031 136.382 142.780 147.247 156.740 107 73.074 80.267 88.733 106.334 126.123 132.144 137.517 143.940 148.424 157.950 108 73.899 81.133 89.645 107.334 127.211 133.257 138.651 145.099 149.599 159.164 109 74.724 82.000 90.558 108.334 128.298 134.369 139.784 146.257 150.774 160.371 110 75.550 82.867 91.471 109.334 129.385 135.480 140.916 147.414 151.948 161.582 111 76.377 83.735 92.385 110.334 130.472 136.591 142.049 148.571 153.121 162.787 112 77.204 84.604 93.299 111.334 131.558 137.701 143.180 149.727 154.295 163.995 113 78.033 85.473 94.213 112.334 132.643 138.811 144.311 150.882 155.467 165.202 114 78.862 86.342 95.128 113.334 133.729 139.921 145.441 152.037 156.637 166.406 115 79.691 87.213 96.043 114.334 134.813 141.030 146.571 153.190 157.808 167.609 116 80.522 88.084 96.958 115.334 135.898 142.138 147.700 154.344 158.977 168.813 117 81.353 88.955 97.874 116.334 136.982 143.246 148.829 155.497 160.146 170.014 118 82.185 89.827 98.790 117.334 138.066 144.354 149.957 156.648 161.314 171.216 119 83.018 90.700 99.707 118.334 139.149 145.461 151.084 157.799 162.481 172.417 120 83.852 91.573 100.624 119.334 140.233 146.567 152.211 158.950 163.648 173.618

Page 215: Domingues 2005 - Estatística Aplicada as Ciências Militares

215

ANEXO L - TABELA PARA O TESTE MANN-WHITNEY (PEQUENAS AMOSTRAS)

Rejeita-se H0 se a soma dos postos de alguma das amostras estiver fora dos intervalos abaixo.

Modificado de B. Rosner. Fundamentals of Biostatistics. Duxbury Press (4th ed), Belmont, 1995.

Valores críticos bi-caudais para o teste de soma de postos

Page 216: Domingues 2005 - Estatística Aplicada as Ciências Militares

216

Continuação do ANEXO L - TABELA PARA O TESTE MANN-WHITNEY (PEQUENAS AMOSTRAS)

Rejeita-se H0 se a soma dos postos de alguma das amostras estiver fora dos intervalos abaixo.

Modificado de B. Rosner. Fundamentals of Biostatistics. Duxbury Press (4th ed), Belmont, 1995.

Valores críticos uni-caudais para o teste de soma de postos

Page 217: Domingues 2005 - Estatística Aplicada as Ciências Militares

217

ANEXO M - TABELA W (PEQUENAS AMOSTRAS)

Valores críticos bi-caudais para o teste de Wilcoxon

Rejeição de H0 para R- ou R+ fora do intervalo dado pelos valores delimitados entre Inferior e Superior

0,1

0,05

0,02

0,01

número de pares com diferenças não-nulas

Inferior Superior Inferior Superior Inferior Superior Inferior Superior

1 2 3 4 5 0 15 6 2 19 0 21 7 3 25 2 26 0 28 8 5 31 3 33 1 35 0 36 9 8 37 5 40 3 42 1 44

10 10 45 8 47 5 50 3 52 11 13 53 10 56 7 59 5 61 12 17 61 13 65 9 69 7 71 13 21 70 17 74 12 79 9 82 14 25 80 21 84 15 90 12 93 15 30 90 25 95 19 101 15 105

Modificado de B. Rosner. Fundamentals of Biostatistics. Duxbury Press (4th ed), Belmont,1995.

Page 218: Domingues 2005 - Estatística Aplicada as Ciências Militares

218

Page 219: Domingues 2005 - Estatística Aplicada as Ciências Militares

219

REFERÊNCIAS

ANDERSON, T.W. and SCLOVE, S.L. Introductory statistical analysis. Houghton Miffin Company, Boston, 1974. BEIGUELMAN, B. Curso prático de bioestatística. 5. ed. Ribeirão Preto: FUNPEC, 2002. BUSSAB, W. O., MORETIN, P. A. Estatística básica. 3. ed. São Paulo: Atual, 1986. CAMPBELL, R.C. Statistics for Biologists. 2nd edition. London, Canbridge University Press, 1974. CHACON, P. E. Curso breve de estatística. 2. ed. Universidad de Duesto, 1965. CLARKE, A. B., DISNEY, R. L. Probabilidade e processos estatísticos. Rio de Janeiro: LTC, 1979. COCHRAN, W. G. Técnicas de amostragem. Rio de Janeiro: Editora Fundo de Cultura, 1965. CONOVER, U.J. Practical Nonparametrical Statistics. New York, John Wiley & Sons, Inc., 1971. COSTA NETO, P.L. de O. Estatística. 2. ed. São Paulo, Edgard Blücher, 2002. CRESPO, A. A. Estatística fácil. 17. ed. São Paulo: Saraiva, 2001 DANIEL, U.U. Applied Nonparametrical Statistics. Boston, Houghton Mifflin Co., 1978. DANIEL, W.W. Bioestatística: A Foundation for Analysis in the Health Sciences. 2nd ed. New York, John Wiley & Sons. DUNN, O.J. Basic Statistics: a primer for the biomedical sciences. John Wiley & Sons, New York, 1964. EDWARDS, A. L. Statistical Methods. 2. ed. New York: Holt, Rinehart and Winston FISHER, F.E. Fundamental Statistical Concepts. Confield Press. San Francisco, 1973. FONSECA, J.S., MARTINS, G. A. Curso de estatística. 3. ed. São Paulo: Atlas, 1984. GATTÁS, R. R. Elementos de probabilidades e inferência. São Paulo: Atlas, 1978. GOES, L. A. C. Estatística: uma abordagem decisorial. São Paulo: Saraiva, 1940. v. 1. GUEDES, M.L.S.; GUEDES, J.S. Bioestatísca. Rio de Janeiro: Ao Livro Técnico S.A., 1988. GUERRA, J. G., DONAIRES, D. Estatística indutiva. 4. ed. São Paulo: LCT, 1990.

Page 220: Domingues 2005 - Estatística Aplicada as Ciências Militares

220

HOEL, P.G. Estatística elementar. 1a ed., 5a tiragem, Editora Atlas, São Paulo, 1981. HOLLANDER, M. Nonparametrical Statistics Methods. New York, John Wiley & Sons, 1973. KARMEL, P. H., POLASEK, M. Estatística geral e aplicada à economia. 2. ed. São Paulo: Atlas, 1976. MARTINS, G. A., DONAIRES, D. Princípios de estatística. 1. ed. São Paulo: Atlas, 1979. MEYER, P. L. Probabilidade: aplicações à estatística. LCT, 1969. PEARSON, E. S., HARTLEY, H. O. Biometrika tables for statisticians. Vol. 1, 3. ed. Londres: Cambridge University Press. SILVA, E. M., SILVA, E. M., GONÇALVES, V., MUROLO, A. C. Estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São Paulo: Atlas, 1997. v. 1. SPIEGEL, M. R. Estatística. 2. ed. São Paulo: McGraw – Hill, 1985. STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Harbra, 1981. RODRIGUES, P.C. Bioestatística. 2. ed. Aumentada. Niterói: EDUFF, 1993. ROHLF, F.J., SOKAL, R.R. Statistical Tables, 2nd ed., USA, 1981 THOMAS, J. R., NELSON, J. K. Métodos de pesquisa em atividade física. 3. ed. Porto Alegre: ARTMED, 2002. WONNACOTT, T. H., WONNACOTT, R. J. Estatística aplicada à economia e administração. Rio de Janeiro: LCT, 1981. ROSNER, B. Fundamentals of Biostatistics. Duxbury Press (4th ed), Belmont,1995. SIEGEL, S. Estatística não paramétrica para as ciências do comportamento. São Paulo, Editora McGraw-Hill do Brasil Ltda, 1979. SNEDECOR, G.W. and COCHRAN, W.G. Statistical methods. 6th ed. The Yowa State University Press, Ames, 1967. SPIEGEL, M.R. Estatística. 2a ed. Editora McGraw-Hill do Brasil Ltda, São Paulo, 1964. SPIEGEL, M.R. Probabilidade e Estatística. Editora McGraw-Hill do Brasil, São Paulo, 1977.