90270606 67773826 Apostila de Bioestatistica
-
Upload
pedro-henrique-veloso -
Category
Documents
-
view
400 -
download
13
Transcript of 90270606 67773826 Apostila de Bioestatistica
Bioestatística Profa Claudia M. G. G. Franchi
1
APOSTILA
DE
BIOESTATÍSTICA
Curso: Tecnologia em Radiologia Médica
Profa. Claudia Franchi
Bioestatística Profa Claudia M. G. G. Franchi
2
Sumário
1. Capítulo 1 – Noções Básicas ........................................................................................... 5 1.1. Variáveis ...................................................................................................................... 5
1.2. Apuração de Dados ..................................................................................................... 5
1.3. População e Amostra .................................................................................................. 6
1.4. Técnicas de Amostragem ............................................................................................ 6
1.4.1. Amostra Casual Simples ......................................................................................... 6
1.4.2. Amostra Sistemática ................................................................................................ 7
1.4.3. Amostra Estratificada .............................................................................................. 7
1.4.4. Amostra de Conveniência ........................................................................................ 8
1.5. Exercícios – Capítulo 1 ................................................................................................ 8
2. Capítulo 2 - Apresentação de Dados em Tabelas ....................................................... 10
2.1. Componentes das Tabelas ........................................................................................ 10
2.2. Tabelas de Contingência ........................................................................................... 11
2.3. Exercícios – Capítulo 2 .............................................................................................. 12
3. Capitulo 3 - Tabelas de Distribuição de Frequências ................................................... 13
3.1. Tabela primitiva ou dados brutos: .............................................................................. 13
3.1.1. ROL ....................................................................................................................... 13
3.2. Distribuição de frequência sem intervalos de classe .................................................. 13
3.3. Distribuição de frequência com intervalos de classe .................................................. 13
3.4. Exercícios – Capítulo 3 .............................................................................................. 17
4. Elementos de uma distribuição de frequência (com intervalos de classe) ................ 20
4.1. Classe ....................................................................................................................... 20
4.2. Limite superior e limite inferior da classe ................................................................... 20
4.3. Amplitude de classe ................................................................................................... 20
4.4. Amplitude total da distribuição ................................................................................... 20
4.5. Amplitude total da amostra (ROL) .............................................................................. 21
4.6. Ponto Médio de classe............................................................................................... 21
4.7. Exercícios – Capítulo 4 .............................................................................................. 21
5. GRÁFICOS ESTATÍSTICOS ............................................................................................ 24 5.1. Gráfico de Barras ....................................................................................................... 24
5.2. Gráfico de Colunas .................................................................................................... 25
5.3. Gráfico de Setores ..................................................................................................... 25
5.4. Gráfico de Linhas....................................................................................................... 26
5.5. Exercícios – Capítulo 5 .............................................................................................. 27
6. REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO ............................................... 28
6.1. Histograma ................................................................................................................ 28
6.2. Polígono de Frequências ........................................................................................... 28
6.3. Exercícios – Capítulo 6 .............................................................................................. 29
Bioestatística Profa Claudia M. G. G. Franchi
3
7. MEDIDAS DE POSIÇÃO .................................................................................................. 30
7.1. Introdução.................................................................................................................. 30
7.2. Média Aritmética: ................................................................................................... 30
7.2.1. Dados não agrupados ........................................................................................... 30
7.2.2. Desvio em relação à média: .................................................................................. 30
7.2.3. Propriedades da média aritmética ......................................................................... 31
7.2.4. Dados agrupados sem intervalo de classe ............................................................ 31
7.3. Exercícios – Capítulo 7 .............................................................................................. 32
7.3.1. Dados agrupados com intervalo de classe ............................................................ 33
7.4. Exercícios: ................................................................................................................. 34
7.5. MODA - Mo .............................................................................................................. 35
7.5.1. Dados não agrupados ........................................................................................... 35
7.5.2. Dados agrupados sem intervalo de classe ............................................................ 35
7.5.3. Dados agrupados com intervalo de classe ............................................................ 36
7.5.4. Cálculo da Moda: Método mais elaborado pela fórmula de CZUBER: ................... 36
7.6. Exercícios: ................................................................................................................. 37
7.7. MEDIANA ............................................................................................................ 38
7.7.1. Dados não agrupados ........................................................................................... 38
7.7.2. Dados agrupados .................................................................................................. 39
7.7.3. Dados Agrupados sem intervalo de classe ............................................................ 39
7.8. Exercícios: ................................................................................................................. 39
7.8.1. Dados Agrupados com intervalos de classe .......................................................... 41
7.9. Resolva: .................................................................................................................... 42
7.10. Exercícios – Capítulo 7 .............................................................................................. 43
8. Medidas de Dispersão ou de Variabilidade ................................................................... 47
8.1. Dispersão ou variabilidade ......................................................................................... 47
8.2. Amplitude Total .......................................................................................................... 48
8.2.1. Dados não agrupados ........................................................................................... 48
8.2.2. Dados agrupados sem intervalo de classe ............................................................ 48
8.2.3. Dados agrupados com intervalo de classe ............................................................ 49
8.3. Variância / Desvio padrão ...................................................................................... 49
8.3.1. Dados não agrupados ........................................................................................... 51
8.4. Resolva: .................................................................................................................... 51
8.4.1. Dados Agrupados sem intervalo de classe ............................................................ 52
8.5. Exercícios: ................................................................................................................. 53
8.5.1. Dados Agrupados com intervalo de classe ............................................................ 54
8.6. Exercícios: ................................................................................................................. 54
8.7. Coeficiente de Variação ............................................................................................. 55
8.8. Exercícios – Capítulo 8 .............................................................................................. 56
Bioestatística Profa Claudia M. G. G. Franchi
4
9. Bibliografia ...................................................................................................................... 58
Bioestatística Profa Claudia M. G. G. Franchi
5
1. CAPÍTULO 1 – NOÇÕES BÁSICAS
Nas áreas médicas, biológicas e engenharias, coletam-se dados de pessoas, de animais
experimentais e de fenômenos físicos e químicos. Interessam aos pesquisadores dessas áreas, dados
sobre mortalidade infantil, eficiência de medicamentos, incidência de doenças, causa de morte, etc. Os
dados referem-se a variáveis que são classificadas em Estatística, como qualitativas, ordinais e
quantitativas.
1.1. Variáveis
Em estatística, uma variável é um atributo mensurável que tipicamente varia entre indivíduos. As
variáveis são divididas em qualitativas e quantitativas.
Variável Quantitativa - São aquelas que são numericamente mensuráveis, por exemplo, a idade, a
altura, o peso. Estas ainda se subdividem em:
Variável Quantitativa Contínua: São aquelas que assumem valores dentro de um conjunto
contínuo, tipicamente os números reais. São exemplos, o peso ou a altura de uma pessoa.
Variável Quantitativa Discreta: São aquelas que assumem valores dentro de um tempo finito
ou enumerável, tipicamente números inteiros. Um exemplo é o número de filhos de uma pessoa.
Variável Qualitativa - São aquelas que se baseiam em qualidades e não podem ser mensuráveis
numericamente. Estas ainda se subdividem em:
Variável Qualitativa Ordinal: São aquelas que podem ser colocadas em ordem, por exemplo, a
classe social (A,B,C,D, ou E) e a variável "Peso" medida em 3 níveis (pouco pesados, pesados,
muito pesados). São variáveis qualitativas ordinais também, grau de instrução, status social,
estágio da doença.
Variável Qualitativa Nominal: São aquelas que não podem ser hierarquizadas ou ordenadas,
como a cor dos olhos, o local de nascimento, peso, altura.
1.2. Apuração de Dados
Os dados são registrados em fichas, com várias outras informações. Para obter apenas os
dados é preciso fazer uma apuração. Se a variável é qualitativa ou ordinal, a apuração resume-se a
simples contagem. Por exemplo, para obter o número de nascidos vivos de cada sexo, é preciso tomar
os prontuários e escrever numa folha de papel:
Feminino
Masculino
Depois, é preciso examinar os prontuários e fazer um traço, na linha correspondente a um dos
sexos, toda vez que o prontuário registrar que o nascido vivo é desse sexo. No exemplo, cada traço
representa um nascido vivo e cada quadrado, cortado pela diagonal, representa cinco nascidos vivos.
O total é dado pelo número de traços de cada linha.
Feminino - = 52
Masculino - = 48
Bioestatística Profa Claudia M. G. G. Franchi
6
Se a variável é quantitativa, a apuração consiste em anotar cada valor observado. Por exemplo,
para apurar dados de peso ao nascer, basta escrever os pesos, uma folha de papel. O número do
prontuário, escrito ao lado do peso ao nascer, facilita a posterior verificação da apuração. Veja o
exemplo:
Número do Prontuário Peso ao nascer
10.525 3,25
10.526 2,00
..... .....
..... .....
..... .....
10.624 3,20
1.3. População e Amostra
Entende-se por população, o conjunto de elementos que têm em comum, determinada
característica. Todo subconjunto não vazio e com menor numero de elementos do que a população
constitui uma amostra dessa população. As populações podem ser finitas, como o conjunto de alunos
de uma escola em determinado ano ou, infinitas, como o número de vezes que se pode jogar um dado.
Para certas finalidades, as populações finitas muito grandes são consideradas infinitas. Como
exemplo, considere as pessoas do sexo masculino com mais de 35 anos de idade, residentes na cidade
de São Paulo. O número dessas pessoas é matematicamente finito, mas tão grande que um registrador
ao analisar uma amostra de 500 pessoas, pode considerar a população como infinita. Os pesquisadores
trabalham com amostras, por vários motivos. Primeiro, é fato que as populações finitas só podem ser
estudadas através de amostras. Por exemplo, por maior que seja o número de vezes que uma pessoa
possa pesar um corpo sólido, o resultado será sempre uma amostra por que, teoricamente, todo corpo
pode ser pesado um número infinito de vezes.
Depois, as populações finitas muito grandes só podem ser estudadas através de amostras. Por
exemplo, o número de cobaias existentes no mundo em determinado período é, matematicamente,
finito, mas as pesquisas que usam cobaias só podem ser feitas com amostras, por que nenhum
pesquisador dispõe de todas as cobaias do mundo para o seu trabalho.
Finalmente, o estudo cuidadoso de uma amostra tem mais valor científico do que o estudo
sumário de toda a população. Por exemplo, para estudar o efeito do flúor sobre a prevenção de cáries
em crianças, é melhor submeter uma amostra de crianças a exames periódicos minuciosos, do que
examinar rapidamente todas as crianças antes, e determinado tempo após o uso do flúor.
1.4. Técnicas de Amostragem
Definida a população, é preciso estabelecer a técnica de amostragem, isto é, o procedimento
que será adotado para escolher os elementos que irão compor a amostra. Conforme a técnica utilizada,
tem-se um tipo de amostra.
1.4.1. Amostra Casual Simples
A amostra casual simples é composta por elementos retirados ao acaso da população. Então
todo elemento da população tem igual probabilidade de ser escolhido para a mostra. Um exemplo ajuda
a entender essa técnica de amostragem.
Bioestatística Profa Claudia M. G. G. Franchi
7
Imagine que um professor quer obter uma mostra casual simples dos alunos de sua escola.
Para isso, pode organizar um sorteio com fichas numeradas, de zero a nove. Para fazer o sorteio, o
professor retira uma ficha de uma urna e anota o número. Esse número será o primeiro dígito do
número do aluno que será sorteado para a amostra. Feito isso, o professor recoloca a ficha na urna,
mistura, retira outra ficha e anota o número, que será o segundo dígito do número do aluno que será
sorteado para a amostra. Esse procedimento deve ser repetido até que sejam retirados todos os dígitos
do número do aluno sorteado.
Se a escola tem, por exemplo, 832 alunos, os números dos alunos têm três dígitos. Para sortear
um aluno, é preciso retirar três fichas da urna, uma de cada vez, sempre lembrando que a ficha retirada
deve ser recolocada na urna antes de nova retirada. O número de um dos alunos sorteados poderia
ser, por exemplo, 377 assim obtido:
Primeira ficha: 3
Segunda ficha: 7
Terceira ficha: 7
É claro que devem ser desprezados números maiores do que 832 (se a escola tem 832 alunos,
nenhum aluno recebeu número maior do que 832), números que já foram sorteados e o número 000. O
professor sorteia tantos números quantos são os alunos que ele quer na amostra.
1.4.2. Amostra Sistemática
Na amostra sistemática, os elementos são escolhidos não por acaso, mas por um sistema. No
exemplo, o professor terá organizado uma amostra sistemática se, em lugar de sortear os alunos,
chamar para a amostra todo aluno com número terminado em determinado dígito. Veja o esquema
dado em seguida. O professor chamou, para a amostra, todos os alunos com números terminados em
zero, assinalados no esquema com asteriscos. Então organizou uma amostra sistemática.
No Nome N
o Nome N
o Nome
1 21 41
. . .
. . .
*10 *30 *50
. . .
. . .
*20 *40 *60
Quando a população está organizada, é mais fácil obter uma amostra sistemática do que uma
amostra casual simples. Por exemplo, para obter uma amostra de 2% dos prontuários dos pacientes de
uma clínica, é mais fácil pegar o último de cada 50 prontuários do que fazer um sorteio até conseguir
2% do total de prontuários.
As amostras sistemáticas são muito usadas, mas exigem especial preocupação com o sistema
de seleção. Por exemplo, se os elementos da população estão em fila, não se devem selecionar os
“primeiros”, ou os “últimos”, nem mesmo “os do meio”, é preciso percorrer toda a fila e escolher, por
exemplo, o décimo de cada grupo de dez.
1.4.3. Amostra Estratificada
A amostra estratificada é composta por elementos provenientes de todos os estratos da
população. No exemplo, se o professor considera que os alunos de diferentes séries apresentam reais
Bioestatística Profa Claudia M. G. G. Franchi
8
diferenças, cada série é um estrato. O professor deve então, obter uma amostra de cada série (estrato)
e depois reunir todas as amostras, em uma só. Essa amostra final é estratificada.
Devem ser obtidas amostras estratificadas sempre que a população for constituída por
diferentes estratos. Por exemplo, se as pessoas que residem nos vários bairros de uma cidade são
diferentes, cada bairro é um estrato. Para obter uma amostra de pessoas dessa cidade, seria razoável
obter uma amostra de cada bairro e depois reunir todas as informações numa amostra estratificada.
1.4.4. Amostra de Conveniência
A amostra de conveniência é formada por elementos que o pesquisador reuniu simplesmente
por que dispunha deles. Então, se o professor tomar os alunos de sua classe como amostra de toda a
escola, estará usando uma amostra de conveniência.
Os estatísticos têm muitas restrições ao uso de amostras de conveniência. Mesmo assim, as
amostras de conveniência são comuns na área de saúde, onde se fazem pesquisas com pacientes de
uma só clínica ou de um só hospital. Mais ainda, as amostras de conveniência constituem muitas vezes
a única maneira de estudar determinado problema.
De qualquer forma, o pesquisador que utiliza amostras de conveniência precisa de muito sendo
crítico. Os dados podem ser tendenciosos. Por exemplo, para estimar a probabilidade de morte por
desidratação não se deve recorrer aos dados de um hospital. Como só são internados os casos graves,
é possível que a mortalidade entre pacientes internados seja muito maior do que entre pacientes não
internados. Consequentemente, a amostra de conveniência – constituída, neste exemplo, por pacientes
internados no hospital – seria tendenciosa.
Finalmente, o pesquisador que trabalha com amostras sempre pretende fazer inferência, isto é,
estender os resultados da amostra para toda a população. Então é muito importante caracterizar bem a
amostra e estender os resultados obtidos na amostra apenas para a população de onde a amostra
proveio.
1.5. Exercícios – Capítulo 1
1. Os prontuários dos pacientes de um hospital estão organizados em um arquivo, por ordem
alfabética. Qual é a maneira mais rápida de amostrar 1/3 do total dos prontuários?
2. Um pesquisador trem dez gaiolas que contém cada uma, seis ratos. Como o pesquisador
pode solucionar dez ratos para a mostra?
3. Para levantar dados sobre o número de filhos por casal, em uma comunidade, um
pesquisador organizou um questionário que enviou, pelo correio, a todas as residências. A resposta ao
questionário era facultativa, pois o pesquisador não tinha condições de exigir a resposta. Nesse
questionário perguntava-se o número de filhos por casal morador na residência. Você acha que os
dados assim obtidos têm algum tipo de tendenciosidade?
4. Um pesquisador pretende levantar dados sobre o número de moradores por domicílio usando
a técnica de amostragem sistemática. Para isso, o pesquisador visitará cada domicílio selecionado. Se
nenhuma pessoa estiver presente na ocasião da visita, o pesquisador excluirá o domicílio da amostra.
Esta última determinação introduz tendenciosidade? Por quê?
5. Muitas pessoas acreditam que as famílias se tornaram menores. Suponha que, para estudar
essa questão, foi selecionada uma amostra de 2.000 casais e perguntou-se quantos filhos eles tinham,
quantos filhos tinham seus pais e quantos filhos tinham seus avós. O procedimento introduz
tendenciosidade nos dados? Por quê?
Bioestatística Profa Claudia M. G. G. Franchi
9
6. Dada uma população de 4 indivíduos, X, W, Y, Z, quantas amostras casuais simples de
tamanho 2 podem ser obtidas? Quais são essas amostras?
7. Dada uma população de 8 elementos, A, B, C, D, E, F, G, e H, descreva três formas
diferentes de obter uma amostra sistemática de 4 elementos.
8. Dada uma população de 40 alunos, descreva uma forma de obter uma amostra casual
simples de 6 alunos.
9. Organize uma lista com 10 nomes de pessoas em ordem alfabética. Depois escreva uma
forma de obter uma amostra sistemática de 5 indivíduos.
10. Em uma pesquisa de mercado para serviços odontológicos tomou-se a lista telefônica, onde
os nomes dos assinantes estão organizados em ordem alfabética do último sobrenome, e se amostrou
o décimo de cada 10 assinantes. Critique esse procedimento.
11. Classifique as variáveis em qualitativa (nominal ou ordinal) e quantitativa (discreta ou
contínua) e dê exemplo de um valor (numérico ou não numérico) para cada item.
a) Estado civil de uma pessoa: b) Marcas de carros em um estacionamento: c) Salário de um funcionário de uma empresa: d) Número de acidentes de trabalho em uma empresa: e) Cor dos cabelos das modelos de uma agencia de modelos: f) Cor dos olhos: g) Grau de instrução: h) Número de filhos de um casal: i) Peso e altura dos alunos de uma escola:
Bioestatística Profa Claudia M. G. G. Franchi
10
2. CAPÍTULO 2 - APRESENTAÇÃO DE DADOS EM TABELAS
Os dados devem ser apresentados em tabelas construídas de acordo com as normas técnicas
ditadas pela Fundação Instituto Brasileiro de Geografia e Estatística – IBGE.
2.1. Componentes das Tabelas
As tabelas têm título, corpo, cabeçalho e coluna indicadora. O título explica o que a tabela
contém. O corpo é formado pelas linhas e colunas de dados. O cabeçalho especifica conteúdo das
colunas, e a coluna indicadora especifica o conteúdo das linhas. Como exemplo, veja a tabela a seguir:
População brasileira residente, com 15 anos e mais,
segundo a alfabetização, de acordo com o senso demográfico de 1980
Alfabetização Frequência
Sabem ler e escrever 54.793.268
Não sabem ler e escrever 18.716.847
Sem declaração 31.828
Fonte: IBGE (1988)
Na tabela acima, observe o título:
População brasileira residente, com 15 anos e mais,
segundo a alfabetização, de acordo com o senso demográfico de 1980
O cabeçalho é constituído pelas palavras:
Alfabetização Frequência
A coluna indicadora é constituída pelas especificações:
Sabem ler e escrever
Não sabem ler e escrever
Sem declaração
O corpo da tabela é formado pelos números:
54.793.268
18.716.847
31.828
As tabelas podem apresentar, além das frequências, as frequências relativas e o total. Para
obter a frequência relativa de uma dada categoria, divide-se a frequência dessa categoria pela soma
das frequências. O resultado, multiplicado por 100, é uma porcentagem. O total da coluna é escrito
entre dois traços horizontais.
Bioestatística Profa Claudia M. G. G. Franchi
11
População brasileira residente, com 15 anos e mais,
segundo a alfabetização, de acordo com o senso demográfico de 1980
Alfabetização Frequência Frequência
Relativa
Sabem ler e escrever 54.793.268 74,51
Não sabem ler e escrever 18.716.847 25,45
Sem declaração 31.828 0,04
Total....................................................... 73.541.943 100,00
Fonte: IBGE (1988)
As tabelas podem conter fonte ou notas. A fonte dá indicação da entidade, ou do pesquisador,
ou dos pesquisadores que publicaram ou forneceram os dados. Como exemplo na tabela citada como
exemplo, a fonte é o IBGE, pois foi essa fundação que publicou os dados.
As notas devem esclarecer aspectos relevantes do levantamento dos dados ou da apuração.
Observe a tabela abaixo. A nota informa que só foram apurados nascimentos ocorridos no ano de
registro.
Nascidos vivos registrados segundo o ano do registro
Ano do Registro Frequência
1984 2.559.038
1985 2.619.604
1986 2.779.253
Fonte: IBGE (1988)
Nota: Nascimentos ocorridos no ano de registro
2.2. Tabelas de Contingência
Muitas vezes os elementos da amostra ou da população são classificados de acordo com dois
fatores. Os dados devem então ser apresentados em tabelas de contingência, isto é, em tabelas de
dupla entrada, cada entrada relativa a um dos fatores. Como exemplo, veja a tabela abaixo que
representa o número de nascidos vivos registrados. Note que eles estão classificados segundo dois
fatores: o ano de registro e o sexo.
Nascidos vivos registrados segundo o ano de registro e o sexo
Ano de
Registro
Sexo
Total
Masculino Feminino
1984 1.307.758 1.251.280 2.559.038
1985 1.339.059 1.280.545 2.619.604
1986 1.418.050 1.361.203 2.779.253
Fonte: IBGE (1988)
Nota: Nascimentos ocorridos no ano de registro
As tabelas de contingência podem apresentar frequências relativas, além de frequências
simples. As frequências relativas dão estimativas de riscos, isto é, dão estimativas de probabilidades de
dano. Veja o exemplo abaixo:
Bioestatística Profa Claudia M. G. G. Franchi
12
Recém-nascidos Segundo a Época do Ataque de Rubéola na Gestante e a
Condição de Normal ou Defeituoso
Época do ataque
Condição
Total
Frequência
Relativa de
defeituosos
Normal Defeituoso
Até o 3º mês 36 14 50 28,0%
Depois do 3º
mês
51 3 54 5,6%
Fonte: HILL et all. (1958)
As frequências relativas apresentadas na tabela acima estimam o risco de um recém-nascido
ser defeituoso em função da época em que a gestante foi atacada de rubéola. Note que a frequência
relativa de defeituosos (risco) é maior quando a gestante foi atacada de rubéola no primeiro trimestre da
gestação. Diz-se então que a época do ataque de rubéola é um fator de risco na ocorrência de recém-
nascidos defeituosos.
2.3. Exercícios – Capítulo 2
1. Faça uma pesquisa sobre os dados dos seus colegas de sala e monte tabelas com as seguintes
variáveis:
a. Idade
b. Sexo
c. Cidade de Residência
d. Idade
e. Número de Filhos
f. Estado Civil
g. Número de Irmãos
Bioestatística Profa Claudia M. G. G. Franchi
13
3. CAPITULO 3 - TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS
É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições
de seus valores).
3.1. Tabela primitiva ou dados brutos:
É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil
formarmos uma ideia exata do comportamento do grupo como um todo, a partir de dados não
ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
3.1.1. ROL
É a tabela obtida após a ordenação dos dados (crescente ou decrescente).
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
3.2. Distribuição de frequência sem intervalos de classe
É a simples condensação dos dados conforme as repetições de seu valores. Para um ROL de
tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Veja
exemplo abaixo:
Dados Frequência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20
3.3. Distribuição de frequência com intervalos de classe
Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores
em vários intervalos de classe.
Bioestatística Profa Claudia M. G. G. Franchi
14
Classes Frequências
41 45 7
45 49 3
49 53 4
53 57 1
57 61 5
Total 20
As tabelas com grande número de dados são cansativas e não dão ao leitor visão rápida e
global do fenômeno. Para isso, é preciso que os dados estejam organizados em uma tabela de
distribuição de frequências. A partir de agora, explicaremos passo a passo, a construção desse tipo
de tabela usando, como exemplo os dados na tabela Peso ao nascer de nascidos vivos em
quilogramas.
Imagine que, para dar uma ideia sobre o peso ao nascer de nascidos vivos, o pesquisador irá
apresentar não os pesos observados, mas o número de nascidos vivos por faixas de peso. Deve,
então, construir uma tabela de distribuição de frequências.
Peso ao nascer de nascidos vivos, em quilogramas
2.522 3.200 1.900 4.100 4.600 3.400
2.720 3.720 3.600 2.400 1.720 3.400
3.125 2.800 3.200 2.700 2.750 1.570
2.250 2.900 3.300 2.450 4.200 3.800
3.220 2.950 2.900 3.400 2.100 2.700
3.000 2.480 2.500 2.400 4.450 2.900
3.725 3.800 3.600 3.120 2.900 3.700
2.890 2.500 2.500 3.400 2.920 2.120
3.110 3.550 2.300 3.200 2.720 3.150
3.520 3.000 2.950 2.700 2.900 2.400
3.100 4.100 3.000 3.150 2.000 3.450
3.200 3.200 3.750 2.800 2.720 3.120
2.780 3.450 3.150 2.700 2.480 2.120
3.155 3.100 3.200 3.300 3.900 2.450
2.150 3.150 2.500 3.200 2.500 2.700
3.300 2.800 2.900 3.200 2.480 .......
3.250 2.900 3.200 2.800 2.450 .......
Primeiro, é preciso definir as faixas de peso que recebem tecnicamente o nome de classes.
Observe os dados apresentados na tabela acima. O menor valor é de 1.570 Kg e o maior é de 4.600
Kg. Podem então ser definidas classes de 1,5 a 2,0 Kg, de 2,0 a 2,5 Kg, e assim por diante, como
mostra o esquema dado a seguir:
1,5 2,0
Bioestatística Profa Claudia M. G. G. Franchi
15
2,0 2,5
2,5 3,0
3,0 3,5
3,5 4,0
4,0 4,5
4,5 5,0
Na classe de 1,5 a menos de 2,0 Kg são colocados desde nascidos com 1,5 Kg até os que
nasceram com 1.999 Kg; na classe de 2,0 a menos de 2,5 Kg, são colocados desde nascidos com 2,0
Kg até os que nasceram com 2,499 Kg, e assim por diante. Logo, cada classe cobre um intervalo de 0,5
Kg, ou seja, cada intervalo de classe é de 0,5 Kg. É mais fácil trabalhar com intervalos de classe
iguais. As distribuições das frequências, obtidas a partir da tabela do Peso ao nascer de nascidos vivos,
em quilogramas, é dada a seguir:
Classe Frequência
1,5 2,0 = 3
2,0 2,5 = 16
2,5 3,0 = 31
3,0 3,5 = 34
3,5 4,0 = 11
4,0 4,5 = 4
4,5 5,0 = 1
Denominam-se extremos de classe os limites dos intervalos de classe. Deve ficar muito claro se os
valores iguais aos extremos devem ou não ser incluídos na classe. Recomenda-se adotar a notação 1,5
2,0, 2,0 2,5 etc. Isto significa que o intervalo „e fechado à esquerda, isto é, pertencem à classe os
valores iguais ao extremo inferior (por exemplo, 1,5 na primeira classe). Também significa que o
intervalo é fechado à direita, isto é, não pertencem à classe os valores iguais ao extremo superior (por
exemplo, 2,0 na primeira classe).
Bioestatística Profa Claudia M. G. G. Franchi
16
Numa tabela de distribuição de frequências também podem ser apresentados os pontos médios
da classe. O ponto médio é dado pela soma dos extremos da classe, dividia por 2. Para a classe 1,5
2,0, o ponto médio é:
Uma tabela típica de distribuição de frequências tem então, três colunas: a da esquerda, onde
estão escritas as classes; a do meio, onde estão escritos os pontos médios; e a da direita, onde estão
escritas as frequências, isto é, o numero de elementos de cada classe. Veja a tabela a seguir:
Nascidos vivos segundo o peso ao nascer, em quilogramas
Classe Ponto Médio Frequência
1,5 2,0 1,75 3
2,0 2,5 2,25 16
2,5 3,0 2,75 31
3,0 3,5 3,25 34
3,5 4,0 3,75 11
4,0 4,5 4,25 4
4,5 5,0 4,75 1
Nem sempre estarão definidos o extremo inferior da primeira classe ou o extremo superior da
última classe. Observa a tabela abaixo. O extremo superior da última classe não esta definido. Esta
tabela também exemplifica o uso de intervalos de classe diferentes.
Mulheres com 30 anos de Idade Segundo a Pressão Sanguínea
Sistólica, em Milímetros de Mercúrio
Classe Ponto Médio Frequência
90 100 95 6
100 105 102,5 11
105 110 107,5 12
110 115 112,5 17
115 120 117,5 18
120 125 122,5 11
125 130 127,5 9
130 135 132,5 6
135 140 137,5 4
Bioestatística Profa Claudia M. G. G. Franchi
17
140 150 145 4
150 160 155 1
160 e mais ... 1
As tabelas de distribuição de frequências mostram a distribuição da variável, mas perdem em
exatidão. Isso porque todos os dados passam a ser representados pelo ponto médio da classe a que
pertencem. Por exemplo, a tabela acima mostra que seis mulheres apresentaram pressão sanguínea
sistólica com o ponto médio igual a 95, mas não d‟a informação exata sobre a pressão de cada uma
delas.
O numero de classes deve ser escolhido pelo pesquisador, em função do que ele quer mostrar.
Em geral, convém estabelecer de 5 a 20 classes. Se o numero de classes for demasiado pequeno (por
exemplo, 3) perde-se muita informação. Se o numero de classes for grande (por exemplo, 30) tem-se
pormenores desnecessários. Mas não existe um numero “ideal” de classes, embora existam até
formulas para estabelecer quantas classes devem ser construídas. Uma dessas fórmulas „e a seguinte:
Onde n é o número de dados. O número de classes é um inteiro próximo de k. Para entender
como se aplica esta fórmula, veja a tabela peso ao nascer dos nascidos vivos, como n=100, tem-se que:
ou seja, deveriam ter sido construídas 7 ou 8 classes.
É importante deixar claro, aqui, que o resultado obtido por esta formula pode ser usado como
referencia, mas cabe ao pesquisador determinar o numero de classes que pretende organizar.
Finalmente, quando se constrói uma tabela de distribuição de frequências, é melhor usar, como
extremos de classes, números fáceis de trabalhar. No caso do peso ao nascer dos nascidos vivos,
foram definidas 7 classes e foram estabelecidos extremos com valores fáceis, como 1,5 e 2,0.
3.4. Exercícios – Capítulo 3
1. De acordo com o IBGE (1988), a distribuição dos suicídios ocorridos no Brasil em 1986,
segundo a causa atribuída foi a seguinte: 263 por alcoolismo, 198 por dificuldade financeira, 700 por
doença mental, 189 por outro tipo de doença, 416 por desilusão amorosa e 217 por outras causas.
Apresente essa distribuição em uma tabela.
2. Construa uma tabela de distribuição de frequências para apresentar os dados da tabela
abaixo, apresente também as frequências relativas:
Pressão arterial, em milímetros de mercúrio, de cães adultos
anestesiados e após laparotomia
130,0 105,0 120,0 111,5 99,0 116,0 82,5
107,5 125,0 100,0 107,5 120,0 143,0 115,0
135,0 130,0 135,0 127,5 90,5 104,5 136,5
100,0 145,0 125,0 104,5 101,5 102,5 101,5
134,5 158,5 110,0 102,5 90,5 107,5 124,0
Bioestatística Profa Claudia M. G. G. Franchi
18
121,5 135,0 102,0 119,5 115,5 125,5 117,5
107,5 140,0 121,5 107,5 113,0 93,0 103,5
3. De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de Trânsito, 27.306 casos
de vitimas fatais, assim distribuídos: 11.712 pedestres, 7.116 passageiros e 8.478 condutores. Faça
uma tabela para apresentar esses dados. Apresente também as frequências relativas e o total.
4. De posse da tabela abaixo, calcule as frequências relativas de não sobreviventes.
Pacientes com câncer de mama segundo a faixa de idade por ocasião
Do diagnostico e sobrevivência por três anos
Sobrevivência
Faixa de idade Sim Não
Menor de 50 anos 11 6
De 50 a 70 anos 18 8
Mais de 70 anos 15 9
Fonte: MORRISON (1973)
5. De posse da tabela abaixo, calcule as frequências relativas em cada linha, isto „e, calcule a
proporção de estabelecimentos de saúde, públicos e particulares, de cada espécie.
Estabelecimentos de saúde, públicos e particulares
Por espécie. Brasil, 1985.
Estabelecimentos
Faixa de idade Públicos Particulares
Hospital 1.002 5.132
Pronto-socorro 150 156
Policlínicas 1.531 6.136
Outros 14.393 472
Fonte: IBGE (1988)
6. Construa uma tabela de distribuição de frequências para apresentar os dados da tabela
abaixo usando intervalos de classes iguais. Depois faça outra tabela, com os seguintes intervalos: 1 dia,
2 ou 3 dias, de 4 a 7 dias, de 8 a 14 dias, mais de 14 dias.
Tempo de internação, em dias, de pacientes acidentados
no trabalho, em um dado hospital
7 8 1 7 13 6
12 12 3 17 4 2
4 15 2 14 3 5
10 8 9 8 5 3
2 7 14 12 10 8
1 6 4 7 7 11
7. Ao nascer, os bebês são pesados e medidos, para saber se estão dentro das tabelas de peso
e altura esperados. Estas duas variáveis são:
a) qualitativas
b) ambas discretas
Bioestatística Profa Claudia M. G. G. Franchi
19
c) ambas contínuas
d) contínuas e discretas
e) discreta e contínua
8. A parcela da população convenientemente escolhida para representa-la é chamada de:
a) variável
b) rol
c) amostra
d) dados brutos
e) nada podemos afirmar, porque a informação é incompleta
9. Um conjunto de 100 notas de matemática, de alunos do sexo masculino, tiradas dos arquivos
da secretaria da escola, constitui:
a) um rol
b) uma tabela
c) uma relação de dados brutos
d) uma distribuição de frequência
10. Por definição, rol é qualquer série ordenada de valores referentes a uma mesma
variável. Então, dadas as séries da mesma variável x:
I. –2, 4, 5, 6, 7
II. 1, 3, 3, 6, 7
III. 8, 7, 5, 2, 1
IV. 5, 4, 4, -1
Podemos afirmar que:
a) todas elas constituem róis
b) só a série I constitui um rol
c) a série II não é um rol, mas as outras sim
d) apenas as séries I e IV não são róis
e) somente a série III é um rol, as demais não
Bioestatística Profa Claudia M. G. G. Franchi
20
4. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA (COM INTERVALOS
DE CLASSE)
Classe Ponto Médio Frequência
1,5 2,0 1,75 3
2,0 2,5 2,25 16
2,5 3,0 2,75 31
3,0 3,5 3,25 34
3,5 4,0 3,75 11
4,0 4,5 4,25 4
4,5 5,0 4,75 1
4.1. Classe
São os intervalos de variação da variável e é simbolizada por i e o número total de classes
simbolizada por k. Exemplo, na tabela acima, K=7 e 2,5 3,0 é a terceira classe, onde i=3.
4.2. Limite superior e limite inferior da classe
São os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior
número é o limite superior ( Li ) da classe. Exemplo, em 2,5 3,0 l3=2,5 e L3=3,0. O símbolo
representa um intervalo fechado à esquerda e aberto à direita. O dado 3,0 do ROL não pertence à
classe 3 e sim a classe 4 representada por 3,0 3,5.
4.3. Amplitude de classe
É obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por
. Exemplo, na tabela acima, na classe k=1, hi = 2,0 - 1,5 = 0,5.
4.4. Amplitude total da distribuição
É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT =
L(max) - l(min). Ex: na tabela anterior AT = 5,0–1,5 = 3,5.
Bioestatística Profa Claudia M. G. G. Franchi
21
4.5. Amplitude total da amostra (ROL)
É a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = Xmax - Xmin.
Em nosso exemplo AA = 4.600–1.570 = 3.030. (AT sempre será maior que AA).
4.6. Ponto Médio de classe
É o ponto que divide o intervalo de classe em duas partes iguais. Exemplo, em 2,0 2,5, o
ponto médio x3= (2,0+2,5)/2= 2,25.
4.7. Exercícios – Capítulo 4
1. A tabela abaixo apresenta a distribuição de frequência dos salários mensais em reais, de 65
empregados da companhia P & R.
1 5.000 ⊢ 6.000 8
2 6.000 ⊢ 7.000 10
3 7.000 ⊢ 8.000 16
4 8.000 ⊢ 9.000 14
5 9.000 ⊢ 10.000 10
6 10.000 ⊢ 11.000 5
7 11.000 ⊢ 12.000 2
Total ............................................ 65
Determinar:
a) A amplitude Total;
b) O limite superior da quinta classe
c) O limite inferior da sexta classe;
d) A amplitude do quinto intervalo de classe;
e) A classe do 40º empregado;
f) A percentagem de empregados cuja renda ultrapassa R$10.000,00 por mês;
g) A percentagem de empregados que ganham menos de R$8.000,00 por mês;
h) A percentagem de empregados que ganham menos de R$10.000,00 e pelo menos R$6.000,00
por mês;
2. A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes:
Áreas (m
2)
300
⊢
400
⊢
500
⊢
600
⊢
700
⊢
800
⊢
900
⊢
1000
⊢
1100
⊢
1200
No
de Lotes
14 46 58 76 68 62 48 22 6
Com referência a essa tabela, determine:
a) A amplitude total.
Bioestatística Profa Claudia M. G. G. Franchi
22
b) O limite superior da quinta classe.
c) O limite inferior da oitava classe.
d) O ponto médio da sétima classe.
e) A amplitude do intervalo da segunda classe.
f) A frequência da quarta classe.
g) A frequência relativa da sexta classe.
h) A frequência acumulada da quinta classe.
i) O número de lotes cuja área não atinge 700m2.
j) O número de lotes cuja área atinge e ultrapassa 800m2.
k) A percentagem dos lotes cuja área não atinge 600m2.
l) A percentagem dos lotes cuja área seja maior ou igual a 900m2.
m) A percentagem dos lotes cuja área é de 500m2, no mínimo, mas inferior a 1000m2.
n) A classe do 72º lote.
o) Até que classe estão incluídos 60% os lotes.
3. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa
de ônibus.
N
o de
Acidentes 0 1 2 3 4 5 6 7
No de
Motoristas 20 10 16 9 6 5 3 1
Determine:
a) O número de e a percentagem de motoristas que não sofreram nenhum acidente.
b) O número e a percentagem de motoristas que sofreram pelo menos 4 acidentes.
c) O número e a percentagem de motoristas que sofreram menos de 3 acidentes
d) O número e a percentagem de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes.
e) A percentagem dos motoristas que sofreram no máximo 2 acidentes.
4. Complete a tabela abaixo:
i Classes fi fr f% F
1 0 ⊢ 8
2 8 ⊢ 16
3 16 ⊢ 24
4 24 ⊢ 32
5 32 ⊢ 40
4
10
14
9
3
= 40 = 1,00
5. Complete os dados que faltam na distribuição de frequência:
i xi fi fri Fi
1 0 1 0,05
2 1 0,15 4
3 2 4
Bioestatística Profa Claudia M. G. G. Franchi
23
4 3 0,25 13
5 4 3 0,15
6 5 2 18
7 6 19
8 7
6. Complete os dados que faltam na distribuição de frequência:
i Classes xi fi Fi
1 0⊢ 2 1 4
2 2⊢ 4 8
3 4⊢ 6 5 30
4 7 27
5 8⊢ 10 15 72
6 10⊢ 12 83
7 13 10 93
8 14⊢ 16
100
7. Considerando as notas de um teste de inteligência aplicado a 100 alunos:
64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73
Forme uma distribuição de frequência.
Bioestatística Profa Claudia M. G. G. Franchi
24
5. GRÁFICOS ESTATÍSTICOS
São representações visuais dos dados estatísticos que devem corresponder, mas nunca
substituir as tabelas estatísticas.
Os gráficos são de extrema importância na visualização e interpretação de informações e dados
acerca de temas de aspectos naturais, sociais e econômicos.
Os gráficos são representações bastante difundidas em diferentes tipos de informativos, dentre
eles, os principais estão em livros, revistas, jornais impressos, além da televisão e a internet, que fazem
o uso continuamente para apresentar informações à população em geral ou grupos específicos de
pesquisas.
Diante dessas afirmações os gráficos consistem em uma representação constituída por formas
geométricas elaboradas de maneira precisa, oriundas de dados numéricos resultados de pesquisas e
organizadas em uma tabela. Os gráficos são classificados segundo sua forma e podem ser de colunas,
de linhas e circulares.
Existem normas adicionais para a construção de gráficos, ditadas pela fundação IBGE. Assim,
todo gráfico deve apresentar título e escala. O título pode ser colocado tanto acima como abaixo do
gráfico. As escalas devem crescer da esquerda para a direita, e de baixo para cima. As legendas
explicativas devem ser colocadas de preferência, à direita do gráfico.
Observe os tipos de gráficos a partir do exemplo da tabela com os dados da população brasileira
residente, com 15 anos e mais segundo o estado conjugal.
População Brasileira residente, com 15 anos e mais, segundo o estado
conjugal, de acordo com o censo demográfico de 1980
Estado conjugal Frequência Percentual
Solteiros (1) 25.146.484 34,18
Casados (2) 41.974.865 57,06
Separados 1.816.046 2,47
Viúvos 3.616.046 4,92
Sem declaração 1.005.234 1,37
Fonte: IBGE
Nota: Estão computados, como separados, os separados, os desquitados e os divorciados
(1) Exclusive as pessoas solteiras, vivendo em união consensual estável
(2) Inclusive 4.939.528 pessoas vivendo em união consensual estável
5.1. Gráfico de Barras
O gráfico de barras é usado para apresentar variáveis qualitativas ou ordinais. Para fazer um
gráfico de barras, primeiro se traça o sistema de eixos cartesianos. Depois se colocam, no eixo das
abscissas, as categorias da variável em estudo. Em seguida constroem-se barras retangulares, com
base no eixo das abscissas e altura igual à frequência, ou à frequência relativa, da respectiva categoria.
As barras devem ser desenhadas separadas para ficar claro que a variável é qualitativa ou ordinal.
Bioestatística Profa Claudia M. G. G. Franchi
25
Figura 1: População brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demográfico de 1980.
5.2. Gráfico de Colunas
Figura 2: População brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demográfico de 1980.
5.3. Gráfico de Setores
O gráfico de setores também é usado para apresentar variáveis qualitativas ou ordinais. Para
fazer um gráfico de setores, primeiro se traça uma circunferência que, como se sabe, tem 360º. Essa
circunferência representa o total, ou seja, 100%. Dentro dessa circunferência devem ser representadas
as categorias da variável em estudo. Para isso, toma-se a frequência relativa de cada categoria e
calcula-se o ângulo central, da seguinte maneira: se 100% correspondem a 360º, uma categoria com
frequência relativa de f% terá um ângulo central x, tal que:
Logo, valor do ângulo central x será:
Bioestatística Profa Claudia M. G. G. Franchi
26
Os ângulos centrais das demais categorias são obtidos da mesma maneira. Para fazer o gráfico
de setores marcam-se, na circunferência, os ângulos calculados, separando-os com o traçado dos
raios. Observe o gráfico de setores apresentado abaixo:
5.4. Gráfico de Linhas
Gráfico de Linhas: É um gráfico que apresenta os dados por meio de linhas, sempre que as
categorias utilizadas representarem um intervalo de tempo.
Bioestatística Profa Claudia M. G. G. Franchi
27
5.5. Exercícios – Capítulo 5
1. Faça um gráfico de barras e um gráfico de setores para apresentar os dados da tabela a
seguir:
Suicidas segundo o sexo. Brasil, 1986
Sexo Frequência Percentual
Masculino ............. 3.562 74,93
Feminino .............. 1.192 25,07
Fonte: IBGE: 1988
2. Utilizando o gráfico em colunas, represente a tabela:
3. Utilizando o gráfico em linhas, represente a tabela:
Bioestatística Profa Claudia M. G. G. Franchi
28
6. REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO
6.1. Histograma
Os dados apresentados em tabelas de distribuição de frequências são apresentados
graficamente em histogramas. Para construir um histograma, primeiro se traça o sistema de eixos
cartesianos. Depois, se os intervalos de classe são iguais, traçam-se barras retangulares com bases
iguais, correspondendo aos intervalos de classe, e com alturas determinadas pelas respectivas
frequências.
Quando os intervalos de classe são diferentes, para construir um histograma é preciso calcular
as densidades de frequência relativa. Entende-se por densidade de frequência relativa o quociente
entre a frequência relativa e o intervalo de classe, isto é:
6.2. Polígono de Frequências
Os dados apresentados na tabela de distribuição de frequências também podem ser
apresentados em gráficos denominados polígonos de frequências. Para fazer esse tipo de gráfico,
primeiro se traça o sistema de eixos cartesianos. Depois, se os intervalos de classe são iguais,
marcam-se pontos com abscissas iguais aos pontos médios de classes e ordenadas iguais às
respectivas frequências. Se os intervalos de classe são diferentes, marcam-se pontos com abscissas
iguais aos pontos médios de classes e ordenadas iguais às respectivas densidades de frequência
relativas.
Para fechar o polígono, unem-se os extremos da figura com o eixo horizontal, nos pontos de
abscissas iguais aos pontos médios de uma classe imediatamente inferior à primeira, e de uma classe
imediatamente superior à última.
Bioestatística Profa Claudia M. G. G. Franchi
29
6.3. Exercícios – Capítulo 6
1. Consideremos os dados da Tabela a seguir.
Preço médio da gasolina comum para áreas selecionadas
dos Estados Unidos, março de 1975, em centavos de dólar.
Área Preço por galão Área Preço por galão
Atlanta
Baltimore
Boston
Buffalo
Chicago
Cincinnati
Cleveland
Dallas
Detroit
Houston
Kansas City
53.4
55.1
53.9
53.4
54.8
53.3
53.9
49.1
53.7
47.9
49.6
Los Angeles
Milwaukee
Minneapolis
New York
Philadelphia
Pittsburgh
St. Louis
San Diego
San Francisco
Seattle
Washington
53.5
50.1
50.3
55.2
52.9
53.4
52.3
55.3
56.8
52.7
55.2
Vamos supor que quiséssemos organizar aqueles preços em uma distribuição de frequências com cerca de 5 classes. Determinar a amplitude conveniente de cada intervalo, de tal forma que todos os intervalos de classe tenham iguais amplitudes, e construir a tabela de frequências fixando o limite inferior da primeira classe em 47.0. Construir o histograma e o polígono de frequência da distribuição.
2. A tabela seguinte representa as alturas (em cm) de 40 alunos de uma classe.
162 163 148 166 169 154 170 166
164 165 159 175 155 163 171 172
170 157 176 157 157 165 158 158
160 158 163 165 164 178 150 168
166 169 152 170 172 165 162 164
a) Calcular a amplitude total. b) Admitindo-se 6 classes, qual a amplitude do intervalo de classe? c) Construir uma tabela de frequências simples absoluta e relativa das alturas dos alunos admitindo
que o limite inferior da 1a classe seja 148 cm. d) Determinar os pontos médios das classes.
3. Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinados municípios do Estado:
144 152 159 160 160 151 157 146 154 145
141 150 142 146 142 141 141 150 143 158
Construir a tabela de frequências simples e acumuladas (“abaixo de” e “acima de”) tanto absolutas quanto relativas.
Bioestatística Profa Claudia M. G. G. Franchi
30
7. MEDIDAS DE POSIÇÃO
7.1. Introdução
São as estatísticas que representam uma série de dados orientando-nos quanto à posição da
distribuição em relação ao eixo horizontal do gráfico da curva de frequência.
As medidas de posições mais importantes são as medidas de tendência central ou promédias
(verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais).
As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.
Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e
biquadrática.
As outras medidas de posição são as separatrizes,que englobam: a própria mediana, os decis,
os quartis e os percentis.
.
7.2. Média Aritmética:
É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.
onde xi são os valores da variável e n o número de valores.
7.2.1. Dados não agrupados
Quando desejamos conhecer a média dos dados não agrupados em tabelas de frequências,
determinamos a média aritmética simples.
Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15,
16, 18 e 12 quilos, temos, para venda média diária na semana de:
7.2.2. Desvio em relação à média:
É a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:
Bioestatística Profa Claudia M. G. G. Franchi
31
Designando o desvio por , temos:
d1 = 10 - 14 = - 4 , ...
d2 = 14 - 14 = 0 ,
d3 = 13 - 14 = - 1 , ...
d4 = 15 - 14 = 1 ,...
d5 = 16 - 14 = 2 ,...
d6 = 18 - 14 = 4 ...e. ..
d7 = 12 - 14 = - 2.
.
7.2.3. Propriedades da média aritmética
1ª Propriedade:
A soma algébrica dos desvios em relação à média é nula.
No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0
2ª propriedade:
Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média
do conjunto fica aumentada (ou diminuída) dessa constante.
Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos:
Y = 12+16+15+17+18+20+14 / 7 = 16 quilos ou
Y = .+ 2 = 14 +2 = 16 quilos
3ª propriedade:
Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a
média do conjunto fica multiplicada (ou dividida) por essa constante.
Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos:
Y = 30+42+39+45+48+54+36 / 7 = 42 quilos ou
7.2.4. Dados agrupados sem intervalo de classe
Bioestatística Profa Claudia M. G. G. Franchi
32
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por família:
Nº de meninos frequência = fi
0 2
1 6
2 10
3 12
4 4
34
Como as frequências são números indicadores da intensidade de cada valor da variável, elas
funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada,
dada pela fórmula:
..xi. ..fi. ..xi.fi .
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
34 78
Onde temos:
7.3. Exercícios – Capítulo 7
1. Complete o esquema para cálculo da média aritmética da distribuição:
xi 1 2 3 4 5 6
fi 2 4 6 8 3 1
Temos:
1 2 2
2 3
3 6
4 8
Bioestatística Profa Claudia M. G. G. Franchi
33
5 3
6 1
7.3.1. Dados agrupados com intervalo de classe
Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo
de classe coincidem com o seu ponto médio e determinamos a média aritmética ponderada por meio
da fórmula:
Onde, é o ponto médio da classe:
Consideremos a distribuição:
I Estaturas (cm) fi
1 150 |----- 154 4
2 154 |----- 158 9
3 158 |----- 162 11
4 162 |----- 166 8
5 166 |----- 170 5
6 170 |----- 174 3
40
Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos
médios e outras para os produtos xi.fi.
i Estaturas (cm) fi xi xi.fi
1 150 |----- 154 4 152 608
2 154 |----- 158 9 156 1404
3 158 |----- 162 11 160 1760
4 162 |----- 166 8 164 1312
5 166 |----- 170 5 168 840
6 170 |----- 174 3 172 516
Bioestatística Profa Claudia M. G. G. Franchi
34
40
6440
Como, neste caso:
7.4. Exercícios:
1. Complete o esquema para cálculo da média aritmética da distribuição de frequência:
Custo (R$)
450 550 650 750 850 950 1050 1150
8 10 11 16 13 5 1
Temos:
1 500 8 4.000
2 10
3 11
4 16
5 13
6 5
7 1.100 1
Logo,
Bioestatística Profa Claudia M. G. G. Franchi
35
7.5. MODA - Mo
É o valor que ocorre com maior frequência em uma série de valores.
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o
salário recebido pelo maior número de empregados dessa fábrica.
.
7.5.1. Dados não agrupados
A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se
repete.
Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.
Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes
que outros.
Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.
.Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a
série tem dois ou mais valores modais.
Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é
bimodal.
7.5.2. Dados agrupados sem intervalo de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor
da variável de maior frequência.
Ex: Qual a temperatura mais comum medida no mês abaixo:
Temperaturas Frequência
0º C 3
1º C 9
2º C 12
3º C 6
Bioestatística Profa Claudia M. G. G. Franchi
36
Resposta: 2º C é a temperatura modal, pois é a de maior frequência.
7.5.3. Dados agrupados com intervalo de classe
A classe que apresenta a maior frequência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os
limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe
modal. Damos a esse valor a denominação de moda bruta.
Onde:
l* = limite inferior da classe modal e
L* = limite superior da classe modal
Assim, para a distribuição:
I Estaturas (cm) fi
1 150 |----- 154 4
2 154 |----- 158 9
3 158 |----- 162 11
4 162 |----- 166 8
5 166 |----- 170 5
6 170 |----- 174 3
40
Temos que a classe modal é i = 3, l* = 158 e L* = 152.
Como,
Vem:
7.5.4. Cálculo da Moda: Método mais elaborado pela fórmula de
CZUBER:
Bioestatística Profa Claudia M. G. G. Franchi
37
na qual:
= limite inferior da classe modal.....
= amplitude da classe modal
= ;
= ;
sendo:
a frequência simples da classe modal;
a frequência simples da classe anterior à classe modal
a freqüência simples da classe posterior à classe modal
Assim, para a distribuição da tabela das estaturas, temos:
Onde,
7.6. Exercícios:
1. Complete o esquema para o cálculo da moda da distribuição de frequência:
Custo
(R$) 450 550 650 750 850 950 1050
1150
fi 8 10 11 16 13 5 1
A classe modal é da ordem...
Logo:
Temos, pois:
Bioestatística Profa Claudia M. G. G. Franchi
38
7.7. MEDIANA
A mediana é outra medida de posição definida como o número que se encontra no centro de
uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a medida de
um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no
conjunto que o separa em dois subconjuntos de mesmo número de elementos.
7.7.1. Dados não agrupados
Dada uma série de valores como, por exemplo:
5, 13, 10, 2, 18, 15, 6, 16, 9
de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou
decrescente) dos valores:
2, 5, 6, 9, 10, 13, 15, 16, 18
Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à
direita e à esquerda. Em nosso exemplo, esse valor é o 10, já que, nessa série, há quatro elementos
acima dele e quatro abaixo.
Md = 10
Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer
dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto
médio.
Assim, a série de valores:
1, 6, 7, 10, 12, 13, 18, 21
tem para a mediana a média aritmética entre 10 e 12.
Logo:
Md=11
Bioestatística Profa Claudia M. G. G. Franchi
39
7.7.2. Dados agrupados
Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa
de modo muito semelhante àquele dos dados não agrupados, implicando, porém a determinação prévia
das frequências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição
em dois grupos que contenham o mesmo número de elementos.
Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos é dada
por:
7.7.3. Dados Agrupados sem intervalo de classe
Nesse caso, é o bastante identificar a frequência acumulada imediatamente superior à metade
da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência
acumulada.
Tomemos a distribuição relativa à tabela abaixo correspondente à frequência acumulada:
Númerode
meninos
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
35
Sendo:
A menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da
variável, sendo este o valor mediano. Logo:
Md = 2 meninos
7.8. Exercícios:
1. Complete o esquema para o cálculo da mediana das distribuições:
a)
2 4 6 8 10
3 7 12 8 4
Bioestatística Profa Claudia M. G. G. Franchi
40
2
4 10
6
8 30
10
Como:
Temos que:
Md = ___________
b)
0 1 2 3 4 5
2 5 9 7 6 3
0 2 2
1
2 9
3
4
5
Como:
Temos que:
Md = ___________
Bioestatística Profa Claudia M. G. G. Franchi
41
7.8.1. Dados Agrupados com intervalos de classe
Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida
a mediana.
Para tanto, temos inicialmente que determinar a classe na qual se encontra a mediana – classe
mediana. Tal classe será evidentemente, aquela correspondente à frequência acumulada
imediatamente superior a .
Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os valores
se distribuam uniformemente em todo o intervalo de classe.
Assim, considerando a distribuição da tabela a seguir:
i Estaturas (cm) fi Fi
1 150 |----- 154 4 4
2 154 |----- 158 9 13
3 158 |----- 162 11 24
4 162 |----- 166 8 32
5 166 |----- 170 5 37
6 170 |----- 174 3 40
40
A 3ª Classe é a classe mediana.
Temos:
Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos
determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos que este deve estar
localizado na terceira classe (i = 3), supondo que as frequências dessas classes estejam uniformemente
distribuídas.
Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar a partir
do limite inferior a distancia:
e a mediana será dada por:
Logo:
Na prática, executamos os seguintes passos:
Bioestatística Profa Claudia M. G. G. Franchi
42
1º) Determinamos as frequências acumuladas.
2º) Calculamos
3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à
- e em seguida, empregamos a fórmula:
na qual:
é o limite inferior da classe mediana
é a frequência acumulada da classe anterior à classe mediana
é a frequência simples da classe mediana
é a amplitude do intervalo da classe mediana
Tomando como exemplo, a distribuição anterior, temos:
Logo, a classe mediana é a de ordem 3. Então:
Substituindo esses valores na fórmula, obtemos:
isto é:
Md = 160,5 cm
7.9. Resolva:
1) Calcule a mediana da distribuição de frequência:
Custo
(R$) 450 550 650 750 850 950 1050
1150
fi 8 10 11 16 13 5 1
Temos:
Bioestatística Profa Claudia M. G. G. Franchi
43
1
450 550 8 8
2 550 650
10 18
3 650 750
11
4 750 850
16
5 850 950
13
6 950 1050
5
7 1050 1150
1
Substituindo esses valores na fórmula, obtemos:
Logo,
7.10. Exercícios – Capítulo 7
1. Considerando os conjuntos de dados:
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6.
b) 20, 9, 7, 2, 12, 7, 20, 15, 7.
c) 51,6; 48,7; 50,3; 49,5; 48,9;
d) 15, 18, 20, 13, 10, 16, 14.
Calcule:
I. a média;
II. a mediana;
Bioestatística Profa Claudia M. G. G. Franchi
44
III. a moda;
2. Os salários-hora de cinco funcionários de uma companhia são:
R$ 75, R$ 90, R$ 83, R$ 142 e R$ 88.
Determine:
a) a média dos salários-hora;
b) o salário-hora mediano;
3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2.
Determine:
a) a nota média;
b) a nota mediana;
c) a nota modal
4. Considerando a distribuição abaixo:
3 4 5 6 7 8
4 8 11 10 8 3
Determine:
a) a média;
b) a mediana;
c) a moda;
5. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição:
2 3 4 5 6 7 8 9 10
1 3 6 10 13 8 5 3 1
Calcule:
a) a nota média;
b) a nota mediana;
c) a nota modal.
6. Determine a média aritmética de:
a)
50 60 80 90
8 5 4 3
b)
50 58 66
20 50 30
Bioestatística Profa Claudia M. G. G. Franchi
45
7. Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4, 15. Qual
é a soma dos desvios?
8. Calcule a média aritmética, a mediana e a moda das distribuições de frequência abaixo:
a)
5
8
14
10
7
44
b)
5
12
18
27
8
70
c)
18
Bioestatística Profa Claudia M. G. G. Franchi
47
8. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
8.1. Dispersão ou variabilidade
Vimos anteriormente que um conjuntos de valores pode ser convenientemente sintetizado por
meio de procedimentos matemáticos, em poucos valores representativos – média aritmética, mediana
e moda. Tais valores podem servir de comparação para dar a posição de qualquer elemento do
conjunto.
No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já
convenientemente simplificados, é necessário ter-se uma ideia retrospectiva de como se apresentavam
esses dados nas tabelas.
Assim, não é o bastante dar uma das medidas de posição para caracterizar perfeitamente um
conjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura média de duas cidades é a
mesma, e igual a 24 oC, ainda assim somos levados a pensar a respeito do clima dessas cidades. Em
uma delas poderá a temperatura variar entre limites de muito calor e de muito frio e haver, ainda, uma
temperatura média de 24 oC, A outra poderá ter uma variação pequena de temperatura e possuir,
portanto, no que se refere à temperatura, um clima mais favorável.
Vemos então, que a média – ainda que considerada como um número que tem a faculdade de
representar uma série de valores – não pode por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compõe o conjunto.
Consideremos os seguintes conjuntos de valores das variáveis x, y e z:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160
Calculando a média aritmética de cada um desses conjuntos, obtemos:
Vemos então, que os três conjuntos apresentam a mesma média aritmética: 70. Entretanto é
fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são
iguais à média.
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação
entre cada um de seus valores e a média representativa.
Chamado de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma
variável em torno de um valor de tendência central tomado como ponto de comparação, podemos dizer
Bioestatística Profa Claudia M. G. G. Franchi
48
que o conjunto X apresenta dispersão ou variabilidade nula e que o conjunto Y apresenta uma
dispersão ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às
medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente
de variação.
8.2. Amplitude Total
8.2.1. Dados não agrupados
A Amplitude Total é a diferença entre o maior e o menor valor observado:
Exemplo: para os valores:
40, 45, 48, 52, 54, 62 e 70
Temos:
Quando dizemos que a amplitude total dos valore é 30, estamos afirmando alguma coisa do
grau de sua concentração. É evidente que, quanto maior a amplitude total, maior a dispersão ou
variabilidade dos valores da variável.
Relativamente aos três conjuntos de valores mencionados no início desse capítulo, temos:
ATx = 70 – 70 = 0 (dispersão nula)
ATy = 72 – 68 = 4
ATz = 160 – 5 = 155
8.2.2. Dados agrupados sem intervalo de classe
Nesse caso, ainda temos:
Exemplo: Considerando a tabela abaixo:
Bioestatística Profa Claudia M. G. G. Franchi
49
0 1 2 3 4
2 6 12 7 3
Temos:
8.2.3. Dados agrupados com intervalo de classe
Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite
inferior da primeira classe:
Exemplo: Considerando a distribuição abaixo:
i Estaturas (cm) fi
1 150 |----- 154 4
2 154 |----- 158 9
3 158 |----- 162 11
4 162 |----- 166 8
5 166 |----- 170 5
6 170 |----- 174 3
40
Temos:
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série,
descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do
resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia
ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão
popular é mais importante que a exatidão e a estabilidade.
8.3. Variância / Desvio padrão
Como vimos, a amplitude total é instável por se deixar influenciar pelos valores extremos, que
são, na sua maioria, devidos ao acaso.
Bioestatística Profa Claudia M. G. G. Franchi
50
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em
consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade
bastante estáveis e, por isso mesmo, os mais geralmente empregados.
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média
aritmética dos quadrados dos desvios. Assim, representando a variância por , temos:
Ou, lembrando que
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade
quadrada em relação à variável em questão, o que, sob o ponto de vista prático é um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que têm utilidade e interpretação práticas,
denominada desvio padrão, definida como a raiz quadrada da variância e representada por s:
Assim,
Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua
compreensão, ela não é uma boa fórmula para fins de computação, pois em geral, a média aritmética ,
é um número fracionário, o que torna pouco prático o cálculo das quantidades .
Podemos simplificar escrevendo a fórmula do seguinte modo:
Bioestatística Profa Claudia M. G. G. Franchi
51
Não apenas este método é usualmente mais prático, como também mais preciso. Quando a
média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a
esse arredondamento.
Para o cálculo do desvio padrão, consideremos os seguintes casos:
8.3.1. Dados não agrupados
Tomemos como exemplo, o conjunto de valores da variável x:
40, 45, 48, 52, 54, 62, 70
O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma
para e outra para . Assim:
40 1600
45 2025
48 2304
52 2704
54 2916
62 3844
70 4900
371 20.293
Como n = 7, temos:
Logo,
8.4. Resolva:
1. Complete o esquema para o cálculo do desvio padrão, dados os valores da variável: 8, 10,
11, 15, 16, 18
Temos:
Bioestatística Profa Claudia M. G. G. Franchi
52
8 64
n=
Logo,
Isto é,
8.4.1. Dados Agrupados sem intervalo de classe
Como, neste caso, temos a presença de frequências, devemos levá-las em consideração,
resultando a fórmula:
Consideremos como exemplo a distribuição na tabela abaixo:
0 1 2 3 4
2 6 12 7 3
Bioestatística Profa Claudia M. G. G. Franchi
53
O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma coluna para os
produtos e outra para , lembrando que para obter basta multiplicar cada pelo
seu respectivo , assim:
0 2 0 0
1 6 6 6
2 12 24 48
3 7 21 63
4 3 12 48
Logo:
8.5. Exercícios:
1. Complete o esquema paras o cálculo do desvio padrão na distribuição:
1 2 3 4 5 6
2 5 8 6 3 1
Temos:
1 2 2 2
2
3
4
5
6
Bioestatística Profa Claudia M. G. G. Franchi
54
Logo:
8.5.1. Dados Agrupados com intervalo de classe
Tomemos como exemplo, a distribuição abaixo.
Começamos por abrir as colunas (ponto médio), para e para .
i Estaturas (cm)
1 150 |----- 154 4 152 608 92.416
2 154 |----- 158 9 156 1.404 219.024
3 158 |----- 162 11 160 1.760 281.600
4 162 |----- 166 8 164 1.312 215.168
5 166 |----- 170 5 168 840 141.120
6 170 |----- 174 3 172 516 88.752
40
6.440 1.038.080
Logo:
8.6. Exercícios:
1. Complete o esquema par o cálculo do desvio padrão da distribuição:
Bioestatística Profa Claudia M. G. G. Franchi
55
Custo
(R$) 30 50 70 90 110 130
2 8 12 10 5
Temos:
i
1 40 2
2
3
4
5
8.7. Coeficiente de Variação
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades
pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a
média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso
na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries
de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou
variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada Coeficiente
de Variação (CV):
Bioestatística Profa Claudia M. G. G. Franchi
56
Exemplo:
Tomemos os resultados das medidas das estaturas e dos presos de um grupo de indivíduos:
Estaturas 175 cm 5,0 cm
Pesos 68 Kg 2,0 Kg
Temos:
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as
estaturas.
8.8. Exercícios – Capítulo 8
1. Calcule a amplitude total dos conjuntos de dados:
a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 22, 20
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2;
d) -10, -6, 2, 3, 7, 9, 10
2. Calcule a amplitude total das distribuições:
Xi 2 3 4 5 6 7 8
fi 1 3 5 8 5 4 2
Classes 1,5 1,6 1,7 1,8 1,9 2,0 2,1
2,2
Fi 4 8 12 15 12 8 4
3. Calcule os desvios padrões dos conjuntos de dados do exercício 1.
4. Calcule os desvios padrões dos conjuntos de dados do exercício 2.
Bioestatística Profa Claudia M. G. G. Franchi
57
5. Dada a distribuição de cem lançamentos de cinco moedas simultaneamente:
Número de
caras
0 11 12 13 14 5
Número de
coroas
4 14 34 29 16 3
Calcule o desvio padrão:
6. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão
respectivamente, 18,3 e 1,47, calcule o coeficiente de variação:
7. Em um exame final de matemática, o grau médio de um grupo de 150 alunos foi de 7,8 e o
desvio padrão, 0,80. Em estatística, entretanto, o grau médio foi de 7,3 e o desvio padrão, 0,76. Em
que disciplina foi maior a dispersão?
8. Medidas as estaturas de 1.017 indivíduos, obtivemos . O peso
médio desses indivíduos é 52 Kg, com um desvio padrão de 2,3 Kg. Esses indivíduos apresentam maior
variabilidade em estatura ou em peso?
9. Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97
cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm. Qual é o coeficiente de variação
de cada um dos grupos? Qual o grupo mais homogêneo?
10. Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de
variação de 3,3%. Qual o desvio padrão desse grupo?
11. Uma distribuição apresenta as seguintes estatísticas: s=1,5 e VC=2,9%. Determine a média
da distribuição
Bioestatística Profa Claudia M. G. G. Franchi
58
9. BIBLIOGRAFIA
1. CRESPO, Antônio A., Estatística Fácil, 19ª ed. atual. – São Paulo, Ed. Saraiva, 2009.
2. DORIA FILHO, Ulysses, Introdução à Bioestatística: para simples mortais, 14ª reimpressão –
São Paulo, Ed. Elsevier, 1999.
3. GUEDES, Marilda Laurenti da silva, José da Silva, Bioestatística, Rio de Janeiro, CNPQ, 1988.
4. JAQUES, Sidia M. Callegari, Bioestatística – Princípios e Aplicações, São Paulo, Ed. Artmed
2003 – reimpressão: 2008.
5. VIEIRA, Sonia, Introdução à Bioestatística, Rio de Janeiro, Ed. Campus, 1997 – 5ª reimpressão.