Bio e Statistic A

122
UNIVERSIDADE DE PERNAMBUCO - UPE Reitor Prof. Emanuel Dias de Oliveira e Silva Vice-Reitor Prof. Armando Carneiro Pereira do Rêgo Filho Pró-Reitor Administrativo Prof. Glêdeston Emerenciano de Melo Pró-Reitor de Planejamento Prof. Béda Barkokébas Jr. Pró-Reitor de Graduação Prof. José Guido Corrêa de Araújo Pró-Reitora de Pós-Graduação e Pesquisa Profª. Aronita Rosenblatt Pró-Reitor de Desenvolvimento Institucional e Extensão Prof. Reginaldo Inojosa Carneiro Campello Capa e Projeto Gráfico Marcos Leite Arte Final Rinaldo Afonso de Lemos Romeu Santos Jr. Impresso no Brasil - Tiragem 360 exemplares Av. Agamenon Magalhães, s/n - Santo Amaro Recife / PE - CEP. 50103-010 - Fone: (81) 3416.4041 - Fax: (81) 3416.4014 NEED - NÚCLEO DE ESTUDO EM EDUCAÇÃO A DISTÂNCIA Coordenador Geral Prof. Renato Medeiros de Morais Coordenação Padagógica Profª Rute Cândida Pereira Profª Maria Vitória Ribas de Oliveira Lima Profª Aidy Araújo Guedes Profª Nara Carneiro Lacerda Coordenação de Revisão Gramatical Profª Angela Maria Borges Cavalcanti Profª Eveline Mendes Costa Lopes Profª Patrícia Lídia do Couto Soares

Transcript of Bio e Statistic A

Page 1: Bio e Statistic A

UNIVERSIDADE DE PERNAMBUCO - UPE

ReitorProf. Emanuel Dias de Oliveira e Silva

Vice-ReitorProf. Armando Carneiro Pereira do Rêgo Filho

Pró-Reitor AdministrativoProf. Glêdeston Emerenciano de Melo

Pró-Reitor de PlanejamentoProf. Béda Barkokébas Jr.

Pró-Reitor de GraduaçãoProf. José Guido Corrêa de Araújo

Pró-Reitora de Pós-Graduação e Pesquisa Profª. Aronita Rosenblatt

Pró-Reitor de Desenvolvimento Institucional e ExtensãoProf. Reginaldo Inojosa Carneiro Campello

Capa e Projeto GráficoMarcos Leite

Arte FinalRinaldo Afonso de Lemos

Romeu Santos Jr.

Impresso no Brasil - Tiragem 360 exemplares

Av. Agamenon Magalhães, s/n - Santo Amaro

Recife / PE - CEP. 50103-010 - Fone: (81) 3416.4041 - Fax: (81) 3416.4014

NEED - NÚCLEO DE ESTUDO EM EDUCAÇÃO A DISTÂNCIA

Coordenador GeralProf. Renato Medeiros de Morais

Coordenação PadagógicaProfª Rute Cândida Pereira

Profª Maria Vitória Ribas de Oliveira Lima

Profª Aidy Araújo Guedes

Profª Nara Carneiro Lacerda

Coordenação de Revisão GramaticalProfª Angela Maria Borges Cavalcanti

Profª Eveline Mendes Costa Lopes

Profª Patrícia Lídia do Couto Soares

Page 2: Bio e Statistic A
Page 3: Bio e Statistic A

Introdução à Bioestatística FASCÍCULO

Gilberto Pereira da Silva

Mário de Souza

Carga Horária - 10 horas

-Compreender a natureza do trabalho estatístico e sua origem,

como forma de apropriar-se da linguagem estatística;

Objetivos

1

Page 4: Bio e Statistic A

- Entender a necessidade do processo de modelagem matemática junto à

estatística, como formas de compreender enunciados, formular questões ou

levantar hipóteses e prever resultados, com uso de argumentos dentro de uma

linguagem matemática, para uso desse fato em situações reais.

- Compreender os conceitos fundamentais de estatística, as fases do trabalho

estatístico e as aplicações/apurações de dados da estatística em fatos vitais, como

forma de desenvolver a capacidade de utilizar a matemática na

interpretação e intervenção do real.

Quando você vai comprar, por exemplo, um aparelho de televisão, você antes de

comprar faz, em princípio, algumas perguntas, tais como: “Por que quero comprar

um aparelho de televisão? Que marca devo comprar? Qual o tempo de utilização

desse aparelho com esta ou aquela marca de interesse, sem que ele vá ao reparo? De

quantas polegadas eu quero este aparelho de televisão? Posso comprar a vista ou a

prazo? Se for a prazo, qual o melhor investimento que devo fazer?”, e assim por

diante. Às vezes até se consultam outras pessoas sobre o referido aparelho de

escolha ou um especialista sobre consertos de televisão.

Quando você está fazendo isto ou algo parecido, você está levantando dados para

tomar uma decisão. Mas, antes de você tomar a decisão, você sempre faz uma análise

das informações obtidas durante o teu processo de solução do problema central:

comprar um aparelho de televisão. Vale salientar que outras variáveis podem ocorrer

neste processo de escolha.

Elabore as perguntas que você faria, no desejo de comprar um computador pessoal.

Seriam estas perguntas, as mesmas que você faria se o computador fosse para uso

em uma empresa na qual você seria o proprietário? Justifique suas respostas.

Assim sendo, aqui temos um problema: identificar as variáveis. E, estes dados que

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

04

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Introdução

Exercício 1.1

Page 5: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

05

poderão ser obtidos (identificados), junto às amostras que estou a consultar. Ou seja,

entendo estas identificações de variáveis e levantamento de dados como um

problema de estatística.

Assim, podemos compreender o trabalho estatístico como sendo um processo de

“pesquisa estatística, que envolve amostras, levantamentos de dados e análise das

informações obtidas” (PCN+EM, 2002, p. 126). Embora estejamos a trabalhar um

exemplo muito singular, fazemos salientar que ele serve de alicerce para a

compreensão do significado do trabalho estatístico, dentro (também) de um

processo histórico.

E, como a estatística trabalha com problemas da vida real, logo, a linguagem

matemática deve ser coerente com as necessidades do problema em estudo, daí a

necessidade da modelagem matemática para a compreensão do contexto de

interesse estatístico. E, nesse sentido, faz bem conhecermos um pouco da origem da

palavra matemática respondendo a questão “o que é a estatística?” Como forma de

nos aperceber da concatenação existente entre essas duas ciências.

Nessa direção, fazemos ver que os conceitos fundamentais em estatística jogam um

papel importante no processo de sua aprendizagem nesta disciplina, pois eles

constituem o princípio de formação de competências (no sentido cognitivo), para

apropriar-se desta linguagem e, assim sendo, você poder criar habilidades no sentido

de trabalhar os problemas estatísticos, criando argumentos concisos dentro de uma

linguagem específica, a estatística aplicada à biologia, ou seja, a bioestatística.

Provavelmente, você deve ter acompanhado, ou até mesmo, apenas percebido,

algumas notícias sobre as últimas eleições para prefeito nas principais capitais do

Brasil, através do jornal televisionado, (embora outras mídias tenham publicado

sobre o fato, a televisiva tem uma influência maior que a escrita neste momento de

campanha eleitoral). E, nestes noticiários, para uma específica capital brasileira eram

apresentados, por exemplo, os últimos três dados coletados e apresentados num

gráfico que mostrava uma tendência de comportamento do eleitor quanto à escolha

(ou preferência) de um certo candidato a outro. Evidentemente, estes resultados

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Compreendendo a Natureza do Trabalho

Estatístico e sua Origem

Page 6: Bio e Statistic A

possibilitam uma previsão analítica de vitória de um candidato sobre o outro (ou

outros). E, durante o processo de coletas de dados e de informação pública, decisões

e inferências acerca do comportamento político são mudadas com bases, também,

nesses trabalhos experimentais de coletas de dados, ou seja, nas informações

estatísticas.

Sendo assim, ao dar início ao estudo da estatística, você está se deparando com uma 1

das parcelas do conhecimento humano, hoje dotado de um processo de

sistematização ou atitude científica, esmerada num trabalho experimental de coleta

de dados, que se constitui como sendo um dos elementos do trabalho estatístico. Ou

seja, a estatística tornou-se um conhecimento transformado num saber científico,

cuja finalidade é a elaboração de modelos matemáticos que servirão como

instrumentos de análise, decisão ou previsão, tomando como base as informações

antes coletadas. Isto possibilita o fornecimento de subsídios às possíveis análises de

resultados e/ou tomadas de decisões (ou previsões) sobre um determinado objeto de

estudo analítico/experimental, concatenado, evidentemente, com as informações

antes coletadas.

Este fato, exposto de forma generalizada no contexto acima, é, na verdade, uma

construção humana, como é todo o saber científico. Sendo assim, vamos,

inicialmente compreender como se estabeleceu, de um modo geral, a origem de seu

nome, indo do nascer da escrita até a origem e uso da palavra estatística.

Sendo a escrita uma das maiores invenções humanas, podemos pensar, então, que

os registros dessa habilidade humana conduziram o homem a informar e comunicar

através da grafia. E, no início dessas grafias, as amostras da representação social e

cultural de um povo se sobressaíram, como expressão de uma sociedade.

Para se ter uma idéia desse fato, basta ver como essas grafias representadas em

pedras, ossos, madeiras, dentre outras formas de suporte físico para materializar um

símbolo (código), se formaram ao longo do tempo em escritas (antes conhecida

como mitografia, pois serviam a uma comunicação imediata através da pictografia)

sintética e ideográfica.

Possivelmente, esses elementos simbólicos representam um sistema gráfico, isto é,

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

06

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

1- Como este é um trabalho cuja referência é educacional, faz-se necessário saber fazer a distinção entre conhecimento e saber. “Enquanto o saber está relacionado ao plano histórico da produção de uma área disciplinar, o conhecimento é considerado mais próximo do fenômeno da cognição, estando submetido ao vínculo da dimensão pessoal do sujeito empenhado na compreensão de um saber” (PAIS, 2001, p. 36).

Page 7: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

07

uma idéia, fato que se concebe hoje como formas de linguagens. Desse modo, pode-

se compreender a estatística como uma ciência milenar, uma vez que expressões

gráficas, decifradas ao longo da história da humanidade, nos informaram a respeito

de trabalhos baseados em coletas de dados, como “podemos mencionar os dados

estatísticos gravados em monumentos egípcios que permitem avaliar as condições

econômicas do Estado e os movimentos das populações e os encontrados nas

bibliotecas de Assurbanipal, que informam sobre a hierarquia dos funcionários

públicos e sobre a população das províncias do Império Assírio” (MILONE &

ANGELINI, 1993, p. 22), isto cerca de 3000 anos a.C.

Como esses assuntos dizem respeito ao estado (states), possivelmente o termo

estatística (statistics) se origina deste termo. O uso desta palavra aparece pela

primeira vez, no século XVI, na escola alemã, pelo economista Gottfried Achenwall

(1719 1772), da Universidade de Göttingen, que, “segundo Peters (1987: 79) e

Walker (1929: 32), foi o momento em que se utilizou a palavra alemã Statistik em

1749, e o uso deste termo na literatura inglesa fora em 1791 devido aos trabalhos de 2John Sinclair (1754 1835) ” (ZAR, 1999, p. 1).

Assim, podemos compreender a natureza do trabalho estatístico como sendo um

estudo de fenômenos coletivos, cuja finalidade está atrelada à criação de modelos

matemáticos para possibilitar uma interpretação das relações funcionais entre os

modelos matemáticos e os resultados apresentados e/ou esperados dos fenômenos

(regulares ou atípicos), ou seja, criam-se os métodos (modelos) estatísticos ou os

métodos de pesquisas estatísticas. Por exemplo, numa sala de aula você enquanto

professor observa, através de levantamento de dados, que em sua disciplina, durante

os três últimos anos a nota individual de cada um de seus alunos, neste mesmo

período, variou de 3,5 até 9,8. Então você tem um modelo linear, cuja representação

pode ser do tipo f(x) = 3,5 + x, com a variável x, estando no intervalo 0 x 5,3. Faz-se

necessário saber que esses métodos (modelos) estatísticos são considerados na

literatura estatística como sendo, pela primeira vez, enunciados em um dos trabalhos

de Gottfried Achenwall, intitulado Staatsverfassung der heutingen vornehmsten

europäischen Reichen (Constituições dos principais países da Europa) em 1752,

quando este faz uma relação entre a estatística e as disciplinas sociais.

Descreva como você compreende um modelo matemático. Após a sua descrição,

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

2 - Tradução livre por Gerson Henrique da Silva .

Exercício 1.2

Page 8: Bio e Statistic A

elabore um exemplo onde esteja presente a compreensão da modelagem

matemática.

Já nos reportamos à concatenação entre as atitudes científicas da análise

experimental de coletas de dados e a formulação matemática, através de uma

arquitetura própria dessa disciplina (expressão numérica, uma equação algébrica,

uma tabela, um gráfico, uma diagramação ou um programa computacional) como

formas de apresentar um auxílio à solução para um problema em estudo.

Como a estatística lida com problemas da vida real, logo se sabe que a complexidade

desses problemas dentro de um contexto de interesse necessita ser trabalhada

dentro de uma perspectiva de tornar o ato complexo do contexto de interesse numa

versão simplificada, através de um modelo matemático. O fato interessante é que

esse modelo matemático-estatístico deve levar em conta a maior parte dos detalhes

de interesse do contexto ou da situação pesquisada na qual o problema está inserido.

No processo de aprendizagem dessa disciplina, você irá se familiarizar com a

variedade dos modelos estatísticos (ou modelos matemáticos). Só como exemplo, a

descrição de gráficos e tabelas com dados numéricos referem-se aos modelos da

estatística, denominada de estatística descritiva.

Assim, pode-se dizer que o ato de modelagem matemática é “um processo artístico,

visto que, para se elaborar um modelo, além do conhecimento de matemática, o

modelador precisa ter uma dose significativa de intuição e criatividade para

interpretar o contexto” (BIEMBENGUT & HEIN, 2000, p. 12). Além disso, podemos

compreender “que cada tipo de modelo é sempre incompleto, de alguma forma, pois

se refere, apenas, à parte do problema” (STEVENSON, 1981, p. 5), ou seja, uma parte 3

da complexidade . Isso nos faz ver que os problemas da vida real e a matemática são

conjuntos diferentes. Logo, a modelização é um processo de formação de uma

linguagem que possivelmente forneça uma representação do contexto, ou seja,

forme um conceito para nos possibilitar que seja estabelecida uma linguagem com o

mundo real, embora de forma complexa (que é diferente de complexidade). Temos

assim:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

08

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

3 - “A complexidade não é complicação. O que é complicado pode reduzir-se a um princípio simples, mas a complexidade encontra-se própria base” segundo Morin, Ciurama & Motta, 2003, pp. 44-5).

Modelagem Matemática e Modelos Estatísticos

Page 9: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

09

O trabalho, no processo de modelagem matemática, está constituído de três etapas.

Vejamos, então, essas etapas e suas subetapas, segundo (BIEMBENGUT & HEIN,

2000, p. 13):

a) Interação

-Reconhecimento da situação-problema;

-Familiarização com o assunto a ser modelado (referencial teórico).

b) Matematização

-Formulação do problema (hipótese);

-Resolução do problema em termos do modelo.

c) Modelo Matemático

-Interpretação da solução;

-Validação do modelo (avaliação).

As situações problemas caracterizam-se por recortes de um domínio complexo, cuja

realização implica mobilizar recursos, tomar decisões e ativar esquemas (apud

MACEDO, 2002, p. 114 em PERRENOUD, 1997, 2000). Onde, por esquema quero

explicitar uma estrutura interna de pensamento, ou seja, “é uma estrutura de

informação para representar os conceitos gerais guardados na memória [...] Um

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Situação Problema

5 - Apresentação simplificada, do texto original (apresentado no livro), feita por Gerson Henrique da Silva.

SITUAÇÃO REAL

MODELAGEM MATEMÁTICA

MATEMÁTICA

MODELO

Page 10: Bio e Statistic A

esquema contém, como parte de sua especificação, a rede de intercorrelações que se

acredita estar normalmente entre os constituintes do conceito em questão”

(RUMELHART, 1980: 33-34. Apud NÖTH, 1998).

Logo, podemos definir modelo como sendo “uma versão simplificada de algum

problema ou situação da vida real destinado a ilustrar certos aspectos do problema, 4

sem levar em conta todos os detalhes” (STEVENSON, 1981, p. 5) , ou seja, é um

trabalho complexo retirado de uma complexidade maior, que é a vida real, ou seja,

modelamos, apenas, um contexto.

Ainda, acerca dos modelos, podemos dizer que (op. cit. p. 5):

a) Utilidades

-Servem para comunicar uma idéia ou conceito.

b) Quanto ao seu uso

-Servem como uso de padrões de comparação.

c) Quanto ao seu envolvimento

-Servem para envolver processos padronizados de solução.

d) Características

-Servem para testar idéias antes de implementá-las;

-Servem para quantificar e formalizar o que se conhece da situação-problema.

Esses aspectos, aqui apresentados, sugerem você pensar numa compreensão maior

da idealização de modelos, que transcorreu em sua vida acadêmica na escola de nível

Fundamental e Médio. Por exemplo, em Geografia o Globo Terrestre é um modelo da

Terra. Os manequins são modelos de pessoas. Assim, ao fazer uso de bolinhas numa

determinada urna, posso compreender como sendo um modelo de determinados

elementos contidos num recipiente ou numa área. Por exemplo, o número de

bactérias (bolinhas) contidas na boca de um ser vivo (urnas). Só que, nesse último

caso, há necessidade de outros elementos para justificar o processo de medição.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

10

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Page 11: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

11

Mas, sua apresentação serve, apenas, para ilustrar a importância da modelização em

matemática, e aqui, especificamente, para a estatística.

-Como você diferencia um problema de um exercício? Justifique sua resposta.

-O que você compreende por hipótese? Dê exemplos.

Uma vez que já compreendemos a origem da palavra e natureza de seu trabalho,

vimos que esse processo de construção está ligado à vida real e, para fazer

compreender o contexto em que se materializa a interpretação do fato (situação-

problema), necessita-se de um conceito, ou seja, da criação de uma linguagem

(códigos) para comunicar/informar a realidade em estudo. Sendo assim, precisa-se

fazer um trabalho de modelagem, ou seja, tomar uma parte da complexidade do

problema e estruturá-lo dentro de um contexto racional de modelização matemática,

como forma de poder expressar os resultados estatísticos (buscados num trabalho

experimental de interesse específico). Compreendido isto, vem agora a pergunta: o

que é estatística?

Antes de responder essa questão, vamos compreender o significado de matemática,

pois, ao estudar estatística, estamos fazendo matemática. O termo matemática tem

duas raízes: “matema que vai direção de explicar, de conhecer, de entender; e tica,

que se origina de techne que é a mesma raiz de arte e de técnica” (D'AMBROSIO,

1998, p. 5). Assim, podemos dizer que a matemática “é a arte de explicar, conhecer, 5

de entender...” (op. cit. p. 5) a natureza . E, dentro desse contexto, é que se estrutura

a estatística. Deste modo, podemos dizer que:

6Estatística é uma atividade científica relacionada à obtenção de informações, a partir

de um corte na complexidade da realidade, com a busca experimental partindo das

coletas de dados, para que, com estas informações, seja possível criar um modelo

matemático (estatístico), com a finalidade de efetuar inferências a respeito da

população, como forma de comunicar o resultado esperado (ou não), a partir dos

dados coletados.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

5 - Aqui o termo natureza vai além da concepção dos elementos de convívio real (no sentido de estar ligado aos cinco sentidos humanos), indo, também, para o mundo do invisível e das relações compreendidas e elaboradas no mundo da cognição. 6 - A construção desse conceito fora adaptada a partir do conceito de estatística apresentado por Mendenhall, no livro Probabilidade e Estatística, da Editora Campus, 1985, na página 17. 7 - Adaptados do texto de Stevenson, no livro Estatística Aplicada à Administração, da Editora Harbra, de 1981, na p.2.

Exercícios 1.3

O Que é Estatística?

Page 12: Bio e Statistic A

Com essa definição de estatística, podemos agora compreender o significado de

bioestatística, uma estatística voltada para as análises dos aspectos que envolvem

vida. Assim, o ambiente de pesquisa está voltado para a área de saúde juntamente

com as profissões que envolvem as ciências biológicas.

A descrição dos ramos da estatística serve de base para você melhor se situar no

contexto de seu trabalho estatístico, numa análise de dados que podem estar em suas

mãos, ou seja, você se apropriando de uma linguagem específica da estatística.

É a parte da estatística que utiliza os números para descrever os fatos. Em geral, esses

dados coletados são apresentados em forma de tabelas e/ou gráficos (histogramas).

É a parte da estatística que utiliza o acaso (aleatório ou randônico), para se basear e

construir o resultado matemático. Em geral, necessita-se de um grande número de

resultados experimentais (experimentos aleatórios).

É a parte da estatística que diz respeito à análise e interpretação dos dados amostrais.

Necessita de conceitos e métodos estatísticos, para entender o que está ocorrendo

com a amostra, tendo como premissa básica a ocorrência aleatória da amostragem.

Como toda ciência, a estatística tem sua linguagem própria. E esta linguagem deve

ser absorvida pelo estudante como forma de melhor trabalhar a compreensão e as

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

12

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Estatística Descritiva

Probabilidade

Inferência

Conceitos Fundamentais em Estatística

7Os Ramos da Estatística

Page 13: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

13

habilidades necessárias ao desenvolvimento da aprendizagem dessa disciplina. Para

isso, vamos compreender os conceitos de população e amostra (MENDENHALL,

1985, pp. 14-5).

É o conjunto que representa todas as medidas de interesse para o coletor de

amostras. Por exemplo, todas as notas de todos alunos(as) de uma escola básica.

É um subconjunto de medidas extraídas da população de interesse. Por exemplo,

considerando a escola básica (anterior), retirar as notas dos alunos(as) da oitava série

do Ensino Fundamental e da primeira série do Ensino Médio da disciplina

Matemática.

Vejamos um outro exemplo para melhor entender este fato. Durante a campanha

para a presidência da República do Brasil, em 2002, as empresas de pesquisa

informavam e mostravam os gráficos de tendências de desempenho de cada

candidato. Como o resultado tinha uma relevância nacional, podia-se pensar que os

dados coletados fossem consultados com toda a população que poderia votar. De

fato, isso não acontece. É inviável financeiramente e, além disso, teríamos de gastar

muito tempo para nos apoderarmos das opiniões de todos os eleitores. Então, diante

desse impasse, resolve-se conhecer da população que poderia votar, uma amostra. E,

com esta amostra, faz-se um estudo estatístico. Fato parecido você deve pensar, caso

desejasse consultar, em Pernambuco, o número de pessoas com AIDS. Será que você

deveria consultar toda a população do estado? Como você resolveria este problema?

Além desses dois conceitos, existem outros que você deve compreender. Vejamos:

Denomina-se de variável uma quantidade ou categoria de interesse no estudo

estatístico.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Variável

População

Amostra

Page 14: Bio e Statistic A

Exemplos:

a) idade;

b) renda da família;

c) cor da pele;

d) pressão sistólica versus idade;

e) intensidade de dor.

Além desses tipos, pode-se também descrever um tipo interessante que é aquele que

apresenta por si mesmo, apenas, dois resultados. É o tipo dicotômico. Este é um tipo

de variável que apresenta, apenas, duas categorias. Pode ser nominal ou ordinal.

Exemplos: (a) sexo masculino ou sexo feminino; (b) hipertensão arterial: presente ou

ausente.

Observe, também, que as variáveis categóricas são denominadas de variáveis

qualitativas, uma vez que elas expressam uma qualidade de interesse na área de

estudo, já que, na variável quantitativa, os valores têm significado numérico.

As variáveis do tipo categórica ordinal também chamada de variável categórica (ou

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

14

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Tipos de variáveis:

CATEGÓRICAS

QUANTITATIVAS

Nominal (Tipo sangüíneo: A, B, AB ou O)

Ordinal (Hipertenso: leve, moderado, grave ou normal)

Discretas (Número de bactérias em um volume de urina)

Contínuas (Pressão sangüínea, peso, altura)

Observações:

Page 15: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

15

qualitativa) por postos, ou seja, quando os elementos forem reunidos, segundo a

ordem em que aparecem dispostos numa lista. Exemplo: lista classificatória de um

concurso público.

É o elemento que o investigador toma por base em sua pesquisa.

Exemplos:

a) pessoas selecionadas para estudos;

b) fragmento de pele encaminhado para análise laboratorial;

c) peixe selecionado num rio para estudo.

Seleção de uma amostra na qual cada membro do conjunto selecionado tenha a

mesma probabilidade de ser incluído.

Exemplo:

Retirar uma amostra de 30% dos alunos da turma de terceira série A, do Ensino Médio

da escola X. O conjunto amostra dessa pesquisa tem como elemento o estudante de

uma específica turma, e qualquer aluno tem a possibilidade de ser escolhido. Logo,

se esta turma tem 50 estudantes, qualquer um deles pode formar o conjunto de 15

para a amostra. Todos têm a mesma possibilidade.

São experimentos que podem ser repetidos em iguais condições, porém o resultado

que vai ocorrer não é um resultado esperado, com certeza. NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Experimentos aleatórios

Unidade de Observação

Amostragem aleatória

Page 16: Bio e Statistic A

Exemplo:

Em Recife 3% das pessoas têm a patologia Esclerose Múltipla. Selecionar mil pessoas

e verificar qual delas é portadora dessa patologia.

Depois de compreender estes conjuntos de informações preliminares sobre

estatística, podemos agora pensar que, num estudo estatístico, estamos a

compreender uma situação-problema, ou seja, um recorte da complexidade. Sendo

assim, ao estruturar um modelo matemático (estatístico), o que envolve o problema

em estudo? Este fato fora especificado por Mendenhall, 1985, p.16. Vejamos:

-Uma clara definição dos objetivos da experiência e da população associada.

-Projeto de experiência (procedimento amostral).

-Coleta e análise de dados.

-Procedimento a ser adotado, a fim de realizar inferências acerca da população,

tomando como base as informações contidas na amostra.

-Provisão de uma medida da confiabilidade de uma inferência a ser realizada.

Esses fatos podem conduzir o estudante em sua pesquisa (e estudos) de

bioestatística a otimizar seus resultados. E o primeiro passo é entender essa

formação de alicerces para compreender a matemática envolvida e construída nos

processos estatísticos.

Prezado estudante, esse texto é o seu primeiro contato com a disciplina bioestatística

e, sendo assim, você deve desempenhar um papel importante no ato de leitura e

compreensão. Para tal, vamos esboçar para você alguns passos que você deve

exercitar nessa sua leitura e compreensão do texto. Vejamos:

PRIMEIRO: Você deve fazer uma leitura geral de todo o texto sem a preocupação

de compreendê-lo como um todo.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

16

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

O que Envolve um Problema Estatístico?

Conclusão/Orientação ao Estudante

Page 17: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

17

Esses passos não formam uma receita de bolo, você deve descobrir o seu próprio

método (ou métodos) de aprendizagem. Se já possui, exercite-o (ou exercite-os).

Mas um fato interessante é que você, além de estar compreendendo a disciplina, está

também se profissionalizando na área de educação. Por isso, a necessidade de

compreensão de suas disciplinas no curso, inclusive da bioestatística, serão de suma

importância para o exercício de sua profissão, em que o conhecimento e a

aprendizagem que você tem da disciplina, em sua atuação como professor(a), deve

ser, em princípio, uma habilidade.

Esse é o seu espaço de re-leitura do texto e de um exercício sobre a disciplina nesse

primeiro momento, após você ter resolvido os exercícios anteriores e lido (no sentido

de compreender) todo o material. Este último exercício é para uma verificação da

aprendizagem na rede, e você deve consultar a agenda da disciplina na plataforma

para entrega do mesmo.

PRIMEIRA: De que maneira a Estatística ajuda a resolver certos problemas

práticos? Justifique sua resposta com um exemplo.

SEGUNDA: Suponha que você seja chamado para prever a média das notas dos

alunos de Ensino Médio, de sua escola, na primeira série, na disciplina de biologia.

Que variáveis você julgar ser necessárias? Justifique-as.

TERCEIRA: Uma indústria, produtora de equipamentos eletrônicos produz

algumas unidades que não funcionam corretamente. O que você pode levantar

suposições sobre essa produção? É possível eliminar o erro totalmente?

QUARTA: Suponha que você queira obter uma estimativa do consumo de

gasolina (km por litro) do carro de marca X. Descreva a população que interessa neste

caso, a partir da qual você poderá selecionar uma amostra.

QUINTA: Você é candidato ao Legislativo de seu estado e deseja examinar as

preferências dos eleitores com relação às suas chances de sair vitorioso. Identifique,

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exercício 1.4

Page 18: Bio e Statistic A

então, a população que lhe interessa, a partir da qual você poderá obter a amostra

desejada. De que maneira essa população irá depender do tempo?

SEXATA: Uma pesquisa médica visa obter uma estimativa do tempo de vida de

um paciente, após este ter sido ser acometido de um tipo específico de câncer e após

ser submetido a um regime particular de radioterapia. Identifique a população que

interessa. É possível perceber algum problema para essa amostrar essa população?

Nesse primeiro momento, o interessante é que você dedique-se a esse texto. Poderá

consultar texto na Internet (ver os sites indicados na orientação do aluno item

quinto). E junto a isso, proceda a uma leitura no capítulo primeiro do livro [5] na

referência bibliográfica deste texto.

Tome uma moeda, de dez centavos, por exemplo, coloque-a sobre uma mesa de sua

casa. E responda a seguinte questão? Quando eu empurrar esta moeda até ao chão,

na vigésima vez ela dará cara? (repita o experimento sempre da mesma maneira).

Anote cada resultado que você encontrar, desde a primeira até a vigésima vez que

você empurrou a moeda para o chão. Responda agora: o número de caras que você

obteve foi igual ao número de caras? E o seu resultado esperado coincidiu?

Após esta prática você deverá perceber que o resultado esperado, de ½ para a cara ou

coroa só começa aparecer quando temos uma enorme quantidade de dados relativos

a estes resultados. Este fato deve ser compartilhado com outros colegas de outros

pólos diferentes do seu para agrupar mais dados e observar a possibilidade desse

resultado com mais realidade. Isto vai ser útil a você na compreensão do conceito de

probabilidade.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

1

18

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Leituras Recomendadas

Prática Realizadar e Discutir no Transcorrer

desta Aula (Optativo)

Page 19: Bio e Statistic A

Referência Bibliográfica

[1] BIEMBENGUT, Maria Salett & HEIN, Nelson. Modelagem Matemática

no Ensino. São Paulo, SP; Contexto, 2000, 127p.

Este é um livro dedicado à Educação Matemática e nele há a pretensão de

esclarecer o que é o modelo e modelagem matemática, como utilizar a

essência da modelagem no ensino e na aprendizagem. Fora introduzido

nessa referência como um referencial para a modelagem em estatística.

Sua linguagem muito é adaptada e bem dirigida ao leitor. Se houver

interesse por parte do estudante do curso de biologia, sobre este livro,

ele deve consultar a parte 1, que compreende da página 1 até 30.

[2] BRASIL, Ministério da Educação, Secretaria de Educação Média e

Tecnológica. PCN+ Ensino Médio: Orientações Educacionais

complementares aos Parâmetros Curriculares Nacionais. Ciências da

Bibliografia Comentada

Page 20: Bio e Statistic A

Natureza, matemática e suas tecnologias. Brasília: MEC; SEMTEC, 2002. 144p.

Esta é uma edição pedagógica lançada pelo MEC como um parâmetro para o Ensino,

aqui dirigido ao Ensino Médio. E o objetivo deste material, dito no próprio

documento, é o de chegar mais perto da construção de um currículo. Nesse sentido

este documento é bom para você que está iniciando a profissionalização na área de

educação, para ler, pelo menos, a parte que se relaciona à Biologia (p. 33 58). Porém,

neste curso ele não relevância para sua aprendizagem direta, na disciplina

bioestatística.

[3] D'AMBROSIO, Ubiratan. Etnomatemática. 4ª Edição. São Paulo, SP; Ática, 1998,

88p.

Este livro está dedicado ao contexto cultural, e portanto, isso nos reporta às

linguagens. Embora esse contexto seja muito amplo, o autor tomou o livro como uma

necessidade de se repensar o ensino da matemática. Ou seja, a produção

cultural/científica da matemática é um produto social e, conseqüentemente,

histórico. Esses fatos conduzem a uma análise crítica da geração e produção do

conhecimento, da sua institucionalização e da sua transmissão. Para você enquanto

estudante de um curso de profissionalização na área de educação, fazemos saber que

uma leitura no capítulo 5, deste livro, interessa a você. O uso dessa referência neste

texto fora apenas para dar uma visão sobre a origem do termo matemática.

[4] HAZZAN, Samuel. Fundamentos de Matemática Elementar. 6ª Edição. Vol. 5. São

Paulo, SP; Atual, 1996, 174p.

Este é um livro voltado para a disciplina matemática, apresentando uma estrutura

seqüencial dos temas Combinatória e probabilidade. Constitui-se uma base

matemática para os estudantes do curso de licenciatura em biologia, quanto a esta

disciplina, em temas posteriores.

[5] HOSPITAL SÃO RAFAEL, Centro Virtual de Epidemiologia Clínica. Diretoria

Científica. Salvador, BA. Disponível em http://www.hsr.com.br/bio02.html, acesso

em 19/08/2004.

Este texto encontra-se na internet, sendo interessante para o estudante se familiarizar

com os termos da bioestatística, sob o ponto de vista da Bioestatística Clínica. É um

texto conciso e de relevância para o estudante do curso de licenciatura em biologia.

[6] MENDENHALL, William. Probabilidade e Estatística. (Trad.: José Fabiano da

Rocha; Introduction to Probability and Statistics); Vol. 1. Rio de Janeiro, RJ, Campus,

Page 21: Bio e Statistic A

1985, 325p.

É um livro de estatística seqüencial sob o tema, mas apresenta o capítulo 1, como

sendo muito bom para o estudante, nesse momento.

[7] MILONE, Giuseppe & ANGELINI, Flávio. Estatística Geral. Vol. I. São Paulo, SP;

Atlas, 1983, 206p.

É um livro antigo, contendo um capítulo sobre a história da estatística que se destaca

como importante, no momento. Deve ser consultado, se houver interesse e tempo

do aluno, sobre este capítulo. Não é de relevância para os objetivos do curso e desse

texto.

[8] MORIN, Edgar; CIURANA, Emílio-Roger & MOTTA, Raúl. Educar na Era

Planetária: o pensamento complexo como método de aprendizagem no erro e na

incerteza humana. (Tradução de Sandra Trabucco). São Paulo, SP; Cortez, Brasília,

DF: UNESCO, 2003, 111p.

Este é um livro que você deve ter em sua biblioteca pessoal, não somente para esse

momento, mas para você começar a pensar a Educação Científica. Sua citação nesse

texto fora para mostrar a diferença entre complexo e complexidade, muito bem

exposto pelos autores.

[9] NÖRT, W. Panorama da Semiótica: de Platão a Pierce. São Paulo, SP: Annablume,

1995, Coleção E, 159p.

Este livro oferece ao leitor uma oportunidade ímpar, de compreender o significado da

semiótica para uma formação científica. Deve ser ele, numa oportunidade futura uma

leitura importante para o estudante em formação de licenciatura.

[10] PAIS, Luiz Carlos. Didática da Matemática: uma análise da influência francesa.

Belo Horizonte, BH; Autêntica, 2001, 125p.

A introdução desse livro na bibliografia teve o objetivo de fazer uma distinção entre

conhecimento e saberes, pois em educação faz-se necessário conhecer essa

diferença para uma melhor performance de sua atuação como professor(a). Se

houver interesse de o estudante querer conhecer sobre: transposição didática;

criações didáticas; epistemologia do professor; obstáculos epistemológicos e

didáticos; os conceitos e as definições; complexidade do conceito e engenharia

didática. Este livro é um bom referencial para sua formação profissional, embora

esteja formatado para a disciplina matemática.

Page 22: Bio e Statistic A

[11] PERRENOUD, P. et. al. As competências para Ensinar no Século XXI: A formação

dos profissionais e o desafio da avaliação. Rio Grande do Sul, RS, Porto Alegre:

ARTMED, 2002, 176p.

Este livro é indicado para o profissional da educação, e apresenta as ênfases de um

trabalho na escola do século XXI. Deve ser lido numa oportunidade futura pelos

estudantes de licenciatura.

[12] STEVENSON, William. Estatística Aplicada à Administração. Tradução: Alfredo

Alves de Farias; Business Statistics). São Paulo, SP. HARBRA, 1981, 495p.

Este é um livro específico de estatística, voltado para à administração, porém pode

ser consultado pelo estudante de biologia sobre alguns conceitos matemáticos.

[13] ZAR, Jerrold H. Biostatistical Analysis. 4ª Edição. USA, Pretece-Hill, 1999, 663p.

Este é um livro específico para a bioestatística, muito bem estruturado, embora

seqüencial, mas com o diferencial de que está escrito na língua inglesa. Mas, se o

estudante ler em inglês, este livro é uma referência para todo o seu curso de

bioestatística.

Page 23: Bio e Statistic A

Introdução à Bioestatística FASCÍCULO

Gilberto Pereira da Silva

Mário de Souza

Carga Horária 10 horas

-Compreender o gráfico como uma forma de linguagem matemática

necessária ao estudo estatístico;

-Entender o gráfico como uma das formas de melhor visualizar os dados

construídos e tabelados numa pesquisa;

2Objetivos

Page 24: Bio e Statistic A

-Conhecer como se desenvolve a construção desses gráficos dentro de uma análise

matemática de sua construção.

Muitas das investigações sistêmicas no processo do conhecimento científico, ou

seja, na formação de saberes, aqui em relevo, a biologia, há necessidade de levantar

dados numéricos. Esse fato traz consigo, muitas das vezes, a premissa da construção

de gráficos a partir dos dados coletados. Nesse momento, temos dois fatos

interessantes: primeiro, o processo de contagem desses dados coletados e, segundo,

o gráfico a ser construído.

Esses dois fatos vêm da característica ímpar da estatística que busca a análise e a

interpretação dos dados como forma de viabilizar uma possibilidade de conclusão

baseada nas coletas de dados junto à análise gráfica, ou seja, numa linguagem visual.

Isso advém do processo das investigações sistêmicas que, organizadas desse modo,

têm a vantagem de apresentar um maior número de informações que podem ser

retiradas (compreendidas) de dentro do contexto da tabulação e/ou do gráfico, ou

seja, no contexto da análise estatística.

Sendo assim, há uma necessidade de compreender como se constroem as

tabulações como também os processos de construções de gráfico, bem como os

seus tipos e suas possibilidades de viabilizar informações visuais, buscados no

processo de coletagem de dados previamente tabulados. Aqui vale salientar que o

termo informações está atrelado à capacidade de leitura do gráfico ou tabela que está

à disposição para a análise.

Nesse espectro, temos que compreender que o processo analítico inclui a análise de

informação qualitativa e quantitativa, na qual, essas informações estão contidas nos

tipos de variáveis, já estudadas no fascículo anterior. Isso caracteriza a idealização de

informação, para este estudo, repito, como uma capacidade de leitura e

interpretação que se faz diante do gráfico ou da tabela em processo de análise.

Assim sendo, a informação qualitativa está, do mesmo modo que as variáveis,

dividida em duas categorias.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

24

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Introdução

Page 25: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

25

[a] nominal, na qual os atributos, em princípio não têm uma relação bem definida

entre eles. Por exemplo: tipo sangüíneo e classificação da cor da pele são

informações nominais que podem ser obtidas numa pesquisa, porém não existe

nenhuma relação entre esses dois atributos, ou seja, uma relação ou função bem

definida entre o tipo sangüíneo e a cor da pele.

[b] ordinal, na qual os atributos possuem uma ordem (crescente ou decrescente) ou

um julgamento de: grande/médio/grande; leve/moderado/grave, entre outros. Por

exemplo, uma pessoa X tem uma hipertensão moderada, enquanto que a pessoa Y

tem uma hipertensão grave. Logo, esses são atributos que têm uma ordem, embora

não quantificada, por isso estão na categoria qualitativa.

Enquanto que a informação quantitativa está seguindo a mesma trilogia, também,

dividida em duas categorias.

[a] discreta, na qual os atributos não estão numa ordem, mas dentro de uma faixa de

valores encontrados discretamente. Exemplo, o número de bactéria x em um volume

de urina, encontrada numa pessoa, nos meses de março, maio e julho, após esta

pessoa ter sido infectada no mês de março, e submetida a um tratamento. Esses são

dados discretos obtidos para cada um dos meses, após ter sido detectada a referida

bactéria.

[b] contínua, na qual os atributos podem estar dentro de uma faixa contínua de

valores. Por exemplo, a altura de um grupo de mil jovens entre 15 e 18 anos, de várias

regiões do Brasil, que foram escolhidos aleatoriamente.

O fato interessante é que, nessa última informação, é que iremos nos deter,

considerando o carro chefe no processo de criação de tabelas e gráficos, pois são

dados quantitativos. Por isso, entende-se como informação quantitativa os atributos

quantificados e dispostos num intervalo numérico.

Um fator observável na construção de dados com intervalos numéricos a serem

plotados (desenhados) é a questão do Zero. Pois, na construção de gráficos existe a

necessidade de compreendermos o Zero, aqui entendido como a origem do sistema

de coordenadas, em que se está trabalhando. Isso se faz necessário, pois, às vezes,

esse ponto é arbitrário. Esse fato dá uma certa “liberdade” para quem constrói gráfico

com esta possibilidade.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Page 26: Bio e Statistic A

[a] Suponha que queremos plotar o gráfico dos diâmetros de um conjunto de árvore

de um parque de preservação florestal, com mais de dez anos de existência. Temos

aqui o limite de área, que é o tamanho do parque. A definição do conjunto, que são as

árvores. E a amostra, que é composta por árvores desse parque, com um mínimo de

dez anos. Feita a catalogação desses diâmetros, vamos plotar o gráfico com a

quantidade de árvores com diâmetros nas faixas F1, F2, F3 e F4 (determinado após as

pesquisas, segundo um critério matemático). Nesse caso, poderíamos tomar, por

exemplo, diâmetros entre 0 e 20cm, como sendo a F1. Neste caso, o “zero” está

inserido numa faixa, e não é um ponto.

[b] Suponha agora que queremos plotar o gráfico das temperaturas médias

encontradas em cinco pontos distintos de um parque de preservação florestal, a

partir das seis horas da manhã até as dezoito horas de um mesmo dia, durante uma

semana de cada mês. Aqui, vê-se que não vamos encontrar a temperatura de zero

graus, logo, ao traçar o gráfico da semana de cada mês versos a temperatura, não

teremos o ponto zero no gráfico, apesar de poder colocá-lo como referência. Embora

esta referência seja útil para dimensionarmos o eixo das abscissas (ou o eixo x, no

sistema de coordenada cartesiana).

Classifique as grandezas abaixo em: nominal; ordinal; discreta e contínua.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

26

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplos:

Exercício 2.1

Descrição Nominal Ordinal Discreta Contínua

Sexo do grupo de adolescente de uma escola

Grupo de fumantes ou não fumantes

Número atendido de ataques de angina

Pressão arterial do conjunto de funcionário

Peso de cada elemento de um grupo escolar

Tipo de parto (normal/cesária)

Número de praia poluída no NE do Brasil

Nível de colesterol sérico (mg/100cc)

Condição de saúde (doente / não doente)

Número de filhos de cada família em Recife

Page 27: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

27

Esse é o primeiro passo dado que busca compreender a construção de tabelas de

contagem e a construção de gráficos. Para tal, um elemento que se destaca é a

Apuração de Dados. Vejamos o que isto significa.

É o processo pelo qual conta-se o número de vezes em que a variável assumiu um

determinado valor.

Número de filhos de cada família da Rua X, do Bairro Y, da cidade do Recife, em

PE/Brasil.

Logo, para resolver esse problema, ou seja, para levantar dados, precisamos apurá-

los, definindo primeiro quem é a variável. Nesse caso, vamos chamar de X essa

variável, que, pela natureza do problema, é o indivíduo: família. Assim sendo, temos:

X: número de filhos de cada família

Agora, cada família possui um certo número de filhos por decisão interna desta. Cabe

ao estatístico, apenas, levantar a apuração desses dados para, depois, um conjunto

de especialista (da área social, por exemplo), faça uma análise dos dados

encontrados. Agora temos que apurar o número de elementos (filhos) de cada

família, ou seja, cada família agora terá assumido um valor.

Vamos supor que nesse espaço de reserva para a pesquisa, ou seja, rua X, bairro Y, da

cidade do Recife, existam 20 (vinte) casas. E do levantamento observou-se que, se

associarmos cada casa como sendo uma família, temos:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Apuração de Dados

Exemplo:

Page 28: Bio e Statistic A

Numa rápida análise desses dados, percebemos que o maior número de filhos se

encontra na casa 15, que é de seis filhos, e o menor número de filhos encontrados,

fora de zero. Assim, num primeiro momento, podemos dizer que o número de filhos

dessa amostra, varia de zero até seis.

[a] famílias com 0 filho estão nas casas: 03, 04.[b] famílias com 1 filho estão nas casas: 05, 10, 12, 19.[c] famílias com 2 filhos estão nas casas: 01, 08, 13, 14, 17, 18.[d] famílias com 3 filhos estão nas casas: 07, 16, 20.[e] famílias com 4 filhos estão nas casas: 02, 11.[f] famílias com 5 filhos estão nas casas: 06, 09.[g] famílias com 6 filhos está na casa: 15.

X número de filhos de cada família (variável).X número de famílias (indivíduo).i

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

28

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

CASA NÚMERO DE FILHOS CASA NÚMERO DE FILHOS

01 2 11 4

02 4 12 1

03 0 13 2

04 0 14 2

05 1 15 6

06 5 16 3

07 3 17 2

08 2 18 2

09 9 19 1

10 1 20 3

E temos que:

Ou seja:

Onde podemos tabular:

Número de filhos - X 0 1 2 3 4 5 6

Número de famílias - xi 2 4 6 3 2 2 1

Page 29: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

29

Dizemos, então, que

[a] a variável 0 filho assume valor 2, ou seja, duas famílias.

[b] a variável 1 filho assume valor 4, ou seja, quatro famílias.

[c] a variável 2 filhos assume valor 6, ou seja, seis famílias.

[d] a variável 3 filhos assume valor 3, ou seja, três famílias.

[e] a variável 4 filhos assume valor 2, ou seja duas famílias.

[f] a variável 5 filhos assume valor 2, ou seja, duas famílias.

[g] a variável 6 filhos assume valor 1, ou seja, apenas uma família.

Os valores assumidos por cada variável recebem o nome de freqüência de

ocorrência, sendo representados pela letra f. Assim, numa tabulação estatística, a

forma de apresentar esses dados pode ser da seguinte maneira:

Essa forma de apresentar dados é mais lucrativa em termos de sistematização de

informação, pois, numa olhada (informação visual), podemos obter informações

mais concisas a respeito dessas famílias.

Observe, também, que o número de filhos pode ser calculado com um olhar sobre a

tabela acima, ou seja, basta multiplicar o número de filhos por cada freqüência de

ocorrência e, depois, somar, assim sendo:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

TABELA – 01

APURAÇÃO DOS DADOS

Número de filhos - n Freqüência de ocorrência - f

0 2

1 4

2 6

3 3

4 2

5 2

6 1

TOTAL

20

Page 30: Bio e Statistic A

Nº de filhos = 0x2 + 1x4 + 2x6 + 3x3 + 4x2 + 5x2 + 6x1 = 0 + 4 + 12 + 9 + 8 + 10

+ 6 = 49

Um outro dado que pode ser obtido desta tabela é o percentual da freqüência de

ocorrência, ou seja, as freqüências relativas, que será representada por fr. Onde:

Freqüência relativa é a razão entre o número de ocorrência de uma certa variável pelo

total das freqüências de ocorrência, ou seja:

onde o é o total da soma de todas as freqüências de ocorrência

Assim, para o primeiro caso, em que o número de filhos é zero temos:

Desse modo, a tabela 01 pode ser refeita e colocada na forma:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

30

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

??

ii

ir

f

ff

∑i

if

1,020

2 ==rf

TABELA – 02

APURAÇÃO DE DADOS

n fi n x fi fr

0 2 0 2/20 = 0,10

1 4 4 4/20 = 0,20

2 6 12 6/20 = 0,30

3 3 9 3/20 = 0,15

4 2 8 2/20 = 0,10

5 2 10 2/20 = 0,10

6 1 6 1/20 = 0,05

TOTAL 20 49 20/20 = 1

Page 31: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

31

Observe que esta tabela pode ser ainda acrescida de uma informação em percentual

para os dados obtidos da freqüência relativa. Assim:

Agora, podemos perceber que, o maior percentual está ligado às famílias que

possuem dois filhos (30%), seguindo-se das famílias que possuem um filho (20%), ou

seja, metade das famílias dessa rua têm um ou dois filhos.

01 - Em uma pesquisa realizada com 200 pessoas, pergunta-se. Qual o seu estado

civil? As respostas foram: [a] solteiro: 70; [b] separado: 30; [c] casado: 80 e [d] viúvo:

20. Construa a tabela:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

TABELA – 03

APURAÇÃO DE DADOS

n fi n x fi fr %

0 2 0 2/20 = 0,10 10

1 4 4 4/20 = 0,20 20

2 6 12 6/20 = 0,30 30

3 3 9 3/20 = 0,15 15

4 2 8 2/20 = 0,10 10

5 2 10 2/20 = 0,10 10

6 1 6 1/20 = 0,05 5

TOTAL 20 49 20/20 = 1 100

Exercícios 2.2

APURAÇÃO DE DADOS

Estado civil - n

Freqüência de ocorrência - fi

Freqüência relativa - fr

Porcentagem %

TOTAL

Page 32: Bio e Statistic A

02 - Em uma pesquisa socioeconômica sobre itens de conforto, perguntamos a

800 entrevistados: quantos aparelhos de televisão em cores há em sua casa? Os

resultados aparecem na tabela abaixo: (complete a tabela).

Observação 01:

Todas essa tabelas até agora estudadas são as ditas tabelas unidimensionais, ou seja,

trabalha-se com uma variável. Caso estejamos a trabalhar com duas variáveis, por

exemplo, dizemos que ela é do tipo tabelas bidimensionais. Vejamos um exemplo de

uma tabela bidimensional:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

32

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

APURAÇÃO DE DADOS

Número de aparelhos n

Freqüência de ocorrência - fi

Freqüência relativa - fr

Porcentagem %

0 20

1

2

3 0,6

4 7,5

5 30

TOTAL

Distribuição de pacientes, segundo ronco noturno e doença cardíaca

DOENÇA CARDÍACA TOTAL

Sim Não

RONCO NOTUR NO

n % n % n %

Não 24 1,7 1355 98,3 1379 100

Ocasional 35 5,5 603 94,5 638 100

Quase sempre as noites 21 9,9 192 90,1 213 100

Sempre 30 11,8 224 88,2 254 100

TOTAL 110 4,4 2374 95,6 2484 100

Fonte: Hand DJ et al. A handbook of small data sets. Chapman & Hall, 1994.

Page 33: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

33

Com esta informação adicional, os dados a seguir são relativos ao peso ao nascer (em

gramas) de recém-nascidos com síndrome de desconforto idiopático grave. Algumas

crianças foram a óbito (*), e outras sobreviveram.

03 - Apresente as variáveis em tabelas unidimensionais, classificando-as em: [a]

abaixo do peso (menos que 2500g) e [b] não abaixo do peso (maior ou igual a 2500g).

04 - Faça uma tabela bidimensional, cruzando as variáveis: [a] condição do recém-

nascido (sobrevivente ou não sobrevivente) e [b] peso ao nascer (baixo peso e não

baixo peso).

05 - Interprete o resultado obtido na questão anterior, ou seja, imagine-se como

um especialista na área de saúde que irá informar estes resultados a um outro colega

especialista de um outro hospital.

Observação 02:

-Ao usarmos nas tabelas o nome freqüência de ocorrência, faz-se necessário saber

que, muitas vezes, nessa coluna, aparece simplesmente o nome freqüência ou

freqüência absoluta. Que agora pode ser representada apenas por f, e não há

necessidade de apresentarmos como fi como vínhamos fazendo, fato que simplifica

a tabela embora o significado seja o mesmo.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Com esta informação adicional, os dados a seguir são relativos ao peso ao nascer (em gramas) de recém -nascidos com síndrome de desconforto idiopático grave. Algumas

crianças foram a óbito (*), e outras sobreviveram.

1030* 1300* 1720 2090 2570 1050* 1310* 1750 2200* 2600 1100* 1410 1760 2200 2700 1130 1500* 1770* 2270* 2730* 1175* 1550* 1820 2275 2830 1185* 1575 1890* 2400 2950

1225* 1600* 1930 2440 3005 1230* 1680 1940* 2500 3160 1262* 1715 2015 2550 3400 1295* 1720* 2040 2560 3640

Fonte: Hand DJ et al. A Handbook of small data sets. Chapman & Hall, 1994

Page 34: Bio e Statistic A

-Um outro caso de estudo das freqüências na construção das tabelas, para uma

posterior construção de gráficos, é a chamada freqüência acumulada. Esse tipo de

freqüência pode incidir sobre as freqüências absolutas e sobre as freqüências

relativas. Como o próprio nome sugere, a freqüência acumulada é a soma (acúmulo)

das freqüências absolutas ou relativas de dois ou mais subconjuntos de dados.

Para melhor entendermos esse processo, vamos calcular as freqüências acumuladas

absolutas faa e as freqüências acumuladas relativas far, partindo-se da tabela 03.

Isso apresenta uma grande vantagem para a leitura da tabela, pois, num olhar sobre

ela pode-se perceber que famílias com números de filhos menores que dois (2, 1 ou

0) são maioria, ou seja, são 12 (ver faa) dentre as 20 famílias, fato que corresponde a

0,60 (60%) do total (veja que temos um acúmulo de 10 + 20 + 30 = 60).

Vale salientar que na construção da tabela 04, usamos o fato de termos faa e far

como crescente, embora nada impeça que possamos usá-la como decrescente,

conforme mostra a tabela na outra página.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

34

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

TABELA – 04

APURAÇÃO DE DADOS

n f faa fr far n x f %

0 2 2 0,10 0,10 0 10

1 4 6 0,20 0,30 4 20

2 6 12 0,30 0,60 12 30

3 3 15 0,15 0,75 9 15

4 2 17 0,10 0,85 8 10

5 2 19 0,10 0,95 10 10

6 1 20 0,05 1 6 2

TOTAL 20 1 49 100

Page 35: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

35

Construa duas tabelas em que apareçam (acrescentadas) as faa e as far, do exercício

01, conforme modelo das tabelas 04 e 05, apresentado anteriormente.

Uma forma de complementar esse dados tabulados é expressá-los através de

gráficos. Essa componente nos estudos estatísticos se faz sempre presente, quando

queremos dar uma representação gráfica ou visual daquilo que estamos a estudar.

Essa forma de apresentação tem a vantagem de mostrar de forma instantânea um

visual que será analisado diante dos problemas que se persegue, com a possibilidade

de apresentar uma maior compreensão para compreensão do que se estuda e que

está em análise. Isso representa formas mais dinâmicas, expressivas e globais de se

estudar um problema estatístico.

Para se analisar o comportamento gráfico, vamos começar a compreender o que vem

a ser o diagrama de Pareto, e, para tal, vamos verificar o significado desse nome. “No

final do século passado, um economista italiano de nome Pareto estudou a

distribuição de renda e verificou que poucas pessoas detinham a maior parte da

renda, enquanto muitas pessoas tinham, apenas, uma pequena porção da renda. [...]

Em homenagem ao economista que primeiro discutiu esse tipo de distribuição,

denominou-se a figura de “diagrama de Pareto”” (VIEIRA, 1999, p. 13).

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

TABELA – 05

APURAÇÃO DE DADOS

n f faa fr far n x f %

0 2 20 0,10 1 0 10

1 4 18 0,20 0,9 4 20

2 6 14 0,30 0,7 12 30

3 3 8 0,15 0,4 9 15

4 2 5 0,10 0,25 8 10

5 2 3 0,10 0,15 10 10

6 1 1 0,05 0,05 6 2

TOTAL 20 1 49 100

Diagrama de Pareto

Exercício 2.3

Page 36: Bio e Statistic A

O estudo dos gráficos teve também uma outra personagem importante em seus

estudos a enfermeira Florence Nightingale (1820 1910) que, em 1907, recebera das

mãos do rei Eduardo VII a ordem do mérito. Ela “foi uma das pioneiras na utilização

dos gráficos estatísticos. Nasceu na Villa Colômbia, próxima de Florença, na Itália,

em maio de 1820 e morrera em agosto de 1910, na cidade de Londres, com 90 anos.

Florense Nightingale utilizou-se dos dados estatísticos, quer em formas de tabelas,

quer em formas de gráficos, como ferramenta para suas atividades de reforma na

área de saúde... seus gráficos foram tão criativos que se constituíram num marco do

desenvolvimento da Estatística...ela foi a primeira mulher eleita membro da

Associação Inglesa de Estatística” (IEZZI, et al. 2004, pp. 170-171).

Hoje a importância dos gráficos nos estudos da Estatística e sua difusão nos meios

sociais com informações para todo um público demonstram a validade de seus

estudos e sua possível praticidade diante dos olhos do outro, ou seja, daquele que se

dispões a lê-los e a interpretá-los, segundo o vislumbre das informações contidas na

comunicação visual e dos interesses que esses elementos estatísticos (tabelas e

gráficos) apresentam para quem os lê.

E, para começar a estudá-los, vamos traçar o diagrama de Pareto para os dados da

tabela 04, fazendo, em seguida, uma indicação de como todo o processo é

constituído. É preciso entender que a construção do diagrama de Pareto parte do

princípio de que os dados já construídos num processo de elaboração as tabelas já

estejam concluídos. E, para desenhar o diagrama de Pareto, devemos, segundo Vieira

(1999, p. 15), adotar os seguintes passos:

[a] trace um eixo horizontal e divida esse eixo em tantas partes iguais quantas são as

categorias listadas na tabelas;

[b] trace um eixo vertical e escreva nele as freqüências;

[c] trace barras verticais, com base no eixo horizontal e altura igual à freqüência da

categoria. A figura resultante é o diagrama de Pareto;

[d] complete a figura, colocando título, unidades, datas e nome do responsável pela

coleta de dados.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

36

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Page 37: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

37

Para termos uma idéia desse processo, elabora-se o Diagrama de Pareto para os

dados da Tabela 02. Vejamos o gráfico:

Um outro diagrama importante também é a chamada curva de Pareto que tem

origem no gráfico anterior e faz uso da freqüência absoluta acumulada ou da

freqüência acumulada relativa.

Observe na tabela 04 que, para o caso inicial de zero filho, temos 0,20 (20%) para os

dois caso juntos, ou seja, zero e um filho temos 0,30 (0,10 + 0,20), ou seja, 30%. E,

assim por diante, conforme a citada tabela, que termina em 1 (100%).

Vejamos esta construção. Primeiro: elabora-se o gráfico conforme o anterior, com

um detalhe a mais, que é o fato da parte superior ser maior para tomar os dados

referentes à far. Segundo: do lado esquerdo do gráfico, estão os dados referentes ao

número de filhos, logo, do lado direito, encontrar-se-ão as informações relativas as

far. Terceiro: em cada lado direito de cada coluna que referenda o número de filhos,

marca-se o ponto referente a far. Quarto: liga-se cada ponto encontrado no lado

direito de cada coluna, formando o que se chama de curva de Pareto. Observe que

escolhemos a far, e em nada mudaria (em passos de construção dessa curva), se

tivéssemos tomado a faa.

Como o referido gráfico vai de 0 (zero) até 7 (sete), na abscissa, enquanto a far vai de

0,10 até 1,00, na ordenada. Por esse motivo, vamos colocar o gráfico com dez

divisões na ordenada significando cada parte correspondente a 0,10 ou 10%.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Page 38: Bio e Statistic A

Desse modo, observe que a referida construção segue os mesmos passos para o caso

da far decrescente (o gráfico acima se refere a far crescente).

Preencha a tabela abaixo e, em seguida, construa o diagrama de Pareto para os tipos

de defeitos. Depois faça a curva de Pareto para, também os tipos de defeitos.

Um outro tipo de gráfico usado em dados estatísticos é o denominado Gráfico de

Barras. Geralmente é usado para representar variáveis qualitativas ou ordinais. Sua

construção é parecida com o gráfico de colunas, primeiramente, construindo-se o

sistema de eixos cartesianos; segundo, no eixo das abscissas (ou das ordenadas),

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

38

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exercício 2.4

Distribuição de peças, segundo o tipo de defeito

Tipo de defeito

Freqüência absoluta

Freqüência absoluta

acumulada

Freqüência relativa

Freqüência acumulada

relativa

Saliências 19

Asperezas 18

Riscos 12

Manchas 10

Cor 10

Outros 11

Total 80

Page 39: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

39

colocam-se as categorias da variável que está se estudando ou analisando.

Finalizando, constroem-se as barras com comprimento equivalente à freqüência

absoluta ou freqüência relativa.

Exemplo:

Na tabela abaixo, apresenta-se o número de internações em estabelecimentos de

saúde, por espécie de clínica, no ano de 1992. Veja o gráfico de barras desses dados

logo abaixo.

Também usado para representar variáveis qualitativas ou ordinais. “Para fazer um

gráfico de setores, primeiro se traça uma circunferência que, como se sabe, tem

360º. Essa circunferência representa o total, ou seja, 100%. Dentro dessa

circunferência, devem ser representadas as categorias da variável em estudo. Para

isso, toma-se a freqüência relativa de cada categoria e calcula-se o ângulo central da

seguinte maneira: se 100% correspondem a 360º, uma categoria com freqüência

relativa fr terá um ângulo central x, tal que (VIEIRA, 1980, 20)”.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Espécie de clínica Freqüência absoluta Freqüência relativa

Médica 6.457.923 32,51%

Ginecológica e Obstetrícia 3.918.308 19,73%

Cirurgia 3.031.075 15,26%

Pediatria 2.943.939 14,82%

Outras 3.513.186 17,69% Fonte: IBGE, Diretoria de Pesquisa, Pesquisa de Assistência Médico – Sanitária.

Gráfico de Setores

Page 40: Bio e Statistic A

Tomar o exercício anterior o qual está se referindo ao número de internações em

estabelecimento de saúde, por espécie de clínica, em 1992, a fim de elaborar o

gráfico de setores para o levantamento de dados apresentados.

Uma outra forma de apresentar dados gráficos é colocá-los na forma de um

histograma (dados agrupados). Mas, antes de construirmos um histograma, vejamos

alguns passos que ascendem o momento de formatar o gráfico. Para isso vejamos a

tabela abaixo:

3Consumo de água, em m , de 75 contas da SABESP

1º Passo: Identificar o tamanho da amostra

N = 75

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

40

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

100 360º fr x

logo:

100

360 rfx ?

Exercício 2.5

Histograma

32 14 22 11 34 40 16 26 23 13 31 27 10 38 17

45 25 10 18 23 35 22 30 14 18 20 13 24 35 29

33 48 20 12 31 39 17 58 19 16 12 21 15 12 20

51 12 19 15 41 21 29 25 13 23 32 14 27 43 37

28 37 26 44 11 53 38 46 17 36 28 49 56 19 11

Page 41: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

41

2º Passo: Identificar o maior valor nesse conjunto de dados

H = 58

3º Passo: Identificar o menor valor nesse conjunto de dados

L = 10

4º Passo: Calcular a Amplitude total que é a diferença entre H e L

A = H L A = 48

5º Passo: Calcular o número de intervalo de classe

k = 1 + 3,22logN

k = 1 + 3,22log75

k = 7,04 ou k > 7; k = 8

6º Passo: Calcular a Amplitude de Classe

AC = A / k

AC = 48 / 8 = 6

Ou seja:

Menor valor é 10, com a AC = 6, e k = 8, logo.

1) 10 + 6 = 16

2) 16 + 6 = 22

3) 22 + 6 = 28

4) 28 + 6 = 34

5) 34 + 6 = 40

6) 40 + 6 = 46

7) 46 + 6 = 52

8) 52 + 6 = 58 (maior valor).

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Page 42: Bio e Statistic A

Veja que o número de intervalos de classe esperado, que é um valor inteiro e logo

acima de 7, ou seja, 8, casou bem com os dados obtidos. Pois, a Amplitude de Classe,

que é 6, e, partindo-se do menor valor com a soma dessa AC, chegamos ao maior

valor com uma coerência dos dados, ou seja, na prática encontraram-se os 8

intervalos de classe, antes previstos.

Veremos agora como montar os intervalos. Já sabemos que o menor valor é 10, e o

valor da Amplitude de Classe é 6, logo, a primeira classe consistirá dos dados entre

10 até 16. Ou seja, a partir do valor 10 até números próximos de 16, sem ser

necessariamente o 16. E, assim, segue durante toda a construção das outras classes.

Antes, vamos fazer a contagem dos dados contidos em cada classe, o que vai

representar a freqüência absoluta. Sendo assim, temos a tabela:

Observação:

A Amplitude total está aqui representada pela letra A, porém, ela também aparece AT

em algumas representações. O importante aqui é o estudante entender o seu

significado.

Com estes dados, agora, passamos a construir o histograma. Para tal, desenhamos o

sistema de eixos cartesiano, no qual: no eixo das abscissas representamos os

intervalos de classes e no eixo das ordenadas, as freqüências absolutas.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

42

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Classe Freqüência absoluta

Freqüência relativa

10 ? 16 16 21,33%

16 ? 22 15 20,00%

22 ? 28 12 16,00%

28 ? 34 10 13,33%

34 ? 40 9 12,00%

40 ? 46 6 8,00%

46 ? 52 4 5,33%

52 ? 58 3 4,00%

TOTAIS 75 100%

Page 43: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

43

Na parte superior deste gráfico, traçamos o polígono de freqüência. Para tal, basta

tomar o ponto médio de cada coluna em sua parte superior e unir cada um desses

pontos. Observe o polígono de freqüência na linha que envolve o histograma.

Um outro fato também importante na construção dos histogramas é colocar no lugar

das representações dos intervalos I1, I2, ..., I8 poderíamos colocar o valor do ponto

médio de cada intervalo de classe. Onde o primeiro ponto médio seria:

E sucessivamente teríamos: P = 19, P = 25, .... (façam os outros).2 3

Poderíamos construir, também, o histograma, envolvendo as freqüências relativas

acumuladas. Isto fica como um exercício de aprendizagem.

Dada a tabela abaixo, dos pesos de crianças nascidas vivas em quilogramas, construa

o histograma de freqüência absoluta e de freqüência relativa. E, ao representar o

histograma, registre o ponto médio de cada intervalo de classe.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

132

16101 ???P

Exercício 2.6

Page 44: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

2

44

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Peso ao nascer de nascidos vivos em quilogramas

2,522 3,100 2,900 3,100 3,600 3,200 2,700 2,750 2,480 2,900

2,720 3,200 2,950 3,150 2,500 4,100 3,150 4,200 3,900 3,700

3,125 2,780 2,480 2,800 2,300 2,400 2,800 2,100 2,500 2,120

3,250 3,155 3,800 2,900 2,950 2,700 2,700 4,450 2,480 3,150

3,220 2,150 2,500 1,900 3,000 2,450 3,300 2,900 2,450 2,400

3,000 3,300 3,550 3,600 3,750 3,400 3,200 2,920 3,400 3,450

3,725 3,250 3,000 3,200 3,150 2,400 3,200 2,720 3,400 3,120

2,890 3,200 4,100 3,300 3,200 3,120 2,800 2,900 1,570 2,120

3,110 3,720 3,200 2,900 2,500 3,400 4,600 2,000 3,800 2,450

3,520 2,800 3,450 2,500 2,900 3,200 1,720 2,720 2,700 2,700

Page 45: Bio e Statistic A

Referência Bibliográfica

IEZZI, Gelson, et al. Fundamentos da Matemática. Vol 11. SP: Atual,

2004.

Este é um livro técnico, mas tem uma apresentação matemática do tema

Estatística, ao nível de Ensino Médio, muito bom e pode servir a você,

neste momento do curso, caso haja um desejo de conhecer mais a

Estatística Descritiva.

MILONE, G. e ANGELINI F. Estatística Geral. SP: Atlas, 1993.

Este é um livro dirigido em sua especificidade que é a Estatística. O seu

forte é uma linguagem clara dos conceitos trabalhados em Estatística.

VIEIRA, S. Introdução à Bioestatística. 3ª Ed. 12ª Tiragem. SP: Campus,

1980.

Um livro que pode ser consultado por você no referido curso.

Page 46: Bio e Statistic A
Page 47: Bio e Statistic A

Percentagens, Índices,

Coeficientes e Taxas FASCÍCULO

Gilberto Pereira da Silva

Mário de Souza

Carga Horária - 10 horas

- Compreender o significado de percentagem

- Entender o significado de dados relativos

- Conhecer a utilidade na construção de números-índices, coeficientes e

taxas

3Objetivos

Page 48: Bio e Statistic A

Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação se

não a contagem ou medida, são chamados dados absolutos. A leitura dos dados

absolutos é sempre enfadonha e inexpressiva; embora esses dados traduzam um

resultado exato e fiel, não tem a virtude de ressaltar de imediato as suas conclusões

numéricas. Daí o uso imprescindível que faz a estatística dos dados relativos. Dados

esses, que são resultados de comparação por quociente (razões) que se estabelecem

entre dados absolutos e tem por finalidade realçar ou facilitar as comparações entre

quantidades. Traduzem-se os dados relativos, em geral, por meio de percentagens,

índices, coeficientes e taxas.

São razões que consistem em considerar um total qualquer igual a 100% e, através de

uma regra de três, estabelecer qualquer relação com as parcelas que compõem o

total assim:

Onde o x na regra de três está representado na equação logo a seguir pela palavra

percentagem. Isto significa que o valor de x, encontrado na regra de três, expressa um

valor na forma de percentagem (daí a multiplicação por 100% que tem o significado

de total). Por exemplo, encontrando-se x = 32 se expressa esse valor na forma de

percentagem 32%.

01 - Em 1995 o Banco do Brasil (BB) renegociou a dívida de R$ 7,1 bilhões dos

agricultores, que foi dividida em parcelas a serem pagas até o final de cada ano. O

valor da primeira parcela era R$ 700 milhões, mas somente metade foi pago; da

segunda parcela (totalizando R$ 1,1 bilhão) vencida em 1997 somente foi pago 26%

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

48

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Introdução

1 - Percentagens

Total — 100% Parcela — x%

O que nos leva a:

100parcela

percentagemtotal

? ?

Exercícios 3.1

Page 49: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

49

do devido. Em 1997 o lucro líquido do BB foi de R$ 646,4 milhões. Quantas vezes a

dívida restante dos agricultores no início de 1998 vale o lucro líquido do BB em 1997?

02 - Uma empresa agropecuária desenvolveu uma mistura, composta de fécula de

batata e farinha, para substituir a farinha de trigo comum. O preço da mistura é 10%

inferior ao da farinha de trigo comum. Uma padaria fabrica e vende 5.000 pães por

dia. Admitindo-se que o kg da farinha comum custa R$ 1,00 e que com 1kg de farinha

ou da nova mistura a padaria fabrica 50 pães, determine:

[a] a economia, em reais, obtida em um dia, se a padaria usar a mistura em vez

da farinha de trigo comum;

[b] o número inteiro máximo de quilos da nova mistura que poderiam ser

comprados com a economia obtida em um dia e, com esse número de quilos,

quantos pães a mais poderiam ser fabricados por dia.

03 - No mês de agosto, Pedro observou que o valor da sua conta de energia elétrica

foi de 50% superior ao valor da sua conta de água. Em setembro, tanto o consumo de

energia elétrica, quanto o de água, na residência de Pedro, foram iguais aos

consumos do mês de agosto. Porém, como as tarifas de água é energia elétrica foram

reajustadas em 10% e 20%, respectivamente, Pedro desembolsou R$ 20,00 a mais do

que em agosto para quitar as duas contas. Quanto Pedro pagou de energia elétrica no

mês de setembro?

04 - No mês de janeiro de determinado ano, uma categoria profissional tem direito

a um aumento salarial de 75%. Como a categoria já havia recebido uma antecipação

de 25% em novembro, qual deve ser a porcentagem de acréscimo adicional do

salário para compensar a antecipação concedida?

05 - Um comerciante compra uma peça de tecido de 50m. Se ele vender 20m com

um lucro de 50%, outros 20m com um lucro de 30% e os restantes pelo preço de

custo, calcule seu percentual de lucro na venda da peça.

06 - Sabendo-se que o Índice Geral de Preços ( IGP ) de junho de 2002 foi de 1,74%

e no mês de julho do mesmo ano foi de 2,05%, qual o percentual de aumento de um

mês para o outro?

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Page 50: Bio e Statistic A

Um outro fato também importante, é que as percentagens podem ser utilizadas de

inúmeras formas, segundo a circunstância que queiramos estudar. Vejamos dois

casos:

Primeiro: Quando quisermos analisar a estrutura de um fato, deveremos ratear as

porcentagens entre os itens que compõem esse fato.

Consideremos a série:

Calculemos as percentagens dos alunos de cada nível de ensino:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

50

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Matrículas nas Instituições de Ensino da cidade Z ano 2000

Categorias Número de Alunos (Dados Absolutos)

Ensino Fundamental 19286 Ensino Médio 1681 Ensino Superior 234

Total 21201

Fonte: Dados Fictícios

Ensino Fundamental ? 96,9021201

10019286 ?x Isto nos leva a

91,0%

Ensino Médio ? 92,721201

1001681 ?x Isto nos leva a

7,9%

Ensino Superior ? 10,121201

100234 ?x Isto nos leva a

1,1% Observe a soma: 91,0% + 7,9% + 1,1% = 100%

Page 51: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

51

Com esses dados podemos formar uma nova coluna na série em estudo:

Matrículas nas Instituições de Ensino da cidade Z ano 2000

Vamos agora fazer uma interpretação dos dados obtidos nesta nova coluna. Esses

valores nos dizem que, cada 100 alunos da cidade Z, 91 estão matriculados no Ensino

Fundamental, 8, aproximadamente, no Ensino Médio e 1 no Ensino Superior. Com

isto, podemos observar que o emprego da percentagem é de grande valia quando é

nosso intuito destacar a participação da parte no todo. Este estudo comparativo pode

ser muito útil na análise de dados numa série estatística, como podemos ver a seguir.

Consideremos, agora, a série:

Qual das cidades tem, comparativamente, maior número de alunos em cada nível de

ensino?

Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a

respeito usando os dados absolutos. Porém, usando as percentagens, tal tarefa

apresenta-se como a forma ideal para a resposta ao questionamento. Para tal, vamos

acrescentar na tabela anterior as colunas correspondentes às percentagens, relativa a

cada nível de ensino, para cada cidade.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Categorias Número de Alunos % (Dados Relativos)

Ensino Fundamental 19286 91,0 Ensino Médio 1681 7,9 Ensino Superior 234 1,1

Total 21201 100 Fonte: Dados Fictícios

Número de alunos

Categorias Cidade Z Cidade T

Ensino Fundamental 19286 38660 Ensino Médio 1681 3399 Ensino Superior 234 424

Total 21201 42483 Fonte: Dados Fictícios

Page 52: Bio e Statistic A

Matrículas nas Instituições de Ensino das cidades Z e T no ano 2000

A análise. A resposta com os dados brutos não seria tão bem posta, como a que se

apresenta com os dados relativos. Pois, num primeiro olhar poderíamos fazer um

julgamento errôneo do fato, uma vez que a cidade T, aos olhos dos dados brutos,

apresenta mais estudantes em todos os níveis de ensino, se comparada com a cidade

Z. Mas, quando vamos dar uma olhada nos dados relativos, isto nos permite dizer

que, comparativamente, contam, praticamente, com a mesma taxa de estudante em

cada nível de ensino. Ou, com o mesmo número de estudantes para cada deles

tomados como referência 100. E, poderíamos informar que, para cada 100

estudantes, as cidades Z e T apresentam as mesmas taxas para os três níveis de

ensino.

Do mesmo modo que tomamos 100 para a base de comparação, também podemos

tomar outro número qualquer, como por exemplo, 1 ou 1000 (base decimal).

Segundo: Quando quisermos estudar a dinâmica de um fato, ou seja, acompanhar a

evolução de um fato ao longo do tempo, deveremos estabelecer um período seja

ano, mês, dia etc. -, uma produção, uma renda etc. como sendo a base,

considerando-a como 100%.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

52

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Cidade Z Cidade T Categorias N° de Alunos % N° de Alunos %

Ensino Fundamental 19286 91,0 38660 91,0 Ensino Médio 1681 7,9 3399 8,0 Ensino Superior 234 1,1 424 1,0

Total 21201 100 42483 100 Fonte: Dados Fictícios

Observação:

Page 53: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

53

Exemplo: Produção em toneladas da Metalúrgica “ABC” ano 1995 = 100

Apenas as duas primeiras colunas fazem parte do enunciado

Exercício 3.2: Faça (continue) os cálculos para os anos: 1998; 1999; 2000 e 2001.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Base Fixa

Anos Produção (t) Ano – base 1995 ( % )

Variação Porcentual com

relação à base ( % )

95 96 97 98

99

00

01

3200 3600 3360 3360

3200

2800

3440

100,0 112,5 105,0 105,0

100,0

87,0

107,5

— + 12,5 + 5,0 + 5,0

0,0

- 12,5

+ 7,5

Base - 100% Valores - x%

Com isto:

100xBase

ValoresmPercentage ?

???

???

Vejamos os cálculos:

Ano 95 ? %1001003200

3200 ?????

??

x

Ano 96 ? %5,1121003200

3600 ?????

??

x

Ano 97 ? %0,1051003200

3360 ?????

??

x

Page 54: Bio e Statistic A

Os valores dessa nova coluna mostram como evoluíram a produção em termos

percentuais em relação ao ano1995 (base escolhida). Por exemplo:

De 1995 para 1996 a produção cresceu 12,5%.

De 1995 para 1997 a produção cresceu 5,0%.

De 1995 para 1998 a produção também cresceu 5,0%.

De 1995 para 1999 a produção foi a mesma, ou seja, não evoluiu.

De 1995 para 2000 a produção decresceu em -12,5%.

De 1995 para 2001 a produção cresceu 7,5%

Este caso difere do anterior, pois a base se modifica para cada dado. Onde, cada novo

dado sempre será relacionado com o dado anterior. Vejamos, o exemplo a seguir:

Exemplo: Produção em toneladas da Metalúrgica “ABC” Base Móvel.

Apenas as duas primeiras colunas fazem parte do enunciado.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

54

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Comentários:

Base móvel

Anos Produção (t) Base Móvel ( %)

Variações % com Relação à Base

95 96 97 98 99 00

01

3200 3600 3360 3360 3200 2800

3440

— 112,5 93,3

100,0 95,2 87,5

122,9

— + 12,5 - 6,7 0,0 - 4,8 - 12,5

+ 22,9

De forma similar ao caso da base fixa, temos:

Base – 100% Valores – x%

Com isto:

100xBase

ValoresmPercentage ?

???

???

Page 55: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

55

Exercício 3.3: Faça (continue) os cálculos para os anos: 1998; 1999; 2000 e 2001.

Os valores dessa nova coluna mostram como evoluem a produção de um ano para o

outro. Por exemplo:

De 1995 para 1996 tivemos um acréscimo na produção de 12,5%

De 1996 para 1997 a produção decaiu em -6,7%.

De 1997 para 1998 não houve alteração na produção.

De 1998 para 1999 a produção decaiu em -4,8%

De 1999 para 2000 a produção também decaiu em -12,5%

De 2000 para 2001 a produção evoluiu em 22,9%.

“Em termos gerais, um número-índice pode ser concebido como uma medida

estatística destinada a comparar, através de uma expressão quantitativa global,

grupos de variáveis relacionadas e com diferentes graus de importância. Através dele

obtém-se um quadro resumido das mudanças ocorridas em áreas afins (TOLEDO e

OVALLE, 1985, p. 311)”. Este resumo dá uma visão geral do referido tema, que aqui

será exposto apenas através das expressões quantitativas para um exercício de

configuração deste conteúdo.

Uma definição deste tema é dizer que, índices são razões entre duas grandezas tais

que uma não inclui a outra (grandezas independentes).

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Vejamos os cálculos: 95 ? Não existe dado anterior, por tanto esse percentual é inexistente.

96 ? %5,1121003200

3600 ?????

??? xmPercentage

97 ? %3,931003200

3360 ?????

??? xmPercentage

Comentários:

2 - Índices

Page 56: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

56

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

São exemplos de índices:

[a] Índice Cefálico

100xD

DIC

L

T

???

????

??

Onde: IC = Índice Cefálico; DT = Diâmetro Transverso do Crânio; DL = Diâmetro

Longitudinal do Crânio [b] Quociente Intelectual

100xI

IQI

C

M

???

????

??

Onde:

QI = Quociente Intelectual; IM = Idade Mental; IC = Idade Cronológica. [c] Densidade Demográfica

100xS

PDD

T

T

???

????

??

Onde: DD = Densidade Demográfica; PT = População Total; ST = Superfície Total.

[a] Produção Per capita

???

????

??

P

VP P

PC

Onde: PPC = Produção “per capita”; VP = Valor da Produção; P = População.

[b] Consumo Per Capita

????

???

P

CC B

PC

Onde: CPC = Consumo “per capita”; CB = Consumo do Bem; P = população.

[c] Renda Per Capita

P

RRD d

PC ?

Onde: RDPC = Renda Per Capita; Rd = Renda; P = População.

Índices Econômicos

Page 57: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

57

Exemplo:

Uma instituição beneficente possuía em 1993 a quantia de $ 200.000 diários para

atender a 4000 pessoas. Em 1996 a receita da instituição é de $ 800.000 para atender

a 8000 pessoas. Calcular a receita per capita da instituição e verificar se sua situação

por atendido melhorou ou piorou, considerando que no período de 93 a 96 houve

um acréscimo de 120% (isto é uma suposição!) no custo de vida.

Resolvendo:

X = 110 a instituição piorou, pois necessitaria de $10 a mais do

que é hoje (1996) a sua renda per capita.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

[d] Receita Per Capita

P

RRC C

PC ?

Onde: RCPC = Receita Per Capita; RC = Receita; P = População.

Logo:

1993 ? Receita per capita = 504000

200000 ?

1996 ? Receita per capita = 1008000

800000 ?

Porém: Houve um acréscimo de 120% ? aumento de um fator de 220 (120 + 100). Daí: Para manter o mesmo padrão a instituição necessitaria de:

100 - 50 220 - x

Page 58: Bio e Statistic A

É a comparação entre duas grandezas em que uma está contida na outra.

São exemplos de coeficientes:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

58

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

3 - Coeficientes

[a] Coeficientes de Natalidade

T

NN

P

NC ?

Onde: CN = Coeficiente de Natalidade; NN = Número de Nascimento; PT = População

Total. [b] Coeficiente de Mortalidade

T

OM

P

NC ?

Onde: CM = Coeficiente de Mortalidade; NO = Número de Óbitos; PT = População Total.

[a] Coeficiente de Evasão Escolar

IM

EEE

N

NC ?

Onde: CEE = Coeficiente de Evasão Escolar; NE = Número de alunos Evadidos;

NIM = Número Inicial de Matricula

[b] Coeficiente de Aprovação Escolar

FM

AAE

N

NC ?

Onde: CAE = Coeficiente de Aprovamento Escolar; NA = Número de alunos Aprovados;

NFM = Número Final de Matrícula

[c] Coeficiente de Recuperação Escolar

AR

RRE

N

NC ?

Onde: CRE = Coeficiente de Recuperação Escolar; NR = Número de alunos Recuperados;

NAR = Números de Alunos em Recuperação.

Coeficientes Educacionais

Page 59: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

59

[E] Taxa de Acidentes de Trabalho

Neste caso, ela se divide em duas partes: [i] Freqüência da Taxa de Acidentes de

Trabalho; [ii] Gravidade da Taxa de Acidentes de Trabalho.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

É a mes ma coisa que coeficiente, apenas apresentando -se multiplic ada por uma potência de 10 (dez) (10, 100, 1000 etc.) para tornar o resultado mais inteligível, uma vez que sempre especificamos os dados em formas relativas. Desse modo temos a expressão:

Taxa = Coeficiente x 10n com n = 1, 2, 3, ..... Exemplos de taxas:

[a] Taxa de Mortalidade - TM TM = CM x 103

(ver o CM na parte de Coeficientes)

[b] Taxa de Natalidade - TN TN = CN x 103

(ver o CN na parte de Coeficientes)

[c] Taxa de Evasão Escolar - TEE

TEE = CEE x 102 (ver o CEE na parte de Coeficientes)

[d] Taxa de Morbidade - TMB

Calculada para casa doença em particular, aqui a tuberculose. Numa determinada cidade, relativa a um certo período (meses, ano, decênio, etc) Y.

Teremos:

TMB = CMB x 103 Onde:

n

MBP

nC ?

Sendo:

CMB = Coeficiente de Morbidade; n = número de acometidos por tuberculose no município X,

no ano Y; Pn = População do município X, no ano Y.

4 - Taxas

Page 60: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

60

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Vejamos a primeira: 610xCT f

ATf

AT ?

Onde:

OH

acfAT

N

NC ?

Sendo: f

ATC = Coeficiente da freqüência dos Acidentes de Trabalho; Nac = Número de

acidentes; NOH = Número de Operários Hora.

Vejamos a segunda:

610xCT gAT

gAT ?

Onde:

OH

HPAgAT

N

NC ?

Sendo: gATC = Coeficiente da gravidade nos Acidentes de Trabalho; NHPA = Número de Horas

Perdidas em razão dos acidentes; NOH = Número de Operários Hora. Convém salientar que o n° de horas perdidas por acidente se conhece tendo em conta, além das horas que o acidentado deixou de trabalhar, a utilização de uma tabela específica que proporciona uma equivalência entre os tipos de incapacidade e o número de horas deb itadas à empresa em virtude do acidente. Por exemplo: perda de uma mão equivale a 3000 horas perdidas, surdez em um ouvido equivale a 600 horas perdidas etc.

I - Calcular a taxa freqüência e de gravidade em uma empresa em que, operando com 50 operários, trabalhando 500 horas cada um, ocorreram 5 acidentes com uma perda de 200 horas.

2001050050

5 6 ?? xx

T fAT

O que significa que nesta empres a, em cada 1000000 de operários –hora, ocorreram 200 acidentes.

80001050050

200 6 ?? xx

T gAT

O que significa que, nesta empresa, em cada 1000000 de operários–hora, 8000 horas são perdidas em virtudes de acidentes.

Exercícios Resolvidos

Page 61: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

61

Tivemos 154 óbitos para cada 1000 habitantes.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

II - A cidade X apresentou 12793 matr ículas nas séries iniciais, no iní cio do semestre 2000 e , 10347 no fim do ano 2000. A cidade Y apresent ou os seguintes números: 8349 no iní cio de 200 0 e 6649 matrí culas no final de 2000. Qual e a cidade que apresentou mais evasão escolar? Cidade X:

Como: TEE = CEE x 102 mas IM

EEE

N

NC ? onde N E = Número de alunos

evadidos. Logo: NE = 12793 – 10347 = 2446 e que NIM = 12793 com isto CEE = 0,191

Daí: TEE = 0,191 x 102 = 0,191 x 100 = 19,1% Cidade Y:

Como: TEE = CEE x 102 mas IM

EEE

N

NC ? onde N E = Número de alunos

evadidos. Logo:

NE = 8349 – 6649 = 1700 e que NIM = 8349 com isto CEE = 0,204 Daí: TEE = 0,204 x 102 = 0,204 x 100 = 20,4% Conclusão: a cidade que apresentou a maior evasão escolar foi a cidade Y. Observe que o valor do coeficiente já diz esta realidade, porém, a informação em termos percentuais dá uma realidade maior ao fato, um vez que podemos compreendê -lo na formação de um todo (100%). III - Em uma cidade cuja população é 520000 habitantes, o números de óbitos registrados é de 80080. Calcular a taxa de mortalidade. Resolução: Temos: Número de óbitos: NO = 80080 e que a População Total : P T =

520000 Como

T

OM

P

NC ? logo 154,0

520000

80080 ??MC

Mas: TM = CM x 103 logo TM = 0,154 x 10 3 = 0,154 x 1000 =

154 000

Ou Seja:

Page 62: Bio e Statistic A

[2] Considere a tabela abaixo:

Evolução das receitas do Café industrializado de Janeiro até Abril do ano de 2002

[3] Um professor preencheu um quadro, enviado pela D.E, com os seguintes dados:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

62

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exercícios 3.4

[1] Considere a série estatística: Séries Alunos Matriculados %

1ª 546 2ª 328 3ª 280 4ª 120 Total 1274 Fonte: Dados Fictícios

Complete-a, determinado as percentagens com uma casa decimal e fazendo a compensação (arredondamento), se necessário. Exemplos: [a] 32,4823% fica 32,5; [b] 12,237% fica 12,2%; [c] 6,971% fica 7,0%; [d] 8,3452% fica 8,3%.

[a] Complete-a com uma coluna de taxas percentuais.[b] Como se distribuem as receitas em relação ao total?[c] Qual o desenvolvimento das receitas de um mês para outro?[d] Qual o desenvolvimento das receitas em relação ao mês de janeiro?

Meses Valor(US$ milhões) % Janeiro 33,3 Fevereiro 54,1 Março 44,5 Abril 52,9 Total 184,8

Fonte: Dados Fictícios

Série e N° de N° de Promovidos Retidos em recu- recupera- não recu- Total GeralTurma Alunos Alunos sem recupe - sem recu- perção dos perados promo- 30/03 30/11 ração peração vidos Retidos

1° B 49 44 35 03

06 05 01 40 04

1° C 49 42 42 00

00 00 00 42 00 1° E 47 35 27 00 08

03 05 30 051° F 47 40 33 06 01 00 01 33 07

Total 192 161 137 09 15 08 07 145 16

Page 63: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

63

Calcule:

[A] A taxa de evasão, por classe;

[b] A taxa de evasão total;

[c] A taxa de aprovação, por classe;

[d] A taxa de aprovação geral;

[e] A taxa de recuperação, por classe;

[f] A taxa de recuperação geral;

[g] A taxa de reprovação na recuperação geral;

[h] A taxa de aprovação, sem a recuperação;

[i] A taxa de retidos, sem a recuperação.

[4] Considerando que em uma região temos os seguintes dados:

População = 1784327 habitantes

Superfície = 137420 km²

Nascimentos em 1 ano = 42327 nascidos vivos

Mortes em 1 ano = 16230 óbitos

Calcular:

[a] Coeficiente de natalidade e taxa de natalidade (por 1.000 hab.)

[b] Coeficiente de mortalidade e taxa de mortalidade (por 10.000 hab.)

[c] Índice da densidade demográfica

[5] Uma cidade de 320000 habitantes apresenta uma taxa de natalidade de 3,2% ao

ano e uma taxa de mortalidade de 27% ao ano. Calcular o aumento da população em

um ano.

[6] Uma entidade assistencial em 1998 atendia 500 internos com uma verba de

R$200.000,00. Em 2003, os internos aumentaram em 20%, enquanto que a verba

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Page 64: Bio e Statistic A

aumentou 50%. Sabendo-se que o custo de vida, pela desvalorização da moeda,

aumentou em 40% no mesmo período, indaga-se se a situação financeira da

entidade, por interno atendido, melhorou ou piorou?

[7] Em uma empresa que possui 250 operários, trabalhando durante 60 dias de 8

horas cada um, verificaram-se 32 acidentados de trabalho, ocasionando uma perda

de 146 horas. Calcular a taxa de freqüência e de gravidade de acidente do trabalho.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

3

64

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Page 65: Bio e Statistic A

Referência Bibliográfica

CRESPO , Antônio Arnot. Estatística Fácil. 17ª Edição, São Paulo, SP; Ed.

Saraiva,1999.

MARTINS, G.A, Donaire,D. Princípio de Estatística. 4ªedição. São Paulo,

SP: Ed. Atlas, 1990.

NAZARETH, Helenalda. Curso Básico de Estatística. 12° Edição. São

Paulo, SP: Ed. Ática, 2000.

SPIEGEL, MR. Estatística. 2ª edição. São Paulo, SP: Ed. Mcgranw Hill,

1985.

Page 66: Bio e Statistic A
Page 67: Bio e Statistic A

Medidas de Tendência

Central e Separatizes FASCÍCULO

Gilberto Pereira da Silva

Mário de Souza

Carga Horária - 10 horas

-Compreender o significado de medidas de posição ou de

tendência central.

-Entender estas medidas de posição em situações problema.

-Conhecer a utilidade, vantagens e desvantagens dessas

medidas.

4Objetivos

Page 68: Bio e Statistic A

Há diversas medidas que possibilitam condensar as informações dentro

da fase analítica da estatística descritiva. Neste capítulo, concentraremos

nossa atenção nas medidas de posição ou de tendência central

(promédios), as quais são assim denominadas, em virtude da tendência

de os dados observados se agruparem em torno desses valores centrais.

A moda, a média aritmética e a mediana são as três medidas de tendência

central ou promédios mais utilizados para resumir o conjunto de valores

representativos do fenômeno que se deseja estudar. Outros promédios

menos usados são a média geométrica, harmônica, quadrática, cúbica e

biquadrada.

O número destinado a resumir uma série de dados diz-se média, designação que

significa que a síntese deve ser um valor intermediário aos valores dados, não

devendo ser inferior ao menor termo da série, nem superior ao maior deles.

A média deve satisfazer, os números que representam algumas condições lógicas ou

propriedades. O critério de escolha apropriado, de determinado tipo de média, para

representar um conjunto de valores, obedece às propriedades da síntese escolhida e

aos objetivos que nos levam a procurar a própria expressão sintética.

Principais Médias:

[a] Aritmética.

[b] Geométrica.

[c] Harmônica.

[d] Potência (cúbica, biquadrada, etc.).

Podendo ainda cada uma delas ser simples ou ponderada.

Onde:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

68

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Introdução

1. Médias

Page 69: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

69

Médias simples: são aquelas obtidas do conjunto cujos elementos têm a mesma

importância ou o mesmo peso.

Médias ponderadas: são aquelas resultantes de conjuntos compostos de elementos

de importância ou freqüência diferenciada.

Vejamos agora cada uma das Médias

1.1 Média Aritmética: é uma das principais medida de posição, cuja aplicação é

seguramente a mais usada, sendo que pode ser simples (dados não agrupados) e

ponderadas (dados agrupados).

1.1.1 - Média Aritmética para dados não agrupados

Para uma seqüência numérica portanto, “n” valores da variável x. A

média aritmética simples de x representada por é definida por:

Determinar a média aritmética simples dos valores 2, 0, 5 e 3.

1.1.2 - Média Aritmética para dados agrupados

Quando os dados estiverem agrupados numa distribuição de freqüência, usaremos a

média aritmética dos valores , ponderados pelas respectivas freqüência

absolutas . Para n dados, teremos:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

x1 2 3 nx , x ,..., x , x

n

x

x

n

ii?

??1

5,24

3502

4

4

1 ???????

?iix

x

1 2 3 nx , x , x ,..., x

1 2 3 nF , F , F , ..., F

n

Fx

x

n

iii?

??1

.

Exemplo 1:

Page 70: Bio e Statistic A

Dada a seguinte distribuição amostral, determinar a média (dados agrupados sem

intervalo de classe, ou seja, contém apenas elementos repetidos ou com freqüência).

Interpretação:

O valor médio da amostra 5,6 é o ponto de concentração dos valores da amostra.

Determinar a média aritmética das alturas (x) dos estudantes de uma classe de Ensino

Médio apresentada na tabela abaixo (dados agrupados com intervalo de classe).

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

70

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 2.

ix 2 5 6 8

iF 1 4 3 2

Solução: inicialmente vamos construir uma tabela com os elementos ix e iF para em

seguida produzir o produto ii Fx . . Depois somar a coluna de freqüência sim ples e

somar o produto de cada elemento da série pela sua freqüência, para depois calcular a média.

ix iF iixF

6,510

56.

4

1

4

1 ????

?

?

?

ii

iii

F

Fx

x

Exemplo 3:

x(cm) ix iF iixF

Page 71: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

71

A altura média desta turma é, aproximadamente, 162 cm, a altura na qual se

concentra o maior número de estudantes (ver tabela).

1.2 Média Geométrica: denominamos média geométrica de um conjunto de “n”

valores a raiz n-ésima do produto desses “n” valores.

1.2.1 Média Geométrica para dados não agrupados

Calcule a Média Geométrica dos dados 3, 5, 7 e 9.

Sejam x , x , x , ..., X valores de x, associados às freqüência absolutas F , F , F , ..., F 1 2 3 n 1 2 3 n

respectivamente. Então, a média geométrica de x é:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Calculando:

??

??5

1

40i

iFn cm

F

Fx

x

ii

iii

6,16140

6465.

5

1

5

1 ????

?

?

?

Interpretação:

n

n

iig xx ?

?

?1

ou que nng xxxxx ..... 321?

5,59459753 44 ??? xxxxg

1.2.2 Média Geométrica para dados agrupados

n

n

i

Fig

ixx ??

?1

ou que n Fn

FFFg

nxxxxx ..... 321

321? onde ??

?n

iiFn

1

Exemplo 4:

Page 72: Bio e Statistic A

Em particular, se , temos o caso da Média Geométrica não agrupada.

Calcular a média geométrica para a distribuição abaixo (sem intervalo de classe):

Quando o número de dados for muito grande, é aconselhável o emprego de

logaritmos.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

72

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Observação:

Exemplo 5:

xi 1 2 3 5

Fi 8 6 5 3

93,119440001252436415321 222222 3568 ???? xxxxxxxg

Como:

n Fn

FFFg

nxxxxx ..... 321

321?

Logo:

n

xFxFxFxFx nn

g

log...loglogloglog 322211 ????? sendo ?

?

?n

iiFn

1

Vejamos a solução deste exemplo usando o logaritmo

2858,022

6990,034741,053010,0608

22

5log33log52log61log8log ????????? xxxx

xg

Daí:

n

xF

antix

n

iii

g

??? 1

log

log com ??

?n

iiFn

1

O que nos leva a:

93,1?gx que é o mesmo resultado anterior.

Teremos:

Nota:

Page 73: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

73

Calcular a média geométrica para os dados da tabela abaixo (com intervalo de

classe).

Estatura dos alunos da FFPNM

Turma do curso de Licenciatura Plena em Biologia, ano 2003

Resolvendo:

(observe que a construção da tabela, com seus respectivos valores de interesse, é

muito importante para facilitar na construção dos dados e sua colocação na

expressão matemática)

1.3 Média Harmônica: É o inverso da média aritmética dos valores.

1.3.1 Média Harmônica para dados não agrupados

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 6:

Estatura (cm) iF ix log ix iF log ix

150 |— 156 156 |— 162 162 |— 168 168 |— 174 174 |— 180

180 |— 186 186 |— 192

5 4 19 18 14

12 4

153 159 165 171 177

183 189

2,18469 2,20139 2,21748 2,23300 2,24797

2,26245 2,27646

10,92345 8,80556 42,13212 40,19400 31,47158

27,14940 9,10584

? 76 — — 169,78195

cmantiantixg 4,171234,2log76

78195,169log ???

??

?n

i i

h

x

nx

1

1

Page 74: Bio e Statistic A

Calcular a média harmônica dos valores 2, 5, 7 e 9.

Temos:

1.3.2 Média Harmônica para dados agrupados

Sejam x , x , x , ..., x valores de x, associados às freqüências absolutas F , F , F , ..., F 1 2 3 n 1 2 3 n

respectivamente.

A média harmônica de x é definida pela seguinte expressão:

Calcular a média harmônica dos dados (sem intervalo de classe) da tabela abaixo.

Apenas as duas primeiras colunas fazem parte do enunciado.

(A terceira coluna é construída como de interesse na solução do problema).

Resolvendo:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

74

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 7:

2,4601

6304

630

601

4

9

1

7

1

5

1

2

1

4 ??????

? xxh

31 2

11 2 3

...h n

n i

in i

n nx

F FF F F

x x x x x?

? ????? ?

onde 1

n

ii

n F?

??

Exemplo 8:

ix iF /i iFx

?

Page 75: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

75

Calcular a média harmônica para os dados das estaturas dos alunos do curso de

Licenciatura Plena em Biologia, da Faculdade de Formação de Professores de Nazaré

da Mata, do ano de 2003, mostrada na página 5 (com intervalo de classe).

Solução:

Vamos construir uma coluna (na tabela de dados) com a fração (e sua soma) Fi / xi ,

que é uma coluna de interesse na solução do problema, uma vez que a mesma serve

para uma melhor identificação dos dados na expressão matemática de interesse.

Resolvendo:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Neste caso, temos

?

?

?

??n

i i

i

n

ii

h

x

F

F

x

1

1 o que nos leva a: 7,35,6

24 ??hx

Exemplo 9:

Estatura (cm) iF ix ii xF /

150 |— 156 156 |— 162 162 |— 168 168 |— 174 174 |— 180

180 |— 186 186 |— 192

5 4 19 18 14

12 4

153 159 165 171 177

183 189

0,03268 0,02516 0,11515 0,10526 0,07910

0,06557 0,02116

? 76 — 0,44408

?

?

?

??n

i x

i

n

ii

h

x

F

F

x

1

1 ? cmxh 1,17144408,0

76 ??

Page 76: Bio e Statistic A

1.4 Média quadrática: É a raiz quadrada da média aritmética dos quadrados dos

elementos da série.

1.4.1 Média Quadrática para dados não agrupados

Calcular a média quadrática da série 6, 17, 9, 9, 3, 13 ,9 e 1.

Na solução desse exercício é bom construir uma tabela com os xi e seus valores

quadráticos, bem como a soma desses valores quadráticos, para aplicação na

expressão matemática.

Daí:

1.4.2 Média quadrática para dados agrupados

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

76

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

n

x

x

n

ii

q

???1

2

Exemplo 10:

ix 6 17 9 9 3 13 9 1 SOMA 2ix 36 289 81 81 9 169 81 1 747

7,9375,938

747 ???qx

?

?

?

??n

ii

n

iii

q

F

Fx

x

1

1

2 .

com ??

?n

iiFn

1

Page 77: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

77

Calcular a média quadrática para os dados (sem intervalo de classe) da tabela abaixo.

Apenas as duas primeiras colunas fazem parte do problema.

(as outras duas colunas são construídas em função da necessidade de trabalhar a

expressão matemática para calcular a média quadrática com dados repetidos)

Resolvendo:

Em uma pesquisa sobre a duração de certa pasta dental junto a 50 famílias do mesmo

tamanho e classe social os resultados foram abaixo descritos. Calcular a duração

média da pasta dental (com intervalo de classe).N

EED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 11:

ix iF 2ix ii Fx .2

2 1 4 4

5 4 25 100

6 3 36 108

8 2 64 128

SOMA 10 340

Temos:

?

?

?

??n

ii

n

iii

q

F

Fx

x

1

1

2 .

o que nos leva a: 8,53414

340 ???qx

Exemplo 12:

Dias Número de

Famílias (Fi)

xi

(ponto médio)

2ix 2

ix .Fi

10/12 8 11 121 968

12/14 12 13 169 2028

14/16 20 15 225 4500

16/18 10 17 289 2890

SOMA 50 10386

Page 78: Bio e Statistic A

Apenas as duas primeiras colunas fazem parte do problema. A terceira coluna é

construída com a finalidade de ajudar na colocação dos dados na expressão

matemática.

Resolvendo:

I - Calcular as médias: aritmética, geométrica, harmônica e quadrática dos seguintes

conjuntos de números:

[a] X= {2, 4, 6, 8,10}

[b] Y= {10, 10,10}

Solução:

[a] Para a série

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

78

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

dias

F

Fx

xn

ii

n

iii

q 4,1450

10386.

1

1

2

????

?

?

?

Exercícios resolvidos dos temas até agora desenvolvidos

Média Aritmética ? 65

1086421 ????????

?

n

x

x

n

ii

A

Média Geométrica ? 2,53840108642 55

1

??????

xxxxxx n

n

iig

Média Harmônica ? 4,4137

600

137

1205

120

137

5

10

1

8

1

6

1

4

1

2

1

5

1

1

????????

???

?

x

x

nx

n

i i

h

Média Quadrática ? 6,6445

220

5

108642 222221

2

??????????

?

n

x

x

n

ii

q

Page 79: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

79

Observação:

Relacionamento entre as médias e os elementos extremos (mínimo e máximo) da

série.

[b] Para a série Y = {10,10,10}

Como todos os valores da série são iguais, então:

II - Calcular a média ponderada dos números 4, 2 e 5, atribuindo a estes,

respectivamente, pesos 3, 2 e 4.

Resolução:

III - Um professor de Estatística leciona para três turmas (A, B e C) de 1° período do

curso de estatística em uma determinada faculdade. Sabemos que as turmas

apresentam as seguintes médias em um dado período:

Turma A (30 alunos) ............... média 8,0

Turma B (20 alunos) ................média 9,0

Turma C (50 alunos) ............... média 6,0

Calcular a média da disciplina de estatística das três turmas juntas e no período em

questão.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Como pode ser notado através deste exemplo qAgh xxxx ??? pois: 4,4 < 5,2 < 6 <

6,6.

min h g A q máxx x x x x x?????

10???? qAgh yyyy

49

36

423

)54()22()23(.

1

1 ????

?????

?

?

? xxx

p

xp

xn

ii

n

iii

Page 80: Bio e Statistic A

Resolução:

IV - Um vendedor viaja da cidade “A” para cidade “B” a 50 km/h e volta a 90km/h.

Determinar a velocidade média de toda a viagem. (Observe que a distância

percorrida é a mesma)

Resolução:

a média harmônica é, particularmente, recomendada para uma série de valores que

são inversamente proporcionais, como para o cálculo de velocidade média, tempo

médio de escoamento de estoques, custo médio de bens comprados com uma

quantia fixa etc.

Observação:

Se as distâncias não forem iguais, devemos utilizar a média harmônica ponderada em

que as freqüências ou pesos serão as respectivas distâncias.

V Um carro percorre 80km com uma velocidade escalar média de 40km/h, 150km

com velocidade escalar média de 50km/h e os 200km restantes de sua viagem a uma

velocidade média de 100km/h. Qual a velocidade média em todo o percurso?

Resolução:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

80

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

neste caso, teremos a média final do conjunto ( fx ) que é uma média ponderada com

pesos representados pelos números de termos das séries componentes desse conjunto.

2,7100

720

502030

)650()920()830(.

1

1 ????

?????

?

?

? xxx

n

xn

xn

ii

n

iii

f

hkmx

x

nxv

n

i i

h /3,6414

900

14

4502

450

14

2

450

59

2

90

1

50

1

2

1

1

?????

??

????

?

Page 81: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

81

Neste caso temos o fato de que as distâncias percorridas pelo móvel têm valores

diferentes, e estes valores vão passar a ser as freqüências (dados sem intervalos de

classe) para a média harmônica, com o intuito de calcular a velocidade escalar média

de todo o percurso.

VI - Uma empresa possui um estoque de 20.000 unidades na cidade x e de 32000

unidades na cidade y. O primeiro esgota-se em quatro meses, e o segundo, em oito

meses. Determinar o tempo médio de escoamento de ambos os estoques.

Resolução:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

hkm

x

F

F

xvn

i i

i

n

ii

h /4,617

430

200

1400

430

100

200

50

150

40

80

20015080

1

1 ?????

??????

?

?

?

1

20000320005,78 meses

2000032000

4 8

h ni

i i

ntx

F

x?

??? ? ???

VII - A contagem de bactérias , em uma certa cultura, aumentou de 1000 para 4000 em três dias. Qual foi a percentagem média de acréscimo por dia? Resolução: para determinar essa percentagem média de acréscimo, representa -se o acréscimo por r, então: Contagem total de bactérias depois do 1° dia: 1000 + 1000r = 1000.(1 + r) Contagem total de bactérias depois do 2° dia: 1000.(1 + r) + 1000.(1 + r)r = 1000.(1 + r)² Contagem total de bactérias depois do 3° dia: 1000.(1 + r)² + 1000.(1 + r)²r = 1000.( 1 + r)³ . Esta ultima expressão deve ser igual a 4000, e assim sendo temos que:

1000.(1 + r)³ = 4000 ? (1 + r) 3 = 4 ? 1 + r = 3 4 ? 1 + r = 1,587 ? r = 0,587

Page 82: Bio e Statistic A

01 - Calcular, as médias aritmética, geométrica, harmônica e quadrática da série

(dados em metros cúbicos): 3,7; 8,2; 10,0 e 15,0. Em seguida, faça a comparação

(ordem decrescente) dos valores encontrados.

02 - Calcule a idade média dos alunos de uma classe de primeiro ano de determinada

faculdade, em anos.

03 - Turmas que possuem determinada disciplina em comum apresentam nessa

disciplina as seguintes médias:

Turma A (40 alunos) média 6,5

Turma B (35 alunos) média 6,0

Turma C (35 alunos) média 4,0

Turma D (20 alunos) média 7,5

Determine a média geral da disciplina nesta faculdade.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

82

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Ou que: r = 0,587 x 100% = 58,7% Observação: De uma maneira geral, se parte de uma quantidade P, que cresce a uma taxa constante r por unidade de tempo, tem-se, após “n” unidades de tempo, um total: T = P.(1 + r) n

Tarefa 4.1

Idades ( anos ) ix N° de alunos iF

17 18 19 20 21

3 18 17 8 4

Page 83: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

83

04 - Uma pesquisa para determinar a eficiência de uma nova ração para animais, em

termos de ganho de peso, mostrou que após um mês em que a ração normal foi

substituída pela nova ração, os animais apresentam um aumento de peso segundo a

tabela:

[a] Calcular o aumento médio de peso por animal.

[b] Se a ração antiga proporcionava em iguais circunstâncias um aumento médio de

peso de 3,100 kg/animal, esta nova ração pode a princípio ser considerada mais

eficiente?

05 - A contagem de bactérias, em certa cultura, aumentou de 500 para 2000 em três

dias. Qual foi a porcentagem média de acréscimo por dia?

06 - Encontrar dois números cuja média aritmética é 50, e a média harmônica, 32.

1.5 Outras Médias

Outras médias menos usadas em estatística são a média cúbica e a média

biquadrática, as quais são calculadas respectivamente, através das seguintes

expressões:

1.5.1 Média Cúbica

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Classe Aumento de peso em kg N° de animais iF

1 2 3 4

5

0 |— 1 1 |— 2 2 |— 3 3 |— 4

4 |— 5

1 5 35 37

28

3

31??

?n

ii

c

x

xn

? [a] Mc simples (dados não agrupados)

Page 84: Bio e Statistic A

[a] Calcule a média cúbica e biquadrática da série de números: 1, 2, 1, 3 e 5.

[b] Calcule a média cúbica e biquadrática de 1, 2 e 3 com cada um deles com

freqüência 10, 4 e 5, respectivamente.

[c] Calcule a média cúbica e biquadrática do exercício 04, da tarefa 4.1.

2. Mediana e Demais Separatrizes

Mediana: é o valor que ocupa a posição central de um conjunto de dados ordenados.

Cálculo da Mediana

Para calcular a mediana vamos fazer uso de três técnicas diferentes para os cálculos:

[a] Dados brutos ou rol, neste cálculo tem apenas os dados na forma não agrupados;

[b] Dado repetido, neste caso os dados agrupados são sem intervalo de classe; [c]

Dados agrupados em classes, ou seja, neste item temos os intervalos de classe.

Observe que essas três formas de agir são as mesmas que vínhamos trabalhando

para as médias.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

84

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

3

31??

?n

iii

c

xF

xn

? [b] Mc ponderada (com ou sem intervalo de classe)

1.5.2 Média Biquadrática ( bqx )

4

41

n

ii

bq

x

xn

???

? [a] Mbq simples (dados não agrupados)

4

41??

?n

i ii

bq

xF

xn

? [b] Mbq ponderada (com ou sem intervalo de

classe)

Tarefa 4.2:

Page 85: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

85

[a] Dados brutos ou rol

Inicialmente devemos ordenar os elementos, caso sejam dados brutos, obtendo o

rol. Em seguida, determinaremos o número (n) de elementos do rol. Neste item,

vamos considerar dois casos: [1] quando o rol tiver uma quantidade “n” de números

ímpares; [2] quando o rol tiver uma quantidade “n” de números pares.

a.1 - Se “n” é ímpar

Calcular a mediana da série 9,15,3,7,6,16,4,19 e 1.

Resolução:

colocando os números que compõem a série em ordem crescente de valor, temos:

1,3,4,6,7,9,15,16 e 19.

Observação:

A posição em que ocupa o valor 7, no rol, deixa a sua esquerda e a sua direita o

mesmo número de elementos, sendo, portanto, o elemento central da série.

a.2 - Se n é par

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

O rol admite apenas um termo central que ocupa a posição 1

2

nP

?? .

Como n = 9 (ímpar), a posição é 19110

5 52 2 2

nP P

? ?? ? ?????.

Isto é, a mediana é o quinto termo da série ordenada de modo crescente ou

decrescente. Concluímos assim que a mediana é 7eM ?.

Neste caso, o rol admite dois termos centrais que ocupam as posições '

2

nP ? e

'' 12

nP ??. A mediana é convencionada como sendo a média aritmética dos valores

que ocupa estas posições centrais.

Exemplo 01:

Page 86: Bio e Statistic A

Determinar a mediana da série: 7,21,13,15,10,8,9,13.

Solução:

Ordenando estes elementos, obtemos: 7,8,9,10,13,13,15,21

O número de elementos é n = 8 (par)

As posições dos termos centrais são:

Onde:

O elemento que ocupa a quarta posição na série é 10 e o elemento que ocupa a quinta

posição é 13. Portanto,

Interpretação:

50% dos valores do rol são valores menores ou iguais a 11,5 e 50% dos valores do rol

são valores maiores ou iguais a 11,5.

[b] Determinação da mediana para o caso de dados repetidos

A mediana é encontrada da mesma forma que a mostrada para dados isolados,

sendo, entretanto ainda mais cômoda a sua determinação com o uso de freqüência

acumulada.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

86

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 02:

42

8

2' ???n

P ou seja, 4ª posição e 51412

'' ?????nP que é a 5ª posição.

Page 87: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

87

Determinar a mediana da série: (caso em que o número de elementos é ímpar).

Interpretação:

50% dos valores da série são menores ou iguais a 8, e 50% dos valores da série são

maiores ou iguais a 8.

Calcular a mediana da série: (caso em que o número de elementos é par).

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 03:

ix iF

?

Solução: o n° de elementos de série é a soma de todas as freqüências, ou seja, n = 23 (ímpar). Portanto, a série admite apenas um termo central que ocupa a posição central que é a soma de 23 +1 dividido por 2, que tem como resultado 12, compreendido como o décimo segundo lugar no conjunto de números dados (que são 23).Para encontrar este 12º elemento vamos construir uma tabela veja logo a seguir - em que apareça a freqüência acumulada, pois, assim procedendo, podemos localizar na referida tabela o 12° elemento da série de 23 elementos.

ix iF acF

?

Note que o 1° elemento da série é 2. Em seguida, aparecem quatro elementos iguais a 5. Totalizando (acumulando) cinco elementos. Estes cinco elementos ocupam na série as posições de primeiro ao quinto. Depois aparece mais 10 elementos iguais a 8, fazendo com que haja agora um acúmulo de quinze elementos. Como a mediana está no décimo segundo elemento, logo, ela está contida na classe terceira dessa série de dados. E, neste local o elemento correspondente x é o número 8. Sendo assim, a mediana i

desse conjunto de número é M = 8.e

Exemplo 04:

Page 88: Bio e Statistic A

Para localizar estes dois elementos, construímos a freqüência acumulada crescente

da série.

Interpretação:

50% dos valores da série são valores menores ou iguais a 2,5 e 50% dos valores da

série são valores maiores ou iguais a 2,5.

[c] Cálculo da Mediana para dados Grupados em Classes

Quando uma série contínua e grupada em classes de freqüência, a mediana

corresponde ao termo que divide a série em duas partes iguais, isto é, o valor que é

precedido e seguido por 50% (n/2) dos termos da série.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

88

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

ix iF Solução:

o n° de elemento da série é a soma de todas as freqüências, ou seja, n = 3 + 5 + 8 + 10 + 6 = 32. Portanto, n é um número par. Neste caso a série admite dois termos centrais. O primeiro dele é o termo central, ou seja, aquele em que n é dividido por dois, ou seja, 32 dividido por dois que é igual a 16. Dizemos assim que o primeiro termo está na décima sexta posição. E o outro termo, é a soma desse resultado (16) mais um, ou seja, 17. Dizemos então que o outro termo que influi no cálculo da mediana ocupa a décima sétima posição.

ix iF acF

?

As três primeiras posições da série são ocupadas, por exemplo, iguais a 0. Da quarta à oitava posição os elementos são iguais a 1. Da nona à décima sexta posição os elementos são iguais a 2. Da décima sétima à vigésima sexta posição os elementos valem 3. e, com isto, podemos ver que, o 16º elemento é o número 2, enquanto que o 17º elementos é o número 3. Uma vez que, nesse caso a mediana é a média aritmética dos dói números encontradas nestas posições, podemos então afirmar que a mediana desse conjunto de números é a média aritmética dos números 2 e 3 que corresponde a 2,5. Ou seja, M = 2,5 e

Page 89: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

89

Em uma distribuição de freqüência, chama-se classe mediana à classe que contém a

mediana. Neste caso o cálculo para encontrar a mediana pode ser obtida por

interpolação em um gráfico de freqüência acumulada, resultando na expressão

matemática:

Calcular a mediana de distribuição de notas dadas na tabela abaixo.

Somente as duas primeiras colunas fazem parte do enunciado.

A terceira coluna fora acrescida em procedimento à solução do problema.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

hF

FnLM a

ie ????

????? 2/

Onde:

Me ? mediana;

Li ? limite inferior da classe que contém a mediana (classe mediana); n ? nº de termos da série e n/2 será, a posição da mediana, seja “n” par ou ímpar;

Fa ? freqüência acumulada da classe vizinha anterior à classe mediana; F ? freqüência da classe mediana; h ? amplitude da classe mediana.

Exemplo - 05:

NOTAS ALUNOS - F Fa

0 ? 10 3 3

10 ? 20 7 10

20 ? 30 12 22

30 ? 40 34 56

40 ? 50 48 104

50 ? 60 90 190

60 ? 70 54 248

70 ? 80 52 300

80 ? 90 15 315

90 ? 100 5 320

TOTAL 320 --------------------

Page 90: Bio e Statistic A

Resolução:

Como a fórmula de cálculo citada refere bastante sobre dados da classe mediana, é

muito importante a sua determinação, o que é feito através da posição (P = n/2) da

mediana e da coluna de freqüência acumulada. No caso, a posição da mediana é P =

n/2 =320/2=160.

Após completarmos a coluna de freqüência acumulada (Fa), observamos que a

mediana é o 160° termo da distribuição, e que a mesma pertence à classe 50 60,

onde se situam as 90 notas dos alunos com números de ordem 105,

106,107,...,159,160,161,...,192,193 e 194.

Finalmente, aplicando a Fórmula da mediana, temos:

A mediana é igual à nota 56,2. Isto revela que tal resultado coloca um certo número

de alunos com notas inferiores a 56,2 bem como, aqueles alunos com notas

superiores a 56,2.

2.1 Separatrizes

Separatrizes (S) de uma série de n termos x1, x2, x3, ..., xn colocados em ordem

crescente (ou decrescente) de valor é o termo da série que a divide em duas ou mais

partes qualquer.

A mediana é uma separatriz, como já foi dito, pois ela divide a série em duas partes

iguais.

As principais separatrizes são a mediana, os quartis, os decis e os percentis (ou

centis). Outras separatrizes poderiam ser deduzidas, porém estas são as mais usuais.

Uma separatriz genérica é chamada quantil.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

90

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

2,5690

5605010

90

565010

90

10416050

2/ ???????

?????

???

??????

???

????? h

F

FnLM a

ie

Exemplo 06:

Page 91: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

91

Observação:

Os quartis, decis e percentis (ou centis) são separatrizes que dividem a série,

respectivamente, em quatro, dez e cem partes iguais.

Quartis:

Decis:

Observação:

O quinto decil é igual à mediana (D = M ).5 e

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

São representados por Q1, Q 2 e Q 3 sendo chamados, respectivamente, primeiro, segundo e terceiro quartil. Onde: ? Primeiro quartil ( Q1) de uma série ordenada de modo crescente (ou decrescente) é o termo da série que é precedido por 25% dos termos (n /4) e seguido pelos restantes 75% (3n/4). ? Segundo quartil coincide com a mediana ( Q2 = M e), dividindo, portanto, a série em duas partes iguais. ?Terceiro quartil (Q3) é o termo da série que é precedido por 75% (3n/4) dos termos

e seguido pelos restantes 25% (n/4).

São representados por D1, D 2, D 3, ..., D 9 sendo chamados, respectivamente primeiro, segundo, terceiro,..., nono decil. Onde: ? Primeiro decil ( D1) de uma série ordenad a de modo crescente (ou decrescente) é o termo da série que é precedido por 10% dos termos (n/10) e seguido pelos restantes 90% (9n/10). ? Segundo decil (D2) é precedido por 20% dos termos (2n/10) e seguido pelos restantes 80% (8n/10). ? E assim sucessivamente até o nono decil.

Page 92: Bio e Statistic A

Percentis:

Responda: Qual o percentil que equivale à mediana numa série de dados numéricos?

Observando as definições dos quartis, decis, percentis e mediana, chegamos a:

Observação:

Com exceção talvez para a mediana não é usual a utilização das demais separatrizes

(quartis, decis e percentis) para séries constituídas de dados isolados ou de dados

repetidos.

2.1.1 Cálculo das separatrizes para dados grupados em classes de freqüência.

Agora vamos ver como proceder para encontrar estas separatrizes, ou seja, os

quartis, decis ou percentis (centis), para, evidentemente, dados agrupados com

classes de freqüências. A fórmula geral de cálculo, semelhante à fórmula da mediana

e é escrita como sendo:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

92

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

São representados por P1, P 2, P 3, ..., P 99 sendo chamados primeiro, segundo, terceiro, .., nonagésimo nono percentil. Onde: ? Primeiro percentil ( P1) de uma sér ie ordenada de modo crescente ( ou decrescente) é o termo da série que é precedido por 1% dos termos (n/100) e seguido pelos restantes 99%(99n/100) ? Segundo percentil ( P2) é precedido por 2% dos termos (2n/100) e seguido pelos restantes 98% (98n/100) ?E assim sucessivamente até o nonagésimo percentil.

1 25Q P?

2 5 50eQ M D P??? 3 75?

1 10D P?

2 20D P? 3 30D P?

4 40D P?

6 60D P?

7 70D P? 8 80D P?

9 90D P?

Page 93: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

93

Onde:

Observamos pela fórmula acima que nela interferem muitos dados da classe que

contém a separatriz. De modo semelhante ao utilizado para a mediana, localizamos

esta classe através da posição da separatriz e da coluna auxiliar de freqüência

acumulada, que iremos sempre acrescentar na tabela dada para uma melhor

visualização dos elementos desta expressão matemática.

2.1.1.1 Como determinar a posição P, de uma separatriz

Veremos agora como proceder para determinar o valor de P, posição de uma

separatriz, para cada uma das separatrizes explicitada anteriormente.

[a] Para os quartis:

Genericamente para um quartil de ordem i, vem:

i = 1, 2 ou 3, conforme se trata, respectivamente, do primeiro, segundo ou terceiro

quartil.

[b] Para os decis:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

hF

FPLS a

i ????

?????

S ? separatriz desejada (mediana, quartil, decil ou percentil); Li ? limite inferior da classe que contém a separatriz; P

? posição da separatriz

Fa

? freqüência acumulada da classe vizinha anterior à classe que contém a separatriz;

F

? freqüência da classe que contém a separatriz h

? amplitude da classe que contém a separatriz.

Primeiro quartil (Q1) ? P = n/4; Segundo quartil (Q2) ? P = 2n/4; Terceiro quartil (Q3) ? P = 3n/4.

4

nPi?

Page 94: Bio e Statistic A

Genericamente para um decil de ordem i, vem:

i = 1, 2, 3,...,9 conforme se tratar, respectivamente, primeiro, segundo, .., nono decil.

[c] Para os percentis:

Genericamente para um percentil de ordem i, vem:

i = 1, 2, 3, ..., 99 conforme se trata, respectivamente, do primeiro, segundo, terceiro,

..., nonagésimo nono percentil.

[d] Para a mediana (seja n, par ou ímpar), temos:

P = n/2

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

94

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Primeiro decil (D1) ? P = n/10 Segundo decil (D2) ? P = 2n/10

Terceiro decil (D3) ? P = 3n/10 Quarto decil (D4) ? P = 4n/10 Quinto decil (D5) ? P = 5n/10 ............................................................. ............................................................. Nono decil (D9) = 9n/10

10

nPi?

Primeiro percentil (P1) ? P = n/100 Segundo percentil (P2) ? P = 2n/100

Terceiro percentil (P3) ? P = 3n/100 ...................................................................................... ...................................................................................... Nonagésimo nono percentil (P99) ? P = 99n/100

100

nPi?

Page 95: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

95

Para facilitar ainda mais os cálculo analítico de uma separatriz, apresentamos como

roteiro:

[i] Compor coluna auxiliar de freqüência acumulada (F )a

[ii] Determinar a posição (P) da separatriz, usando uma das fórmulas:

no caso de calculamos, respectivamente, quartis, decis, percentis ou a mediana,

[iii] Com o auxílio dos itens anteriores, localizar a classe que contém a separatriz;

[iv] Usar a fórmula geral da separatriz S, observando que:

-não é recomendável usar aproximações numéricas para o valor da posição (P) da

separatriz;

-Quando a separatriz se situar na primeira classe, a freqüência acumulada da classe

anterior à mesma será nula, isto é, F = 0.a

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

4

nPi?;

10

nPi?;

100

nPi? ;

2

nP ?

Chama-se ordem percentílica (OP) o índice do percentil. É um número que indica o percentual de elementos de uma série ordenada de modo crescente, que é inferi or a separatriz correspondente. Assim por exemplo, se para uma distribuição de ganhos horários encontramos Me = R$ 158,00/h; Q 3 = R$ 172,50/h; P 84 = R$ 181,71 e D 7 = R$ 168,67/h, temos para essas separatrizes, ordens percentílicas, respectivamente iguais a, 50, 75 , 84 e 70. Isto nos permite afirmar que: ? Q ue 50% dos empregados percebem salários inferiores (ou superiores) a 158,50/h; ? Q ue 75% dos empregados ganham menos R$ 172,50/h (ou que 25% deles recebem mais que esse valor); ? Que 84% dos empregados recebem até R$ 181,71/h (ou que apenas 16% deles percebem mais que essa quantia); ? Que 70% dos empregados ganham até R$ 168,67/h (ou que 30% dos empregados recebem mais que R$ 168,67/h).

Page 96: Bio e Statistic A

Damos a seguinte distribuição de pesos (apenas as duas primeiras linhas: classes

pesos - e freqüências simples número de pessoas, fazem parte do problema. A outra

linha, de freqüência acumulada fora construída para solução do exercício).

Determinar

[a] a mediana e o primeiro quartil, indicando as respectivas ordens percentílicas e

significados;

[b] a separatrizes com o respectivo significado, cuja ordem percentílica é 74;

[c] o peso acima do qual temos 20% de pessoas com pesos superiores a ele;

[d] a ordem percentílica corresponde a 64,4 kg e o seu significado;

[e] determinar a faixas de ordens percentílicas e de peso, dividindo as pessoas em

classes de gordos (20% dos indivíduos mais pesados médios), (55% das pessoas com

peso abaixo dos gordos) e magros (25% das pessoas mais magras).

Resolução

[a] Seguindo o roteiro para cálculo analítico de uma separatriz, vem:

Uma vez que, já compomos a linha auxiliar de freqüência acumulada (Fa)

correspondente à distribuição de peso, logo:

a.1 - posição (P) da mediana, usando a fórmula P = n/2 = 440/2 = 220.

Assim, a mediana será o peso correspondente ao 220° elemento da série ordenada;

vemos, assim, com o auxilio de Fa, que o termo cuja posição é 220° está localizada na

classe 66 72 (onde se situam desde o 121° elemento até o 330°);

Então:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

96

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 07:

Pesos (kg) 60 ? 66 66 ? 72 72 ? 78 78 ? 84 84 ? 90 TOTAL

Nº de Pessoas (F)

120 180 80 40 20 440

Fa 120 300 380 420 440

?

Page 97: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

97

Como se trata da mediana, que divide a série em duas partes, logo, a ordem

percentílica é de 50.

Conclusão: 50% das pessoas têm pesos inferiores (ou superiores) a 69,3kg.

Como se trata do primeiro quartil, logo a ordem percentílica é de 25.

Conclusão: temos 25% das pessoas pesando até 65,5kg, ou, dito de outra forma, 75%

das pessoas têm pesos superiores a 65,5kg.

b) neste caso há separatrizes cuja ordem percentílica é 74 é o septuagésimo quarto

percentil, pois, o quartil e o decil não possuem esta ordem. Sendo assim.

[c] O peso acima do qual temos 20% de pessoas com pesos superiores a ele é o

mesmo abaixo do qual se situam 80% (100% - 20%) de indivíduos com pesos

inferiores, ou, em outras palavras, é a separatriz cuja ordem percentílica é 80 (oitavo

decil ou octagésimo percentil).

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

kghF

FPLS a

i 3,69180

600666

180

12022066 =+=

−+=

−+=

a.2 – Primeiro quartil ? Q1 neste caso, P = n/4 (i = 1), daí P = 440/4 ? P = 110.

Logo, olhando a linha de freqüência acumulada, este valor está na classe 60 ? 66.

Calculando:

kghF

FPLQS a

i 5,65120

660606

120

0110601 ????

???

??????

???

??????

OP = 74 ? P74 onde P74 = 100

44074x uma vez que i = 74 e n = 440 ? P = 325,6

Este valor esta representado na classe 72 ? 78 onde 680

3006,3257274 ?

???

?? ????PS

Resolvendo: P74 = 73,9kg ? 74% das pessoas pesam menos que 73,9kg.

Page 98: Bio e Statistic A

[d] Este item se refere ao problema inverso: dá-se a separatriz e procura-se a ordem

percentílica que lhe corresponde.

Assim, o significado é que 20% das pessoas pesam menos de 64,4 kg.

[e] Como as separatrizes necessárias à composição das faixas de pesos já foram

determinadas nos itens anteriores, temos:

A moda, norma, valor modal, é por definição, o valor x da série que ocorre com a k

maior freqüência, isto é, o valor mais comum.

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

98

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Assim sendo, basta calcularmos D8 onde D8 = 10

4408x ? D8 = 352

Este valor corresponde a classe 72 ? 78 onde 680

30035272808 ?

???

??????? PDS

Daí: D8 = P80 = 75,8kg

Da fórmula geral hF

FPLS a

i ????

????? , conhecemos 64,4 kgiS P?? , que pertencendo

a classe 60 ? 66, nos conduz a Li = 60; F = 120; Fa ( freqüência acumulada da classe

anterior à primeira) e h = 6. Assim, vem:

0 6

64, 4 60 6 ; 64,4 60 120 4,4 / 6 88 (posição da separatriz).120 120

??? ? ?? ?? ?P PeP

Como pela fórmula, /100??Pin , temos: 88 440 /100 ; 100 88 / 440 20 .?? ?? ??i i OP

Classificação

Faixas OP Pesos (kg)

Page 99: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

99

Um conjunto de valores pode apresentar mais de uma moda. Neste caso, dizemos

ser plurimodal, caso contrário será unimodal, ou ainda, amodal (quando todos os

valores das variáveis em estudo apresentarem uma mesma freqüência).

3.1 - Cálculo da Moda

3.1.1 Caso: dados brutos ou rol

Basta identificar o elemento de maior freqüência.

Determine a moda dos seguintes conjuntos de dados:

A = {1, 2, 3, 4, 5, 6}; B = {10; 10; 12; 13; 18}; C = {100, 100, 200, 200, 300, 600}

3.1.2 Caso: variável discreta

Neste caso, as freqüências já estão computadas na segunda coluna. Basta identificar

o elemento de maior freqüência.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 08:

Solução:

O conjunto A não tem moda, é chamado de “conjunto amodal”. O conjunto B tem uma moda Mo = 10, é também chamado de “conjunto unimodal” O conjunto C tem Mo = 100 e Mo = 200, é chamada de “conjunto binmodal” ou “plurimodal”

Exemplo 09:

ix Fi

A maior freqüência observada na segunda coluna é 23 corresponde ao elemento 248 da série. Por tanto é uma

série unimodal com 248oM ?

Page 100: Bio e Statistic A

3.1.3 Variável Contínua (dados agrupados em classe)

Neste caso, a moda não é percebida tão facilmente como nos casos anteriores, para

tal, utilizaremos dois processos na sua obtenção.

Antes do conhecimento desses dois processos vamos compreender que se chama de

Classe Modal, a classe no agrupamento que possui a mais alta freqüência.

1° Processo: moda de Czuber

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

100

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 10:

ix

Fi

A maior freqüência observada é 5 e corresponde aos valores 2 e 4. Portanto, é uma série bimodal com Mo = 2 e Mo = 4.

ix

Fi

Observe que todos os elementos da série possuem a mesma freqüência. Portanto a série é amodal (não tem moda).

Exemplo 11:

1

1 1

o iM l h? ???? ?? ????? ?

Onde:

ModaoM ?

1 1 máx ant

2 2 máx post

- freqüência da classe modal - freqüência da classe vizinha anterIor ( )

- freqüência da classe modal - freqüência da classe vizinha posterior ( =F F )

h - amplitude do interval

F F? ????? ?

i

o de classe

l - limite inferior da classe modal

Page 101: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

101

Calcule a moda pelo processo de Czuber da distribuição abaixo.

Solução:

A classe modal é a 3° classe, portanto, a moda vale:

Interpretação: 24,3 é o valor mais freqüente nesta distribuição.

2° Processo: moda de King

Onde:

Calcule a moda pelo processo de King para a distribuição do exemplo - 12.

Interpretação: 24 é o valor mais freqüente nesta distribuição

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplo 12

Classe Freqüência

3361 ???? ; 4262 ???? ; Li = 20; h = 10 ? 1043

320 ?

???

??

???oM ? Mo = 24,3

[ ].post

o i

ant post

FM l h

F F??

?

post

ant

- limite inferior da classe modal

- freqüência da classe posterior à classe modal

- freqüência da classe anterior à classe modal

h - amplitude do intervalo de classe

il

F

F

Li = 20; Fpost = 2; Fant = 3; h = 10 ? 1023

220 ?

???

??

???oM ? Mo = 24

Exemplo - 13

Page 102: Bio e Statistic A

I - Abaixo temos a distribuição do número de acidentados por dia, durante 53 dias,

em certa rodovia:

Pede-se:

a) Determinar a média;

b) Determinar a mediana;

c) Calcular a moda;

d) Qual a porcentagem de dias em que tivemos dois ou mais acidentes?

II - Na distribuição de salário abaixo descrita, determinar:

a) o salário modal;

b) o salário mediano;

c) o salário médio;

d) abaixo de que salário se situam os 30% mais mal remunerados?

e) acima de que salário se encontram os 15% mais bem remunerados?

f) acima de que salário ficam os 20 operários mais bem pagos?

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

4

102

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Tarefa 4.3

N° de acidentados 0 1 2 3 4

N° dias 20 15 10 5 3

Salários (R$) N° de operários

600 |— 800 28

800 |— 1000 36

1000 |— 1200 58

1200 |— 1400 72

1400 |— 1600 43

1600 |— 1800 13

Page 103: Bio e Statistic A

Referência Bibliográfica

AZEVEDO, Amílcar Gomes. Estatística Básica. 5 ed, Rio de Janeiro: LTC,

1987.

CRESPO, Antônio Arnot. Estatística Fácil. 17 ed. São Paulo: Saraiva,1999.

MARTINS, G. A, Donaires, D. Princípios de Estatística. 4 ed. São Paulo.

Atlas,1990.

MOREIRA, José dos Santos. Elementos de Estatísticas. 9 ed. São Paulo:

Atlas. 1975.

PEREIRA, Wilson. Estatística: Conceitos Básicos. 2 ed. São Pailo: MC

Graw Hill,1990.

SPIEGEL, MR. Estatística. 2 edição São Paulo: Mcgraw. Hill,1985.

TOLEDO, Geraldo Luciano. Estatística Básica. 2ª ed. São Paulo: Atlas,

1985.

VIEIRA, Sonia. Elementos de Estatística. 3ª ed. São Paulo: Atlas, 1999.

Page 104: Bio e Statistic A
Page 105: Bio e Statistic A

Medidas de Dispersão

-Intervalo (Amplitude Total)

-Desvio Médio Absoluto

-Variância Desvio Padrão FASCÍCULO

Gilberto Pereira da Silva

Mário de Souza

Carga Horária - 10 horas

Após terminar a leitura deste fascículo, o estudante deve estar em

condições de:

1. Definir o objetivo das medidas de dispersão.

2. Explicar o que são medidas de dispersão e como elas podem ser

usadas.

5Objetivos

Page 106: Bio e Statistic A

3. Identificar as vantagens e descrever as características importantes de cada

medida de dispersão

As medidas de dispersão de uma distribuição são valores que indicam o grau de

afastamento dos valores da variável em relação à média.

O intervalo de um grupo de números é de modo geral, a medida mais simples de

calcular e de entender. Focaliza o maior e o menor valor no conjunto (ou seja, os

valores extre- mos). O intervalo pode ser expresso de duas maneiras:

I) A diferença entre o maior e o menor valor (também cha- mada Amplitude Total);

II) O maior e o menor valor no grupo.

Consideremos estes três valores: 1, 10 e 25. A diferença entre o valor maior e o

menor é: 25 1 = 24. Alternativamente, pode se dizer que o intervalo de valores vai

de 1 à 25.

A vantagem de utilizar o intervalo como medida de disper- são reside no fato de o

intervalo ser relativamente fácil de cal- cular, mesmo para um grande conjunto de

números. Igualmen- te, a significação de intervalo é fácil de entender.

A maior limitação de intervalo é o fato de ele só levar em conta os dois valores

extremos de um conjunto, nada informando quanto aos outros valores.

1) A amplitude total (AT) da distribuição: 2, 3, 5, 9, 11, 15, 17, 22, 25 é: 25 -- 2 =

23

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

106

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Introdução

Intervalo (amplitude total)

Exemplos:

Page 107: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

107

2) O intervalo (AT) da distribuição: 14, 3, 17, 4, 8, 73, 36, 48 é:

73 3 = 70.

3) O intervalo (AT) da distribuição: 3,2; 4,7; 5,6; 2,1; 1,9; 10,3; é: 10,3 1,9 = 8,4

A amplitude de um intervalo de classe ou simplesmente, intervalo de classe é a

medida do intervalo que define a classe.

Ela é obtida pela diferença entre os limites superior e inferior dessa classe, e é

indicada por

Na distribuição da tabela (1) abaixo:

Tabela.1

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Amplitude de um Intervalo de Classe

ih . Assim: iii lLh ?? , onde:

iL limite superior da classe

il limite inferior da classe

Exemplos:

i ESTATURAS (cm) FREQUÊNCIA 1 154150 ? 4 2 158154 ? 9 3 162158? 11 4 166162 ? 8 5 170166 ? 5 6 174170 ? 3

??40

Page 108: Bio e Statistic A

Amplitude total da distribuição (AT) é a diferença entre o limite superior da última

classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior

mínimo)

Na distribuição anterior (tabela.1) temos:

Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da

amostra

Exemplo:

Na distribuição da amostra:

166 160 161 150 162 160 165 167 164 160

162 161 168 163 156 173 160 155 164 168

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Temos: cmhh 4150154 11 ????

cmhh 4170174 77 ????

Amplitude Total da Distribuição

)()( mínmáx lLAT ??

Exemplo:

cmATAT 2424150174 ?????

Amplitude Amostral

)()( mínmáx xxAA ??

108

Page 109: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

O desvio médio absoluto (DMA) de uma distribuição é a média aritmética dos

módulos dos desvios (diferença entre o valor da variável e a média).

O desvio médio absoluto mede o desvio médio dos valores em relação à média do

grupo, ignorando o sinal do desvio.

Calcula-se o DMA subtraindo a média de cada valor do grupo e desprezando o sinal

(+ ou --) do desvio, e tomando a média em seguida.

ou , onde n é o número de

observações do conjnto.

Obsercação:

Para o cálculo do desvio médio são tomados os módulos dos desvios, pois a

soma dos desvios é zero.

1) Calcular o desvio médio da distribuição: 7, 10, 12, 15, 16, 18, 20.

Resolução:

Primeiramente devemos calcular a média aritmética dos dados:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Temos: 2323150173 ????? AAAA

Desvio Médio Absoluto (DMA)

Dada à distribuição: x1, x2, x3, ... xn , os desvios são: xx ?1 ; xx ?2 ; xx ?3 ;

... xxn ?, e o desvio médio é:

n

xxxxxxDm

n ???????

?21

n

xx

Dm

n

ii?

?

??1

Exemplos:

109

Page 110: Bio e Statistic A

2) Determine o desvio médio para o seguinte conjunto de números: 2, 4, 6, 8, 10.

Resolução:

Tomemos os valores absolutos dessas diferenças e soma- mos:

3) Determine o desvio médio para o conjunto de valores: 1, 2, 3, 4, e 5.

Resolução:

147

98

7

2018161512107 ????????. Portanto,

7

142014181416141514121410147 ??????????????Dm

42,37

26

7

6421247 ?????????

i. Determinemos a média: 6

5

108642 ??????X

ii. Determinemos a diferença entre cada valor e a média:

xxi ?

2 -- 6 = -- 4 4 – 6 = -- 2 6 – 6 = 0 8 – 6 = 2 10 – 6 = 4

???????? xxi1242024 . Logo; 4,25

12 ???

?n

xxDm

i

35

15

5

54321 ???????X

2,15

6

5

21012

5

3534333231???????

??????????

??n

xxi

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

110

Page 111: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

O fato de conhecermos a média de uma distribuição de probabilidade já nos ajuda

bastante, porém não temos uma medida que nos dê o grau de dispersão de

probabilidade em torno dessa média.

A variância é uma medida que dá o grau de dispersão (ou de concentração) de

probabilidade em torno da média.

Observações:

O processo, para calcular a variância amostral, é o seguinte: NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Variância

A variância de uma distribuição é a média aritmética dos quadrados dos desvios. A

variância de uma amostra é represen- tada por 2S e constitui uma estimativa da

variância da popula- ção que é representada por 2?(sigma ao quadrado).

Assim, se nxxxx ?,,, 321 , é uma amostra de n elementos da variável ix , então:

n

xx

S

n

ii?

?

??1

2

2

)(

e para dados tabulados a variância é dada por:

1

.)(1

2

2

−=

∑=

n

fxx

Si

n

ii

Onde: =ix média da classe e if = freqüência da classe.

Para valores pequenos de n )25( ?n devemos tomar o deno - minador de 2S como

1?n em lugar de n .

Assim, para amostras pequenas temos: 1

.)(1

2

2

?

??

??

n

xx

S

n

ii

111

Page 112: Bio e Statistic A

1. Calcular a média da amostra.

2. Subtrair a média de cada valor da amostra.

3. Elevar ao quadrado cada uma das diferenças.

4. Somar esses quadrados.

5. Dividir por .

1) Determinar a variância da amostra, constituída dos seguintes elementos: 7, 10, 12,

15, 16, 18 e 20.

Resolução:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

1−n

Exemplos:

147

98

7

20181615121071 ???????????

?

n

x

x

n

ii

17

)1420()1418()1416()1415()1412()1410()147( 22222222

???????????????S

= 216

126

6

6421)2()4()7( 2222222

???????????

2) Ao se cultivar o peixe tambaqui, a 60ind/m 3 / 120 dias, criados em gaiolas de1,0 m3, obtiveram-se os seguintes pesos (g):

Gaiola/1 Gaiola/2

350,3 342,3 352,8 345,9 340,7 350,1 350,1 331,7 334,1 350,9

328,4 345,8 334,1 360,6 356,6 349,9 348,7 345,1 348,0 348,9

gX 75,345? gX 75,345?

112

Page 113: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

Observe que as médias dos pesos dos peixes das gaiolas 1 e 2 são iguais,

evidenciando que apenas a média não é suficiente para diferenciar qual dos dois

cultivos gerou peixes de melhor ou pior crescimento em peso. Dessa forma, faz-se

necessário conhecer a variância, para um melhor diagnóstico.

Gaiola/1

Gaiola/2

Como a variância da gaiola 2 foi menor do que a da gaiola 1, pode-se concluir que o

crescimento dos peixes da gaiola 2 foi mais uniforme.

3) Determinar a variância da amostra constituída dos seguin- tes elementos: 7, 10,

12, 15, 16, 18, 20.

Resolução:

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Calculando a variância, temos:

g09,98110

)75,3456,356()75,3458,352()75,3453,342()75,3453,350( 2222

=−

−++−+−+− L

g76,48110

)75,3459,348()75,3457,331()75,3451,350()75,3451,350( 2222

??

???????? ?

147

98

7

2018161512107 ?????????X

113

Page 114: Bio e Statistic A

4) Calcule a variância da amostra 2, 4, 6, 8, 10

Resolução:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

ix )( xxi ?

2)( xxi ?

7 --7 49 10 --4 16 12 --2 4 15 1 1 16 2 4 18 4 16 20 6 36

? ?? 126)( 2xxi

Portanto, 216

126

1

.)(21

2

2 ????

??

?? S

n

xx

S

n

ii

65

30

5

108642 ???????X

ix )( xxi ? 2)( xxi ?

2 --4 16

4 --2 4

6 0 0

8 2 4 10 4 16

? ?? 40)( 2xxi

Logo; 104

40

1

.)(21

2

2 ????

??

?? S

n

xx

S

n

ii

114

Page 115: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

5) Determine a variância dos dados: 1, 3, 4, 3, 4, 2, 4, 1, 2, 2, 1, 0

Resolução:

O desvio padrão de uma distribuição é a raiz quadrada da variância.

O desvio padrão da amostra é representado por .

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

25,212

27

12

012214243431 ??????????????X

ix )( xxi ? 2)( xxi ?

1 -1,25 1,5625 3 0,75 0,5625 4 1,75 3,0625 3 0,75 0,5625 4 1,75 3,0625 2 -0,25 0,0625 4 1,75 3,0625 1 -1,25 1,5625 2 -0,25 0,0625 2 -0,25 0,0625 1 -1,25 1,5625 0 -2,25 5,0625

? ?? 25,20)( 2xxi

Portanto, 84,111

25,20

1

.)(221

2

2 ?????

??

?? SS

n

xx

S

n

ii

S

Desta forma, se nxxxx ?,,, 321 é uma amostra de n elementos da variável ix , então o

desvio padrão é ??

1

2

??

??n

xxS

i.

Desvio Padrão

115

Page 116: Bio e Statistic A

1) Calcule o desvio padrão da amostra: 20, 5, 10, 15, 25.

Resolução:

2) Sendo a variância de uma amostra igual a 81, calcule o desvio padrão dessa

amostra.

Resolução:

O desvio padrão é uma das medidas mais comumente usadas para distribuições, e

desempenha papel relevante em toda a estatística.

Cabe notar que a unidade do desvio padrão é a mesma da média. Por exemplo, se a

média é em dólar, o desvio padrão também é em dólar.

1) As estaturas de uma amostra de 40 alunos de um colégio foram:

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

Exemplos:

155

75

5

251510520 ???????X

ix )( xxi ?

2)( xxi ?

20 5 25 5 -10 100 10 -5 25 15 0 0 25 10 100 ? ?? 250)( 2xxi

Portanto, ??

91,75,624

250

1

2

????

???

n

xxS

i

Como o desvio padrão é a raiz quadrada da variância, temos: 981 ??? SS

Exercícios:

116

Page 117: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

Sendo a distribuição de freqüência:

Responda:

a. Qual a amplitude amostral?

b. Qual a amplitude de distribuição?

c. Qual o número de classes da distribuição?

d. Qual o limite inferior da quarta classe?

e. Qual amplitude do segundo intervalo de classe?

2) Determine o intervalo dos seguintes conjuntos de dados:

8.100; 9.000; 4.580; 5.600; 7.680; 4.800; 10.640

3) Calcule o desvio-padrão dos seguintes dados:

2,1; 2,5; 2,7; 2,3; 2,4; 2,0; 2,7; 3,0; 1,4; 2,4; 2,8

4) Considerando os seguintes dados correspondentes a preços de propostas:

26,5; 27,5; 25,5; 26,0; 27,0; 23,4; 25,1; 26,2; 26,8

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161

i ESTATURAS (cm) FREQUÊNCIA

1 154150 ? 4

2 158154 ? 9

3 162158? 11

4 166162 ? 8

5 170166 ? 5

6 174170 ? 3

??40

117

Page 118: Bio e Statistic A

a. Calcule o intervalo

b. Determine o Desvio Médio Absoluto

c. Determine a variância

d. Determine o desvio-padrão

5) Dada a distribuição abaixo:

5 10 9 1 10 10 8 7 7 3 8 0 9 8 2.

Pede-se:

a. Calcular o desvio médio absoluto;

b. Calcular a variância;

c. Calcular o desvio-padrão.

6) Dada a distribuição abaixo:

3 8 4 4 3 3 4 5 4 0 7 5 6 5 3.

Pede-se:

a. Calcular o desvio médio absoluto;

b. Calcular a variância;

c. Calcular o desvio-padrão.

7) Considerando os seguintes dados relativos ao número de ca-acidentes diários

num grande estacionamento, durante um período de 20 dias:

6 9 2 7 0 8 2 5 4 1

5 4 1 4 4 2 5 6 3 7

Pede-se:

a. Calcular o desvio médio absoluto;

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

118

Page 119: Bio e Statistic A

UPE -

Un

iver

sid

ade

de

Per

nam

bu

co

5

b. Calcular a amplitude amostral;

c. Calcular a variância;

d. Calcular o desvio padrão;

8) O desvio padrão pode ser zero? Explique. Pode ser negativo? Explique.

NEED

- N

úcl

eo d

e Est

ud

o e

m E

du

caçã

o a

Dis

tân

cia

119

Page 120: Bio e Statistic A
Page 121: Bio e Statistic A

Referência Bibliográfica

Bibliografia (Básica):

1. Iezzi Gelson et al. Fundamentos de Matemática Elementar. Vol 11.

São Paulo: Atual.

2. MEYER, Paul L. Probabilidade: Aplicações à Estatística. Livros

Técnicos e Científicos. Rio de Janeiro: Editora S.A, 1983.

3. SPIEGEL, M. R. Estatística. 3. ed. São Paulo: Makron Books do Brasil,

1993. 643p.

4. WILLIAM J. Stevenson. Estatística Aplicada à Administração. Editora

Harbra Ltda.

1. COSTA Neto, P.L. Estatística. 15 ed. São Paulo: Edgard Blucher. 1977,

262p

2. GOMES, F.P. Curso de estatística experimental. Piracicaba: NOBEL,

1982. 469P.

Page 122: Bio e Statistic A

3. LEVIN, J. Estatística aplicada a ciências humanas. 2. ed. São Paulo:

Harbra, 1987. 392p.

4. MARTINS, G. de A. DONAIRE, D. Princípios de estatística. 4.ed. São Paulo: Atlas,

1990. 255p.

5. MORETTIN, L. G. Estatística Básica. 7. ed. Makron Books do Brasil. Editora Ltda.

6. SPIEGEL, M. R. Probabilidades e Estatística. Coleção SCHAUM. Editora

Santuário. Aparecida-SP.

Bibliografia (Complementar):