ESTATÍSTICA No sentido comum – representa uma coleção de dados numéricos: –Resumir o...
Transcript of ESTATÍSTICA No sentido comum – representa uma coleção de dados numéricos: –Resumir o...
ESTATÍSTICA ?
PRA QUÊ ?
ESTATÍSTICA
• No sentido comum – representa uma coleção de dados numéricos:– Resumir o desempenho de um time de futebol
durante uma temporada;– Relacionar nascimentos em uma cidade;– Índices PIB, IPC
ESTATÍSTICA
• Vem do latim “status” = Estado
• inicialmente envolvia:– compilações de dados e gráficos representativos
dos vários aspectos de um estado ou país.• taxa de mortalidade, • taxa nascimento,• renda, • taxas de desemprego, etc.
ESTATÍSTICA
• É uma coleção de métodos para:– planejar experimentos,
– obter dados,
– organizar,
– resumir,
– analisar
– concluir sobre as informações coletadas
Estatística
• Ramo da matemática que analisa dados estatísticos– Estatística Descritiva– Inferência Estatística
• Ouvimos falar em estatísticas:– do movimento da Bolsa de Valores– da Saúde Pública– do crescimento da população, etc.
• Essa noção prende-se normalmente apenas à parte de ORGANIZAÇÃO E DESCRIÇÃO dos dados observados.
Estatística
• Há ainda outro campo de atuação da Estatística que se refere à ANÁLISE E INTERPRETAÇÃO desses dados.
• OBJETIVO:– utiliza os conceitos como auxílio nas tomadas
de decisão diante de incertezas– justifica cientificamente as decisões
Estatística
• UTILIZAÇÃO: aplicável a qualquer ramo do conhecimento onde se manipulem dados numéricos:– Física Química Economia– Biologia Engenharia Medicina– Ciências Sociais– Ciências Administrativas, etc.
Estatística
• Estatística pode ser dividida em duas partes:– .Estatística Descritiva - cuida da:
• Organização
• descrição dos dados experimentais;
– .Estatística Indutiva - cuida da:
• análise
• interpretação dos dados
STRESS
• Mecanismo que põe em alerta as funções corporais;
• prepara a pessoa para a ação;• PEQUENAS DOSES: melhora desempenho;• CRÔNICO: mal à saúde.
STRESS
• ESTÁGIOS:• 1) ALERTA:
– percepção do perigo;– organismo se prepara para o confronto.– Isto ocorre através de descargas extras de
hormônios na corrente sangüínea.– Principal é a adrenalina
STRESS
• 2. CRÔNICO:– sistema imunológico entra em colapso;– abre espaço à doenças oportunistas;– aumenta risco de males cardíacos e danos às
estruturas cerebrais.
STRESS - níveis de tensão (médico americano)
• Morte de filho........................123 pontos
• Morte de cônjuge...................119 pontos
• Morte dos pais ou irmãos......101 pontos
• divórcio................................. 96 pontos
• doença grave......................... 74 pontos
• demissão no emprego........... 74 pontos
profissões campeãs de stress
• 1) policiais e seguranças privados
• 2) controladores de vôo e motoristas de ônibus urbano;
• 3) executivos, trabalhadores de área de saúde, de atendimento ao público e bancários
• 4) jornalistas
Usos da Estatística
• AARP (Associação Americana de Aposentados) alega que os motoristas mais idosos se envolvem em menor número de acidentes do que os mais jovens.
• A alegação da AARP é válida ?
idade nº de acidentes
16 - 19 anos 1.500.000
Mais de 70 anos 540.000
Usos da Estatística
• embora os motoristas mais novos tenham maior número de acidentes, os mais velhos apresentam as mais altas taxas de acidente
idade taxa de acidentes
16 - 19 anos 8,6
75 - 79 anos 4,6
80 - 84 anos 8,9
Mais de 85 anos 20,3
Abusos da Estatística• Segundo Benjamin Disraeli: “Há três tipos de
mentira: as mentiras, as mentiras sérias e a estatística”
• Outro provérbio: “Os números não mentem; mas os mentirosos forjam os números”
• “se torturarmos os dados por bastante tempo, eles acabarão por admitir qualquer coisa”
Abusos da Estatística• Andrew Lang (historiador): algumas pessoas usam a
estatística como um bêbado usa um poste de iluminação - para servir de apoio e não para iluminar
Exemplo:
33% dos acidentes de trânsito envolvem pessoas embriagadas...
Portanto, 67% estão completamente sóbrias,
Conclusão: devemos, então, dirigir totalmente bêbados ??
Abusos da Estatística• Números precisos:
– a área do território brasileiro é de 8.547.403,2574 metros quadrados
– a idade de uma peça de museu é de 10 mil e três anos.
• Números precisos: (palpites)– Quando o Papa visitou Miami, fontes informaram
uma estimativa de 250 mil pessoas. Através de fotos aéreas e grades, estimaram em 150 mil pessoas
Abusos da Estatística• Porcentagens distorcidas:
– Uma Cia aérea anuncia a melhoria dos serviços.– Houve uma melhora de 100% nos últimos meses em
relação à bagagem extraviada.– Não se extravia mais bagagens?
• Perguntas tendenciosas– quando as perguntas são feitas de modo a sugerir uma
resposta.– Você gosta do refrigerante “X”?– De qual refrigerante você gosta?
Abusos da Estatística• Pressão do pesquisador:
– Perguntas feitas a indivíduos pesquisados, estes normalmente dão respostas favoráveis à sua auto-imagem.
– Em uma pesquisa telefônica 94% dos entrevistados responderam que lavam suas mãos após usar um banheiro, mas a observação em lugares públicos confirmaram apenas em 68% dos indivíduos.
• Más amostras– métodos inadequados para coleta de dados.– Existem técnicas de amostragem.
Estatística
• Conceitos fundamentais:
– POPULAÇÃO
– AMOSTRA
População (Universo Estatístico)
• conjunto de elementos com pelo menos uma característica comum.
• Esta característica deve delimitar quais os elementos que pertencem à população e quais os que não pertencem.
• Exemplo: Vamos estudar o desempenho dos estudantes em 2008. – POPULAÇÃO = todos os estudantes de 2008
População
• Pode ser:– FINITA: onde o número de unidades a
observar pode ser contado e é limitado. Ex• alunos matriculados nas escolas públicas• pessoas portadoras de aparelho telefone
celular• pacientes da clínica de fisioterapia/terapia
ocupacional “Dom Bosco” de Lins
População
– INFINITA: onde a quantidade de observação é ilimitada, ou as unidades da população não podem ser contadas. Ex:• conjunto de medidas de determinado
comprimento, • gases, líquidos, onde as unidades não podem
ser identificadas ou contadas.
População - Universo Estatístico
• Mas a quem interessa este resultado?• Se o analista dos resultados for o
responsável pelo curso FISIOTERAPIA e T.O., será que interessa a ele o desempenho dos alunos de Administração e Ciências Contábeis?
• Devemos procurar as características que interessam ao analista dos resultados
População - Universo Estatístico
• Os alunos da Enfermagem em 2008• Os alunos da Enfermagem em 2008 que
cursam o 3º termo• a cada item, estamos especificando cada vez
mais as características das pessoas a serem observadas, restringindo a “população” objeto de nossos estudos.
População - Universo Estatístico
• uma vez definida as características da POPULAÇÃO– o passo seguinte é o levantamento de
dados da População acerca das características objeto de estudo.
• Mas será que SEMPRE SERÁ POSSÍVEL possível o levantamento de dados de toda a população que devemos analisar?
Fatores que influenciam o levantamento de uma população
• TEMPO: as informações devem ser obtidas com rapidez
PRECISÃO: as informações devem ser corretas
CUSTO: no processo de coleta, sistematização, análise e interpretação, o custo deve ser o menor possível.
Amostra• Outros motivos para se tomar uma amostra
– Exame de doença contagiosa: o pesquisador poderia infectar-se e começar a transmitir a doença a todos os entrevistados.
– Testes destrutivos– exame de sangue de um paciente– trabalho extenso: anotações erradas
Amostra• Devemos então delimitar nossas
observações a uma parte da população, isto é, a uma amostra proveniente dessa população.
• AMOSTRA: É um subconjunto de uma população, necessariamente finito, pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado.
Amostra
• A Estatística Indutiva tira conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações.
• A partir do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo.
• Logicamente a indução não traz resultado exato, dando margem a erro.
Amostra
• A Estatística Indutiva, entretanto, irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade.
Amostra
• Quanto maior a amostra, mais confiáveis serão as induções ?
• erros grosseiros e conclusões falsas podem ocorrer devido a falhas na amostragem.
Amostragem
• Classificação quanto aos fatores em estudo:– OBSERVACIONAL: o analista não há
controle sobre os fatores em estudo.• Ex: Pesquisa eleitoral
– DE EXPERIMENTO: o analista têm o controle sobre os fatores em estudo.• O analista pode modificar situações do
ambiente de estudo. Utilizado em pesquisas científicas.
Variável• Qual a primeira pergunta que se deve fazer
quando pretende-se fazer uma pesquisa científica?
Qual é a variável que queremos estudar?
Variável• portanto, é necessário que se tenham bem
definidas quais características deverão ser verificadas. Ex.: Alunos da FITEO. (Universo Estatístico ou População).
• Dentro da população, é preciso definir quais as características que nos interessa averiguar. Ex. idade, sexo, estado civil, etc.
• A escolha da variável dependerá dos objetivos do estudo estatístico.
Variável• é o conjunto de resultados possíveis de um
fenômeno.• é a característica ou propriedade da
população que está sendo medida. Ex.:– População: moradores de uma cidade– Variável : número de filhos– População: alunos de Administração– Variável : sexo
Variável– População: moradores de um prédio– Variável : peso
• CLASSIFICAÇÃO DA VARIÁVEL• pode ser: • A) QUANTITATIVA A 1 - DISCRETA• A.2 - CONTÍNUA• B) QUALITATIVA
VARIÁVEIS
• QUALITATIVAS: quando a variável é não numérica ou definida através de atributos, categorias. Ex:– sexo– plano de saúde– tipo de doença– raça
Variáveis
• QUANTITATIVA: quando pode ser expressa em números. Ex:– quantidade de valores de notas de uma moeda– quantidade de sabores de refresco– duração de uma bateria de telefone celular– número de ossos existentes em um animal
Variáveis Quantitativas• DISCRETAS:
– quando os valores podem assumir apenas determinados valores e resultam de uma contagem.
– O conjunto de valores possíveis que a variável pode assumir é finito ou infinitos enumerável. Ex:
• valores das cédulas da moeda brasileira• número de filhos dos casais de Lins
Variáveis Quantitativas• CONTÍNUAS
– quando os valores podem assumir pertence ao conjunto dos números reais. Podem assumir qualquer valor.
– Obtido por medição. Ex;• peso de um paciente• altura • tempo de vôo entre duas cidades
ESCALA DE MEDIÇÃO DAS VARIÁVEIS
• 1. ESCALA NOMINAL:
– dão nome a uma categoria ou classe.
– Não há hierarquia entre os nomes
Ex: procedência - de que cidade (Lins, Promissão, etc.)
plano de saúde: UNIMED, São Lucas, etc...
ESCALA DE MEDIÇÃO DAS VARIÁVEIS
• 2. ESCALA ORDINAL:
– dão nome e uma ordem a uma categoria ou classe;
Ex: Grau de instrução: 1: sem instrução;
2: primeiro grau;
3: segundo grau,
4: superior;
5: mestre;
6: doutor.
• embora 3 seja maior do que 2, não significa que 3 + 2 = 5.
• Não é possível quantificar o quanto o nível 3 é melhor do que 2 ou o 4 é melhor do que 3.
ESCALA DE MEDIÇÃO DAS VARIÁVEIS
• ESCALA INTERVALAR: elimina a limitação da escala ordinal estabelecendo intervalos iguais com o mesmo significado.
Ex: na medição de temperatura tanto de 25º a 30º o aumento é de 5º, como o aumento de temperatura tanto de 30º a 35º o aumento é de 5º.
Porém, não se pode afirmar que 60º é o dobro de 30º, pois 0º da escala de temperatura é arbitrário.
• ESCALA PROPORCIONAL: Apresenta um ZERO absoluto. Ex: peso. Peso Zero = ausência de peso. 60 kgs é o dobro de 30 kgs.
Variáveis DEPENDENTES E INDEPENDENTES
• Variável Independente:– é a que influencia, determina ou afeta outra variável;
– referida como fator determinante, condição ou causa para ocorrência de determinada resposta.
• Variável dependente:– a sua resposta varia em virtude dos diferentes valores
que a variável independente pode assumir;
– modificando-se a variável independente, altera-se o valor da variável dependente.
Variáveis DEPENDENTES E INDEPENDENTES
• Variável Independente (VI): é o antecedente;• Variável dependente(VD): é o conseqüente
Variável Independente Variável Dependente
Idade dos animais comprimento
Deficiência alimentar Dific. De aprendizagem
Maior pigmentação na pelagem dos animais
Menor adaptação em climas quentes
Variáveis DEPENDENTES E INDEPENDENTES
• Como detectar se uma variável é dependente ou independente ?
• Critério de sucetibilidade à influência:– Variável dependente é alterada ou influenciada pela
variável independente:
– Ex: dependente: predisposição a problemas cardíacos
independente: sexo
Variáveis DEPENDENTES E INDEPENDENTES
• Critérios para identificar o sentido de influência entre as variáveis dependente e independente ?
• 1) Ordem temporal:– o que ocorre depois não pode influenciar o que
aconteceu antes. Ex:V. independente V. dependente
Amamentação materna do recém-nascido
Maior resistência a infecções na infância
Hábito de fumar durante a gravidez Peso do recém-nascido
Variáveis DEPENDENTES E INDEPENDENTES
• 2) Fixidez: em Ciência Biológicas, muitas variáveis podem ser consideradas fixas, ou não saão sujeitas a influências. Ex:
– suscetibilidade a certas doenças está associada ao sexo do indivíduo;
– variáveis bioquímicas em animais e no homem são dependentes da idade.
– Peso do recém-nascido está relacionado com a ordem de nascimento.
CO-VARIÁVEIS
• Em todo experimento existe:– variável dependente: a ser analisada;– variável independente:
• que são fatores que influenciam os resultados da variável dependente;
• determinam as condições sob os quais a variável dependente é obtida.
CO-VARIÁVEIS
• Qualquer outra variável que possa interferir no resultado deve ser mantido constante.
• Isto é possível em procedimentos experimentais e não em processos não controlados.
• Ex: Comparação de 2 tipos de cirurgias executadas na rotina hospitalar:
CO-VARIÁVEIS
• Variáveis como: idade e tempo da doença geralmente devem ser consideradas como co-variáveis.
• Desta forma a comparação entre tratamentos pode ser efetuada sem que elas interfiram,– mascarando resultados – levando a conclusões erradas
• Esta neutralização é obtida através de processos estatísticos adequados
• Ex: Comparação da produção de leite entre vacas de uma mesma raça, alimentadas com duas rações diferentes.– O período de lactação que varia ao longo do
experimento influencia a produção– esta influência deve ser adequadamente
neutralizada, para que os resultados não sejam mascarados, levando a conclusões falsas.
CO-VARIÁVEIS
CONCLUSÃO
CO-VARIÁVEL: é um fator que o pesquisador procura neutralizar intencionalmente em uma investigação, com a finalidade de impedir que interfira na análise da relação entre as variáveis independentes e dependentes
Tabela Primitiva • Dado um levantamento de dados estatísticos
de uma variável quantitativa, como por exemplo, a altura dos alunos da FITEO em 2004, que tenha dado os seguintes valores (em cm.):
• 165 167 172 160 158 175 157 168
174 179 154 160 173 181 155 166
185 172 157 164 170 168 174 155
Tabela Primitiva • Notamos que a tabela não está
numericamente organizada. • A esta tabela denominamos TABELA
PRIMITIVA.• com os dados dispostos desta maneira é
difícil fazer qualquer análise e tirarmos alguma conclusão a respeito deste levantamento.
• Para facilitar a análise vamos dispor em uma ordem crescente ou decrescente.
ROL• 154 155 155 157 157 158 160 160
164 165 166 167 168 168 170 172172 173 174 174 175 179 181 185
• Concluímos que a menor estatura é de 154 e a maior é de 185.
• A amplitude é de 185 - 154 = 31.• A leitura da tabela fica mais clara.• A esta tabela organizada denominamos ROL.
Estatística• Resumindo:
• TABELA PRIMITIVA: é a tabela onde o : é a tabela onde o conjunto de elementos não foram conjunto de elementos não foram numericamente ordenados.numericamente ordenados.
• ROL: a tabela onde os dados foram a tabela onde os dados foram numericamente ordenados de forma numericamente ordenados de forma crescente ou decrescentecrescente ou decrescente.
Distribuição de Freqüência• Para facilitar a análise dos dados:
– vamos ordenar em colunas colocando o número de vezes que aparece repetido.
• TABULAR: é registrar quantas vezes o termo aparece no rol.
• Este processo pode ser inconveniente, pois pode gera uma tabela muito extensa pela quantidade de valores diferentes no levantamento de dados
Distribuição de Freqüência
Altura
• Estaturas dos alunos de FITEO-2000
freqüência
154 1
155 2
157 2
158 1
160 2
154 1
Altura freqüência
165 1
166
167 1
2
170 1
172 2
168
1
Fonte: Dados fictícios
Distribuição de Freqüência
Altura
• Estaturas dos alunos de FITEO-2004
freqüência
173 1
174 2
175 1
179 1
181 1
185 1
total 24
Distribuição de Freqüência• Para facilitar a análise dos dados obtidos,
agrupar os valores em intervalos de classes (principalmente para variáveis contínuas).
• Assim dividimos nossa distribuição em INTERVALOS DE CLASSE
• INTERVALO DE CLASSE: é a forma de agrupar valores.
Distribuição de FreqüênciaALUNOS DA FITEO DO ANO 2004
Altura freqüência
154 158.......... 5
158 162.......... 3162 166.......... 2
166 170.......... 4
170 174.......... 4
174 178.......... 3
178 182.......... 2
182 186.......... 1
total......... 24
Fonte: Dados fictícios
Distribuição de Freqüência• CLASSES DE FREQÜÊNCIA
• São intervalos de variação da variável As classes são representadas
simbolicamente por “ i ” Assim o intervalo 162 166 define a 3ª
classe i = 3
A distribuição é formada por 8 classes
Distribuição de Freqüência
As classes são:
1ª classe: 154 158
2ª classe 158 162
3ª classe 162 166
4ª classe 166 170
5ª classe 170 174
6ª classe 174 178
7ª classe 178 182
8ª classe 182 186
Distribuição de Freqüência• LIMITES DE CLASSE
• São os extremos de cada classe. Temos• li = limite inferior da classe
• ls = limite superior da classe
• Referente à 3ª classe temos:– 162 166 li = 162 inclui limite inferior
– lS = 166 exclui limite superior
Distribuição de Freqüência• FREQÜÊNCIA
• É o número de ocorrências em que uma única característica é observada.
• FREQÜÊNCIA SIMPLES ou ABSOLUTA (fi)
• São os valores que representam o número de dados de classe
• é resultante da contagem.• Ex: Na 3ª classe a freqüência foi igual a 2, ou
seja duas pessoas têm estatura entre 162 a 166 cm (exclusive).
Distribuição de Freqüência• FREQÜÊNCIA ACUMULADA (Fac ou Fi )
• É o valor total (soma) das freqüências dos valores inferiores ao limite superior do intervalo de uma das classes.
• FREQÜÊNCIA RELATIVA ( Fr )
• É dado pela razão da freqüência simples e a freqüência total.
Fr = freqüência simples (f i)
freqüência total
Distribuição de FreqüênciaFREQÜÊNCIA RELATIVA PERCENTUAL
(Fr %)
Fr % = Fr x 100
PONTO MÉDIO ( PM )• É o ponto que divide o intervalo de classe em
duas partes iguais.
PM = li + ls
2
Distribuição de FreqüênciaAMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT)
• AT=limite superior máximo-limite inferior mínimo
• No nosso exemplo AT = 186 - 154 = 32
AMPLITUDE DE UM INTERVALO DE CLASSE ( h )
h = limite superior da classe - limite inferior da classe
h = ls - li