Bioestatística
-
Upload
felipethoaldo -
Category
Technology
-
view
24.499 -
download
1
Transcript of Bioestatística
BIOESTATÍSTICA
• A Bioestatística estuda métodos para a obtenção, organização e análise de dados e os métodos de tirar conclusão e fazer predições com base nesses dados.
• É uma matéria fundamental para a realização de pesquisas com coleta de dados
• Os procedimentos estudados na Bioestatística serão utilizados na realização do TCC
Estatística Descritiva: consistem em resumir as principais características de um conjunto de dados através de tabelas, gráficos e medidas descritivas em forma de resumos numéricos;
Inferência Estatística: consiste em generalizar os resultados de uma amostra para todos os elementos da população, isto é realizado basicamente na forma de Estimação Intervalar e de Testes de Hipóteses.
CONCEITOS BÁSICOS
• População: Conjunto de TODAS as unidades que se deseja estudar
• Amostra: Subconjunto da população, são as unidades que iremos observar
CONCEITOS BÁSICOS
• INDIVÍDUO: cada elemento afetado por uma medida ou enumerado por um índice.
• VARIÁVEL: determinada característica que, por algum motivo, nos interessa estudar. A escolha da variável de interesse dependerá, em cada caso, dos objetivos do estudo estatístico em questão, É O QUE MEDIREMOS!!
FASES DE UM TRABALHO ESTATÍSTICO
1ª DEFINIÇÃO DO PROBLEMA.
2ª PLANEJAMENTO
3ª COLETA DE DADOS
4ª APURAÇÃO DOS DADOS
5ª APRESENTAÇÃO DOS DADOS
6ª ANÁLISE E INTERPRETAÇÃO DOS DADOS
Planejamento• O QUE MEDIR – quais variáveis
utilizar
• COMO MEDIR – como medir estas variáveis
• DE QUEM MEDIR – qual será a amostra
Exemplo 1: Realizar uma pesquisa de opinião com os alunos da
Faculdade
• Como medir estar variáveis?? Questionário. Como aplicar,...
• Quais variáveis utilizar?? Quais questões, opções de resposta,...
• Como será a amostra?? Quantas pessoas, como selecionar,...
Exemplo 2: Verificar a eficiência de um treinamento em jogadores de Basquete
12 a 14 anos jogos colegiais• Quais variáveis utilizar?? Velocidade, Impulsão,...
• Como medir estar variáveis??. Quais Protocolos utilizar.
• Como será a amostra?? Quantas pessoas, como selecionar,...
VARIÁVEIS
• QUALITATIVAS (CATEGÓRICAS)– NOMINAIS (NÃO TEM ORDEM)– ORDINAIS (TEM ORDEM)
• QUANTITATIVAS– DISCRETAS (CONTAGEM)– CONTÍNUAS (MENSURAÇÃO)
AMOSTRAGEM
Amostra é parte desta população, é a parte que será realmente estudada,
portanto pode-se compreender que ela deva apresentar o melhor possível, a
população da qual veio.
• Razões para o Uso de Amostra:
De ordem prática
População hipotética
TIPOS DE AMOSTRAS MAIS USADAS
- Aleatória simples: Sortear indivíduos do total da população (LISTA)
- Aleatória sistemática: Selecionar indivíduos de “k em k” quando não é possível sortear
- Estratificada proporcional: Dividir a população em estratos (grupos) e selecionar a amostra proporcionalmente dentro de cada estrato
• Exemplo:
Uma população é dividida em 3 grupos da seguinte forma
• Estrato A (jovens) _____> 120 elementos
• Estrato B (adultos) _____> 72 elementos
• Estrato C (3ª idade) _____> 48 elementos
Retirar uma amostra de 50 indivíduos dessa população
AMOSTRA POR CONVENIÊNCIA
Quando não é possível utilizar nenhum dos planos amostrais anteriores e a única possibilidade é utilizar alguns indivíduos que temos a disposição
Obs: Caracterizar bem a amostra para deixar claro qual população ela representa (descrição das características dos indivíduos como: sexo, escolaridade classe social, etc.)
TABELAS
GRÁFICOS• Barras ou Colunas:- Comparar as quantidades- Escala Iniciar do ZERO!!
• Pizza ou Setores:- Comparar as partes de um todo- Apenas Categorias NOMINAIS- No Máximo 5 ou 6 Categorias
• Linhas:- Verificar comportamento AO LONGO DO TEMPO
CORRELAÇÃO
Verificar como 2 variáveis quantitativas se relacionam- Diagrama de Dispersão- Coeficiente de Correlação de Pearson
DISTRIBUIÇÃO DE FREQUÊNCIA
Tabela para variáveis quantitativas
Histograma
0
5
10
15
20
60 |- 80 80 |- 100 100 |- 120 120 |- 140 140 |- 160
MEDIDAS DE TENDÊNCIA CENTRAL
• Média. É o valor em torno do qual os dados se concentram.
• Exemplo: Amostra de 5 valores de colesterol: 200 - 250 - 280 - 310 - 320
X
X
n
ii
n
1
dLmbX /272
5
320310280250200
• Mediana. É o valor que divide um conjunto de observações ao meio
Ex 1) Amostra de 5 valores de colesterol:
200 - 250 - 280 - 310 - 320
(n.º de observações ímpares)
Md = 280 (mg/dL)
Interpretação : 50% dos indivíduos tem colesterol igual ou menor que 280 e os outros 50% tem 280 ou mais.
Ex 2) Amostra de salários de 6 profissionais:
200 – 220 – 250 – 280 – 310 – 320
(n.º de observações par)
Md= 250 + 280
2
Md= 265,00 reais
Interpretação : metade dos profissionais tem salário igual ou menor que 265,00 reais e os demais tem salário igual ou maior de 265,00 reais.
• Moda. É o valor que ocorre com maior freqüência dentro do conjunto de observação.
Ex) Idade de alunos (em anos): 18 - 19 - 19 - 19 - 20 - 21 - 22
Mo = 19 anos Interpretação: a idade que mais aparece é 19
anos.
1 moda = unimodal 2 modas = bimodal+ de 2 modas = multimodal não possui moda = amodal
• Separatrizes. São valores que dividem um conjunto de observações em partes iguais:
• Mediana -- Divide em 2 partes iguais (Md)
• Quartil----- Divide em 4 partes iguais (Q)
• Decil -------Divide em 10 partes iguais (D)
• Percentil ------Divide em 100 partes iguais (P)
Ex) P45 = 23,8 anos
Interpretação: 45% das pessoas tem menos de 23,8 anos e 55% tem mais de 23,8 anos
MEDIDAS DE VARIABILIDADE• AMPLITUDE (H) É a diferença entre o valor
máximo e o valor mínimo de conjunto de dados
H = M – m
• VARIÂNCIA (S2) É a “média” entre os quadrados das diferenças entre cada elemento do conjunto de dados e sua média.
S 2
(X X)
n 1i
2
• DESVIO PADRÃO (s) É a raiz quadrada positiva da variância. Ele mede a dispersão de um conjunto de dados em relação à média.
Notas de 4 bimestres na disciplina de Bioestatística de 2 alunos:
• A) 4 - 6 - 4 - 6• B) 0 - 4 - 6 - 10
1
)( 2
n
XXs i
1º Passo: cálculo da média2º Passo: cálculo dos desvios3º Passo: cálculo dos desvios ao quadrado4º Passo: Cálculo da somatória dos desvios ao
quadrado5º Passo: aplicação da fórmula
• COEFICIENTE DE VARIAÇÃO (CV) É a medida de dispersão relativa porque estabelece uma relação entre o desvio padrão e a média.
Utilizada para comparar a variabilidade relativa ou grau de homogeneidade de diferentes grupos
Considera-se um grupo homogêneo quando CV ≤ 30%. Com um CV > 30% o grupo vai perdendo a homogeneidade
100.X
sCV %
Exemplo: Indique qual grupo é mais homogêneo em relação ao salário:
Grupo A : Média R$600 desvio padrão R$50
Grupo B : Média R$1.000 desvio padrão R$70
CV A = 50/600 = 8,33%
CV B = 70/1.000 = 7%
Grupo B mais homogêneo (CV menor)
Cálculos no Excel:- Contar Valores: =CONT.SE(A1:A20;”C”)Obs. No lugar de C colocar o valor que será contado
entre aspas- Média: =MÉDIA(A1:A20)- Mediana: =MED(A1:A20)- Percentil: =PERCENTIL(A1:A20;0,p) Obs. No lugar de p colocar o pecentil desejado- Maior Valor: =MÁXIMO(A1:A20)- Menor Valor: =MÍNIMO(A1:A20)- Variância: =VAR(A1:A20)- Desvio Padrão: =DESVPAD(A1:A20)- Coeficiente de Correlação de Pearson:
=CORREL(A1:A20;B1:B20)
INFERÊNCIA ESTATÍSTICA Generalizar os resultados
da Amostra para a População
- Parâmetro = Verdadeiro valor populacional – Desconhecido (impossível calcular com dados amostrais)
- Estimativa = Valor amostral – Conhecido (possível calcular com dados amostrais
Estimação IntervalarCom base no valor amostral calcular a margem
de erro para estimar o valor populacional
- Ex.:Pesquisa Eleitoral:
Candidato A: 30%
Candidato B: 27%
Margem de erro de 2 pontos percentuais para mais a para menos
Candidato A : 28% a 32%
Candidato B: 25% a 29%
• CONFIABILIDADE
- Probabilidade do Intervalo conter o verdadeiro valor populacional (estar certo)
90% 95% 99%
• SIGNIFICÂNCIA
- Probabilidade do Intervalo não conter o verdadeiro valor populacional (estar
errado)
10% 5% 1%
n
ppZ
)1(
Cálculo da Margem de Erro:
• Z = valor da tabela Z com a confiabilidade definida (para 95% = 1,96)
• P= proporção estimada (usualmente 0,5)• n = tamanho da amostra
Ex. Com 95% de confiabilidade e amostra de 600 indivíduos margem de erro = 4%
CÁLCULO TAMANHO DA AMOSTRA
Ex.: Para uma população de 3.000 pessoas, com 95% de confiabilidade e 5% de erro
admissível (margem de erro)
n = 384 nc = 340
Amostra de 340 indivíduos
2
2 )1(
ppZ
n
Nn
NnnC
.
TESTES DE HIPÓTESES• COMPARAÇÃO 2 Grupos Diferentes ou Mesmos Indivíduos em
2 Momentos Diferentes
• OBJETIVO: VERIFICAR SE AS DIFERENÇAS SÃO SIGNIFICATIVAS
Será que a diferença entre as médias das amostras é significativa quando generalizamos os resultados para a população?
• Ho => Hipótese Nula => Indica Igualdade => É a Hipóteses que Será Testada
• H1 => Hipóteses Alternativa => Indica Diferença
O resultado de um teste é uma das seguintes afirmações:
REJEITO HoNÃO REJEITO Ho
Hipóteses Estatísticas
• Ho: =
• H1: ≠• Se o teste indica que REJEITO Ho
isto significa que EXISTE DIFERENÇA SIGNIFICATIVA
• Se o teste indica que NÃO REJEITO Ho
isto indica que NÃO EXISTE DIFERENÇA SIGNIFICATIVA
Para a realização de um teste deve-se calcular a Estatística de Teste ou Valor Calculado, definir as Regiões Críticas (com base nas tabelas), e fazer a conclusão com base no esquema abaixo:
Procedimentos para realização de um teste de hipóteses com Valor Calculado:
• Formular as hipóteses ( H0 e H1)
• Calcular a Estatística de Teste ou Valor Calculado
• Determinar as Regiões Críticas
• Decidir pela rejeição, ou não rejeição, da hipótese nula
• Interpretar o resultado.
TESTE F PARA COMPARAR VARIÂNCIAS
Ho: VAR A = VAR B
H1: VAR A ≠ VAR B
Distribuição F com gl
• Estatística de Teste:
2
2
menor
maiorc S
SF
1;1 DENNUM nn
TESTE t PARA COMPARAR MÉDIAS
Ho: MÉDIA A = MÉDIA BH1: MÉDIA A ≠ MÉDIA B
1) OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE IGUAIS
2) OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE DIFERENTES
3) OBSERVAÇÕES DEPENDENTES
• OBSERVAÇÕES INDEPENDENTES:
2 GRUPOS COM INDIVÍDUOS DIFERENTES
• OBSERVAÇÕES DEPENDENTES:
OS MESMOS INDIVÍDUOS EM 2 MOMENTOS DIFERENTES (ANTES E DEPOIS OU PRÉ
E PÓS TESTES)
OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE IGUAIS
Estatística de Teste:
Distribuição t com n1+n2–2 gl
i.
21
2
21
11
nnS
XXt
p
c , onde 2
)1()1(
21
222
2112
nn
SnSnS p .
OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE DIFERENTES
Estatística de Teste:
Distribuição t com gl
Onde
2
22
1
21
21
n
S
n
S
XXtc
11
)(
2
22
1
21
221
n
w
n
w
wwv
i
ii nSw
2
OBSERVAÇÕES DEPENDENTES
Estatística de Teste:
Onde é a média da diferenças e Sd é o desvio padrão das diferenças
Distribuição t com n – 1 gl
nSd
td
c
d
TESTES DE HIPÓTESES COM VALOR P (P-VALOR)
• P-VALOR é a probabilidade de errar quando Ho é rejeitado, desta forma:
se p-valor for grande :
NÃO REJEITO Ho
se p-valor for pequeno:
REJEITO Ho
TESTES DE HIPÓTESES COM VALOR P (P-VALOR)
• Desta forma utilizamos o seguinte critério para a realização de um teste com p-valor:
se p-valor for MAIOR que a significância (5% ou 0,05) :
NÃO REJEITO Ho
se p-valor for MENOR que a significância (5% ou 0,05) :
REJEITO Ho
Procedimentos para realização de um teste de hipóteses
com p-valor
• Formular as hipóteses ( H0 e H1)
• Decidir pela rejeição, ou não rejeição, da hipótese nula (com base no p-valor)
• Interpretar o resultado.
TESTE QUI QUADRADO (2) PARA INDEPENDÊNCIA
Utilizado quando a variável medida é QUALITATIVA e deseja-se comparar 2 ou mais grupos
Consiste em comparar os valores OBSERVADOS com os valores ESPERADOS, se não houvesse diferença nenhuma entre os grupos
TESTE QUI QUADRADO (2)
Estatística de teste:
Distribuição 2 com (s-1)x(r-1) gl
r
i
s
j ij
ijij
E
EO
1 1
2
2
Cálculos no Excel:
- Teste F: =TESTEF(A1:A20;B1:B20)- Teste t de student: =TESTET(A1:A20;A1:B20;1;tipo)
Obs. No lugar de tipo colocar:
1 se forem observações dependentes
2 se forram observações independentes variâncias iguais
3 se forram observações independentes variâncias diferentes
- Teste qui-quadrado: =TESTE.QUI(A1:B2;A4:B5)
Obs. Primeiro Intervalo: Valores Observados
Segundo Intervalo: Valores Esperados
TESTES NÃO PARAMÉTRICOS
2 grupos Mais de 2 grupos
Nível de
Mensuração Dependente Independente Dependente Independente
Nominal McNemar Fisher ou 2 Q Cochran 2
Ordinal Wilcoxon U Mann-Whitney
Friedman Kruskal-Wallis
ANOVA Análise de Variância
É utilizada quando a variável é QUANTITATIVA e deseja-se comparar MAIS DE 2 GRUPOS, é uma alternativa
ao teste t com observações independentes
ANÁLISE ESTATÍSTICA
Quando o objetivo do trabalho é apenas fazer uma descrição e não se pretende fazer uma comparação:
• Cálculo de medidas descritivas:
• Média e desvio padrão para variáveis quantitativas
• Porcentagem para variáveis qualitativas
ANÁLISE ESTATÍSTICA
Quando o objetivo do trabalho é fazer uma comparação entre grupos ou entre o pré teste e o pós teste. Para verificar se existe diferença significativa deve ser utilizado algum dos seguintes testes estatísticos:
Variável quantitativa com pelo menos 15 indivíduos por grupo:
• Comparar pré e pós teste: teste t de student para observações dependentes (pareado)
• Comparar 2 grupos: teste t de student para observações independentes
• Comparar mais de 2 grupos: ANOVA• Comparar 2 grupos ou mais em períodos de tempo diferentes:
ANOVA de medidas repetidas
ANÁLISE ESTATÍSTICA Variável quantitativa com menos de 15 indivíduos por grupo ou
variável qualitativa ordinal:
• Comparar pré e pós teste: teste Wilcoxon• Comparar 2 grupos: teste U de Mann-Whitney• Comparar mais de 2 grupos: teste Kruskal-Wallis• Comparar mais de 2 períodos de tempo diferentes: Friedman
Variável qualitativa nominal:
• Comparar pré e pós teste: teste McNemar• Comparar 2 grupos: teste qui-quadrado (amostras grandes) ou
teste de Fisher (apenas 2 possíveis respostas)• Comparar mais de 2 grupos: teste qui-quadrado (amostras grandes)
Tamanho da amostra
Para justificar amostras de até 100 indivíduos, com 95% de confiabilidade, para a comparação de grupos pode-se utilizar a seguinte tabela, segundo Altman (1991)
Referência:
ALTMAN D. G. Pratical Statistics for Medical
Research. Chapman and Hall, London, 1991
Tabela com tamanho da amostra para uma confiabilidade de 95%:
Tamanho da amostra
Poder de teste Diferença padronizada
15 60% 1,220 65% 125 70% 130 80% 135 85% 140 85% 0,9550 85% 0,8560 85% 0,7570 85% 0,7080 85% 0,6590 85% 0,60
100 85% 0,55