Bioestatística

58
BIOESTATÍSTICA A Bioestatística estuda métodos para a obtenção, organização e análise de dados e os métodos de tirar conclusão e fazer predições com base nesses dados. É uma matéria fundamental para a realização de pesquisas com coleta de dados Os procedimentos estudados na Bioestatística serão utilizados na realização do TCC

Transcript of Bioestatística

Page 1: Bioestatística

BIOESTATÍSTICA

• A Bioestatística estuda métodos para a obtenção, organização e análise de dados e os métodos de tirar conclusão e fazer predições com base nesses dados.

• É uma matéria fundamental para a realização de pesquisas com coleta de dados

• Os procedimentos estudados na Bioestatística serão utilizados na realização do TCC

Page 2: Bioestatística

Estatística Descritiva: consistem em resumir as principais características de um conjunto de dados através de tabelas, gráficos e medidas descritivas em forma de resumos numéricos;

Inferência Estatística: consiste em generalizar os resultados de uma amostra para todos os elementos da população, isto é realizado basicamente na forma de Estimação Intervalar e de Testes de Hipóteses.

Page 3: Bioestatística

CONCEITOS BÁSICOS

• População: Conjunto de TODAS as unidades que se deseja estudar

• Amostra: Subconjunto da população, são as unidades que iremos observar

Page 4: Bioestatística

CONCEITOS BÁSICOS

• INDIVÍDUO: cada elemento afetado por uma medida ou enumerado por um índice.

• VARIÁVEL: determinada característica que, por algum motivo, nos interessa estudar. A escolha da variável de interesse dependerá, em cada caso, dos objetivos do estudo estatístico em questão, É O QUE MEDIREMOS!!

Page 5: Bioestatística

FASES DE UM TRABALHO ESTATÍSTICO

1ª DEFINIÇÃO DO PROBLEMA.  

2ª PLANEJAMENTO

3ª COLETA DE DADOS

4ª APURAÇÃO DOS DADOS

5ª APRESENTAÇÃO DOS DADOS 

6ª ANÁLISE E INTERPRETAÇÃO DOS DADOS

Page 6: Bioestatística

Planejamento• O QUE MEDIR – quais variáveis

utilizar

• COMO MEDIR – como medir estas variáveis

• DE QUEM MEDIR – qual será a amostra

Page 7: Bioestatística

Exemplo 1: Realizar uma pesquisa de opinião com os alunos da

Faculdade

• Como medir estar variáveis?? Questionário. Como aplicar,...

• Quais variáveis utilizar?? Quais questões, opções de resposta,...

• Como será a amostra?? Quantas pessoas, como selecionar,...

Page 8: Bioestatística

Exemplo 2: Verificar a eficiência de um treinamento em jogadores de Basquete

12 a 14 anos jogos colegiais• Quais variáveis utilizar?? Velocidade, Impulsão,...

• Como medir estar variáveis??. Quais Protocolos utilizar.

• Como será a amostra?? Quantas pessoas, como selecionar,...

Page 9: Bioestatística

VARIÁVEIS

• QUALITATIVAS (CATEGÓRICAS)– NOMINAIS (NÃO TEM ORDEM)– ORDINAIS (TEM ORDEM)

• QUANTITATIVAS– DISCRETAS (CONTAGEM)– CONTÍNUAS (MENSURAÇÃO)

Page 10: Bioestatística

AMOSTRAGEM

Amostra é parte desta população, é a parte que será realmente estudada,

portanto pode-se compreender que ela deva apresentar o melhor possível, a

população da qual veio.

• Razões para o Uso de Amostra:

De ordem prática

População hipotética

Page 11: Bioestatística

TIPOS DE AMOSTRAS MAIS USADAS

- Aleatória simples: Sortear indivíduos do total da população (LISTA)

- Aleatória sistemática: Selecionar indivíduos de “k em k” quando não é possível sortear

- Estratificada proporcional: Dividir a população em estratos (grupos) e selecionar a amostra proporcionalmente dentro de cada estrato

Page 12: Bioestatística

• Exemplo:

Uma população é dividida em 3 grupos da seguinte forma

• Estrato A (jovens) _____> 120 elementos

• Estrato B (adultos) _____> 72 elementos

• Estrato C (3ª idade) _____> 48 elementos

Retirar uma amostra de 50 indivíduos dessa população

Page 13: Bioestatística

AMOSTRA POR CONVENIÊNCIA

Quando não é possível utilizar nenhum dos planos amostrais anteriores e a única possibilidade é utilizar alguns indivíduos que temos a disposição

Obs: Caracterizar bem a amostra para deixar claro qual população ela representa (descrição das características dos indivíduos como: sexo, escolaridade classe social, etc.)

Page 14: Bioestatística

TABELAS

Page 15: Bioestatística

GRÁFICOS• Barras ou Colunas:- Comparar as quantidades- Escala Iniciar do ZERO!!

• Pizza ou Setores:- Comparar as partes de um todo- Apenas Categorias NOMINAIS- No Máximo 5 ou 6 Categorias

• Linhas:- Verificar comportamento AO LONGO DO TEMPO

Page 16: Bioestatística

CORRELAÇÃO

Verificar como 2 variáveis quantitativas se relacionam- Diagrama de Dispersão- Coeficiente de Correlação de Pearson

Page 17: Bioestatística

DISTRIBUIÇÃO DE FREQUÊNCIA

Tabela para variáveis quantitativas

Page 18: Bioestatística

Histograma

0

5

10

15

20

60 |- 80 80 |- 100 100 |- 120 120 |- 140 140 |- 160

Page 19: Bioestatística

MEDIDAS DE TENDÊNCIA CENTRAL

• Média. É o valor em torno do qual os dados se concentram.

• Exemplo: Amostra de 5 valores de colesterol: 200 - 250 - 280 - 310 - 320

X

X

n

ii

n

1

dLmbX /272

5

320310280250200

Page 20: Bioestatística

• Mediana. É o valor que divide um conjunto de observações ao meio

Ex 1) Amostra de 5 valores de colesterol:

200 - 250 - 280 - 310 - 320

(n.º de observações ímpares)

Md = 280 (mg/dL)

Interpretação : 50% dos indivíduos tem colesterol igual ou menor que 280 e os outros 50% tem 280 ou mais.

Page 21: Bioestatística

Ex 2) Amostra de salários de 6 profissionais:

200 – 220 – 250 – 280 – 310 – 320

(n.º de observações par)

Md= 250 + 280

2

Md= 265,00 reais

Interpretação : metade dos profissionais tem salário igual ou menor que 265,00 reais e os demais tem salário igual ou maior de 265,00 reais.

Page 22: Bioestatística

• Moda. É o valor que ocorre com maior freqüência dentro do conjunto de observação.

Ex) Idade de alunos (em anos): 18 - 19 - 19 - 19 - 20 - 21 - 22

Mo = 19 anos Interpretação: a idade que mais aparece é 19

anos.

1 moda = unimodal 2 modas = bimodal+ de 2 modas = multimodal não possui moda = amodal

Page 23: Bioestatística

• Separatrizes. São valores que dividem um conjunto de observações em partes iguais:

• Mediana -- Divide em 2 partes iguais (Md)

• Quartil----- Divide em 4 partes iguais (Q)

• Decil -------Divide em 10 partes iguais (D)

• Percentil ------Divide em 100 partes iguais (P)

Ex) P45 = 23,8 anos

Interpretação: 45% das pessoas tem menos de 23,8 anos e 55% tem mais de 23,8 anos

Page 24: Bioestatística

MEDIDAS DE VARIABILIDADE• AMPLITUDE (H) É a diferença entre o valor

máximo e o valor mínimo de conjunto de dados

H = M – m

• VARIÂNCIA (S2) É a “média” entre os quadrados das diferenças entre cada elemento do conjunto de dados e sua média.

S 2

(X X)

n 1i

2

Page 25: Bioestatística

• DESVIO PADRÃO (s) É a raiz quadrada positiva da variância. Ele mede a dispersão de um conjunto de dados em relação à média.

Notas de 4 bimestres na disciplina de Bioestatística de 2 alunos:

• A) 4 - 6 - 4 - 6• B) 0 - 4 - 6 - 10

1

)( 2

n

XXs i

Page 26: Bioestatística

1º Passo: cálculo da média2º Passo: cálculo dos desvios3º Passo: cálculo dos desvios ao quadrado4º Passo: Cálculo da somatória dos desvios ao

quadrado5º Passo: aplicação da fórmula

Page 27: Bioestatística

• COEFICIENTE DE VARIAÇÃO (CV) É a medida de dispersão relativa porque estabelece uma relação entre o desvio padrão e a média.

Utilizada para comparar a variabilidade relativa ou grau de homogeneidade de diferentes grupos

Considera-se um grupo homogêneo quando CV ≤ 30%. Com um CV > 30% o grupo vai perdendo a homogeneidade

100.X

sCV %

Page 28: Bioestatística

Exemplo: Indique qual grupo é mais homogêneo em relação ao salário:

Grupo A : Média R$600 desvio padrão R$50

Grupo B : Média R$1.000 desvio padrão R$70

CV A = 50/600 = 8,33%

CV B = 70/1.000 = 7%

Grupo B mais homogêneo (CV menor)

Page 29: Bioestatística

Cálculos no Excel:- Contar Valores: =CONT.SE(A1:A20;”C”)Obs. No lugar de C colocar o valor que será contado

entre aspas- Média: =MÉDIA(A1:A20)- Mediana: =MED(A1:A20)- Percentil: =PERCENTIL(A1:A20;0,p) Obs. No lugar de p colocar o pecentil desejado- Maior Valor: =MÁXIMO(A1:A20)- Menor Valor: =MÍNIMO(A1:A20)- Variância: =VAR(A1:A20)- Desvio Padrão: =DESVPAD(A1:A20)- Coeficiente de Correlação de Pearson:

=CORREL(A1:A20;B1:B20)

Page 30: Bioestatística

INFERÊNCIA ESTATÍSTICA Generalizar os resultados

da Amostra para a População

- Parâmetro = Verdadeiro valor populacional – Desconhecido (impossível calcular com dados amostrais)

- Estimativa = Valor amostral – Conhecido (possível calcular com dados amostrais

Page 31: Bioestatística

Estimação IntervalarCom base no valor amostral calcular a margem

de erro para estimar o valor populacional

- Ex.:Pesquisa Eleitoral:

Candidato A: 30%

Candidato B: 27%

Margem de erro de 2 pontos percentuais para mais a para menos

Candidato A : 28% a 32%

Candidato B: 25% a 29%

Page 32: Bioestatística

• CONFIABILIDADE

- Probabilidade do Intervalo conter o verdadeiro valor populacional (estar certo)

90% 95% 99%

• SIGNIFICÂNCIA

- Probabilidade do Intervalo não conter o verdadeiro valor populacional (estar

errado)

10% 5% 1%

Page 33: Bioestatística

n

ppZ

)1(

Cálculo da Margem de Erro:

• Z = valor da tabela Z com a confiabilidade definida (para 95% = 1,96)

• P= proporção estimada (usualmente 0,5)• n = tamanho da amostra

Ex. Com 95% de confiabilidade e amostra de 600 indivíduos margem de erro = 4%

Page 34: Bioestatística

CÁLCULO TAMANHO DA AMOSTRA

Ex.: Para uma população de 3.000 pessoas, com 95% de confiabilidade e 5% de erro

admissível (margem de erro)

n = 384 nc = 340

Amostra de 340 indivíduos

2

2 )1(

ppZ

n

Nn

NnnC

.

Page 35: Bioestatística

TESTES DE HIPÓTESES• COMPARAÇÃO 2 Grupos Diferentes ou Mesmos Indivíduos em

2 Momentos Diferentes

• OBJETIVO: VERIFICAR SE AS DIFERENÇAS SÃO SIGNIFICATIVAS

Será que a diferença entre as médias das amostras é significativa quando generalizamos os resultados para a população?

Page 36: Bioestatística

• Ho => Hipótese Nula => Indica Igualdade => É a Hipóteses que Será Testada

• H1 => Hipóteses Alternativa => Indica Diferença

O resultado de um teste é uma das seguintes afirmações:

REJEITO HoNÃO REJEITO Ho

Hipóteses Estatísticas

Page 37: Bioestatística

• Ho: =

• H1: ≠• Se o teste indica que REJEITO Ho

isto significa que EXISTE DIFERENÇA SIGNIFICATIVA

• Se o teste indica que NÃO REJEITO Ho

isto indica que NÃO EXISTE DIFERENÇA SIGNIFICATIVA

Page 38: Bioestatística

Para a realização de um teste deve-se calcular a Estatística de Teste ou Valor Calculado, definir as Regiões Críticas (com base nas tabelas), e fazer a conclusão com base no esquema abaixo:

Page 39: Bioestatística

Procedimentos para realização de um teste de hipóteses com Valor Calculado:

• Formular as hipóteses ( H0 e H1)

• Calcular a Estatística de Teste ou Valor Calculado

• Determinar as Regiões Críticas

• Decidir pela rejeição, ou não rejeição, da hipótese nula

• Interpretar o resultado.

Page 40: Bioestatística

TESTE F PARA COMPARAR VARIÂNCIAS

Ho: VAR A = VAR B

H1: VAR A ≠ VAR B

Distribuição F com gl

• Estatística de Teste:

2

2

menor

maiorc S

SF

1;1 DENNUM nn

Page 41: Bioestatística

TESTE t PARA COMPARAR MÉDIAS

Ho: MÉDIA A = MÉDIA BH1: MÉDIA A ≠ MÉDIA B

1) OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE IGUAIS

2) OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE DIFERENTES

3) OBSERVAÇÕES DEPENDENTES

Page 42: Bioestatística

• OBSERVAÇÕES INDEPENDENTES:

2 GRUPOS COM INDIVÍDUOS DIFERENTES

• OBSERVAÇÕES DEPENDENTES:

OS MESMOS INDIVÍDUOS EM 2 MOMENTOS DIFERENTES (ANTES E DEPOIS OU PRÉ

E PÓS TESTES)

Page 43: Bioestatística

OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE IGUAIS

Estatística de Teste:

Distribuição t com n1+n2–2 gl

i.

21

2

21

11

nnS

XXt

p

c , onde 2

)1()1(

21

222

2112

nn

SnSnS p .

Page 44: Bioestatística

OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE DIFERENTES

Estatística de Teste:

Distribuição t com gl

Onde

2

22

1

21

21

n

S

n

S

XXtc

11

)(

2

22

1

21

221

n

w

n

w

wwv

i

ii nSw

2

Page 45: Bioestatística

OBSERVAÇÕES DEPENDENTES

Estatística de Teste:

Onde é a média da diferenças e Sd é o desvio padrão das diferenças

Distribuição t com n – 1 gl

nSd

td

c

d

Page 46: Bioestatística

TESTES DE HIPÓTESES COM VALOR P (P-VALOR)

• P-VALOR é a probabilidade de errar quando Ho é rejeitado, desta forma:

se p-valor for grande :

NÃO REJEITO Ho

se p-valor for pequeno:

REJEITO Ho

Page 47: Bioestatística

TESTES DE HIPÓTESES COM VALOR P (P-VALOR)

• Desta forma utilizamos o seguinte critério para a realização de um teste com p-valor:

se p-valor for MAIOR que a significância (5% ou 0,05) :

NÃO REJEITO Ho

se p-valor for MENOR que a significância (5% ou 0,05) :

REJEITO Ho

Page 48: Bioestatística

Procedimentos para realização de um teste de hipóteses

com p-valor

• Formular as hipóteses ( H0 e H1)

• Decidir pela rejeição, ou não rejeição, da hipótese nula (com base no p-valor)

• Interpretar o resultado.

Page 49: Bioestatística

TESTE QUI QUADRADO (2) PARA INDEPENDÊNCIA

Utilizado quando a variável medida é QUALITATIVA e deseja-se comparar 2 ou mais grupos

Consiste em comparar os valores OBSERVADOS com os valores ESPERADOS, se não houvesse diferença nenhuma entre os grupos

Page 50: Bioestatística

TESTE QUI QUADRADO (2)

Estatística de teste:

Distribuição 2 com (s-1)x(r-1) gl

r

i

s

j ij

ijij

E

EO

1 1

2

2

Page 51: Bioestatística

Cálculos no Excel:

- Teste F: =TESTEF(A1:A20;B1:B20)- Teste t de student: =TESTET(A1:A20;A1:B20;1;tipo)

Obs. No lugar de tipo colocar:

1 se forem observações dependentes

2 se forram observações independentes variâncias iguais

3 se forram observações independentes variâncias diferentes

- Teste qui-quadrado: =TESTE.QUI(A1:B2;A4:B5)

Obs. Primeiro Intervalo: Valores Observados

Segundo Intervalo: Valores Esperados

Page 52: Bioestatística

TESTES NÃO PARAMÉTRICOS

2 grupos Mais de 2 grupos

Nível de

Mensuração Dependente Independente Dependente Independente

Nominal McNemar Fisher ou 2 Q Cochran 2

Ordinal Wilcoxon U Mann-Whitney

Friedman Kruskal-Wallis

Page 53: Bioestatística

ANOVA Análise de Variância

É utilizada quando a variável é QUANTITATIVA e deseja-se comparar MAIS DE 2 GRUPOS, é uma alternativa

ao teste t com observações independentes

Page 54: Bioestatística

ANÁLISE ESTATÍSTICA

Quando o objetivo do trabalho é apenas fazer uma descrição e não se pretende fazer uma comparação:

• Cálculo de medidas descritivas:

• Média e desvio padrão para variáveis quantitativas

• Porcentagem para variáveis qualitativas

Page 55: Bioestatística

ANÁLISE ESTATÍSTICA

Quando o objetivo do trabalho é fazer uma comparação entre grupos ou entre o pré teste e o pós teste. Para verificar se existe diferença significativa deve ser utilizado algum dos seguintes testes estatísticos:

 

Variável quantitativa com pelo menos 15 indivíduos por grupo:

• Comparar pré e pós teste: teste t de student para observações dependentes (pareado)

• Comparar 2 grupos: teste t de student para observações independentes

• Comparar mais de 2 grupos: ANOVA• Comparar 2 grupos ou mais em períodos de tempo diferentes:

ANOVA de medidas repetidas

Page 56: Bioestatística

ANÁLISE ESTATÍSTICA Variável quantitativa com menos de 15 indivíduos por grupo ou

variável qualitativa ordinal:

• Comparar pré e pós teste: teste Wilcoxon• Comparar 2 grupos: teste U de Mann-Whitney• Comparar mais de 2 grupos: teste Kruskal-Wallis• Comparar mais de 2 períodos de tempo diferentes: Friedman

 

Variável qualitativa nominal:

• Comparar pré e pós teste: teste McNemar• Comparar 2 grupos: teste qui-quadrado (amostras grandes) ou

teste de Fisher (apenas 2 possíveis respostas)• Comparar mais de 2 grupos: teste qui-quadrado (amostras grandes)

Page 57: Bioestatística

Tamanho da amostra

Para justificar amostras de até 100 indivíduos, com 95% de confiabilidade, para a comparação de grupos pode-se utilizar a seguinte tabela, segundo Altman (1991)

Referência:

ALTMAN D. G. Pratical Statistics for Medical

Research. Chapman and Hall, London, 1991

Page 58: Bioestatística

Tabela com tamanho da amostra para uma confiabilidade de 95%:

Tamanho da amostra

Poder de teste Diferença padronizada

15 60% 1,220 65% 125 70% 130 80% 135 85% 140 85% 0,9550 85% 0,8560 85% 0,7570 85% 0,7080 85% 0,6590 85% 0,60

100 85% 0,55