Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
EstatísticaEstatísticaDescritivaDescritiva
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Dado & InformaçãoDado & Informação
Registro ou a representação de uma medida, contagem, atributo ou fato, passível de comunicação, interpretação e processamento.
É o produto da manipulação ou processamento de dados.
Dado:
Informação:
32 69
A+
R09
172
M
R09 32 M 172 69 A +
Reg Idad Sex Est Pes GS Rh
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
População & AmostraPopulação & AmostraParâmetros & EstimadoresParâmetros & Estimadores
;
_x1 ; s1
12
3
_x3 ; s3
_x2 ; s2
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Variável BiológicaVariável Biológica Propriedade através da qual podemos
averiguar as diferenças individuais dos elementos em estudo.
Se essa propriedade não difere nem dentro da amostra ou pelo menos entre amostras, então esse caráter não tem nenhum interesse estatístico.
Relação entre variáveis: Variáveis independentes Variável dependente Variáveis de confusão.
Tipos de variáveis: Variáveis Qualitativas
(produtos de contagem) Variáveis Quantitativas
(produtos de medição)
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Coleta de DadosColeta de Dados
Levantamentos: Contínuos (Registros públicos, hospitalares)
Periódicos (Censos)
Ocasionais (Pesquisas, coletas pontuais)
Níveis de mensuração:
Escala Nominal (Dados qualitativos)
Escala Ordinal (Dados qualitativos)
Escala Intervalar (Dados quantitativos)
Escala de Razões (Dados Quantitativos)
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Dados Qualitativos:
Distribuição de freqüênciasDistribuição de freqüências
Grupo Sanguíneo
Frequência Observada
Frequência Relativa
Frequência em %
A 180 0,30 30B 90 0,15 15
AB 30 0,05 5O 300 0,50 50
Total 600 1,00 100
0
100
200
300
400
A B O AB
Grupos Sangüíneos
Freq
üênc
ia
0
100
200
300
400
AB B A O
Grupos Sangüíneos
Frre
qüên
cia
Gráficos: Diagrama de barrasGráficos: Diagrama de barras
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Gráficos – Dados QualitativosGráficos – Dados Qualitativos
Freqüências dos Grupos Sangüíneos
3090
180
300
AB
B
A
O
Gráfico: Setores Circulares
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Dados: Séries HistóricasDados: Séries Históricas
050
100150200250
1940 1950 1960 1970 1980 1990
Décadas
Mor
talid
ade
(x 1
000)
País A
País B
Taxas de mortalidade infantil observadas entre 1940 a 1990
País 1940 1950 1960 1970 1980 1990
A 220 200 170 150 110 90
B 180 170 165 160 150 145
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Manipulação de gráficosManipulação de gráficos
Filhos x Casal (Dados Hipotéticos)
012345678
1900
1910
1920
1930
1940
1950
1960
1970
1980
1990
2000
A N O
Num
. Filh
os
Filhos x Casal (Dados Hipotéticos)
0
1
2
3
4
5
6
7
8
A N O
Filhos x Casal (Dados Hipotéticos)
02468
1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000
A N O
Num
. Filh
os
Número médio de filhos por casal no século 20
1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000
6,8 6,5 6,1 5,4 5,0 4,7 4,4 3,9 3,3 3,1 2,6
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Análise DescritivaAnálise DescritivaDados QuantitativosDados Quantitativos
142 153 145 146 158 148 147 144
164 147 161 134 151 158 160 159
161 158 152 156 164 145 150 154
148 143 157 145 137 152 157 167
165 156 150 161 146 156 166 148
144 164 154 147 158 151 152 162
157 146 151 162 153 159 165 156
131 166 160 152 157 160 151 179
162 155 167 172 137 169 175 143
153 139 151 148 163 154 140 173
Estaturas de uma amostra de 80 escolares
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Distribuição de FrequênciasDistribuição de FrequênciasDistribuiçao de Estaturas
7
34 34
5
05
10152025303540
136,6 148,8 161,0 173,2
Estatura (Ponto Medio)
Freq
uênc
ia
Distribuição de Estaturas
1 10
2 21
4
67
2
9
6
1
76 6
45
4
10
21 1 1
0
2
4
6
8
10
Estatura (Ponto Médio)
Freq
uênc
ia
Distribuição de estaturas
0
5
10
15
20
25
134 141 148 155 162 169 176
Estatura (Ponto Médio)
Freq
uênc
ia
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Análise DescritivaAnálise DescritivaDados QuantitativosDados Quantitativos
7132,613010,09031,11
)2log()80log(1
)2log(log
nk
Número de Classes:
Valores reais:153 154 155
152,5 153,5 154,5 155,5
Intervalo:
77
5,1305,179
I
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Tabela de FrequênciasTabela de Frequências
Distribuição de Frequências
47
2023
17
63
0
5
10
15
20
25
134 141 148 155 162 169 176
Estatura (Ponto Médio)
Freq
uênc
ia
Distribuição de Estaturas de 80 estudantesClasse X Contagem Freq
130,5 – 137,5 134 **** 4137,5 – 144,5 141 ******* 7144,5 – 151,5 148 ******************** 20151,5 – 158,5 155 *********************** 23158,5 – 165,5 162 ***************** 17165,5 – 172,5 169 ****** 6172,5 179,5 176 *** 3
Totais 80
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Medidas de PosiçãoMedidas de Posição
Moda:
Medida de tendência central definida simplesmente como o valor da variável que apresenta a maior freqüência.
Esta medida é de pouco interesse prático em relação a dados biológicos, principalmente devido à sua grande instabilidade de um grupo de observações para outro.
Unimodal Bimodal Multimodal
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Medidas de PosiçãoMedidas de Posição
Mediana:
Valor correspondente àquela observação que ocupa a posição central.
Esta medida separa a amostra (ou população) em dois grupos de igual tamanho.
Valor descritivo mais representativo quando a distribuição não é NORMAL
Usada como base nos testes estatísticos Não-Paramétricos.
Posto 1 2 3 4 5 6 7 8
Salário 320 600 800 800 900 950 3000 15000
850850
Média = 2.796,25
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Gráficos – Cálculo da MedianaGráficos – Cálculo da Mediana
Idade Frequência Frequência Acumulada
15 10 1016 16 2617 25 5118 32 8319 11 9420 6 100
Total 100
0
20
40
60
80
100
120
14 15 16 17 18 19 20
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Dados agrupados: Obtenção gráfica Dados agrupados: Obtenção gráfica da medianada mediana
Distribuição de Estaturas de 80 estudantes
Classe X Frequência Freq. Acumulada
130,5 – 137,5 134 4 4137,5 – 144,5 141 7 11144,5 – 151,5 148 20 31151,5 – 158,5 155 23 54158,5 – 165,5 162 17 71165,5 – 172,5 169 6 77172,5 179,5 176 3 80
Totais 80
0
10
20
30
40
50
60
70
80
90
130,5 137,5 144,5 151,5 158,5 165,5 172,5 179,5
155
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Dados agrupados: Cálculo da medianaDados agrupados: Cálculo da mediana
74,223
7.9x
Classe que contem a Mediana: 151,5 – 158,5
Intervalo da classe = 7
Metade da amostra: n/2 = 40
Freq. Acumulada até a classe abaixo da Mediana: F = 31
Frequência da classe mediana: 23
Nº de indivíduos pertencentes à classe e cujas medidas correspondem à do grupo de medidas inferior à Mediana: n/2 – 31 = 9
Ponto do intervalo correspondente a esses 9 indivíduos:
Logo:
E a mediana = 151,5 + 2,74 = 154,24
Fórmula Geral: Me = I
fFnl
2/inf
23 --------------- 7
9 --------------- x
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Média AritméticaMédia Aritmética
142 153 145 146 158 148 147 144164 147 161 134 151 158 160 159161 158 152 156 164 145 150 154148 143 157 145 137 152 157 167165 156 150 161 146 156 166 148144 164 154 147 158 151 152 162157 146 151 162 153 159 165 156131 166 160 152 157 160 151 179162 155 167 172 137 169 175 143153 139 151 148 163 154 140 173
Valor ao redor do qual se distribui o conjunto de observações.
É a medida de posição mais representativa da amostra (ou população) quando os dados apresentam uma distribuição NORMAL.
36,15480349.12
nX
X
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Dados agrupados: Obtenção da Dados agrupados: Obtenção da MédiaMédia
Distribuição de Estaturas de 80 estudantesClasse X Frequência (f) F . X
130,5 – 137,5 134 4 536137,5 – 144,5 141 7 987144,5 – 151,5 148 20 2960151,5 – 158,5 155 23 3565158,5 – 165,5 162 17 2754165,5 – 172,5 169 6 1014172,5 179,5 176 3 528
Totais 80 12.344
Média ponderada:
30.15480344.12
fX.f
X
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Medidas de DispersãoMedidas de Dispersão
Valores Quarticos e Percentis
Desvio Médio
Variância
Desvio Padrão
X X - | X - | (X - )2
4 1 1 12 -1 1 13 0 0 01 -2 2 45 2 2 4
15 0 6 10
| X - | = 6 ==> Desvio Médio = 6 / 5 = 1,2
(X - )2 = Soma de Quadrados = 10
Variância = 2 = SQ / N = 10 / 5 = 2,0
Desvio Padrão = SQ / N = 2,0 = 1,41
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Medidas de DispersãoMedidas de Dispersão
1nXX
1nSQs
2
1nXX
1nSQs
2
2
Variância Amostral:
Desvio Padrão Amostral:
nssEP X
Erro Padrão:
Coeficiente de Variação:
XsCV
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Propiedades da média e Propiedades da média e da variânciada variância
X X- (X-)2 X1=X + 4 D1 D1D1
5 2 4 9 2 42 -1 1 6 -1 13 0 0 7 0 01 -2 4 5 -2 44 1 1 8 1 1
15 0 10 35 0 10
Média de X = 15/5 = 3
Média de X1 = 35/5 = 7 = 3 + 4
Variância de X = 10/5 = 2
Variância de X1 = 10/5 = 2
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Propriedades da média ePropriedades da média eda variânciada variância
X X- (X-)2 X1=X . 5 D1 D1D1
5 2 4 25 10 1002 -1 1 10 -5 253 0 0 15 0 01 -2 4 5 -10 1004 1 1 20 5 25
15 0 10 75 0 250
Média de X = 15/5 = 3
Média de X1 = 75/5 = 15 = 3 . 5
Variância de X = 10/5 = 2
Variância de X1 = 250/5 = 50 2 . 52
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Fórmula computacional da Fórmula computacional da Soma de QuadradosSoma de Quadrados
2XXSQ
22 XXX2X
22 XXX2X
SQ
22 XnXX2X
2
2
nX
nXnX
2X
nX
nX
2X22
2
nX
X2
2
Ministério da Saúde – MSFundação Oswaldo Cruz - Fiocruz
Dr. Pedro H. CabelloInstituto Oswaldo Cruz – IOC
Laboratório de Genética Humana - LGH
Cálculo da Soma de QuadradosCálculo da Soma de Quadrados
X X- (X-)2 X X2
5 2 4 5 252 -1 1 2 43 0 0 3 91 -2 4 1 14 1 1 4 16
15 0 10 15 55
Média de X = 15/5 = 3
Soma de Quadrados (SQ) = 10
Soma de Quadrados (SQ) = 55 – (225/5) = 10
Top Related