Análise de Dados
Luiz Claudio Santos Thuler – MD, PhDTecnologista - Instituto Nacional de Câncer (INCA)
Professor Associado – Universidade Federal do Estado do Rio de Janeiro (UNIRIO)
Declaração de conflito de interesse
Não existe conflito de interesse em relação a esta
apresentação
“Por serem mais precisos do que as palavras, os números são
particularmente mais adequados para transmitir as conclusões para transmitir as conclusões
científicas.” (PAGANO e GAUVRE 2004 )
No entanto tal como se podementir com palavras, pode-sementir com palavras, pode-sefazer o mesmo com números.
“Existem 3 tipos de mentiras: mentiras,
mentiras condenáveis e ... as estatísticas.”e ... as estatísticas.”
Benjamin Dissaeli (Primeiro Ministro Britânico)
• Conhecer as característicasda população
• Verificar se hádiferenças que
Analítica
Análise Estatística
da população
Descritiva
diferenças quepossam explicaro desfecho
Onde entra a Estatística na pesquisa científica ?
PROJETO DE PESQUISA
FASE DE PREPARAÇÃOEscolha do temaDelimitação do problema
Revisão de literatura
FASES DA CONSTRUÇÃO DO PROJETOI. O PROBLEMAIntroduçãoFormulação da situação-problemaJustificativaObjetivo do estudoHipóteses, variáveisDelimitação do estudoDelimitação do estudoDefinição dos termos e abreviaturas
II. METODOLOGIADesenho - tipo de pesquisaSeleção das observações (população; plano de amostragem)InstrumentaçãoPlano de coleta, digitação, tratamento estatístico e análise de dados
III. CRONOGRAMAIV. REFERÊNCIAS BIBLIOGRÁFICAS
FLUXOGRAMA DE PESQUISA
FASE DE EXECUÇÃOElaboração do instrumento de medidaEstudo PilotoColeta de dadosDigitação dos dados
Onde entra a Estatística na pesquisa científica ?
Digitação dos dadosAnálise estatísticaAvaliação das hipóteses
FASE DE ELABORAÇÃO E APRESENTAÇÃO DOS RESULTADOSElaboração do relatórioRedaçãoApresentação
Construção do Banco de Dados
Planilhas
Planilhas
•Excel
•Access
•Programas estatísticos:•Programas estatísticos:
•Epi Info
•SPSS
•Stata
. . .
Análise dos Dados
• Números absolutos – representam o que se
obtém ao contar diretamente uma série de eventos da mesma natureza. Têm limitações pois não se apoia em pontos de referência pois não se apoia em pontos de referência que permitem conhecer melhor a situação.
Estimativas do número de casos novos de câncer, por região. Brasil, 2010
• Números relativos – são valores absolutos
expressos em relação a outros valores absolutos que guardam entre si uma relação coerente. Relaciona-se dois dados coerente. Relaciona-se dois dados diferentes. Permitem comparações. São as proporções, taxas ou coeficientes e razões.
Proporção = é um tipo de razão em que onumerador está incluído no denominador,sendo expresso em percentagem.
Razão = fração em que o numerador não estáincluído no denominador, expresso comouma relação.uma relação.
Taxa = razão na qual existe distinta relaçãoentre o numerador e o denominador; amedida de tempo é intrínseca aodenominador.
Proporção• Relação entre o nº de indivíduos com certo atributo e o total de indivíduos considerados.• O numerador está contido no denominador.• Mostra a importância relativa do evento.
Nx 100
P
Exemplo: Mortalidade proporcional por câncer:
Total óbitos por câncer x 100
Total de óbitos
P
Distribuição proporcional dos óbitos conforme causa básica. Brasil, 2007Capítulo CID-10 Óbitos %
I. Algumas doenças infecciosas e parasitárias 45945 4,4
II. Neoplasias (tumores) 161491 15,4
III. Doenças sangue órgãos hemat e transt imunitár 5719 0,6
IV. Doenças endócrinas nutricionais e metabólicas 61860 5,9
V. Transtornos mentais e comportamentais 10948 1,1
VI. Doenças do sistema nervoso 20413 2,0
VII. Doenças do olho e anexos 26 0,003
VIII.Doenças do ouvido e da apófise mastóide 118 0,01
IX. Doenças do aparelho circulatório 308466 29,4
X. Doenças do aparelho respiratório 104498 10,0
XI. Doenças do aparelho digestivo 53724 5,1
XII. Doenças da pele e do tecido subcutâneo 2475 0,2
XIII.Doenças sist osteomuscular e tec conjuntivo 3789 0,4
XIV. Doenças do aparelho geniturinário 18301 1,8
XV. Gravidez parto e puerpério 1615 0,2
XVI. Algumas afec originadas no período perinatal 26898 2,6
XVII.Malf cong deformid e anomalias cromossômicas 10262 1,0
XVIII.Sint sinais e achad anorm ex clín e laborat 80244 7,7
XX. Causas externas de morbidade e mortalidade 131032 12,5
Razão• É a relação entre dois eventos distintos, ou características diferentes do mesmo evento.
N
PR=
Exemplo: Razão Homem:Mulher no câncer de mama
Óbitos por câncer em Homens
Óbitos por câncer em Mulheres
Casos de câncer de mama conforme o gênero. Brasil, 2007
Em 2007 ocorreram 11.194 óbitos por câncer. Destes11.060 eram no sexo feminino e 134 no sexomasculino.
A razão homem / mulher é de: 83 : 1
NP
x k
• É a relação (quociente) entre dois valores numéricos que estima uma probabilidade ou risco.
Coeficiente ou Taxa
NP
x k
NN nº vezes ocorre um eventoP nº pessoas expostas ao risco de um eventoK base do coeficiente (múltiplo de 10)
Exemplo: Taxa de Incidência de Câncer, por topografia, no Sexo Masculino
Nº de casos de câncer por localização
População masculinaX 100.000
Exemplo: Taxa de Incidência de Câncer de Mama
Nº de casos de câncer de mama
População feminina X 100.000
Numerador incluídono Denominador
Tempo noDenominador
Tipo deMedida
Não --- Razão
Razões, Proporções e Taxas
Sim Não Proporção
Sim Sim Taxa
Média: ponto de equilíbrio do
conjunto.
Mediana: divide o conjunto
Moda: valor mais
provável.
Mediana: divide o conjunto
em duas partes iguais.
QUARTIS
Mínimo Máximoquartil 1 quartil 3 quartil 2
25% 25% 25%25%
Mínimo Máximoquartil 1
Q1
quartil 3
Q3
quartil 2
Q2
PERCENTIS
Mínimo MáximoPercentil 20
20% 80%
Mínimo MáximoPercentil 20
P20
-Amplitude total: é a diferença entre o valor maior e o valor menor de um grupo de dados;-Variância: é a soma dos quadrados dividida pelo número de observações do grupo menos 1;-Desvio padrão: é expresso na mesma medida das variaçõe (Kg, cm, m³ N).
• Conhecer as característicasda população
• Verificar se hádiferenças que
Analítica
Análise Estatística
da população
Descritiva
diferenças quepossam explicaro desfecho
As diferenças observadas podem ser atribuídas aos fatores estudados?
Valores de P
Valor de p < α → diferença estatisticamente significativa
Ponto de corteα = 0,05
Valor de p menor que alfa Valor de p maior ou igual a alfa
Valor de p < α → diferença estatisticamente significativa
Valor de p ≥ α → a diferença não foi estatisticamente significativa
Intervalos com 95% de Confiança
• É uma estimativa dos valores que seriamencontrados na verdadeira população de ondevem a amostra.
• Se o seu estudo for repetido 100 vezes, espera-• Se o seu estudo for repetido 100 vezes, espera-se, com 95% de confiança, encontrar overdadeiro valor para a população em 95desses estudos.
• O valor pode ser uma média, uma porcentagemou um risco
Apresentação dos ResultadosApresentação dos Resultados
Apresentação dos Resultados:
� Tabelas
� Quadros
� Figuras
A diferença está na finalidade:
• Tabela – tem por finalidade a síntese de dadosnuméricos, de um modo geral apresentatratamento estatístico;
• Quadro – tem por finalidade a síntese de• Quadro – tem por finalidade a síntese deinformações textuais;
• Figura – tem por finalidade a apresentação deimagens visuais.
Tabelas
• A sua formatação requer a presença de linhas e colunas, porém sem
fechamento nas laterais; não há o emprego da moldura para a
limitação das laterais;
• O título deve estar localizado na sua parte superior. A legenda (se
houver) deve estar na parte inferior da Tabela. Tanto o título como a houver) deve estar na parte inferior da Tabela. Tanto o título como a
legenda devem ser digitados em tamanho menor do que aquele
usado no corpo do texto;
• Sugere-se organizar a tabela no Menu Tabela do Editor de texto Word.
Fonte: Brandão, 2005
Quadros
• A sua formatação exige limitação externa por uma moldura, podendo
ser utilizadas linhas e/ou colunas;
• O título deve estar localizado na sua parte superior. O título do quadro
bem como a sua legenda (se houver) devem ser digitados em
tamanho menor do que aquele usado no corpo do texto;tamanho menor do que aquele usado no corpo do texto;
• Sugere-se que os quadros sejam organizados utilizando-se o Menu
Tabela do editor de texto Word
Fonte: Brandão, 2005
Figuras
• São classificadas como Figuras: os gráficos, as fotografias, os
esquemas, os diagramas, os traçados de eletro, os fluxogramas e
todas as demais imagens visuais;
• Tanto o título quanto a legenda (se houver) devem estar localizados
na sua parte inferior e devem ser digitados em tamanho menor do na sua parte inferior e devem ser digitados em tamanho menor do
que aquele usado no corpo do texto;
Fonte: Brandão, 2005
SetogramaDistribuição dos pacientes com neoplasias malignas segundo o grau de
instrução. HC/INCA, 1994
21%
11%ANALFABETO
PRIMEIRO GRAU INCOMPLETO
PRIMEIRO GRAU COMPLETO
16%
45% 6%
1%
PRIMEIRO GRAU COMPLETO
SEGUNDO GRAU COMPLETO
NÍ VEL SUPERIOR
SEM INFORMAÇÃO
Fonte: RHC/INCA
150
200
250
300MASCULINO
FEMININO
Gráfico de BarrasGráfico x - Distribuição das neoplasias malignas segundo faixa etária.
HC/INCA, 1994
0
50
100
0 a
4
5 a
9
10 a
14
15 a
19
20 a
24
25 a
29
30 a
34
35 a
39
40 a
44
45 a
49
50 a
54
55 a
59
60 a
64
65 a
69
70 a
74
75 a
79
80 e
+
Fonte: RHC/INCA
Histograma
Ogiva de Galton
800,00
900,00
1000,00
1100,00
1200,00
1300,00
1400,00
1500,00
Polígono de FreqüênciaTaxas brutas de incidência de câncer de próstata, por faixa etária,
São Paulo, 1998
0,00
100,00
200,00
300,00
400,00
500,00
600,00
700,00
800,00
0 -
4
5 -
9
10 -
14
15 -
19
20 -
24
25 -
29
30 -
34
35 -
39
40 -
44
45 -
49
50 -
54
55 -
59
60 -
64
65 -
69
70 -
74
75 +
Fonte: RCBP/São Paulo
Correlação
Rev. Saúde Pública v.39 n.2 São Paulo abr. 2005
Sobrevida
Overall survival analysis of SILTAL1rearrangement in children younger than 9 years-old.Leukemia & Lymphoma, August 2009; 50(8): 13185
Atividade Prática
Top Related