Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria...

21
PROJETO LINGUAGEM R Heart Disease Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins

Transcript of Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria...

Page 1: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

PROJETO LINGUAGEM RHeart Disease

Grupo: Alberto de Oliveira Martins

Igor Ryan Bernardo Santos

João Carlos Procópio Florêncio

Maria Marcela Soares de Meira Lins

Page 2: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Introdução

• Dados da Organização Mundial de Saúde (OMS) estima 17,5 milhões de mortes por ano devido a problemas cardiovasculares

• Doenças como infarto se propagam de modo assintomático

• Impacto pode ser visualizado através de Estatística Descritiva

Page 3: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Dados de estudo

• Dados de pacientes internados nos hospitais de Cleveland, Ohio, USA

• Uso de fatores de risco para estudo:

• Taxa de Colesterol (em mg/dl)• Pressão Sanguínea em

Repouso• Freqüência cardíaca máxima

do paciente quando submetido a esforço físico

• Pico da depressão ST induzida pelo exercício

• Idade do paciente

Page 4: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas• Gráficos usados para estimativas

• Obtenção de classes usa métodos conceituais, porém não são precisos:

• Fórmula de Sturges:K = 1 + 3.22 log n

• Fórmula de Freedman-Diaconis(Fórmula de FD)

- IQR é o intervalo entre o 1º quartil e o 3º quartil

- n é o tamanho da amostra.

Page 5: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveisCHOL: Colesterol mg/dl

• Considerado o fator de risco mais devastador das doenças cardiovasculares

• Atinge cada vez mais pessoas mais jovens, mesmo crianças

• Fator ocasiona cerca de 4,4 milhões de mortes por ano

Média: 246.6931Desvio Padrão: 51.77692Mediana: 241Moda: 197, 204, 234

Page 6: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveis

Método de Sturges• Mostra gráfico mais normalizado

• Positivamente desviado

Método de Freedman-Diaconis (FD) • Gráfico ligeiramente menos normalizado que o anterior

• Possui mais classes, trazendo mais detalhes

Page 7: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveis

TRESTBPS: Pressão Sanguínea em Repouso

• Pressão exercida pelo sangue nos vasos sanguíneos

• Taxas elevadas de pressão podem danificar ou romper os vasos

• Variável aleatória contínua

Média: 131.6898Desvio Padrão: 17.59975Mediana: 130Moda: 120

Page 8: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveis

Método de Sturges• Mostra gráfico mais normalizado

• Positivamente desviado

Método de Freedman-Diaconis (FD)

• Apresenta diversos picos no gráfico

• Histograma não recomendado se critérios de normalidade gráfica forem recomendados

Page 9: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveisOLDPEAK: Depressão

ST

•Se refere a depressões anormais encontradas no eletrocardiograma

• É frequente sinal de isquemia no miocárdio

• Variável aleatória contínua

Média: 1.039604Desvio Padrão: 1.161075Mediana: 0,8Moda: 0,0

Page 10: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveis

Método de Sturges• Mostra gráfico mais normalizado

• Positivamente desviado

Método de Freedman-Diaconis (FD)

• Apresenta diversos picos no gráfico

• Histograma não recomendado se critérios de normalidade gráfica forem recomendados

Page 11: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveis

THALACH: Frequência cardíaca máxima

alcançada

• Frequência cardíaca máxima alcançada durante esforço físico

• Pessoas com que atingem maior frequência cadíaca durante esforço físico indica sedentarismo

• Variável aleatória contínua

Média: 149.6073Desvio Padrão: 22.87500Mediana: 153Moda: 162

Page 12: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveis

Método de Sturges• Mostra gráfico mais normalizado

• Positivamente desviado

Método de Freedman-Diaconis (FD)

• Apresenta diversos picos no gráfico

• Histograma não recomendado se critérios de normalidade gráfica forem recomendados

Page 13: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveis

AGE: Idade

• Idade do paciente no momento da pesquisa

• Pessoas com idade mais avançadas tem maior risco de ter problemas do coração

• Variável aleatória discreta Média: 54.43894

Desvio Padrão: 9.038662Mediana: 56Moda: 58

Page 14: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Histogramas – Descrição das variáveis

Método de Sturges• Mostra gráfico mais normalizado

• Positivamente desviado

Método de Freedman-Diaconis (FD)

• Apresenta diversos picos no gráfico

• Histograma não recomendado se critérios de normalidade gráfica forem recomendados

Page 15: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Testes de Hipótese

Sabe-se que homens costumam ter maior probabilidade infarto do que as mulheres. Acredita-se, então, que a probabilidade dos infartos nos homens esteja ligado a pressão alta em repouso. Prove por teste de hipótese com nível de significância de 95% e 99% que homens têm pressão sanguínea maior que o das mulheres.

Page 16: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Testes de Hipótese

Dados: N: 33 indivíduos

tanto para a amostra de homens quanto para a de mulheres.

Hipótese Nula: Homens possuem pressão sanguínea mais elevada que mulheres.

Page 17: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Testes de Hipótese

Os dados gerados em R para nível de significância = .05:

Welch Two Sample t-test data: pre and premu t = -2.7073, df = 63.241, p-value = 0.008712 alternative hypothesis: true difference in means is

not equal to 4.727273 95 percent confidence interval: -11.705394 2.250849 sample estimates: mean of x mean of y 132.2727 137.0000

Page 18: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Testes de Hipótese

Para nível de significância = .01 Welch Two Sample t-test data: pre and premu t = -2.7073, df = 63.241, p-value = 0.008712 alternative hypothesis: true difference in

means is not equal to 4.727273 99 percent confidence interval: -14.002011 4.547466 sample estimates: mean of x mean of y 132.2727 137.0000

Page 19: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Testes de Hipótese

Estima-se que a média de nível de colesterol da população mundial é de 235mg/dL com desvio padrão de 40mg/dL. Teste a hipótese de que esta é uma amostra representativa da população mundial com nível de significância de 95%.

Page 20: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Testes de Hipótese

Dados: μ = 235,0 mg/dL x = 245.3824 mg/dL N = 34 indivíduos Hipótese Nula: A média de

colesterol dos individuas da amostra é igual a média dos indivíduos da população.

Page 21: Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins.

Testes de Hipótese

data: c t = 1.3729, df = 33, p-value = 0.1790 alternative hypothesis: true mean is

not equal to 235 95 percent confidence interval: 229.9967 260.7680 sample estimates: mean of x 245.3824