Correlação e Regressão
-
Upload
alberto-peixoto-neto -
Category
Documents
-
view
7 -
download
0
description
Transcript of Correlação e Regressão
-
Correlao e Regresso
-
Associao &Variveis QuantitativasSituao 1: Deseja-se realizar uma investigao sobre a ocorrncia de anemia e infeco em uma comunidade. Seria interessante poder estimar a concentrao de hemoglobina e a contagem de eritrcitos e leuccitos no sangue pela medida do hematcrito. Para verificar a possibilidade de se usar tal procedimento, conduzido um estudo-piloto a partir dos resultados da rotina de um laboratrio de hematologia.Como verificar se essas variveis esto associadas?
-
Testes de Hipteses? Estabelecem se existe associao entre duas variveis, mas... No quantificam a fora da associao; e No permitem representar a relao existente sob uma forma funcional.
-
Associao &Variveis Quantitativas possvel fazer um grfico das variveis de interesse e analisar a existncia de uma relao a partir da anlise desse grfico.
Plan1
ExameLeuccitoEritrcitoHemoglobinaHematcrito
(103/mm3)(106/mm3)(g/dl)(%)
16.84.5014.641
29.75.2015.647
34.34.5514.441
47.94.6514.441
57.44.4013.840
67.64.4014.040
72.84.3013.640
87.84.6013.842
95.54.9015.244
104.64.1013.039
118.05.0017.046
127.05.1716.047
137.14.2011.735
...............
13810.54.5013.439
1396.94.5014.240
14013.54.4513.640
1418.33.7011.033
1427.04.3012.738
1434.34.6714.043
1442.74.4012.739
14511.24.4013.338
1475.94.4011.937
14812.34.2410.031
Plan2
Plan3
-
Associao &Variveis QuantitativasDiagrama de Disperso Representao grfica que permite a visualizao do comportamento conjunto das duas variveis. grfico sobre o qual cada medida individual representada por um ponto, sendo que a posio de cada ponto determinada pelos valores observados em um indivduo, para as duas caractersticas medidas (por exemplo, hematcrito e hemoglobina). denominado, tambm, de grfico XY.
-
Diagrama de DispersoAnlise Parece no haver uma relao entre o valor do hematcrito e o valor do leuccito.
-
Diagrama de DispersoAnlise H uma relao crescente entre o valor do hematcrito e o valor de hemoglobina. Esta relao parece ser linear.
-
Diagrama de DispersoAnlise H uma relao crescente entre o valor do hematcrito e o valor do eritrcito. Esta relao parece ser linear.
-
Diagramas de DispersoA anlise no alterada, se trocamos as variveis X e Y, ou seja, a existncia ou no da relao no depende de qual varivel considerada independente. O modelo matemtico, porm, ser alterado a depender de quem X.
-
Associao &Variveis QuantitativasCoeficiente de correlao linear de Pearson Valor numrico que mede a intensidade da associao linear existente entre as duas variveis, medida a partir de uma srie de observaes.Karl Pearson (1857 1936)
-
Coeficiente de Correlao LinearMedindo a Fora da Associao
-
Coeficiente de Correlao LinearInterpretando o valor de rr - assume valores entre 1 e + 1 inclusive.
-
Coeficiente de Correlao Linear
-
Teste de Hipteses sob o Coeficiente de Correlao Linear
-
Coeficiente de Correlao Linear Teste de HiptesesExemplo 1: Vamos calcular o coeficiente de Pearson entre as variveis hemoglobina e hematcrito.H correlao entre hematcrito e hemoglobina.
-
Exemplo 2: Vamos calcular o coeficiente de Pearson entre as variveis leuccito e hematcrito.No h correlao entre hematcrito e leuccito.Coeficiente de Correlao Linear Teste de Hipteses
-
Associao &Variveis QuantitativasModelos de Regresso Modelo matemtico para a relao linear analisada. Permite a predio de uma varivel em funo de outra.
-
Modelos LinearesSituao 2: Uma vez verificada a existncia de uma relao entre a quantidade de hemoglobina e o nmero de hematcritos, desejamos desenvolver um modelo para estimar a medida de hemoglobina (varivel y) a partir da medida de hematcrito (varivel x).Qual a reta que melhor se ajusta a estes dados?
-
Modelos LinearesEquao da RetaIntercepto yaa e b - parmetros da retab
Grf1
Viso Geral
Livro de Exerccios - Dados sobre Lojas de Remessa de Carga
Objetivo:Ponto de partida para os exemplos do Excel das Sees 11.6.2 e 11.7.
Referncia:Sees 11.6.3, 11.7
Contedo do Livro de Exerccios (duas planilhas):
Planilha Viso GeralResumo deste livro de exerccios.
Planilha DadosDados sobre o nmero de clientes e vendas semanais para uma amostra
de 20 lojas de remessa de carga.
VarivelIntervaloValores
Nmero da LojaA2:A21
ClientesB2:B21
VendasC2:C21semanais, em milhares de dlares
&L&F/&A
Dados
LojaClientesVendasLojaClientesVendas ($1000)LojaClientesVendas
190711.20190711.20116797.63
292611.05292611.05128729.43
35066.8435066.84139249.46
47419.2147419.21146077.64
57899.4257899.42154526.92
688910.08688910.08167298.95
78749.4578749.45177949.33
85106.7385106.731884410.23
95297.2495297.2419101011.77
104206.12104206.12206217.41
116797.63
128729.43
139249.46
146077.64LojaClientesVendas ($1000)
154526.92116797.63
167298.95128729.43
177949.33139249.46
1884410.23146077.64
19101011.77154526.92
206217.41167298.95
177949.33
1884410.23
19101011.77
206217.41
&L&F/&A
Dados
Vendas
Nmero de clientes
Quantidade de vendas ($1000)
Diagrama de Disperso - Dados das 20 empresas
-
Regresso Linear SimplesMtodo dos Mnimos QuadradosO objetivo minimizar a soma do quadrado dos erros:Obtendo os valores de e que minimizam a equao acima.
-
Regresso Linear SimplesMtodo dos Mnimos Quadrados
-
Reta de Regresso & EstimativaEstimativa da Medida de Hemoglobina AnliseO valor de homoglobina mdia estimada, para um valor observado de hematcrito igual a 40%, de 13,97 g/dl.
-
Suponha que desejemos considerar o hematcrito como varivel dependente. Neste caso, podemos calcular outra reta de regresso, pelo mtodo dos mnimos quadrados, considerando a hemoglobina como varivel x (independente) e o hematcrito como varivel y (dependente).Reta de Regresso & EstimativaEstimativa da Medida de Hematcrito O valor de hematcrito mdio estimado, para um valor observado de hemoglobina Hb = 13,97 g/dl, de 40,54%. Note que a reta, para Ht, no a inversa da obtida para Hb.
-
Exemplo 1:Encontre a linha de regresso dos mnimos quadrados para os dados sobre renda e gasto com alimentao nos sete domiclios apresentados na tabela abaixo. Utilize renda como uma varivel independente e gasto com alimentao como uma varivel dependente.
Renda xGasto com Alimentao yxyx235931512254915735240121714744139114291521155752252882247842592256252126421507222
-
Qualidade do Ajuste na Regresso Coeficiente de DeterminaoR2 = proporo da variabilidade de y que explicada pelo modelo (reta de regresso)Se R2 = 0,90 significa que 90% da variao em y pode ser explicada pela equao obtida.
-
Qualidade do Ajuste na Regresso Coeficiente de DeterminaoQuando fazemos uma regresso linear, os valores observados (x,y) esto espalhados ao redor da reta de regresso. Quanto menor for este espalhamento, melhor a reta de regresso representa o conjunto de valores observados. A varincia amostral total, como estimador do espalhamento, pode ser decomposta da seguinte forma:
-
Qualidade do Ajuste na Regresso Coeficiente de DeterminaoExemplo 2:Para os dados da tabela do exemplo 1, sobre rendas mensais e gastos mensais com alimentao de sete domiclios, calcule o coeficiente de determinao.b=0,2642SQxy=211,7143SQyy=60,8571