Estatística aplicada a geologia

37
Universidade Federal do Ceará Centro de Ciências Departamento de Geologia Tratamento de Dados Geológicos Modulo 3 Duas variáveis,1 amostra Correlação e regressão lineares

description

estatística aplicada a geologia : duas variáveis e uma amostra - correlação e regressão linear

Transcript of Estatística aplicada a geologia

Page 1: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Tratamento de Dados Geológicos

Modulo 3

Duas variáveis,1 amostra

Correlação e regressão lineares

Page 2: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Exemplo 1: Em uma camada de calcário metamórfico,

mineralizado em blenda (ZnS), suspeita-se que uma determinada falha cortando transversalmente a camada possa ter servido de conduto para as soluções mineralizadas,

Para investigar esta hipótese foram coletadas 9 amostras geológicas ao longo de uma galeria aberta na direção do calcário, a primeira sobre a falha e a última distando 93m da falha,

Em cada amostra mediu-se o teor de Zn, tendo sido obtidos os seguintes resultados:

22/04/2023 2

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 3: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Distância à falha (m) x Zn (%)

22/04/2023 3

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

0

Page 4: Estatística aplicada a geologia

Exemplo 1:

Dist, a falha (m) x

Zn (%)y

0,0 8,98

12,0 8,14

29,5 6,67

43,0 6,08

53,0 5,90

62,0 5,83

75,5 4,68

85,0 4,20

93,0 3,72

Procedimento:

Identificar a variável dependente e a variável independente,

Elaborar o diagrama de dispersão,

Obter o coeficiente de correlação linear de Pearson (r),

Fazer um teste de significância para r,

Caso o teste seja positivo, determinar a reta de regressão de y sobre x,

22/04/2023 4

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 5: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Exemplo 2: Em 10 furos de

sondagem, em uma bacia sedimentar, um geólogo mediu a espessura de uma formação calcária, bem como de um horizonte de folhelho intercalado nesta formação,

Os resultados obtidos estão ao lado,

Furo Espessura

Calcário (m)

Folhelho (m)

1 550 200

2 200 50

3 280 60

4 340 140

5 410 130

6 475 180

7 160 20

8 380 120

9 510 190

10 510 160

22/04/2023 5

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 6: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Diagramas de dispersão

0

2

4

6

8

10

0 20 40 60 80 100

distância (m)

Zn

(%

)

0

50

100

150

200

250

0 200 400 600

Esp. calcário (m)

Esp

. fo

lhel

ho

(m

)

22/04/2023 6

Exemplo 1 Exemplo 2

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 7: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Relação causa e efeitoNormalidade do modelo

No exemplo 1, tem-se motivo para considerar a variável x (distância a partir da falha) como variável independente, ou seja, uma variável controlada,

Deseja-se saber se a variável y (teor de Zn) depende da distância à falha,

Nesta situação, diz-se que o modelo é uni variante,

A variável y deve ter uma distribuição normal, enquanto para a variável x esta exigência não é necessária,

22/04/2023 7

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 8: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Relação causa e efeito Normalidade do modelo

Com relação ao exemplo 2, não é claro se existe uma variável independente,

Diz-se que este é um modelo bi variante, onde x e y necessitam ter distribuição normal,

Na prática, no entanto, não se investiga qual é a variável independente e qual é dependente,

Todos os modelos vão ser tratados como bivariantes,

22/04/2023 8

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 9: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Coeficiente de correlação Para medir o grau de associação linear entre as

variáveis x e y, utiliza-se o coeficiente de correlação linear de Pearson (r), que é uma medida adimensional assumindo valores entre –1 e +1,

Quando r é nulo, não há correlação linear entre x e y, Quando r é positivo, a correlação é dita positiva ou

direta; Quando r é negativo a correlação é negativa ou inversa,

22/04/2023 9

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 10: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Coeficiente de determinaçãoO quadrado do coeficiente de correlação

linear de Pearson é chamado de coeficiente de determinação, Varia entre 0 e 1,

O valor 100r2, expresso em percentagem, representa a fração da variância total de x e y explicada pela relação linear, isto é, o ajuste dos pontos em relação à reta, (Landim, 2003, pag, 1000),

22/04/2023 10

Page 11: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Diagramas de dispersão

0

2

4

6

8

10

0 20 40 60 80 100

distância (m)

Zn

(%

)

0

50

100

150

200

250

0 200 400 600

Esp. calcário (m)

Esp

. fo

lhel

ho

(m

)

22/04/2023 11

Exemplo 1 Exemplo 2

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

y = 0,4462x - 45,227R² = 0,932

y = -0,0532x + 8,704R² = 0,9745

Page 12: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Coeficiente de correlação

Genericamente:Se a dependência é insignificante;

Se a dependência é significante;

Se a dependência é forte,

22/04/2023 12

70,r

9070 ,r,

90,r

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 13: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Solução do exemplo 1: x – distância à falha – variável independente y = f(x) – teor de Zn – variável dependenteCoeficiente de correlação:

22/04/2023 13

2222

.

iiii

iiii

yynxxn

yxyxnr

22 20,545350,35095,45375,311529

20,545,45326,22899r

9870,r 974202 ,r

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 14: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Ponto No Dados brutos Produtos e quadrados

1 0,0 8,98 0,000 0,00 80,6404

2 12,0 8,14 97,680 144,00 66,2596

3 29,5 6,67 196,765 870,25 44,4889

4 43,0 6,08 261,440 1849,00 36,9664

5 53,0 5,90 312,700 2809,00 34,8100

6 62,5 5,83 364,375 3906,25 33,9889

7 75,5 4,68 353,340 5700,25 21,9024

8 85,0 4,20 357,000 7225,00 17,6400

9 93,0 3,72 345,960 8649,00 13,8384

453,5 54,20 2289,260 31152,75 350,5350

ix

2

iy2

ixiiyxiyi

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

22/04/2023 14

Page 15: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

iii) Teste de significância para r H0: a correlação linear entre as variáveis x e y não é significante H1: a correlação linear entre as variáveis x e y é significante

22/04/2023 15

26,1629.9742,01

987,02.

1 2

tn

r

rt

365,27;025,0t2n;2

t

365,27;025,0t26,16t

Conclusão: a correlação entre x e y é significante para = 0,05,

então rejeita-se H0 e aceita-se H1,

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 16: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

iv) Determinação da reta de regressão y=ax+b

22/04/2023 16

0532,09

5,45375,31152

920,545,453

26,2289.

222

anx

x

nyx

yxa

ii

iiii

703,8

9

5,4530532,020,54

n

xayb ii

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 17: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

iv) Determinação da reta de regressão y=ax+b

Equação da reta de regressão:

v) Dois pontos da reta de regressão: Para x = 0 tem-se y = 8,703 Para x = 80 tem-se y = 4,447

22/04/2023 17

x,,y 053207038

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 18: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Reta de regressão

y = -0.0532x + 8.704

r2 = 0.9745

0

1

2

3

4

5

6

7

8

9

10

0 20 40 60 80 100

Distância a partir da falha (m)

Zn

(%

)

22/04/2023 18

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 19: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

22/04/2023 19

Page 20: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

y

xrelação não linear

y

xrelação não linear

y

xamostras de duas

populações

y

xponto discrepante

y

xrelação não verdadeira

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

22/04/2023 20

Page 21: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Ajustamento de curvas

22/04/2023 21

x

y

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 22: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

a) Função exponencial:

22/04/2023 22

axbey Na forma linear:

axby lnln

b

a>0

x0

y

a<0Ln b

0x

Ln y a>0

a<0

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 23: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Função exponencial:

0ln

n

xay ii

22/04/2023 23

2222 lnln

ln.ln

iiii

iiii

yynxxn

yxyxnr

n

xayb ii

ln

ln n

xx

n

yxyx

ai

i

iiii

2

2

ln.ln.

Obs,: Se a função não pode ser determinada,

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

n

xayb ii

ln

exp

Page 24: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Função logarítmica :

22/04/2023 24

baxy

bx

y

Na forma linear:

bxay log

b

Log x

y

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 25: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Função logarítmica:

22/04/2023 25

2222 log)(log

.log.log

iiii

iiii

yynxxn

yxyxnr

n

xx

n

yxyx

ai

i

iiii

2

2 loglog

.log.log

n

xayb ii

log

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 26: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Função potência

22/04/2023 26

abxy Na forma linear:

a>1 0<a<1

b

y

a<0x

Ln y

Ln b

Ln x

0<a<1

a>1

a<0

bxay lnlnln

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 27: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Função potência

22/04/2023 27

2i2i

2i

2i

iiii

ylnylnnxlnxlnn

yln.xlnyln.xlnnr

n

xx

n

yxyx

ai

i

iiii

2

2 lnln

ln.lnln.ln

n

xayb ii

lnln

ln

Obs,: Se

a função potência não pode ser determinada,

0ln

n

xay ii

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

n

xayb ii

lnln

exp

Page 28: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Exemplo Na tabela a seguir estão valores de Cu em ppm obtidos de testemunhagem a diversas profundidades em cm, Solicita-se:

i) Diagrama de dispersão (gráfico x versus y), ii) Cálculo do coeficiente de correlação linear de Pearson

(r) para as 4 funções: linear, exponencial, logarítmica e potência, Escolher a função de maior coeficiente de correlação em termos absolutos,

iii) Teste de significância para r, Tome iv) Caso o teste em iii) seja positivo, calcule a “curva de

regressão” e a trace no diagrama x versus y, v) Caso a função selecionada não seja a linear, trace a

reta de regressão em diagrama adequado,

22/04/2023 28

050,

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 29: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Valores de teor de Cu em ppm obtidos de testemunhagem

Profundidade (m)xi

Teor de Cu (ppm)yi

90 55,0

100 36,0

110 31,0

120 27,5

130 20,2

140 15,0

150 12,5

22/04/2023 29

Profundidade (m)xi

Teor de Cu (ppm)yi

10 355,0

20 250,0

30 197,5

40 165,0

50 141,0

60 107,0

70 100,0

80 63,0

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 30: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Solução:

22/04/2023 30

i) Diagrama de dispersão:

0.00 20.00 40.00 60.00 80.00 100.00 120.00 140.00 160.00

0.00

50.00

100.00

150.00

200.00

250.00

300.00

350.00

400.00

Curva de regressão

Profundidade (cm)

Cu

(p

pm

)

Page 31: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Solução:

ii) Cálculo de rFunção linear: r = -0,916Função exponencial:r = -0,997Função logarítmica: r = -0,996Função potência: r = -0,933A função selecionada é a exponencial,

22/04/2023 31

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 32: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

iii) Teste de significância para r Hipóteses: H0: A correlação linear entre x e y e não é significante, H1: A correlação linear entre x e y é significante,

22/04/2023 32

44,46215.997,01

997,02n

r1

rt

22

160,213;025,0t215;25,0t2n;2

t

160,213;025,0t44,46t

Rejeita-se H0 e aceita-se H1,

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 33: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

y = 434,19e-0,0236x

R2 = 0,9946

0

50

100

150

200

250

300

350

400

0 50 100 150 200

Profundidade (cm)

Cu

(p

pm

)

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

22/04/2023 33

Page 34: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

y = -0,0236x + 6,0735R2 = 0,9946

0

1

2

3

4

5

6

7

0 50 100 150 200

Profundidade (cm)

ln C

u (

pp

m)

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

22/04/2023 34

Page 35: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

iv) “Curva de regressão”

Conclusão: há um decréscimo exponencial do teor de Cu com a profundidade, A equação estima este decréscimo, onde x é a profundidade em cm e y é o teor de Cu em ppm,

22/04/2023 35

x,bx e,aey 02360189434

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 36: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

EXEMPLO:

(Maranhão, 1982), Os preços médios da exportação da tonelada de concentrado de scheelita produzido no Brasil, entre os anos de 1963 e 1975, são dados na tabela abaixo,

Determinar a equação da reta de tendência e o preço provável da tonelada exportada em 1980,

22/04/2023 36

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Page 37: Estatística aplicada a geologia

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

Preço médio da exportação de uma tonelada de concentrado de scheelita produzida no Brasil, entre 1963 e 1965,

22/04/2023 37

Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia

ano U$ scheelita ano U$ scheelita1963 650,5 1970 4597,4

1964 750,7 1971 3922,8

1965 1747,5 1972 3181,2

1966 2689,9 1973 3320,7

1967 3328,2 1974 5396,2

1968 2996,6 1975 6690,4

1969 3194