Estatística aplicada a geologia
description
Transcript of Estatística aplicada a geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Tratamento de Dados Geológicos
Modulo 3
Duas variáveis,1 amostra
Correlação e regressão lineares
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Exemplo 1: Em uma camada de calcário metamórfico,
mineralizado em blenda (ZnS), suspeita-se que uma determinada falha cortando transversalmente a camada possa ter servido de conduto para as soluções mineralizadas,
Para investigar esta hipótese foram coletadas 9 amostras geológicas ao longo de uma galeria aberta na direção do calcário, a primeira sobre a falha e a última distando 93m da falha,
Em cada amostra mediu-se o teor de Zn, tendo sido obtidos os seguintes resultados:
22/04/2023 2
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Distância à falha (m) x Zn (%)
22/04/2023 3
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
0
Exemplo 1:
Dist, a falha (m) x
Zn (%)y
0,0 8,98
12,0 8,14
29,5 6,67
43,0 6,08
53,0 5,90
62,0 5,83
75,5 4,68
85,0 4,20
93,0 3,72
Procedimento:
Identificar a variável dependente e a variável independente,
Elaborar o diagrama de dispersão,
Obter o coeficiente de correlação linear de Pearson (r),
Fazer um teste de significância para r,
Caso o teste seja positivo, determinar a reta de regressão de y sobre x,
22/04/2023 4
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Exemplo 2: Em 10 furos de
sondagem, em uma bacia sedimentar, um geólogo mediu a espessura de uma formação calcária, bem como de um horizonte de folhelho intercalado nesta formação,
Os resultados obtidos estão ao lado,
Furo Espessura
Calcário (m)
Folhelho (m)
1 550 200
2 200 50
3 280 60
4 340 140
5 410 130
6 475 180
7 160 20
8 380 120
9 510 190
10 510 160
22/04/2023 5
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Diagramas de dispersão
0
2
4
6
8
10
0 20 40 60 80 100
distância (m)
Zn
(%
)
0
50
100
150
200
250
0 200 400 600
Esp. calcário (m)
Esp
. fo
lhel
ho
(m
)
22/04/2023 6
Exemplo 1 Exemplo 2
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Relação causa e efeitoNormalidade do modelo
No exemplo 1, tem-se motivo para considerar a variável x (distância a partir da falha) como variável independente, ou seja, uma variável controlada,
Deseja-se saber se a variável y (teor de Zn) depende da distância à falha,
Nesta situação, diz-se que o modelo é uni variante,
A variável y deve ter uma distribuição normal, enquanto para a variável x esta exigência não é necessária,
22/04/2023 7
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Relação causa e efeito Normalidade do modelo
Com relação ao exemplo 2, não é claro se existe uma variável independente,
Diz-se que este é um modelo bi variante, onde x e y necessitam ter distribuição normal,
Na prática, no entanto, não se investiga qual é a variável independente e qual é dependente,
Todos os modelos vão ser tratados como bivariantes,
22/04/2023 8
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Coeficiente de correlação Para medir o grau de associação linear entre as
variáveis x e y, utiliza-se o coeficiente de correlação linear de Pearson (r), que é uma medida adimensional assumindo valores entre –1 e +1,
Quando r é nulo, não há correlação linear entre x e y, Quando r é positivo, a correlação é dita positiva ou
direta; Quando r é negativo a correlação é negativa ou inversa,
22/04/2023 9
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Coeficiente de determinaçãoO quadrado do coeficiente de correlação
linear de Pearson é chamado de coeficiente de determinação, Varia entre 0 e 1,
O valor 100r2, expresso em percentagem, representa a fração da variância total de x e y explicada pela relação linear, isto é, o ajuste dos pontos em relação à reta, (Landim, 2003, pag, 1000),
22/04/2023 10
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Diagramas de dispersão
0
2
4
6
8
10
0 20 40 60 80 100
distância (m)
Zn
(%
)
0
50
100
150
200
250
0 200 400 600
Esp. calcário (m)
Esp
. fo
lhel
ho
(m
)
22/04/2023 11
Exemplo 1 Exemplo 2
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
y = 0,4462x - 45,227R² = 0,932
y = -0,0532x + 8,704R² = 0,9745
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Coeficiente de correlação
Genericamente:Se a dependência é insignificante;
Se a dependência é significante;
Se a dependência é forte,
22/04/2023 12
70,r
9070 ,r,
90,r
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Solução do exemplo 1: x – distância à falha – variável independente y = f(x) – teor de Zn – variável dependenteCoeficiente de correlação:
22/04/2023 13
2222
.
iiii
iiii
yynxxn
yxyxnr
22 20,545350,35095,45375,311529
20,545,45326,22899r
9870,r 974202 ,r
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Ponto No Dados brutos Produtos e quadrados
1 0,0 8,98 0,000 0,00 80,6404
2 12,0 8,14 97,680 144,00 66,2596
3 29,5 6,67 196,765 870,25 44,4889
4 43,0 6,08 261,440 1849,00 36,9664
5 53,0 5,90 312,700 2809,00 34,8100
6 62,5 5,83 364,375 3906,25 33,9889
7 75,5 4,68 353,340 5700,25 21,9024
8 85,0 4,20 357,000 7225,00 17,6400
9 93,0 3,72 345,960 8649,00 13,8384
453,5 54,20 2289,260 31152,75 350,5350
ix
2
iy2
ixiiyxiyi
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
22/04/2023 14
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
iii) Teste de significância para r H0: a correlação linear entre as variáveis x e y não é significante H1: a correlação linear entre as variáveis x e y é significante
22/04/2023 15
26,1629.9742,01
987,02.
1 2
tn
r
rt
365,27;025,0t2n;2
t
365,27;025,0t26,16t
Conclusão: a correlação entre x e y é significante para = 0,05,
então rejeita-se H0 e aceita-se H1,
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
iv) Determinação da reta de regressão y=ax+b
22/04/2023 16
0532,09
5,45375,31152
920,545,453
26,2289.
222
anx
x
nyx
yxa
ii
iiii
703,8
9
5,4530532,020,54
n
xayb ii
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
iv) Determinação da reta de regressão y=ax+b
Equação da reta de regressão:
v) Dois pontos da reta de regressão: Para x = 0 tem-se y = 8,703 Para x = 80 tem-se y = 4,447
22/04/2023 17
x,,y 053207038
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Reta de regressão
y = -0.0532x + 8.704
r2 = 0.9745
0
1
2
3
4
5
6
7
8
9
10
0 20 40 60 80 100
Distância a partir da falha (m)
Zn
(%
)
22/04/2023 18
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
22/04/2023 19
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
y
xrelação não linear
y
xrelação não linear
y
xamostras de duas
populações
y
xponto discrepante
y
xrelação não verdadeira
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
22/04/2023 20
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Ajustamento de curvas
22/04/2023 21
x
y
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
a) Função exponencial:
22/04/2023 22
axbey Na forma linear:
axby lnln
b
a>0
x0
y
a<0Ln b
0x
Ln y a>0
a<0
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Função exponencial:
0ln
n
xay ii
22/04/2023 23
2222 lnln
ln.ln
iiii
iiii
yynxxn
yxyxnr
n
xayb ii
ln
ln n
xx
n
yxyx
ai
i
iiii
2
2
ln.ln.
Obs,: Se a função não pode ser determinada,
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
n
xayb ii
ln
exp
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Função logarítmica :
22/04/2023 24
baxy
bx
y
Na forma linear:
bxay log
b
Log x
y
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Função logarítmica:
22/04/2023 25
2222 log)(log
.log.log
iiii
iiii
yynxxn
yxyxnr
n
xx
n
yxyx
ai
i
iiii
2
2 loglog
.log.log
n
xayb ii
log
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Função potência
22/04/2023 26
abxy Na forma linear:
a>1 0<a<1
b
y
a<0x
Ln y
Ln b
Ln x
0<a<1
a>1
a<0
bxay lnlnln
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Função potência
22/04/2023 27
2i2i
2i
2i
iiii
ylnylnnxlnxlnn
yln.xlnyln.xlnnr
n
xx
n
yxyx
ai
i
iiii
2
2 lnln
ln.lnln.ln
n
xayb ii
lnln
ln
Obs,: Se
a função potência não pode ser determinada,
0ln
n
xay ii
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
n
xayb ii
lnln
exp
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Exemplo Na tabela a seguir estão valores de Cu em ppm obtidos de testemunhagem a diversas profundidades em cm, Solicita-se:
i) Diagrama de dispersão (gráfico x versus y), ii) Cálculo do coeficiente de correlação linear de Pearson
(r) para as 4 funções: linear, exponencial, logarítmica e potência, Escolher a função de maior coeficiente de correlação em termos absolutos,
iii) Teste de significância para r, Tome iv) Caso o teste em iii) seja positivo, calcule a “curva de
regressão” e a trace no diagrama x versus y, v) Caso a função selecionada não seja a linear, trace a
reta de regressão em diagrama adequado,
22/04/2023 28
050,
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Valores de teor de Cu em ppm obtidos de testemunhagem
Profundidade (m)xi
Teor de Cu (ppm)yi
90 55,0
100 36,0
110 31,0
120 27,5
130 20,2
140 15,0
150 12,5
22/04/2023 29
Profundidade (m)xi
Teor de Cu (ppm)yi
10 355,0
20 250,0
30 197,5
40 165,0
50 141,0
60 107,0
70 100,0
80 63,0
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Solução:
22/04/2023 30
i) Diagrama de dispersão:
0.00 20.00 40.00 60.00 80.00 100.00 120.00 140.00 160.00
0.00
50.00
100.00
150.00
200.00
250.00
300.00
350.00
400.00
Curva de regressão
Profundidade (cm)
Cu
(p
pm
)
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Solução:
ii) Cálculo de rFunção linear: r = -0,916Função exponencial:r = -0,997Função logarítmica: r = -0,996Função potência: r = -0,933A função selecionada é a exponencial,
22/04/2023 31
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
iii) Teste de significância para r Hipóteses: H0: A correlação linear entre x e y e não é significante, H1: A correlação linear entre x e y é significante,
22/04/2023 32
44,46215.997,01
997,02n
r1
rt
22
160,213;025,0t215;25,0t2n;2
t
160,213;025,0t44,46t
Rejeita-se H0 e aceita-se H1,
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
y = 434,19e-0,0236x
R2 = 0,9946
0
50
100
150
200
250
300
350
400
0 50 100 150 200
Profundidade (cm)
Cu
(p
pm
)
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
22/04/2023 33
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
y = -0,0236x + 6,0735R2 = 0,9946
0
1
2
3
4
5
6
7
0 50 100 150 200
Profundidade (cm)
ln C
u (
pp
m)
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
22/04/2023 34
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
iv) “Curva de regressão”
Conclusão: há um decréscimo exponencial do teor de Cu com a profundidade, A equação estima este decréscimo, onde x é a profundidade em cm e y é o teor de Cu em ppm,
22/04/2023 35
x,bx e,aey 02360189434
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
EXEMPLO:
(Maranhão, 1982), Os preços médios da exportação da tonelada de concentrado de scheelita produzido no Brasil, entre os anos de 1963 e 1975, são dados na tabela abaixo,
Determinar a equação da reta de tendência e o preço provável da tonelada exportada em 1980,
22/04/2023 36
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
Preço médio da exportação de uma tonelada de concentrado de scheelita produzida no Brasil, entre 1963 e 1965,
22/04/2023 37
Universidade Federal do CearáCentro de CiênciasDepartamento de Geologia
ano U$ scheelita ano U$ scheelita1963 650,5 1970 4597,4
1964 750,7 1971 3922,8
1965 1747,5 1972 3181,2
1966 2689,9 1973 3320,7
1967 3328,2 1974 5396,2
1968 2996,6 1975 6690,4
1969 3194