Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

59
Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV

Transcript of Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Page 1: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Geoestatística Aplicada à Agricultura de Precisão I

Daniel Marçal de Queiroz

DEA/UFV

Page 2: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Geoestatística

Maneira de descrever a continuidade espacial

Técnica importante para análise de muitos fenômenos naturais

Adaptação de técnicas de regressão clássica para tomar vantagem da continuidade espacial

Page 3: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Geoestatística

Aplicações na agricultura de precisão:– geração de mapas - produtividade, modelo digital de

elevação, incidência de pragas e doenças, e outros

– análise da variabilidade espacial

– análise da correlação entre fatores que afetam a produtividade e a qualidade do café

– definição de zonas de manejo

Page 4: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Descrição em termos de uma variável

Dados dão boa idéia do fenômeno apenas quando organizados adequadamente

Muitas técnicas usadas em estatística cuida da organização, apresentação e representação resumida dos dados

Page 5: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Descrição em termos de uma variável

Dados analisados representarão uma área de 10m por 10m

Variáveis U e V foram aredondadas para o número inteiro mais próximo

Page 6: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Localização relativa dos 100 pontos da variável V

81 +

77 +

103 +

112 +

123 +

19 +

40 +

111 +

114 +

120 +

82 +

61 +

110 +

121 +

119 +

77 +

52 +

111 +

117 +

124 +

82 +

74 +

97 +

105 +

112 +

91 +

73 +

115 +

118 +

129 +

88 +

70 +

103 +

111 +

122 +

64 +

84 +

105 +

113 +

123 +

89 +

88 +

94 +

110 +

116 +

108 +

73 +

107 +

118 +

127 +

77 +

82 +

86 +

101 +

109 +

113 +

79 +

102 +

120 +

121 +

74 +

80 +

85 +

90 +

97 +

101 +

96 +

72 +

128 +

130 +

75 +

80 +

83 +

87 +

94 +

99 +

95 +

48 +

139 +

145 +

77 +

84 +

74 +

108 +

121 +

143 +

91 +

52 +

136 +

144 +

87 +

100 +

47 +

111 +

124 +

109 +

0 +

98 +

134 +

144 +

Page 7: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Histograma para os 100 valores da variável V

0

2

4

6

8

10

12

14

16

180

-9

10

-19

20

-29

30

-39

40

-49

50

-59

60

-69

70

-79

80

-89

90

-99

10

0-1

09

11

0-1

19

12

0-1

29

13

0-1

39

14

0-1

49

Faixa de valores da variável V (ppm)

Fre

qu

ên

cia

, %

Page 8: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Frequência dos 100 valores selecionados da variável V com largura de classe de 10 ppm.

Classe Número Percentagem 0 V < 10 1 1 10 V < 20 1 1 20 V < 30 0 0 30 V < 40 0 0 40 V < 50 3 3 50 V < 60 2 2 60 V < 70 2 2 70 V < 80 13 13 80 V < 90 16 16 90 V < 100 11 11 100 V < 110 13 13 110 V < 120 17 17 120 V < 130 13 13 130 V < 140 4 4 140 V < 4 4

Page 9: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Frequência acumulada dos 100 valores da variável V usando classes de 10 ppm

Classe Número Porcentagem V < 10 1 1 V < 20 2 2 V < 30 2 2 V < 40 2 2 V < 50 5 5 V < 60 7 7 V < 70 9 9 V < 80 22 22 V < 90 38 38 V < 100 49 49 V < 110 62 62 V < 120 79 79 V < 130 92 92 V < 140 96 96 V < 100 100

Page 10: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Histograma acumulativo para os 100 valores selecionados da variável V

0

20

40

60

80

100

120

< 1

0

< 2

0

< 3

0

< 4

0

< 5

0

< 6

0

< 7

0

< 8

0

< 9

0

< 1

00

< 1

10

< 1

20

< 1

30

< 1

40

< 1

50

V (ppm)

Fre

qu

ên

cia

acu

mu

lad

a (

%)

Page 11: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráfico de probabilidade normal para os 100 valores selecionados da variável V

A escala no eixo Y é tal que a curva de frequência será uma reta se os valores de V tiverem uma distribuição normal

Page 12: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráfico de probabilidade lognormal dos 100 valores selecionados da variável V

A escala do eixo Y é tal que a curva de frequência acumulada será uma reta se o logarítmo de V seguir a distribuição lognormal

Page 13: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráficos de probabilidade normal e lognormal

Algumas ferramentas de estimativa trabalham melhor se a variável apresenta distribuição Gaussiana ou normal.

Distribuição Gaussiana é um dos muitos tipos de distribuição para o qual existe todo um tratamento matemático já desenvolvido.

Portanto é importante determinar se a distribuição em estudo se aproxima da distribuição de Gauss.

O gráfico de probabilidade normal é um dos tipos de gráfico de frequência acumulada que ajuda a verificar se a distribuição é Gaussiana

Page 14: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráficos de probabilidade normal e lognormal

Em gráficos de probabilidade normal a escala do eixo Y é tal que se a curva descrita pelos dados for uma reta, a distribuição é gaussiana.

Para a V variável em estudo embora boa parte da curva de frequência acumulada se aproxima de uma reta, para pequenos valores de V forge dessa tendência.

Muitas variáveis da Ciências da Terra têm distribuição que não se aproximam da distribuição normal.

É muito comum ter muitos valores que bem baixos e poucos outros que são muito altos.

Page 15: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráficos de probabilidade normal e lognormal

Uma variável tem distribuição lognormal se a distribuição dos valores dos logarítmos da variável segue a distribuição normal.

Usando uma escala logarítmica no eixo X de um gráfico de distribuição normal pode-se verificar a lognormalidade.

Se a curva resultar em uma linha reta, é dito que os dados seguem um distribuição lognormal.

Para a variável V em estudo pode-se verificar que os dados claramente não seguem uma distribuição lognormal.

Page 16: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Análise Estatística Descritiva

Fornece informações sobre a variável em estudo por exemplo:– qual é a produtividade média da área?– qual foi a máxima e a mínima produtividade obtida?

É facilmente obtida Permite avaliar a qualidade dos dados obtidos

Page 17: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Análise Estatística Descritiva

Importantes comportamentos de muitos histogramas podem ser obtidos por meio de certas análises estatísticas.

A estatística descritiva é classificada em três categorias: mede a localização, mede a dispersão e mede a forma.

Page 18: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Análise Estatística Descritiva

Primeiro grupo: localização da distribuição– A média, a mediana e a moda pode dar uma idéia de onde o

centro da distribuição cai.

– A localização de outras partes é fornecida pelos quantis (quantiles).

Page 19: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Análise Estatística Descritiva

O segundo grupo inclui a variância, o desvio padrão e a faixa dos interquantis (interquantiles range)

Esse grupo é usado para medir a dispersão dos dados.

Page 20: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Análise Estatística Descritiva

A forma da distribuição é medida por meio do coeficiente de simetria (coefficient of skewness) e do coeficiente de variação.

O coeficiente de simetria mede a informação associada à simetria da distribuição.

O coeficiente de variação fornece informação a respeito do comportamento do final da curva de certas distribuição.

Page 21: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de localização

A media, m, é a média aritmética dos valores:

n

iixn

m1

1

• O valor médio dos 100 valores da variável V é 97,55 ppm.

Page 22: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de localização

A mediana, M, é o ponto médio dos valores observados, se eles estão dispostos em ordem crescente.

parfornse

xx

imparfornsex

Mnn

n

2

122

2

1

• O valor da mediana pode ser facilmente lida no gráfico de probabilidade.• Para os 100 valores da variável V a mediana é 100,50 ppm.

Page 23: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Lendo a mediana num gráfico de probabilidade

Page 24: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de localização

A moda é o valor que ocorre com maior frequência.

Em um gráfico de barras com os valores de frequência para cada classe a moda é representada pela barra mais alta.

Para a variável V a classe 110-120 ppm é a classe com mais valores.

O valor 111 ppm é o que ocorre com maior frequência.

Um dos pontos negativos da moda é que ela é afetada pela precisão dos dados.

Page 25: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de localização

Valor mínimo: é o valor mais baixo do conjunto de dados.

Muitas vezes é gravado apenas como um valor abaixo de qualquer um limite detectável.

Em algumas análises é conveniente usar um valor mínimo diferente de zero.

Para os valores da variável V o valor mínimo é zero.

Page 26: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de localização

Valor máximo: é o maior valor no conjunto de dados.

Para os valores de V o valor máximo é 145.

Page 27: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medida de localização

Quartil inferior e superior (Lower and Upper Quartile)

A mediana divide os dados em duas metades, os quartis dividem os dados em quartos.

Se os dados estão colocados em ordem crescente, um quarto dos dados caem abaixo do quartil mais baixo ou primeiro quartil e um quarto dos dados caem acima do quartil mais alto ou terceiro quartil.

Page 28: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Quartis de um gráfico de probabilidade normal

Page 29: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de localização

Decis, percentis e quantis

Decis: dividem os dados em décimos (10 partes) Um décimo dos dados caem abaixo do primeiro decil

Percentis: dividem os dados em centésimos (100 partes)

Quantis: servem para expressar qualquer fração.

Page 30: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de dispersão

Variância (2 ) calculada por:

n

ii mx

n 1

22 1

• A variância dos 100 valores da variável V é de 688 ppm2

Page 31: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de dispersão

Desvio padrão: raiz quadrada da variância

Para os 100 valores da variável V o desvio padrão é de 26,23 ppm

Page 32: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de dispersão

Faixa entre os quartis: Diferença entre o maior e o menor quartil

Não utiliza da média como centro da distribuição

Geralmente preferível se poucos valores erradamente elevados influenciam fortemente a média

O faixa entre os quartis para os 100 valores da variável V é de 35,50 ppm.

Page 33: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas da forma

Coeficiente de simetria, Ca (coefficient of skewness): o histograma não dá idéia da simetria dos dados.

3

1

31

n

ii mx

nCa

• Coeficiente de simetria sofre mais influência que a média e a variância de valores erroneamente elevados• Geralmente o sinal do momento de ordem 3 é mais usado que o próprio valor nas análises.

Page 34: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas da forma

Coeficiente de simetria:

– positivo significa que a curva é longa com altos valores do lado direito.

– próximo de zero, o histograma é aproximadamente simétrico e a mediana é próxima da média

Para os 100 valores da variável V, o coeficiente de simetria é próximo de zero (igual a –0,779), indicando que a distribuição apenas ligeiramente assimétrica.

Page 35: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de forma

Coeficiente de variação: usado alternativamente ao coeficiente de simetria para descrever a forma da distribuição.

Usado para distribuições em que todos valores são positivos e com coeficiente de simetria também positivo.

Embora possa ser calculado para outras situações sua utilidade como medida de forma é questionável.

Page 36: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Medidas de forma

Um coeficiente de variação maior que um indica a presença de alguns valores com erros podem ter tido impacto significativo nas estimativas.

O coeficiente de variação para os 100 valores da variável V é 0,269, o que signifca que o histograma não um longo trecho no final da curva com elevados valores

mCV

Page 37: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Descrição usando duas variáveisValores de duas

variáveis U e V

81 + 15

77 + 12

103 + 24

112 + 27

123 + 30

19 + 0

40 + 2

111 + 18

114 + 18

120 + 18

82 + 16

61 + 7

110 + 34

121 + 36

119 + 29

77 + 7

52 + 4

111 + 18

117 + 18

124 + 20

82 + 16

74 + 9

97 + 22

105 + 24

112 + 25

91 + 10

73 + 7

115 + 19

118 + 19

129 + 23

88 + 21

70 + 8

103 + 27

111 + 27

122 + 32

64 + 4

84 + 10

105 + 15

113 + 17

123 + 19

89 + 21

88 + 18

94 + 20

110 + 27

116 + 29

108 + 19

73 + 7

107 + 16

118 + 19

127 + 22

77 + 15

82 + 16

86 + 16

101 + 23

109 + 24

113 + 25

79 + 7

102 + 15

120 + 21

121 + 20

74 + 14

80 + 15

85 + 15

90 + 16

97 + 17

101 + 18

96 + 14

72 + 6

128 + 28

130 + 25

75 + 14

80 + 15

83 + 15

87 + 15

94 + 16

99 + 17

95 + 13

48 + 2

139 + 40

145 + 38

77 + 16

84 + 17

74 + 11

108 + 29

121 + 37

143 + 55

91 + 11

52 + 3

136 + 34

144 + 35

87 + 22

100 + 28

47 + 4

111 + 32

124 + 38

109 + 20

0 + 0

98 + 14

134 + 31

144 + 34

Page 38: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Descrição usando duas variáveis

0

2

4

6

8

10

12

14

16

18

0-9

10

-19

20

-29

30

-39

40

-49

50

-59

60

-69

70

-79

80

-89

90

-99

10

0-1

09

11

0-1

19

12

0-1

29

13

0-1

39

14

0-1

49

Faixa de valores da variável V (ppm)

Fre

qu

ên

cia

, %

0

5

10

15

20

25

30

35

0-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59

Valores da variável U, ppm

Fre

qu

ên

cia,

%

Page 39: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Resultados das análises estatísticas dos valores da variáveis U e V

V U n 100 100 m 97,6 19,1 26,2 9,81 CV 0,27 0,51 min 0,0 0,0 Q1 81,3 14,0 M 100,5 18,0 Q3 116,8 25,0 max 145,0 55,0

Page 40: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Comparação dos quantis das variáveis V e U

Quantil Quantil Frequência Acumulada V U

Frequência Acumulada V U

0,05 48,1 3,1 0,55 104,1 19,0 0,10 70,2 7,0 0,60 108,6 20,0 0,15 74,0 8,1 0,65 111,0 21,0 0,20 77,0 11,2 0,70 112,7 22,7 0,25 81,3 14,0 0,75 116,8 25,0 0,30 84,0 15,0 0,80 120,0 27,0 0,35 87,4 15,4 0,85 122,9 29,0 0,40 91,0 16,0 0,90 127,9 33,8 0,45 96,5 17,0 0,95 138,9 37,0 0,50 100,5 18,0

Page 41: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráfico de quartis

O gráfico de quartis pode permitir uma visualização comparativa entre duas distribuições

O gráfico de quartis de duas distribuições idênticas resultará em uma linha reta do tipo y=x

Se o gráfico de quartis de duas distribuições é uma linha reta diferente de y=x, as duas distribuições têm a mesma forma mas a sua localização e dispersão podem diferir

Page 42: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráfico dos quartis das distribuições de 100 valores da variável U versus os 100 valores de V

O caso em estudo mostra que as distribuições das variáveis U e V são diferentes.

Page 43: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráficos de dispersão

Fornecem uma boa idéia qualitativa de como duas variáveis estão relacionadas.

Pode auxiliar a detectar dados completamente fora da realidade.

Nos primeiros estágios da análise de continuidade espacial é necessário checar e corrigir os erros que por ventura exista no conjunto de dados.

Os métodos de estimativa dependem em muito da confiabilidade dos dados.

O gráfico de dispersão pode ser muito útil na validação inicial dos dados e no entendimento de futuros resultados.

Page 44: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráfico de dispersão dos 100 valores de U versus os 100 valores de V

O gráfico (b) ilustra um dado erroneamente introduzido.

Page 45: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Correlação

Em um gráfico de dispersão é possível detectar se as variáveis são positivamente correlacionadas, negativamente correlacionadas ou se não têm correlação.

Coeficiente de correlação () é a maneira mais usada em estatística para verificar o relacionamento entre duas variáveis. É calculado por:

yx

yixi mymxn

1

Page 46: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Correlação

Covariância (Cxy): é o numerador do coeficiente de correlação

A covariância é usada como uma característica do gráfico de dispersão.

A covariância entre duas variáveis depende da magnitude dos valores dessas variáveis.

n

iyixiXY mymx

nC

1

1

Page 47: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Correlação

Se os valores de U e V são multiplicados por 10, a covariância é multiplicada por 100, embora o gráfico de dispersão pareça o mesmo.

Dividindo a covariância pelos devios padrões das duas variáveis obtem-se um valor entre –1 e +1 (coeficiente de correlação) independentee da magnitude dos dados.

Para os 100 pares de valores U-V:– a covariância é 216,1 ppm2

– o desvio padrão da variável V é 26,2 ppm

– o desvio padrão da variável U é 9,81 ppm

– o coeficiente de correlação entre U e V é 0,84

Page 48: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Correlação

O coeficiente de correlação e a covariância podem ser afetados por poucos pares de dados completamente fora da realidade.

O coeficiente de correlação é uma medida da proximidade que dados observados tem de uma reta.

Se =+1, o gráfico de dispersão será uma reta com declividade positiva.

Se =-1, o gráfico de dispersão será uma reta com declividade negativa

Page 49: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Correlação

Quando a relação entre as variáveis é não-linear o coeficiente de correlação não é uma boa medida estatística.

Ao invés do coeficiente de correlação usa-se o coeficiente de correlação de rank

Rxi = rank de xi entre os valores de x e é geralmente calculado ordenando os valores de x em ordem crescente. O valor mais baixo de x terá rank igual a 1

Ryi = rank de yi entre os valores de y. mRx = média dos ranks Rx1, Rx2, …, Rxn

Rx = desvio padrão dos ranks Rx1, Rx2, …, Rxn

RyRx

RyiRxi

rank

mRymRxn

1

Page 50: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Correlação

Grandes diferenças entre rank e revela a localização dos pontos extremos em um gráfico de dispersão.

O rank não é tão influenciado por valores extremos.

Altos valores de rank e baixos valores de podem significar a existência de erros nos dados tiveram efeito adverso afetando a obtenção de uma boa correlação.

Se é alto e rank é baixo pode ser que está sendo influenciado por poucos valores extremos.

Page 51: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Correlação

Para os pares de valores V e U com um par de ponto completamente fora (figura b):

= 0,64 rank = 0,80

Se o coeficiente de correlação dos ranks é +1 significa que os ranks das duas variáveis são iguais.

Para Y = X2 resultará em próximo de zero e rank igual a um.

Page 52: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Regressão linear

A dependência de uma variável em relação a outra pode ser descrita pela equação de uma linha reta

y = ax + b

A declividade “a” e a constante “b” são dadas por:

x

ya

xy mamb

Page 53: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Regressão linear

Usando-se os 100 pares de valores V-U para calcular os parâmetros do modelo de regressão linear obtem-se:

Portanto, a equação que prevê os valores de V a partir dos valores conhecidos de U é dada por:

24,281,9

2,2684,0 a 7,541,1924,26,97 b

7,5424,2 UV

Page 54: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Regressão linear

Se o interesse for pela equação que prevê U a partir de valores conhecidos de V, então:

A equação que prevê os valores de U a partir dos valores conhecidos de V é dada por:

314,02,26

81,984,0 a 5,116,97314,01,19 b

5,11314,0 VU

Page 55: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráfico mostrando a regressão linear sobreposta num gráfico de dispersão

Observando-se cuidadosamente os dois gráficos verifica-se que as duas linhas não as mesmas, ou seja,

5,11314,0 VU

não é um simples arranjo de

7,5424,2 UV

Page 56: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Esperança condicional

Analisando-se a Figura (a) da análise de regressão linear verifica-se que uma linha reta não representa bem a relação entre as variáveis.

Os dados mostram que uma linha curva poderiam representar melhor o relacionamento entre as variáveis.

Uma alternativa à regressão linear é calcular valores médios de y para diferentes faixas de valores de x

Os valores são chamados de condicional porque eles são bons apenas para uma certa faixa de valores de U.

Para uma classe diferente, espera-se um valor diferente.

Page 57: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Valor médio de V dentro das classes de valores de U definidas

Classes Número de Pares de Pontos

Valor Médio de V

0 U < 5 8 40,3 5 U < 10 8 72,4

10 U < 15 10 85,5 15 U < 20 33 97,5 20 U < 25 15 106,9 25 U < 30 12 113,5 30 U < 35 7 125,7 35 U < 7 133,9

Page 58: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráfico do valor médio de V definido dentro de cada classe de valores de U

Page 59: Geoestatística Aplicada à Agricultura de Precisão I Daniel Marçal de Queiroz DEA/UFV.

Gráfico das curvas de esperança condicional sobrepostas nos gráficos de dispersão

Esperança condicional obtida por técnica de regressão linear dentro de uma vizinhança local. Existem algorítmos para definição do número de pontos ideal que deve compor a vizinhança.