Predição de Diâmetros e Cálculo de Volume de Clones de ...

95
U NIVERSIDADE F EDERAL DE G OIÁS I NSTITUTO DE I NFORMÁTICA WELINGTON G ALVÃO RODRIGUES Predição de Diâmetros e Cálculo de Volume de Clones de Eucalipto Uma abordagem com redes Multi Layer Perceptron e Long-Short Term Memory Goiânia 2019

Transcript of Predição de Diâmetros e Cálculo de Volume de Clones de ...

Page 1: Predição de Diâmetros e Cálculo de Volume de Clones de ...

UNIVERSIDADE FEDERAL DE GOIÁS

INSTITUTO DE INFORMÁTICA

WELINGTON GALVÃO RODRIGUES

Predição de Diâmetros e Cálculo deVolume de Clones de Eucalipto

Uma abordagem com redes Multi Layer Perceptron eLong-Short Term Memory

Goiânia2019

Page 2: Predição de Diâmetros e Cálculo de Volume de Clones de ...
Page 3: Predição de Diâmetros e Cálculo de Volume de Clones de ...

WELINGTON GALVÃO RODRIGUES

Predição de Diâmetros e Cálculo deVolume de Clones de Eucalipto

Uma abordagem com redes Multi Layer Perceptron eLong-Short Term Memory

Dissertação apresentada ao Programa de Pós–Graduação doInstituto de Informática da Universidade Federal de Goiás,como requisito parcial para obtenção do título de Mestre emCiência da Computação.

Área de concentração: Ciência da Computação.Orientador: Prof. Dr. Fabrizzio Alphonsus Alves de MeloNunes Soares

Goiânia2019

Page 4: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Ficha de identificação da obra elaborada pelo autor, através doPrograma de Geração Automática do Sistema de Bibliotecas da UFG.

CDU 004

Rodrigues, Welington Galvão Predição de Diâmetros e Cálculo de Volume de Clones de Eucalipto[manuscrito] : Uma abordagem com redes Multi Layer Perceptron eLong-Short Term Memory / Welington Galvão Rodrigues. - 2019. XCIII, 93 f.: il.

Orientador: Prof. Dr. Fabrizzio Alphonsus Alves de Melo Nunes Soares. Dissertação (Mestrado) - Universidade Federal de Goiás, Institutode Informática (INF), Programa de Pós-Graduação em Ciência daComputação, Goiânia, 2019. Bibliografia. Inclui siglas, lista de figuras, lista de tabelas.

1. Redes Neurais. 2. LSTM. 3. Inventário Florestal. 4. Eucalipto. I.Soares, Fabrizzio Alphonsus Alves de Melo Nunes , orient. II. Título.

Page 5: Predição de Diâmetros e Cálculo de Volume de Clones de ...

UNIVERSIDADE FEDERAL DE GOIÁS

INSTITUTO DE INFORMÁTICA

ATA DE DEFESA DE DISSERTAÇÃO

Ata nº 11/2019 da sessão de Defesa de Dissertação de Welington GalvãoRodrigues, que confere o título de Mestre em Ciência da Computação, naárea de concentração em Ciência da Computação.

Aos quinze dias do mês de agosto de dois mil e dezenove, a partir dasquatorze horas, na sala 150 do Insituto de Informática, realizou-se a sessãopública de Defesa de Dissertação intitulada “Predição de Diâmetros eCálculo de Volume de Clones de Eucalipto: Uma abordagem com redesMulti Layer Perceptron e Long-Short Term Memory”. Os trabalhosforam instalados pelo Orientador, Professor Doutor Fabrizzio Alphonsus Alvesde Melo Nunes Soares (INF/UFG) com a participação dos demais membrosda Banca Examinadora: Professor Doutor Christian Dias Cabacinha(ICA/UFMG), membro titular externo, cuja participação ocorreu através devideoconferência; Professora Doutora Deborah Silva Alves Fernandes(INF/UFG), membro suplente externa. Durante a arguição os membros dabanca não fizeram sugestão de alteração do título do trabalho. A BancaExaminadora reuniu-se em sessão secreta a fim de concluir o julgamento daDissertação, tendo sido o candidato aprovado pelos seus membros.Proclamados os resultados pelo Professor Doutor Fabrizzio Alphonsus Alvesde Melo Nunes Soares, Presidente da Banca Examinadora, foram encerradosos trabalhos e, para constar, lavrou-se a presente ata que é assinada pelosMembros da Banca Examinadora, aos quinze dias do mês de agosto de doismil e dezenove.

TÍTULO SUGERIDO PELA BANCA

Documento assinado eletronicamente por Deborah Silva AlvesFernandes, Professor do Magistério Superior, em 19/08/2019, às14:20, conforme horário oficial de Brasília, com fundamento no art. 6º,§ 1º, do Decreto nº 8.539, de 8 de outubro de 2015.

Documento assinado eletronicamente por Fabrízzio Alphonsus AlvesDe Melo Nunes Soares, Professor do Magistério Superior, em19/08/2019, às 18:51, conforme horário oficial de Brasília, comfundamento no art. 6º, § 1º, do Decreto nº 8.539, de 8 de outubro de

SEI/UFG - 0835204 - Ata de Defesa de Dissertação https://sei.ufg.br/sei/controlador.php?acao=do...

1 of 2 10/09/2019 10:12

Page 6: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2015.

Documento assinado eletronicamente por Christian Dias Cabacinha,Usuário Externo, em 20/08/2019, às 19:32, conforme horário oficialde Brasília, com fundamento no art. 6º, § 1º, do Decreto nº 8.539, de 8de outubro de 2015.

A autenticidade deste documento pode ser conferida no sitehttps://sei.ufg.br/sei/controlador_externo.php?acao=documento_conferir&id_orgao_acesso_externo=0, informando o código verificador 0835204e o código CRC 93BF2D6A.

Referência: Processo nº 23070.025379/2019-51 SEI nº 0835204

SEI/UFG - 0835204 - Ata de Defesa de Dissertação https://sei.ufg.br/sei/controlador.php?acao=do...

2 of 2 10/09/2019 10:12

Page 7: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Todos os direitos reservados. É proibida a reprodução total ou parcial dotrabalho sem autorização da universidade, do autor e do orientador(a).

Welington Galvão Rodrigues

Graduou-se em Sistemas de Informação pela FACIMP - Faculdade de Im-peratriz, com ênfase em desenvolvimento mobile. Atualmente é técnico eminformática no Instituto Federal do Maranhão - IFMA, Campus Açailândia.

Page 8: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Dedico este trabalho à minha mãe Maria Galvão e ao meu pai Raimundo Carlospor todo o empenho dedicado a minha educação.

Page 9: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Agradecimentos

Primeiramente, agradeço a Deus pela vida, por ter me proporcionado saúde, sa-bedoria, pela proteção em meio a tantas viagens ao longo dessa jornada e pela oportuni-dade de realizar este trabalho.

Agradeço aos meus pais por todo amor, carinho e apoio que deram para continuarestudando, do qual sem eles isso não seria possível.

Aos amigos que estiveram ao meu lado neste percurso, que me auxiliaram deinúmeras maneiras a qual serei sempre grato.

Ao meu querido orientador Prof. Dr. Fabrízzio A. A. M. N. Soares, por suaimportantíssima contribuição para a realização deste trabalho, por todos os conselhosconcedidos e pela confiança em mim depositada.

Page 10: Predição de Diâmetros e Cálculo de Volume de Clones de ...

“Computer science is no more about computers than astronomy is abouttelescopes, biology is about microscopes or chemistry is about beakers andtest tubes. Science is not about tools, it is about how we use them and whatwe find out when we do.”

E. W. Dijkstra

Page 11: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Resumo

Rodrigues, Welington G.. Predição de Diâmetros e Cálculo de Volume deClones de Eucalipto. Goiânia, 2019. 94p. Dissertação de Mestrado. Institutode Informática, Universidade Federal de Goiás.

O gerenciamento efetivo dos recursos florestais é de grande importância para o sucesso deum empreendimento florestal. Obter informações precisas de florestas plantadas é essen-cial para o planejamento eficaz da atividade florestal. Neste sentido, o inventário florestalé o procedimento utilizado para obter as informações qualitativas e quantitativas de umadeterminada região. Através dele é possível, por exemplo, quantificar árvores, identificaras espécies de um povoamento e obter o volume total a ser explorado. O volume cons-titui um dos elementos mais importantes para a exploração de uma determinada área.Empresas usam informações obtidas através do inventário para o manejo florestal esta-belecendo a quantidade de árvores a serem retiradas sem interromper o ciclo natural dasflorestas. Para o empreendimento florestal é desejável obter as informações necessáriasde um povoamento sem elevar os custos. Assim, os métodos estatísticos apresentam umcaminho para explorar essas informações sem elevar o custo entregando um resultadopróximo ao real. Vários trabalhos presentes na literatura aplicam redes neurais artificiasem diversas áreas do setor florestal, os resultados obtidos por elas mostraram-se bastan-tes promissores para problemas de classificação e predição de recursos florestais. Nestecontexto, o presente trabalho apresenta um estudo no desenvolvimento de modelos cons-truídos através de redes neurais de diferentes arquiteturas, em especial as redes Multi layer

Perceptron e Long-Short Term Memory, além da análise estatística dos modelos para pre-dição de diâmetros e cálculo de volume de clones de eucalipto. Os resultados alcançadospelos modelos foram comparados com os valores obtidos através de cubagem rigorosae pelo modelo de Schumacher e Hall (log). Os modelos construídos pelas redes do tipoLong-Short Term Memory apresentaram boa capacidade de generalização e mostraram-sesuperiores para estimar diâmetros e calcular volume de eucaliptos em demais sítios nãodisponíveis durante a fase de treinamento. Além de apresentar resultados bastantes próxi-mos aos obtidos através da cubagem rigorosa. De modo geral os resultados mostraram-sebastante satisfatórios em relação aos métodos estatísticos e presentes na literatura.Palavras–chave

Redes neurais, LSTM, Inventário florestal, Predição recursiva, Eucalipto.

Page 12: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Abstract

Rodrigues, Welington G.. Prediction of Diameters and Volume Calculationof Eucalyptus Clones. Goiânia, 2019. 94p. MSc. Dissertation. Instituto deInformática, Universidade Federal de Goiás.

Effective management of forest resources is of great importance to the success of a forestenterprise. Obtaining accurate information on planted forests is essential for effectiveforest activity planning. In this sense, the forest inventory is the procedure used to obtainqualitative and quantitative information from a given region. Through inventory it, ispossible, for example, to quantify trees, identify species of a settlement and obtain thetotal volume to be explored. The total volume is one of the most important elementsfor the exploration of a given area. Companies use information obtained from forestmanagement inventory to establish the number of trees to be removed without disruptingthe natural cycle of forests. For the forest enterprise, it is desirable to obtain the necessaryinformation from a stand without raising costs. Thus, statistical methods provide a way toexploit this information without raising the cost by delivering a near-real result. Severalworks in the literature apply artificial neural networks in several areas of the forest sector,the results obtained by them have been quite promising for problems of classification andprediction of forest resources. In this context, the present work presents a study on thedevelopment of models built through neural networks of different architectures, especiallythe textit Multi layer Perceptron and textit Long-Short Term Memory networks, besidesthe statistical analysis of the models. For diameter prediction and volume calculation ofeucalyptus clones. The results achieved by the models were compared with the valuesobtained by rigorous cubing and by the Schumacher and Hall model (log). The modelsbuilt by Long-Short Term Memory networks showed good generalization capacity andwere superior for estimating diameters and calculating eucalyptus volume in other sitesnot available during the training phase. In addition to presenting results quite close tothose obtained through rigorous cubing. In general, the results were quite satisfactoryconcerning the statistical methods present in the literature.

KeywordsNeural networks, LSTM, Forest inventory, Recursive prediction, Eucalyptus.

Page 13: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Sumário

Lista de Figuras 14

Lista de Tabelas 15

1 Introdução 171.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

1.2.1 Objetivo geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.2.2 Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . . . 19

1.3 Organização do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2 Inventário Florestal em Florestas Plantadas 212.1 Dendrometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.2 Eucalipto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.3 A Forma da Árvore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.4 Cubagem Rigorosa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.5 Estimativa de Volumes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3 Redes Neurais Artificiais 313.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313.2 Um breve histórico sobre redes neurais . . . . . . . . . . . . . . . . . . . . 323.3 Perceptron de Múltiplas Camadas . . . . . . . . . . . . . . . . . . . . . . . 343.4 Algoritmo de Retropropagação - Backpropagation . . . . . . . . . . . . . . . 363.5 Funções de Ativação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403.6 Taxa de Aprendizagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.7 Limited-Memory L-BFGS . . . . . . . . . . . . . . . . . . . . . . . . . . 423.8 Redes Neurais Recorrentes . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.8.1 Treinamento de Redes Recorrentes . . . . . . . . . . . . . . . . . . . . 453.8.2 Redes Long-Short Term Memory - LSTMs . . . . . . . . . . . . . . . . 47

4 Aplicação de Redes Neurais na área Florestal 504.1 Predição de diâmetros, Altura e Volume em Árvores . . . . . . . . . . . . . . 504.2 Demais aplicações florestais . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5 Metodologia Proposta para Estimativa de Diâmetros 545.1 Predição de Diâmetros como uma série temporal . . . . . . . . . . . . . . . . 545.2 Metodologia utilizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555.3 Materiais e Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

5.3.1 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

Page 14: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.3.2 Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575.3.3 Normalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585.3.4 Data Augmentation . . . . . . . . . . . . . . . . . . . . . . . . . . 585.3.5 Modelagem e treinamento das redes neurais . . . . . . . . . . . . . . . . 59

5.4 Métricas de Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 635.4.1 Cálculo dos erros dos diâmetros . . . . . . . . . . . . . . . . . . . . . 635.4.2 Cálculo do volume das árvores . . . . . . . . . . . . . . . . . . . . . 645.4.3 Cálculo de estimativa de erros para volume . . . . . . . . . . . . . . . . 645.4.4 Cálculo da diferença de volume percentual entre os modelos . . . . . . . . 655.4.5 Testes estatísticos . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

6 Resultados 666.1 Predição de diâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 666.2 Comparação entre o volume calculado a partir dos diâmetros reais, diâmetros

estimados pelos modelos e o volume calculado através de Schumacher e Hall (log) 696.3 Análise residual de volume . . . . . . . . . . . . . . . . . . . . . . . . . . 746.4 Comparação com os demais sítios . . . . . . . . . . . . . . . . . . . . . . . 76

6.4.1 Predição de diâmetros Sítio I . . . . . . . . . . . . . . . . . . . . . . 776.4.2 Predição de diâmetros Sítio II . . . . . . . . . . . . . . . . . . . . . . 786.4.3 Comparação e análise estatística do cálculo de volume para os sítios I e II . . 79

6.5 Considerações finais do capítulo . . . . . . . . . . . . . . . . . . . . . . . . 82

7 Conclusões e Trabalhos Futuros 837.1 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

Referências Bibliográficas 85

Page 15: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Lista de Figuras

2.1 Áreas de árvores plantadas no Brasil por gênero (Ibá, 2017). . . . . . . . 242.2 Áreas de árvores plantadas no Brasil por estado e por gênero (Ibá, 2017). . 252.3 Sólidos de revolução de maior importância na cubagem de uma árvore

(Netto, 2004). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.4 Exemplo da cubagem rigorosa em uma árvore. . . . . . . . . . . . . . . . 272.5 Ilustração da seção de uma árvore e suas dimensões. . . . . . . . . . . . . 28

3.1 Modelo de um neurônio biológico (Silva et al. , 2010). . . . . . . . . . . 323.2 Processo de transmissão de impulsos nervosos por meio da fenda sináp-

tica (Canto, 2004). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.3 Perceptron de Múlti-Camadas (Silva et al. , 2010). . . . . . . . . . . . . . 353.4 Rectified Linear Activation (Goodfellow et al. , 2016). . . . . . . . . . . . 413.5 Processo de realimentação de um neurônio recorrente (Goodfellow et al.

, 2016) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.6 Ilustração do processo de “desenrolar” em uma rede recorrente. (Good-

fellow et al. , 2016) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.7 Comparação entre a célula de uma rede recorrente comum e uma célula

do tipo LSTM (Donahue et al. , 2015). . . . . . . . . . . . . . . . . . . . 48

5.1 Altura das medidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575.2 Relação entre os dez primeiros diâmetros de uma árvore. . . . . . . . . . 585.3 Curvas de treinamento do modelo LSTM-VA. . . . . . . . . . . . . . . . 615.4 Curvas de treinamento do modelo LSTM-DA. . . . . . . . . . . . . . . . 625.5 Curvas de treinamento do modelo MLP-PR. . . . . . . . . . . . . . . . . 625.6 Curvas de treinamento do modelo MLP-PD. . . . . . . . . . . . . . . . . 625.7 Curvas de treinamento do modelo MLP-DAPHT. . . . . . . . . . . . . . 63

6.1 Predição de diâmetros da LSTM-VA (melhor e pior caso). . . . . . . . . 686.2 Predição de diâmetros da LSTM-DA (melhor e pior caso). . . . . . . . . 686.3 Predição de diâmetros da MLP-PR (melhor e pior caso). . . . . . . . . . 686.4 Gráfico de dispersão de volume para LSTM-VA e LSTM-DA. . . . . . . 726.5 Gráfico de dispersão de volume para MLP-PR e MLP-PD. . . . . . . . . 726.6 Gráfico de dispersão de volume para MLP-DAPHT e Schumacher e Hall

(log). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 736.7 Distribuição gráfica de resíduos para o modelo LSTM-VA. . . . . . . . . 746.8 Distribuição gráfica de resíduos para o modelo LSTM-DA. . . . . . . . . 756.9 Distribuição gráfica de resíduos para o modelo MLP-PR. . . . . . . . . . 756.10 Distribuição gráfica de resíduos para o modelo MLP-PD. . . . . . . . . . 766.11 Distribuição gráfica de resíduos para o modelo MLP-DAPHT. . . . . . . 76

Page 16: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Lista de Tabelas

2.1 Modelos volumétricos de simples entrada. . . . . . . . . . . . . . . . . . 292.2 Modelos volumétricos de dupla entrada. . . . . . . . . . . . . . . . . . . 30

5.1 Distribuição das árvores . . . . . . . . . . . . . . . . . . . . . . . . . . . 565.2 Estatísticas do conjunto de dados. . . . . . . . . . . . . . . . . . . . . . 575.3 Estrutura dos modelos construídos. . . . . . . . . . . . . . . . . . . . . . 605.4 Análise das métricas R2 e MAPE. . . . . . . . . . . . . . . . . . . . . . 615.5 Recursos utilizados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

6.1 Erro de predição de diâmetros por classe. . . . . . . . . . . . . . . . . . 666.2 Comparação entre o volume total calculado a partir dos diâmetros reais,

diâmetros estimados pelos modelos e Schumacher e Hall (log). . . . . . . 706.3 Estatísticas realizada entre os volumes reais, os modelos treinados e

Schumacher e Hall (log). . . . . . . . . . . . . . . . . . . . . . . . . . . 716.4 Avaliação dos modelos para estimação de diâmetros do sítio I. . . . . . . 776.5 Avaliação dos modelos para estimação de diâmetros do sítio II. . . . . . . 786.6 Comparação entre os volumes totais calculados para o síto I. . . . . . . . 796.7 Comparação entre os volumes totais calculados para o síto II. . . . . . . . 806.8 Estatística de erros de estimativa de volume entre o volume cubado e

estimado pelos modelos para os sítios I e II. . . . . . . . . . . . . . . . . 81

Page 17: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Lista de Abreviaturas e Siglas

ANOVA Análise de Variância

BPT T Backpropagation Through Time

DAP Diâmetro na Altura do Peito

LST M Long-Short Term Memory

LST M−DA Long-Short Term Memory com Data Augmentation

LST M−VA Vanilla Long-Short Term Memory

MAE Desvio Médio Percentual

MAPE Mean Absolute Percentage Error

MLP Multilayer Perceptron

MLP−DAPHT Multilayer Perceptron com DAP e Altura Total

MLP−PD Multilayer Perceptron com Predição Direta

MLP−PR Multilayer Perceptron com Predição Recursiva

R Correlação Linear

R2 Coeficiente de determinação

RMSE Root Mean Square Error

SGD Stochastic Gradient Descendent

Page 18: Predição de Diâmetros e Cálculo de Volume de Clones de ...

CAPÍTULO 1Introdução

1.1 Motivação

O setor florestal brasileiro é mundialmente reconhecido pela sua produtividade.O tempo entre o plantio e a colheita representa a menor rotatividade conhecida. A áreatotal de árvores plantadas no Brasil totalizou 7,84 milhões de hectares em 2017, resultandoem um crescimento de 0,5% em relação a 2015, devido exclusivamente ao aumento dasáreas com eucalipto. Dados mostram que os plantios de eucalipto ocupam 5,7 milhõesde hectares da área de árvores plantadas do país (Ibá, 2017). Esse crescimento deve-seprincipalmente ao investimento de indústrias que utilizam cada vez mais o eucalipto comomatéria-prima para sua produção.

No ano de 2018, o setor florestal recebeu R$ 6,7 bilhões em investimentos egerou uma receita bruta de R$ 74,8 bilhões, representando 1.1% do Produto InternoBruto (PIB) nacional e 6,1% do PIB industrial. Os investimentos geraram 3,7 milhõesde empregos direto e indireto (Ibá, 2018).

O inventário florestal é um recurso utilizado para quantificar o volume de umdeterminado povoamento, visando planejar operações florestais através de estimativas dequantidade e distribuição da madeira (Leite & Andrade, 2002). Vibrans et al. (2010)definem o inventário como o processo de obtenção de dados qualitativos e quantitativosdos recursos florestais.

Dentre os diversos parâmetros que podem ser obtidos de um inventário florestal,o volume de madeira plantado é uma informação essencial no direcionamento racional esustentável dos recursos disponíveis nas florestas. Assim, é muito importante quantificá-lo de maneira mais precisa possível. Para isto, são necessárias diversas medições emamostras representativas das florestas a fim de conhecer a dinâmica dos povoamentos(Soares, 2012).

Durante o processo de realização de um inventário florestal os erros de cálculovolumétricos podem comprometer o volume total de uma árvore. Couto & Bastos (1987)mostraram que o erro de 1 metro na medição da altura total da árvore corresponde aaproximadamente 14% do volume cilíndrico das árvores. Enquanto o erro de 1 cm no

Page 19: Predição de Diâmetros e Cálculo de Volume de Clones de ...

1.1 Motivação 18

Diâmetro na Altura do Peito (DAP) corresponde a um erro de aproximadamente 19% dovolume total da árvore. O DAP é o diâmetro na altura de 1,3 metros do solo.

O volume total de madeira plantada de um determinado povoamento é crucialpara a gestão correta dos recursos florestais. Assim, quantificá-lo de maneira mais precisapossível é de grande importância.

A cubagem rigorosa é método mais simples e utilizado para a mensuração demaneira mais precisa. No entanto uma desvantagem consiste na necessidade de abate deárvores selecionadas. Além de ser um processo lento e implica a comercialização imediatapara evitar perder o produto (Cabacinha, 2003).

De maneira restrita, o tronco de uma árvore assemelha-se a alguns sólidos geo-métricos de revolução. A base da árvore assemelha-se a um neilóide, a parte intermediá-ria é semelhante um parabolóide e a extremidade final assemelha-se a um cone (Gomes,1957; Scolforo et al. , 1997). Assim, as equações volumétricas (Schumacher, 1933) po-dem empregadas para estimar o volume através de suposições feitas sobre a forma daárvore previamente cubada.

Considerando a disposição de diferentes formas para uma única árvore, a relaçãoentre os seus diâmetros possui características não lineares. Dada essa característica o usode redes neurais foram aplicados para predição de diâmetros, calcular volume e demaisparâmetros florestais visto sua capacidade de lidar com problemas que se relacionam demaneira não linear.

Muitos trabalhos empregam redes neurais para realizar a predição de diversosparâmetros utilizados no inventário florestal. Embora as redes neurais tenham apresentadobons resultados, por outro lado, a escolha de parâmetros utilizados para treiná-las e aforma de obtê-los pode comprometer o desempenho da rede.

Medições realizadas de maneira imprecisa devido a erros humanos ou problemasnos equipamentos podem classificar uma árvore em uma classe diamétrica diferente,fazendo com que a rede neural estime erroneamente os diâmetros de uma árvore econsequentemente o cálculo de volume da mesma. Outra característica bastante utilizadaé a altura total da árvore, que se apresenta como uma medida complicada de se obter emcampo, mas fundamental em diversos modelos de equações volumétricas.

Neste trabalho são utilizadas abordagens com redes neurais multicamadas do tipofeedforward, que possuem diversas aplicações no setor florestal presentes na literatura, eredes neurais recorrentes, em especial, as redes Long-Short Term Memory que mostraram-se eficientes em diversos trabalhos que abordam problemas de modelagem sequencial.

Page 20: Predição de Diâmetros e Cálculo de Volume de Clones de ...

1.2 Objetivos 19

1.2 Objetivos

1.2.1 Objetivo geral

Conforme o cenário apresentado, o objetivo deste trabalho busca elaborar umestudo com modelos de redes neurias para estimar diâmetros e realizar o cálculo devolume de clones de eucalipto através de diferentes arquiteturas de redes neurais, emespecial as redes Multilayer Perceptron - MLP e Long-Short Term Memory - LSTM

utilizando diferentes variáveis obtidas em um inventário florestal.

1.2.2 Objetivos específicos

Como objetivos específicos, têm-se:

• Minimizar a necessidade da altura total da árvore.• Verificar os parâmetros do inventário que possam simplificar a entrada de variáveis

para a rede neural.• Criar modelos que tenham capacidade de estimar árvores em diferentes sítios de

eucalipto.• Verificar a influência do erro em cada estimativa de diâmetro e volume.• Analisar o desempenho dos modelos em relação à cubagem rigorosa e o modelo

volumétrico de Schumacher e Hall (log).

1.3 Organização do trabalho

A estrutura deste trabalho foi organizada da seguinte forma:No capítulo 1 são apresentados na introdução a contextualização, descrição geral

dos problemas, os objetivos gerais e específicos.O capítulo 2 aborda aspectos sobre mensuração florestal, eucaliptocultura e as

técnicas de estimativa de volume.O capítulo 3 abordará sobre as redes neurais artificiais apresentando um breve

histórico, uma descrição sobre o Perceptron multicamadas, o Backpropagation, funçõesde ativação, uma descrição sobre redes neurais recorrentes, seu funcionamento e atopologia Long-Short Term Memory.

No capítulo 4 são apresentados alguns trabalhos que utilizam redes neurais nosetor florestal.

No capítulo 5 são apresentados as arquiteturas utilizadas, os materiais e métodosutilizados para avaliar os resultados obtidos neste trabalho.

O capítulo 6 apresentará os resultados alcançados e as comparações com osmodelos existentes na literatura.

Page 21: Predição de Diâmetros e Cálculo de Volume de Clones de ...

1.3 Organização do trabalho 20

Por fim, o capítulo 7 apresentará a conclusão do trabalho, contribuições e ostrabalhos futuros, considerações finais e as referências bibliográficas utilizadas.

Page 22: Predição de Diâmetros e Cálculo de Volume de Clones de ...

CAPÍTULO 2Inventário Florestal em Florestas Plantadas

O inventário pode ser entendido como a base para o planejar e gerir recursosflorestais, onde, através dele é possível quantificar e qualificar uma região analisando asespécies que compõe essa determinada área. Esta prática faz usos da teoria da amostragempara estimar ou determinar uma dada característica, seja qualitativa ou quantitativa de umaamostra (Brena & Péllico Neto, 1997).

Um dos principais objetivos do inventário florestal em relação às florestasplantadas, consiste em avaliar e aplicar métodos de amostragem que possam obterinformações precisas de biomassa, área basal, volume, qualidade do fuste, classe de copae qualidade de crescimento. Além disso, o desejável para o empreendimento é obter estasinformações sem elevar o custo da produção florestal. Os métodos estatísticos mostramum caminho para explorar as relações entre as amostras e entregar um resultado próximodo real e com baixo custo (Mello, 2004).

A sua importância consiste como a base do plano de manejo e da produção deuma empresa madeireira. O inventário deve fornecer, além do volume total explorável,a distribuição do número de árvores por hectare e por outras características, tais como,classe de diâmetro, área basal por hectare, por grupo de espécies e para cada espécieindividualmente o que torna possível prever gastos e lucros para a indústria madeireira(Silva, 2001)

Já em relação a floresta nativa, através do inventário, planos de exploração podemser traçados de modo a contemplar a subdivisão da área a ser explorada em lotes (talhões)que serão explorados em sequência. Quando o ciclo de exploração estiver completo,a extração de madeira deverá ocorrer novamente no primeiro lote explorado, o qualjá deve ter se regenerado parcialmente. O manejo florestal pode ser acompanhado deenriquecimento da floresta, ou seja, de plantio de espécies desejadas. Em geral, os planosde manejo de florestas nativas em execução no Brasil envolvem ciclos de exploração de30 anos (Juvenal & Mattos, 2002).

Page 23: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2.1 Dendrometria 22

2.1 Dendrometria

Durante a elaboração de um inventário florestal é importante mensurar com pre-cisão as variáveis que serão utilizadas pra quantificação e avaliação dos produtos flores-tais. Estas variáveis dendrométricas constituem a base técnica que auxilia no processo demanejo florestal.

A palavra Dendrometria tem origem grega (DENDRO = árvore; e METRIA =medida), significando a medida da árvore. Em outras palavras este ramo das CiênciasFlorestais que tem por objetivos principais determinar ou estimar os recursos florestais,seja da própria árvore ou mesmo de um povoamento, predizer o volume, o incrementoou a produção de recursos florestais. Ela surgiu da necessidade dos homens estimaremquantitativamente o que possuíam em recursos florestais (Silva & Neto, 1979).

Dentre outros termos a Dendrometria também é conhecida como Dasometria,Silvimensuração, Mesnuração Florestal e Silvimetria. Assim, ela é empregada para aten-der objetivos específicos, tais como, comercial, ordenação florestal e de pesquisas.

Quando aplicada ao âmbito comercial a Dendrometria visa estimar com precisãoo que é retirado da floresta para fins de compra e venda de produtos e subprodutos flo-restais. Quanto ao manejo florestal, a dendrometria pode ser utilizada, por exemplo, parasaber se quantidade de produtos restirados de uma determinada área seja compatível aoquanto essa área possa crescer novamente de modo a elaborar planejamento florestal delongo prazo. Outra aplicação se dá na área de pesquisas com o objetivo de novos conhe-cimento, tabelas, técnicas, entre outros. Que podem ser realizados durante a pesquisa emcampo.

A Dendrometria faz uso de diversas variáveis para realizar estimativas, as prin-cipais consistem na altura total e nos diâmetros das árvores, medidos no tronco em váriasalturas em relação ao solo. Algumas medidas podem ser obtidas diretamente através deuma suta ou outro instrumento semelhante, já outras medidas como altura total de umaárvore necessitam de instrumentos para que possa ser conhecida ou também por utilizaçãode princípios trigonométricos e geométricos.

As medições de diâmetros que vão do tronco da árvore até medidas próximas àaltura do DAP podem ser obtidas diretamente com a árvore em pé, já para medidas alémdo DAP é necessário, escadas ou andaimes em alturas que ainda possam ser acessíveis.

Mesmo que inúmeras variáveis possam existir durante os procedimentos den-drométricos, os erros devem ser minimizados para que o inventário florestal possa serrealizado com o menor erro possível, garantindo assim, uma estimação mais precisa commenos danos florestais.

Page 24: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2.2 Eucalipto 23

2.2 Eucalipto

A palavra eucalipto (do grego, eu , verdadeira; e kalúptw , cobertura) é adesignação popular das várias espécies vegetais do gênero Eucalyptus. Este nome é usadotambém para outros gêneros da família Myrtaceae, nomeadamente dos gêneros Corymbia

e Angophora (Soares et al. , 2010).O eucalipto possui uma característica marcante de sua espécie quanto a diver-

sidade do uso de sua madeira. Ele pode ser utilizado pela indústria para a produção depapel e celulose, carvão, lenha, postes; na construção civil o mesmo pode ser utilizadopara produção de chapas laminados, etc. Outra característica desta espécie é seu rápidocrescimento e adaptabilidade a diversas regiões. (Pavan, 2009).

Estas características fazem do eucalipto um dos gêneros mais plantados nomundo por diversos países das Américas, Europa, África, Ásia, além de alguns paísesdo mediterrâneo e algumas ilhas da Oceania (Flynn & Shield, 1999).

A produtividade do eucalipto nestes demais países pode variar bastante devidoas características edafoclimáticas presentes no território, da origem do propágulo vegetale o grau de melhoramento, além das práticas de manejo e silvicultura adotados nos países(Scarpinati, 2007).

O eucalipto foi introduzido no Brasil na segunda metade do século XIX com oobjetivo de ajudar na produção de dormentes para as linhas férreas que se instalavam nopaís (Lutinski et al. , 2006).

Durante a década de 50, passou a ser usado como matéria-prima no abasteci-mento das fábricas de papel e celulose. É um vegetal de rápido crescimento e adaptadopara as situações edafo-bioclimáticas brasileira. Durante as décadas de 60 e 70, o euca-lipto teve um crescimento expressivo devido aos incentivos fiscais e perdurou até meadosdos anos 80 e ficou conhecido como um marco na silvicultura brasileira dado os efei-tos positivos que gerou no setor. Com o fim dos incentivos fiscais houve uma queda noplantio de eucaliptos. Exceção disso ocorreu naqueles feitos, independentes dos investi-mentos, nas indústrias de papel e celulose e de siderúrgicas a carvão vegetal (Dossa et al.

, 2002).O eucalipto é uma planta que ao longo da sua evolução natural desenvolveu

mecanismos adaptativos eficientes para crescer rapidamente sob condições favoráveis etambém suportar estresse hídrico, de temperatura, nutricional, entre outros, o que explicao grande número de espécies na natureza e sua ampla dispersão nas regiões de origem(Paludzyszyn Filho et al. , 2006).

O setor florestal brasileiro é mundialmente reconhecida pela alta produtividadede suas áreas plantadas. A produtividade florestal é medida em volume de madeiraproduzida por unidade de área no decorrer de um ano. Também possui a menor rotação

Page 25: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2.2 Eucalipto 24

do mundo, que equivale ao tempo decorrido entre o plantio e a colheita das árvores.

Figura 2.1: Áreas de árvores plantadas no Brasil por gênero (Ibá, 2017).

As áreas plantadas de eucalipto ocupam 5,7 milhões de hectares e estão distri-buídos principalmente entre os estados de Minas Gerais (24%), São Paulo (17%) e MatoGrosso do Sul (15%). Nos últimos cinco anos, o crescimento da área de eucalipto foi de2,4% a.a.. O estado Mato Grosso do Sul registrou aumento de 400 mil hectares em 2017,com uma taxa média de crescimento de 13% a.a. conforme pode ser observado na Figura2.1.

Os plantios da espécie pinus ocupam 1,6 milhão de hectares e distribuem-seprincipalmente entre os estados do Paraná (42%) e em Santa Catarina (34%). A regiãoSul brasileira oferece as melhores condições de solo e clima para essa espécie.

As empresas de papel e celulose detêm 34% dos 7,84 milhões de hectares deárvores plantadas nos Brasil em 2016. Os pequenos e médios produtores que atuam emplantio para a comercialização de madeira in natura representam 29%. Adiante estão osegmento de siderurgia e carvão vegetal (14%), segmentos de painéis de madeira e pisoslaminados (6%), de produtos sólidos de madeira (4%) e outros (3%) completam o quadrode distribuição de áreas de árvores plantadas no Brasil conforme a Figura 2.2.

O tipo clonal é a principal prática de silvicultura do eucalipto atualmente. Elacompreende todo o processo de formação de uma floresta clonal, incluindo a seleção daárvore superior, a multiplicação vegetativa, a avaliação das árvores selecionadas em testeclonal, a produção de mudas e o estabelecimento da floresta clonal (Xavier, 2002).

O clone é definido como uma população de células ou indivíduos originadospor divisão assexuada a partir de uma célula, ou indivíduo. A propagação vegetativa,assexuada, não consiste em recombinação genética, o que viabiliza a cópia fiel dogenótipo de um indivíduo vegetal. As plantações de espécies originadas de propagaçãovegetativa não possuem variabilidade genética, constituindo assim as populações maishomogêneas do que as formadas por sementes, mas tornam-se mais vulneráveis aosfatores edáficos (Raven et al. , 1978).

Page 26: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2.3 A Forma da Árvore 25

Figura 2.2: Áreas de árvores plantadas no Brasil por estado e por gênero (Ibá, 2017).

2.3 A Forma da Árvore

Dentro de uma floresta seja ela plantada ou nativa, pode-se observar a variaçãoda forma das árvores. Esta variação ocorre de individuo para indivíduo e isso se devea vários fatores, tais como, as condições edafoclimáticas, aos métodos de silvicultura,idade da árvore e a condição de crescimento da árvore dentro de uma determinada região(SILVA & NETO, 1979).

O fuste de uma árvore é a medida que vai do toco até um determinado diâmetrolimite (diâmetro comercial) ou um defeito no fuste. A forma deste fuste pode ser associadaao termo “afilamento”, ou seja, o diâmetro tende a diminuir a mediada que a alturaaumenta, que é uma tendência natural que ocorre na maioria das espécies e pode serexpressa por uma função matemática que descreve a tendência dessa variação. (Machado& Calegario, 2007).

Segundo Borges (1981), do ponto de vista dendrométrico a forma do fuste deárvores genericamente não se identifica com uma única configuração geométrica, massim com várias, de acordo com a parte do tronco analisada.

Para Loetsch et al. (1973), o fuste das árvores coníferas e folhosas apresentamvariações de formas geométricas ao longo dos seus fustes. A base do tronco é convexa epossui um ponto de inflexão variável em função da espécie e se assemelha a um sólidode revolução do tipo neilóide; a partir neilóide até a base da copa o traçado apresenta-secôncavo ao referido eixo. Em coníferas essa porção do tronco poderia ser descrita por um

Page 27: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2.4 Cubagem Rigorosa 26

parabolóide, enquanto que nas folhosas (das quais o eucalipto faz parte), uma parte dessaseção seria parabolóide e a parte terminal até a base da copa assemelha-se ao tronco deum cone. Esta relação pode ser observada na Figura 2.3.

Figura 2.3: Sólidos de revolução de maior importância na cubagem de uma árvore (Netto,2004).

Segundo Husch et al. (1972), os troncos das árvores podem assumir sólidosgeométricos do tipo neilóide, parabolóide ou cone. Quando considerado o fuste comoum único elemento, dificilmente assumirá quaisquer um destes sólidos. Portanto, o maissensato é supor que o tronco é composto por vários destes sólidos.

Identificar pontos de transição ou limites desses sólidos, apresenta uma tarefade difícil delimitação nos troncos. Segundo Gomes (1957), se fosse possível identificaressas limites bastaria aplicar as fórmulas geométricas e o problema na obtenção dosvolumes seria resolvido. Porém, visto a impossibilidade deste processo, faz-se necessáriaa definição de expressões matemáticas que descrevem a forma do fuste (Figueiredo Filhoet al. , 1996).

2.4 Cubagem Rigorosa

A cubagem rigorosa é o método direto bastante utilizado nos inventários flores-tais para a estimação do volume de árvores. A cubagem consiste na medição sucessivade diâmetros ao longo do fuste, dividindo-o em seções. Através dela é possível o desen-volvimento de funções matemáticas para estimar o volume de árvores em pé (Belchior,1996).

Segundo Figueiredo Filho et al. (1996), as medições sugeridas ao longo do fustepara espécies de Eucalyptus e Pinus são: 0,05; 0,07; 1,30; 2,30 e os comprimentos das

Page 28: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2.4 Cubagem Rigorosa 27

seções devem ser de 1 ou 2 metros para que se possa controlar ao máximo o efeitode conicidade e que as seções sejam regulares. Scolforo et al. (1994) estabelecem asmedições nos diâmetros: 0,30; 0,70; 1,30, 2,00; 3,00 e sucessivamente de 1 em 1 metroaté que a altura desejada para a cubagem seja alcançada.

A Figura 2.4 representa o método de cubagem rigorosa em uma árvore. Onde di

indica os diâmetros medidos e hi representa as alturas dos respectivos diâmetros.

h2 h3h1 hn-1

d1 d2 d3 d4 dn-1 dn

Figura 2.4: Exemplo da cubagem rigorosa em uma árvore.

A cubagem pode ser realizada através de métodos absolutos e relativos. Nosmétodos absolutos não há relação entre o comprimento da seção e o comprimento daárvore. Já nos métodos relativos o comprimento da seção representa um percentual docomprimento da árvore, o que permite uma comparação dos volumes individuais da árvorecom a mesma forma (Machado et al. , 2006).

Existem diferentes métodos de cubagem rigorosa, tais como, o método de Hu-ber, Newton e Smalian. Segundo Gomes (1957), todos os métodos calculam o volumecom valores divergentes, no entanto, não existem diferenças significativas entre os vo-lumes calculados. Portanto, a escolha do método a ser utilizado fica a cargo apenas domensurador.

No Brasil, os métodos absolutos são os mais utilizados pelas empresas florestais.O método de Smalian se destaca como o mais frequente devido sua praticidade, mesmoque isso implique no abate de árvores para realizar a mensuração (Silva & Neto, 1979).

De maneira restrita, o fuste de uma árvore apresenta semelhança com diferentessólidos de revolução, entre eles: o neilóide, o parabolóide, o cilindro e o cone. Dada estascaracterísticas, o fuste é dividido em seções (toras) e são aplicadas fórmulas aproximadaspara obter o volume de cada seção e por fim, o volume total da árvore (Campos, 1983).

Considerando o método de Smalian, o volume de cada seção pode ser obtidoatravés da Equação 2-1.

Page 29: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2.5 Estimativa de Volumes 28

vi =

(gi +gs

2

)L, (2-1)

onde vi é o volume da i-ésima seção em m3 com ou sem casca, gi é a área seccional daseção i, gs é a área seccional da seção i+1 e L é o comprimento da seção.

Realizado o cálculo do volume de cada seção, é efetuado o somatório de cadaseção para obter o volume total da árvore conforme a Equação 2-2.

v =

(n−1

∑i=1

gi +gi+1

2li

)+

gnln3

, (2-2)

gi =(di/2)2π

10.000, (2-3)

onde v é o volume total da árvore, gi é a área basal na i-ésima posição, li é o comprimentoda seção na i-ésima posição, gn é a área basal do cone, ln é o comprimento do cone e di éo diâmetro na i-ésima posição.

Para converter de cm2 para m2 a área de cada gi é dividida por 10.000 conformea Equação 5-10.

A seção de uma árvore e suas respectivas dimensões podem ser observadas naFigura 2.5.

L

Figura 2.5: Ilustração da seção de uma árvore e suas dimensões.

2.5 Estimativa de Volumes

A expressão quantitativa mais usada em florestas é o volume de madeira, o qualse constitui em informação imprescindível no inventário e em planos de manejo florestal.

A maneira mais precisa de determinar o volume é pelo método do deslocamentode água seguindo o Princípio de Arquimedes, ou seja, as toras são colocadas em tanquescheios de água e, a partir do deslocamento da água, obtém-se o volume delas. Noentanto, essa forma de obtenção do volume é de difícil aplicação em inventários florestaisdevido ao tempo gasto nesse processo, tornando uma prática inviável economicamente etecnicamente (Machado et al. , 2006; Soares et al. , 2011).

Page 30: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2.5 Estimativa de Volumes 29

Entre as diversas metodologias utilizadas para a estimação de volume. A equaçãode volume para as árvores individuais é a mais utilizada (Couto & Bastos, 1987). Outrasmetodologias podem ser empregadas para se obter o volume do fuste como, por exemplo,o fator de forma, o método dos dois diâmetros e o uso das relações hipsométricasjuntamente com uma equação de volume.

O volume de árvores individuais pode ser obtido a partir de medidas do diâmetroda altura do tronco da árvore (Batista, 1998). O conhecimento do volume de umadeterminada área é obtido por meio do inventário quantitativo. Essa operação consistena mensuração de amostras representativas da população, nomeadas de parcelas (Binotiet al. , 2012).

Dessa forma, o volume de madeira em cada parcela advém da aplicação demodelos volumétricos que, em sua maioria, possuem dependência de árvores cubadaspreviamente. Atividade essa bastante onerosa e morosa no setor florestal. Portanto,foram desenvolvidos meios para realizar estimativas de modo que não seja necessárioa derrubada da árvore.

Quando deseja-se obter estimativas mais precisas do estoque florestal, pode-seusar modelos matemáticos que estimam o volume para as árvores individuais e gerartabelas de volume ou modelos que estimam o volume por unidade de área (Cabacinha,2003).

O emprego de equações volumétricas constitui uma das principais ferramentaspara quantificação da produção de povoamentos, sendo base para o manejo sustentável deplantações florestais (Leite & Andrade, 2002).

De acordo com Scolforo et al. (1997) os modelos volumétricos ou equações devolume podem ser divididos em três grupos: Equações de simples, dupla e tripla entrada.

No modelo de simples entrada as equações devem ser utilizadas quando existeuma correlação forte entre o volume e a altura, assim pode-se afirmar que as variações naaltura são bem explicadas pelo diâmetro, no caso diâmetro na altura do peito (DAP). ATabela 2.1 apresenta as equações de simples entrada.

Tabela 2.1: Modelos volumétricos de simples entrada.

Autor Modelo

Kopezky-Gehrhardt V = β0 +β1DAP2 + ε

Dissescu-Meyer V = β1DAP+β2DAP2 + ε

Hohenadl-Krenm V = β0 +β1DAP+β2DAP2 + ε

Berkhout V = β0DAPβ1 + ε

Husch lnV = β0 +β1 lnDAP+ ε

Brenac lnV = β0 +β1 lnDAP+β2 +1

DAP + ε

As equações de dupla entrada são utilizadas quando não existe certa homogenei-

Page 31: Predição de Diâmetros e Cálculo de Volume de Clones de ...

2.5 Estimativa de Volumes 30

dade entre altura e diâmetro dentro do povoamento. Nestas equações o volume é calculadoem função do diâmetro e da altura sendo que existe uma forte correlação entre a altura eo diâmetro. A Tabela 2.2 apresenta algumas equações de dupla entrada comumente utili-zadas.

Tabela 2.2: Modelos volumétricos de dupla entrada.

Autor Modelo

Spurr V = β0 +β1DAP2Ht + ε

Spurr (log) lnV = β0 +β1 ln(DAP2Ht)+ ε

Schumacher-Hall V = β0DAPβ1Htβ2 + ε

Schumacher-Hall (log) lnV = β0 +β1 lnDAP+β2 lnHt + ε

Honner V = DAP2

β0+β11

Ht+ ε

Ogaya V = DAP2(β0 +β1Ht)Stoate V = β0 +β1DAP2 +β2DAP2Ht +β3Ht + ε

Naslund V = β1DAP2 +β2DAP2Ht +β3DAPH 2t +β4H 2

t + ε

Takata V = DAP2Htβ0+β1DAP + ε

Meyer V = β0 +β1DAP+β2DAP2 +β3DAPHt +β4DAP2Ht +β5Ht + ε

Por último, no modelo de tripla entrada o volume é estimado em função do DAP,da altura total e de uma medida que expressa a forma da árvore. Este tipo de modelo não érecomendável, pois, a forma da árvore é uma variável difícil de ser quantificada, e quandoé realizada a cubagem rigorosa, esta já é controlada.

Entre os vários modelos existentes, observado na tabela anterior, para expressaro volume de madeira em função dos diâmetros da altura, o modelo proposto por Schu-macher e Hall é um dos mais difundidos na área florestal, devido às suas propriedadesestatísticas, uma vez que resulta em estimativas quase sempre não tendenciosas (Leite &Andrade, 2002);

Outro modelo bastante difundido é variação de Schumacher e Hall em sua formalinearizada, logarítmica, conhecido também como Schumacher e Hall logarítmico ousimplesmente, Schumacher e Hall (log) (Cabacinha, 2003). O modelo de Schumachere Hall (log) é uma equação volumétrica de dupla entrada que estima o volume das árvoresa partir do diâmetro na altura do peito DAP , ou dbh, e da altura total (Ht) (Soares, 2012).

Page 32: Predição de Diâmetros e Cálculo de Volume de Clones de ...

CAPÍTULO 3Redes Neurais Artificiais

As redes neurais são uma estrutura maciçamente paralela com a habilidade degeneralização, ou seja, podem produzir saídas adequadas para entradas que não estavampresentes durante a fase de treinamento. A capacidade de generalização é o que diferenciaa rede neural dos demais algoritmos de aprendizagem que processam apenas os dados quelhe foram apresentados (MONTGOMERY & JUNIOR, 2007).

Segundo Silva et al. (2010) as redes neurais são modelos computacionaisinspirados no sistema nervoso dos seres vivos. Possuem a capacidade de aquisição emanutenção do conhecimento e podem ser definidas como um conjunto de unidadesde processamento, caracterizadas por neurônios artificiais, que são interligados por umgrande número de interconexões (sinapses artificiais).

Neste capítulo será abordado um breve estudo sobre redes neurais, partindo dohistórico, suas principais arquiteturas, funções de ativação e algoritmos de treinamento.

3.1 Introdução

As redes neurais buscam alcançar bons resultados baseados na densa intercone-xão de elementos computacionais simples. A estrutura de uma rede neural é baseada noconhecimento que temos do funcionamento do nosso sistema nervoso biológico (Lipp-mann, 1987).

Elas podem ser resumidas como um sistema computacional feito por umasérie de elementos de processamentos simples, altamente conectados, cuja informaçãoé processada a partir de entradas de informação externas. (Hecht-Nielsen, 1992).

De modo geral, uma rede neural é uma máquina projetada para modelar amaneira como o cérebro realiza uma tarefa em particular ou uma função de interesse. Paraalcançarem bom desempenho, as redes neurais empregam uma interligação maciça decélulas computacionais denominadas neurônios ou unidades de processamento (Haykin,2001).

O funcionamento do cérebro humano é regido por processadores biológicos in-terligados operando em paralelo produzindo diferentes ações que regem o comportamento

Page 33: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.2 Um breve histórico sobre redes neurais 32

humano, como pensar e memorizar. O neurônio é a principal célula responsável por con-duzir estímulos elétricos produzidos por reações físico-químicas. Basicamente o neurôniopode ser divido em três partes:

• Dendritos: são responsáveis por captar continuamente estímulos vindos de outrosneurônios ou do próprio meio.• Corpo celular ou soma: estrutura onde são processadas as informações obtidas

através dos dendritos que indicará se o neurônio poderá disparar o impulso elétricopara o axônio.• Axônio: constituído por um único filamento é responsável por propagar os impulsos

elétricos para outros neurônios ou diretamente para o tecido muscular.

Os sinais são recebidos pelos dendritos, processados pelo corpo celular e casoativado pelo neurônio são passados adiante através do axônio e suas ramificações. AFigura 3.1 apresenta o modelo de neurônio biológico.

Figura 3.1: Modelo de um neurônio biológico (Silva et al. , 2010).

O processo de comunicação entre os dendritos e o axônio é dado através de li-gações sinápticas. As sinapses são locais onde ocorre a passagem de informação dessascélulas. Essas passagens são realizadas por de uma substância química, um neurotrans-missor, eles podem excitar novos impulsos nervosos ou inibir a passagem de novos im-pulsos. As sinapes tem possuem importância fundamental no processo de aprendizagem(Cosenza & Guerra, 2009). A Figura 3.2 ilustra o processo de conexão sináptica.

3.2 Um breve histórico sobre redes neurais

As pesquisas sobre redes neurais artificiais tiveram início por volta da décadade 40 quando McCulloch & Pitts (1943) publicaram o primeiro artigo relacionado

Page 34: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.2 Um breve histórico sobre redes neurais 33

Figura 3.2: Processo de transmissão de impulsos nervosos por meio da fenda sináptica(Canto, 2004).

a neurocomputação. Nesta publicação os autores desenvolveram o primeiro modelomatemático de um neurônio biológico, lançando a primeira ideia de um neurônio artificial.

Neste modelo inicial, um neurônio era capaz de executar uma função lógica e osnós produziam resultados binários que eram transmitidos. Este processo era é alusão aoneurônio biológico onde os disparos para um próximo neurônio podem ser transmitidosou não pelos neurotransmissores. No modelo artificial, esse neurotransmissor era definidopor um limiar (treshold).

No ano de 1949, o neurofisiologista Donald Hebb publicou o livro denominadoThe Organization of Behavior (Hebb, 1949). Neste livro Hebb apresentou uma formula-ção explícita sobre a regra de aprendizagem, deixando em evidência que o processo deaprendizagem ocorria por meio de modificações sinápticas (Haykin, 2001).

O trabalho de Hebb serviu de inspiração para o desenvolvimento de diversosmodelos matemáticos fundamentados no princípio biológico e na regra de aprendizagem.Durante a década de 50, Frank Rosenblatt desenvolveu o primeiro neurocomputador,denominado Mark I - Perceptron, onde fora idealizado o modelo inicial de Perceptron

(Rosenblatt, 1958).Os perceptrons tornaram-se famosos por serem capazes de reconhecer padrões

linearmente separáveis, mas foram suficientes para despertar o interesse de muitos pes-quisadores. Nos anos 60, Widrow & Hoff (1994) desenvolveram a rede denominada Ada-line (Adaptive Linear Element). Posteriormente, em 1962, os pesquisadores propuserama Adaline múltipo, chamada Madaline. Nesta nova abordagem, foi introduzido um novoalgoritmo de aprendizagem que ficou conhecido como LMS (Leat Mean Square).

No ano de 1969, após alguns anos de pesquisas relacionadas a neurocomputação,a publicação do trabalho de Minski & Papert (1969) provaram matematicamente de formaenfática as limitações das redes neurais de uma única camada, tal como, Perceptrons

Page 35: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.3 Perceptron de Múltiplas Camadas 34

e Adaline. As redes até então difundidas não eram capazes de resolver problemas declassificação de padrões que não são linearmente separáveis.

Após a publicação de Minski & Papert (1969) muitos pesquisadores desistiramde trabalhar com redes neurais, além disso, a limitação tecnológica pela falta de com-putadores pessoais ou estações de trabalho para realizar os experimentos. Para algunspesquisadores, a década de 70 pode ser considerada como a década do adormecimentodas redes neurais (Haykin, 2001).

No entanto, ainda na década de 70 alguns trabalhos buscaram resolver as limi-tações das redes neurais. No fim dos anos 60, Grossberg (1968) propôs um modelo deadição de um neurônio por meio de equações diferenciais. Amari (1972) propôs usar omodelo aditivo de um neurônio para estudar o comportamento dinâmico de neurôniosconectados de forma aleatória. Em 1974, Werbos (1974) propôs resolver problemas deregressão utilizando gradiente reverso. Little & Shaw (1975), desenvolveram um modeloprobabilístico de neurônio que pode disparar ou não um potencial de ação, assim, de-senvolveram um modelo de teoria de memória de curto prazo. Anderson et al. (1977)propuseram um modelo do estado cerebral em uma caixa, uma rede associativa simplesutilizando uma dinâmica não linar. Kohonen (1982) propôs a formulação de mapas auto-organizáveis. Somente em 1982, com a publicação de Neural networks and physical sys-

tems with emergent collective computational abilities, de Hoppefield, que as pesquisassobre redes neurais foram retomadas. Ele propôs redes neurais recorrentes baseadas emfunção de energia, mostrando que a memória da rede neural estaria entre as conexõessinápticas (Hopfield, 1982).

No final dos anos 80, a evolução dos computadores, criação de novos algoritmosde optimização e novas descobertas sobre o sistema nervoso biológico, foram alguns dosfatores que retomaram as pesquisas em redes neurais. Em 1986, com o trabalho de Ru-melhart et al. (1986) que apresentou o algoritmo de retropropagação (backpropagation)e a publicação do livro Parallel distributed processing, (Rumelhart & McClelland, 1986)tornou-se possível treinar de perceptrons de múltiplas camadas.

O algoritmo de retropropagação passou a ser a principal técnica para treinamentode redes neurais de múltiplas camadas. Este marco motivou de forma definitiva a retomadade pesquisas sobre as redes neurais.

3.3 Perceptron de Múltiplas Camadas

A dificuldade das redes neurais em resolver problemas linearmente não sepa-ráveis, por exemplo, o XOR, apresentou como a principal limitação dos perceptrons. Oavanço nos estudos na área criou novas estratégias para contornar e resolver esse pro-blema. Posteriormente, surgiram estratégias de adicionar camadas intermediárias entre

Page 36: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.3 Perceptron de Múltiplas Camadas 35

a camada de entrada e saída. Essa estratégia ficou conhecida pelo nome de Multilayer

Perceptron - MLP.As redes perceptron de múltiplas camadas consistem essencialmente de uma

camada de entrada, uma ou mais camadas intermediárias, ou “ocultas” e uma camadade saída. Nesta arquitetura, os estímulos ou dados são apresentados a rede pela camadade entrada, estes sinais são propagados para frente sem nenhuma alteração (feedforward)para as camadas intermediárias, denominadas camadas ocultas, elas são capazes deextrair informações e representá-las através do ambiente em que estão inseridas. Por fim,essas informações são propagadas para os neurônios da camada de saída, produzindo asrespostas referentes aos dados de entrada.

O fluxo de transmissão da informação inicia-se na camada de entrada, atravessama camada intermediária e é finalizado na camada de saída. A Figura 3.3 apresenta aarquitetura básica de uma MLP clássica.

Figura 3.3: Perceptron de Múlti-Camadas (Silva et al. , 2010).

Diferentemente do perceptron simples, onde um único neurônio é responsávelpor todo mapeamento de um processo, as MLPs podem ser configuradas para conectar to-dos os neurônios de uma camada para a camada seguinte e então realizar o processamentoque irá definir o comportamento do conjunto entrada/saída de um treinamento.

Os neurônios são arranjados em camadas (layers), a camada de entrada passaráas informações para as camadas intermediárias. A quantidade de camadas intermediárias éestabelecida conforme o problema a ser tratado, elas levarão a informação para a próximacamada, da esquerda para a direta. A saída de uma MLP é, portanto o resultado do ajustedos pesos nas camadas intermediárias. Os neurônios de uma camada podem se conectarcom outras camadas, mas, não com os neurônios da própria camada (Gibson et al. , 1989).

Page 37: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.4 Algoritmo de Retropropagação - Backpropagation 36

Nas camadas ocultas de uma MLP, o ajuste dos pesos é realizado através deaprendizado supervisionado, onde, para um conjunto de amostra de entrada espera-sea respectiva saída. Cada neurônio de uma camada oculta ou de saída é projetado paracalcular a saída de um sinal por meio de uma função não linear e calcular o valor dogradiente para minimizar o erro. O cálculo do valor do gradiente é realizado através doalgoritmo de retropropagação (backpropagation), sendo o principal algoritmo utilizadopara o treinamento das redes de múltiplas camadas.

3.4 Algoritmo de Retropropagação - Backpropagation

O algoritmo de retropropagação é um dos principais algoritmos utilizados parao treinar redes neurais. Ele busca se aproximar do mínimo global através da descida dogradiente. O algoritmo pode ser entendido como uma generalização do least mean square

- (LMS) (Leung & Haykin, 1991).A retropropagação é baseada na regra de aprendizagem de correção de erro. O

algoritmo aplica dois passos fundamentais durante o processo de aprendizagem: um passopara frente (feedforward), denominado propagação e um passo para trás (backward), nosentido inverso da rede, denominado retropropagação.

Dado um conjunto de dados de entrada da rede, os mesmos são passadoscamada a camada até gerarem um padrão de saída correspondente a resposta da rede.No passo seguinte, durante a retropropagação, os pesos dos neurônios de cada camadasão reajustados consoante a regra de correção de erro. O cálculo do erro ocorre quando oresultado de resposta produzido na saída da rede é subtraído da resposta alvo. Por fim, oerro é propagado no sentido inverso das conexões sinápticas. (Haykin, 2001).

A regra da cadeia de cálculo é utilizada para calcular as derivadas de funçõesformadas pela composição de outras funções onde os valores derivados já são conhecidos.O backpropagation calcula a regra da cadeia com uma ordem específica e de maneiraeficiente (Goodfellow et al. , 2016).

O sinal de erro na saída de um neurônio j, é calculada através da diferença entrea saída desejada yd j(n) e a resposta da rede y j(n). O cálculo do erro e j(n) é obtido atravésda Equação 3-1.

e j(n) = yd j(n)− y j(n) (3-1)

O valor da energia do erro quadrático para o neurônio j é definido por 12(e j(n))2.

Somando-se os termos de todos os neurônios da camada de saída, obtém-se o valorinstantâneo da energia total do erro. A Equação 3-2 apresenta a equação deste processo.

Page 38: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.4 Algoritmo de Retropropagação - Backpropagation 37

ε(n) =12 ∑

j(e j(n))2 (3-2)

Considerando que N seja o número total do conjunto de treinamento. A energiado erro quadrático médio é obtido pela soma do erro ε(n) para todos os n e então,normalizado em relação ao tamanho do conjunto N, conforme a Equação 3-3.

E =1N

N

∑n=1

ε(n) (3-3)

O processo de treinamento têm por objetivo, ajustar os pesos da rede paraminimizar a função de custo. Considerando um nerônio j, v j(n), que possui como entradaum conjunto de sinais oriundos de uma camada anterior, a ativação interna deste neurônioé dada pela função de ativação da saída dos neurônios que estão conectados ao neurônioj por meios dos pesos w[ ji] conforme a Equação 3-4, onde p é o número de neurônios dacamada anterior ao neurônio j.

v j(n) =p

∑i=0

w ji(n)yi(n) (3-4)

Posteriormente, a saída do neurônio j é um valor real produzido através de umafunção não linear, como mostrado na Equação 3-5.

y j(n) = f j(v j(n)) (3-5)

Para realizar o reajuste do peso wi j(n) e minimizar e função de custo, o backpro-

pagation aplica o método do gradiente descendente. O ajuste a ser realizado é proporcio-nal a derivada parcial ∂ε(n)

∂wi j(n)em relação a cada peso da rede. De acordo com da regra da

cadeia de cálculo, o gradiente pode ser obtido através da seguinte Equação 3-6.

∂ε(n)∂wi j(n)

=∂ε(n)∂e j(n)

∂e j(n)∂y j(n)

∂y j(n)∂v j(n)

∂v j(n)∂w j(n)

(3-6)

Aplicando a diferenciação da Equação 3-1 em relação a y j(n), (3-2) em relaçãoa e j(n), 3-4 em relação a w ji(n), (3-5) em relação a v j(n) e substituindo na Equação 3-6,obtém-se como resultando a Equação 3-7.

∂ε(n)∂wi j(n)

=−e j(n) f′j(v j(n))yi(n) (3-7)

Os ajustes nos pesos de ∆wi j é realizado em direção oposta ao gradiente atravésda Regra Delta. A constante η na Equação 3-8 representa a taxa de aprendizagem, o sinalde negativo indica a descida do gradiente em relação ao espaço de pesos.

Page 39: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.4 Algoritmo de Retropropagação - Backpropagation 38

∆w ji(n) =−η∂ε(n)

∂wi j(n)(3-8)

A aplicação da Equação 3-7 na Equação 3-8 gera a Equação 3-9.

∆w ji(n) = ηδ(n)yi(n) (3-9)

Onde o gradiente local δ j(n) é definido pela Equação 3-10

δ j(n) =−∂ε(n)∂e j(n)

∂e j(n)∂y j(n)

∂y j(n)∂v j(n)

= e j(n) f′j(v j(n)) (3-10)

Conforme mostrado nas equações 3-9 e 3-10 a atualização dos pesos dependesinal de erro e j(n) para o gradiente local. Para tal, é necessário saber a localização doneurônio j, sendo que o mesmo pode estar na camada de saída ou na camada oculta. Casoo neurônio j esteja localizado na camada de saída, o erro pode ser calculado através daEquação 3-1. Portanto, o δ j(n), é igual ao produto da derivada da função de ativação e oerro e j(n), como pode ser observado na Equação 3-11.

δ j(n) = e j(n) f′j(v j(n)) (3-11)

No entanto, caso o neurônio j esteja localizado na camada intermediária, o sinalde erro e j(n) pode ser calculado em termos dos neurônios em que j esteja conectado.Dessa maneira, para calcular o gradiente local δ j(n), a Equação 3-10 pode ser reescritada seguinte forma.

δ j(n) =−∂ε(n)∂y j(n)

∂y j(n)∂v j(n)

=− ∂ε(n)∂y j(n)

f′j(v j(n)) (3-12)

A Equação 3-13 é utilizada para calcular a derivada parcial ∂ε(n)/∂y j(n) e obtero erro quadrático do neurônio k.

ε(n) =12 ∑

k(ek(n))2 (3-13)

Diferenciando a Equação 3-13 em relação ao sinal y j(n), obtêm-se a Equação3-14.

∂ε(n)∂y j(n)

= ∑k

ek(n)∂ek(n)∂y j(n)

(3-14)

Utilizando a regra da cadeia para a derivada parcial ∂ek(n)/∂y j(n), a Equação3-14 pode ser reescrita da seguinte maneira.

Page 40: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.4 Algoritmo de Retropropagação - Backpropagation 39

∂ε(n)∂y j(n)

= ∑k

ek(n)∂ek(n)∂vk(n)

∂vk(n)∂y j(n)

(3-15)

O sinal de erro do ek(n), onde k é o neurônio de saída, pode ser obtido pelaEquação 3-16.

ek(n) = ydk(n)yk(n) = ydk(n) fk(vk(n)) (3-16)

Já o nível de ativação do neurônio k é calculado através da Equação 3-17, ondeq, representa o número de entradas conectadas ao neurônio k.

vk(n) =q

∑j=0

wk j(n)y j(n) (3-17)

Realizando a diferenciação da Equação 3-16 em relação a y j(n) e substituindo naEquação 3-14, obtém-se a Equação 3-18, onde δ j(n), representa o campo local induzidodo neurônio k.

∂ε(n)∂y j(n)

=−∑k

ek(n) f′k(vk(n))wk j(n) =−∑

kδk(n)wk j(n) (3-18)

Por fim, substituindo a Equação 3-18 na Equação 3-13, obtemos o gradiente localδ j(n) para o neurônio intermediário j, que pode ser calculado através da Equação 3-19.

δ j(n) = f′j(v j(n))∑

kδk(n)wk j(n) (3-19)

Como pode ser observado na Equação 3-19, caso o neurônio j esteja localizadona camada intermediária, o gradiente local δ j(n) será obtido pelo produto da derivadada função de ativação com a soma ponderada dos gradientes locais calculados para osneurônios conectados ao neurônio j.

Resumidamente, durante a primeira fase, o backpropagation realiza o processoforward sem alterar os pesos das camadas da rede neural. A fase forward inicia com aentrada das informações através da camada de entrada e encerra com o cálculo de erro nacamada de saída.

A segunda fase backward inicia através da camada de saída e propaga por todasas camadas da rede até a camada de entrada. Os pesos são ajustados inicialmente nacamada de saída, e propagados recursivamente ajustando os pesos de todas as camadasintermediárias até a camada de entrada.

Page 41: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.5 Funções de Ativação 40

3.5 Funções de Ativação

As funções de ativação são elementos essenciais para a ativação dos neurôniosde uma MLP, através delas é possível calcular o gradiente local de um neurônio. Seuprincipal objetivo é a introdução da não linearidade. Para tal, é necessário que a funçãode ativação seja diferenciável, caso contrário, a rede neural não passaria de um modelo deregressão linear.

Em outras palavras, as funções de ativação limitam a amplitude da saída de umneurônio (Karlik & Olgac, 2011). Existem diversas funções de ativação, umas das maisutilizadas é a função logística, ela é diferenciável e mapeia os valores de 0 a 1 conformea Equação 3-20.

yi(n) = f j(v j(n)) =1

1+ exp−v j(n)(3-20)

Onde v j(n) é a ativação do neurônio j no instante n. Dada a não linearidade, asaída do neurônio j está no intervalo de 0 ≤ y j ≤ 1. Diferenciando a Equação 3-20 emrelação a v j(n), obtemos a Equação 3-21.

f ′(v j(n)) =exp(−v j(n))

[1+ exp(−v j(n)))]2= y j(n)[1− y j(n)] (3-21)

A função tangente hiperbólica assemelha-se a função logística mantendo oformato de S., no entanto, essa função é capaz de mapear valores no intervalo de−1≤ y j ≤ 1. A tangente hiperbólica possui a seguinte forma.

yi(n) = f j(v j(n)) = a tanh(bv j(n)) (3-22)

Diferenciando a Equação 3-22 em função de v j(n), obtemos a Equação 3-23.

f ′(v j(n)) =ba[a− y j(n)][a+ y j(n)] (3-23)

A Rectified Linear Units - ReLU, é uma função de ativação amplamente utilizadaao projetar redes neurais nos trabalhos recentes. Assim como as demais funções, a ReLUé diferenciável, o que permite o ajuste dos pesos.

Contudo, a principal vantagem de usar a função ReLU sobre outras funções deativação é que ela não ativa todos os neurônios ao mesmo tempo. Caso a entrada sejanegativa, ela será convertida em zero e o neurônio não será ativado. Isso significa que,ao mesmo tempo, apenas alguns neurônios são ativados, tornado a rede mais eficientee facilitando a computação (Nair & Hinton, 2010). A Figura 3.4 apresenta o gráfico dafunção ReLU.

Page 42: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.6 Taxa de Aprendizagem 41

Figura 3.4: Rectified Linear Activation (Goodfellow et al. , 2016).

3.6 Taxa de Aprendizagem

Durante o processo de treinamento, o ajuste dos pesos é realizado através dadescida do gradiente. A direção é dada pelo gradiente da superfície de erro no pontoatual no espaço. A magnitude da modificação é uma proporção constante da magnitudedo gradiente. Especificamente, cada peso é ajustado por uma proporção constante η daderivada parcial do erro em relação ao peso. Essa proporção é comumente referida comotaxa de aprendizado ou tamanho do passo (Jacobs, 1988).

Em outras palavras, a taxa de aprendizagem η é uma constante de proporciona-lidade que varia de 0 a 1. Este ajuste é o que indicará o passo da descida do gradiente emdireção ao mínimo global.

A escolha da taxa de aprendizagem deve considerar o problema a ser resolvido.A aplicação de uma taxa de aprendizagem muito alta pode provocar instabilidade na redevisto que os saltos do gradiente serão altos e podem provocar a saturação dos neurônios.

Por outro lado, o uso de uma taxa de aprendizagem com um valor muito pequeno,irá provocar poucas mudanças na descida do gradiente. Isso provoca o aumento do custode computação, elevando o tempo de processamento visto que muitas iterações serãonecessárias até que a rede alcance a convergência.

Rumelhart et al. (1986) apresentam uma alternativa para aumentar a taxa deaprendizagem contornando o problema de instabilidade. O método consiste em modificara regra delta introduzindo o momentum. A Equação 3-24 apresenta a Regra Delta Gene-ralizada, onde η é a constante momentum que varia no intervalo de [0,1).

∆w ji(n) = α ji(n−1)+ηδ j(n)yi(n) (3-24)

Um dos principais benefícios da introdução do momentum no treinamento de

Page 43: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.7 Limited-Memory L-BFGS 42

uma rede neural, consiste em evitar que a convergência ocorra em um mínimo local.

3.7 Limited-Memory L-BFGS

Diversos trabalhos empregam o método de gradiente descendente estocástico,do inglês, Stochastic Gradient Descendent (SGD) para resolver questões de aprendizadode máquina. Uma das cateterísticas que o tornam bastante difundido, consiste na fácilimplementação e bom desempenho quando existem muitos dados para o treinamento.

Algumas desvantagens do uso dos SGDs consiste na escolha manual dos parâ-metros, tais como, taxa de aprendizagem e critério de parada. Algumas alternativas con-sistem em executar múltiplos testes com diferentes parâmetros e escolher o que apresentaum bom resultado no conjunto de validação (Le et al. , 2011).

Os métodos Quasi-Newton apresentam-se como uma solução de acelerar atécnica de descida do gradiente para a minimização de funções (Shanno, 1970). Nosmétodos Quasi-Newton, a matriz Hessiana são é calculada, em vez disso, elas sãoestimadas por meio de avaliações aproximadas do gradiente. O método BFGS é o maispopular quasi-Newton, descoberto pelos pesquisadores Broyden, Fletcher, Goldfarb, andShanno (Nocedal & Wright, 2006).

Os L-BFGS constituem métodos poderosos para resolver problemas onde asmatrizes Hessianas não podem ser computadas com um custo razoável ou são muitodensas para serem manipuladas facilmente (Wright & Nocedal, 1999).

Assim como o BFGS, o algoritmo L-BFGS não computa as derivadas de segundaordem ou precisa de qualquer conhecimento sobre a função de custo. O termo limited éutilizado, pois, foi proposto em situações onde o sistema de armazenamento é limitado(Nocedal, 1980). Uma das características principais do algoritmo em relação a outrosmétodos Quasi-Newton, consiste pelo uso de matrizes BFGS de memória limitada paraaproximar a matriz Hessiana da função de custo (Byrd et al. , 1995).

Em vez de armazenar toda matriz Hessiana completa de aproximadamente n x n

de comprimento, o algoritmo salva apenas alguns vetores de tamanho n que representama aproximação. A ideia principal do L-BFGS consiste em usar a curvatura da informaçãodas mais recentes iterações para construir a aproximação Hessiana (Wright & Nocedal,1999).

3.8 Redes Neurais Recorrentes

Como pode ser visto nas seções anteriores, as redes neurais feedforward demuitas camadas totalmente conectadas recebem os sinais na camada de entrada, ou seja,os dados a serem processados pela rede, e os passa adiante através das camadas ocultas até

Page 44: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.8 Redes Neurais Recorrentes 43

a camada de saída. Porém, na arquitetura de uma rede neural recorrente a camada ocultapode receber tanto informações da camada de entrada quanto informação dela mesma nainteração de tempo anterior (feedback).

O fato das redes recorrentes serem capazes de utilizar o estado anterior permiteque elas tenham potencial para trabalhar em modelagens sequenciais, por exemplo, sériestemporais ou espaciais onde a ordem é um fator relevante (Rumelhart et al. , 1986).O efeito prático deste processo permite que o estado oculto passa a funcionar comouma “memória” de curto prazo através dos feedbacks existentes na rede. O processo derealimentação do estado oculto pode ser observado através da Figura 3.5.

Figura 3.5: Processo de realimentação de um neurônio recorrente (Goodfellow et al. ,2016)

Neste exemplo, a rede recorrente acima recebe os sinais da camada de entrada xt

e atribui o estado ht que é passado adiante no tempo juntamente com o sinal de entrada x

(cabe ressaltar que o tempo nesse contexto não significa uma unidade de tempo, mas sima ordem dentro de uma sequência). O lado esquerdo do diagrama mostra o processo deatribuição do estado h, o quadrado preto indica que há defasagem de 1 intervalo de tempo.O lado direito do diagrama desenrola (unfold) o grafo mostrando que cada nó passa a serassociado com uma instância de tempo específica.

As redes neurais recorrentes são redes capazes de simular um sistema dinâmicodiscreto que tem como entrada xt = {x1, ...,xt , ...,xt−1, ...,xt , ...,xt+1, ...,xT} e o estadooculto ht , no geral, uma rede recorrente genérica pode pode ser construída conforme daEquação 3-25 (Pascanu et al. , 2013),

ht = φ(ht−1,xt ,θ) (3-25)

onde ht representa o estado atual e θ é usado para parametrizar a função não linear φ

(geralmente Tangente Hiperbólica ou ReLu) em todos os passos.Como mencionado, o estado oculto pode fornecer informações para a camada de

saída a fim de realizar uma previsão bem como fornecer informações para o estado ocultodo próximo passo. A Figura 3.6 apresenta o processo de um ciclo de uma rede recorrentepara computar a função de perda.

Page 45: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.8 Redes Neurais Recorrentes 44

Figura 3.6: Ilustração do processo de “desenrolar” em uma rede recorrente. (Goodfellowet al. , 2016)

O diagrama da Figura 3.6 apresenta o graficamente o processo de uma rederecorrente desde a entrada até a saída computada pela função de perda L. Inicialmenteo vetor de entrada x em sentido ao estado oculto é parametrizado pela matriz de pesosU , posteriormente o estado oculto ht com 1 intervalo de defasagem é parametrizado pelamatriz de recorrência W . O valor de ht−1 é propagado adiante como mostra o lado direitoda Figura 3.6. O novo valor do estado oculto ht em direção a saída é dado pela função φ

conforme a Equação 3-26.

ht = φ(b+Wht−1 +Uxt) (3-26)

O novo valor de ht em sentido a saída é então parametrizado com a matriz V eadicionado ao estado da célula c como mostra a Equação 3-27.

ot = c+V ht (3-27)

Assumindo que a saída ot seja discreta tal como em problemas de classificação,por exemplo, pode-se representar a saída como um vetor de probabilidades logarítmicasnão normais para cada valor de uma variável discreta.

Para obter um vetor y normalizado para a saída ot pode-se aplicar a função

Page 46: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.8 Redes Neurais Recorrentes 45

softmax() conforme a Equação 3-28.

yt = softmax(ot) (3-28)

P(yt |xt , ...,x1) = yt (3-29)

O vetor de probabilidades normalizadas P representa a probabilidade de yt dadaque ocorreu xt , expresso pela Equação 3-29. Através dele é possível calcular o erro entrea saída da rede y e o valor alvo de treinamento y. A função de perda pode ser calculadaatravés da entropia cruzada (cross-entropy) visto que o erro total é a soma das perdas aolongo de todos os passos no tempo conforme as Equações 3-30 e 3-31.

Et(yt , yt) =−yt log yt (3-30)

E(yt , yt) = ∑t

Lt(yt , yt) (3-31)

=−∑t

yt log yt (3-32)

3.8.1 Treinamento de Redes Recorrentes

Conforme mencionado na seção (3.4) A retropropagação em redes feedforward

retrocede do erro que é calculado na saída da rede dado um conjunto de entrada e pesos.O algoritmo reajusta os pesos calculando os gradientes do erro em relação a cada camadaconsoante a regra de correção de erro.

As redes recorrentes dependem de uma modificação do algoritmo de retropropa-gação. Werbos et al. (1990) propôs o algoritimo denominado Backpropagation Through

Time (BPTT), que é uma derivação do conhecido backpropagation.Originalmente foi proposto tendo ativação contínua e atualização discreta. No

BPTT a rede é treinada pela primeira vez com os dados de treinamento e o gradientede erro de saída é salvo para cada etapa do tempo. Então, a rede é “desdobrada” notempo, replicando a rede recorrente em uma rede feedforward. A feedforward geradaé uma versão da rede recorrente com derivação correspondente a cada intervalo de tempoT, onde T é o número de passos de tempo da sequência. A versão feedforward da redecontém a replicação dos pesos correspondentes a cada intervalo de tempo. O erro é entãocalculado com a regra padrão de retropropagação para cada peso. Por fim, os termosde correção calculados para rede feedforward são acumulados para obter os termos decorreção para os pesos na rede recorrente finalizando uma época de treino.

Page 47: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.8 Redes Neurais Recorrentes 46

Como pode se analisado nas Equações de 3-30 à 3-32 a perda pode ser calculadaatravés de entropia cruzada, dessa forma, o gradiente pode ser calculado a partir da funçãode perda. Assim, o erro total é a soma de cada erro no tempo t, definido pela Equação 3-33.

∂E∂W

=T

∑t=1

∂Et

∂W(3-33)

As Equações 3-26 e 3-28 podem ser reescritas para melhor compreensão doBPTT para as Equações 3-34 e 3-37.

st = φ(Wst−1 +Uxt) (3-34)

yt = softmax(V st) (3-35)

O objetivo da rede é calcular os gradientes de erro em relação as matrizes U , V

e W até o passo t = 0. Fazendo ∂Et∂W , temos:

∂Et

∂V=

∂Et

∂yt

∂yt

∂V(3-36)

∂Et

∂V=

∂E3

∂yt

∂yt

∂zt

∂zt

∂V(3-37)

∂Et

∂V= (yt− yt)⊗ st (3-38)

O valor do erro em ∂Et∂V depende dos valores correntes em t e o gradiente pode ser

calculado em (3-38). Já em relação ∂Et∂W e ∂Et

∂U , visto que st = φ(Uxt +Wst−1) depende dovalor do erro no passo st−1, st−2, ... , st0, ajuste do erro em W é então calculado através daregra da cadeia conforme a Equação 3-39,

∂Et

∂W=

t

∑k=0

∂Et

∂yt

∂yt

∂st

∂st

∂sk

∂sk

∂W(3-39)

Desta maneira, tal como ocorre com backpropagation tradicional, pode-se cal-cular um gradiente local para um determinado estado. Assim, para um zk = Uxk +Wsk

um vetor delta pode ser definido pela Equação 3-40.

δtk =

∂Et

∂zk=

∂Et

∂sk

∂st

∂sk

∂sk

∂zk(3-40)

O BPTT tende a ser poderoso para o treinamento de redes recorrentes. No en-tanto, esse processo é bastante custoso computacionalmente, além dos desafios associados

Page 48: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.8 Redes Neurais Recorrentes 47

à existência de mínimos locais são bem mais acentuados do que no caso de redes neuraisfeedforward.

Bengio et al. (1994) mostra a dificuldade de treinar as redes recorrentes paraproblemas com dependência temporal de longo prazo, isso acontece porque os gradientestendem na maioria dos casos desaparecer (vanish gradientes) ou em casos mais rarosexplodir (exploding gradients).

Diversos estudos buscam algumas alternativas para abordar o problema de de-pendência de logo prazo, como podem ser vistas nos trabalhos de Williams & Zipser(1989), Martens & Sutskever (2011) e Pascanu et al. (2013). Estes trabalhos abordamtécnicas de utilizar um algoritmo mais eficiente que calcular o Gradiente Descendente,como utilizar derivadas de segunda ordem ou truncar o gradiente. Uma técnica bastantedifundida para lidar com esse problema é clipping gradient (Chung et al. , 2014).

3.8.2 Redes Long-Short Term Memory - LSTMs

As redes Long-Short Term Memory - LSTM são um tipo de rede recorrentecapaz de lidar dependências de longo prazo. A LSTM foi proposta por Hochreiter &Schmidhuber (1997). Sua arquitetura LSTM foi idealizada para evitar o problema dadependência de longo prazo que provoca o conhecido vanish ou explode gradientes queocorre quando uma rede recorrente lida com uma sequência significativa de dados.

A maneira que as LSTMs lidam com isso é buscando preservar o erro a serretropropagado através do tempo e das camadas. Ao manter a infamação do erro maisconstante, permitem que redes recorrentes continuem aprendendo ao longo de muitospassos de tempo (acima de 1000), mesmo na em caso de sequências ruidosas (Hochreiter& Schmidhuber, 1997).

O controle do fluxo de uma LSTM é semelhante ao de uma rede recorrentecomum. A principal diferença está nas operações que ocorrem dentro de uma célula (cell

state) LSTM. Essas operações realizam pequenas transformações lineares que permitema LSTM manter ou esquecer uma informação. A Figura 3.7 apresenta do lado esquerdo, odiagrama de uma célula básica de uma rede recorrente comum, já do lado direito apresentao diagrama de uma célula LSTM destacando os processos realizados em seu interior.

Durante o treinamento a célula transporta as informações relevantes adiantena cadeia de sequências da rede levando informações das etapas anteriores para etapasposteriores atuando como uma memória. O efeito prático deste processo é reduzir o efeitoda memória de curto prazo.

A maneira como as informações entram ou saem das células é controladopor unidades denominadas gates, que atuam como portões que gerenciam o fluxo deinformações nas células, ou seja, as informações que ela deve manter ou esquecer.

Page 49: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.8 Redes Neurais Recorrentes 48

Figura 3.7: Comparação entre a célula de uma rede recorrente comum e uma célula dotipo LSTM (Donahue et al. , 2015).

Os portões são diferentes redes neurais compostas uma função de ativaçãosigmoide que mapeiam os valores de entrada entre [0,1] seguidas de uma operação demultiplicação.

O forget gate decide descartar ou não uma informação. Ele analisa o estado ht−1

e a entrada xt Caso a saída do sigmoide seja próximo de 1 a informação é “mantida” econtinua no estado da célula, visto que o produto de qualquer número por 1 é ele mesmo.No entanto, se a saída da função for próxima de 0 a informação é “esquecida” e retiradado estado da célula. A Equação 3-41 mostra o processo realizado no forget gate.

ft = σ(Wf .[ht−1,xt ]+b f ) (3-41)

De modo semelhante, para decidir quais novas informações devem atualizar oestado da célula, a LSTM prover o input gate. As informações do estado anterior ht−1 e xt

serão processadas pela função sigmoide gerando um vetor de valores entre 0 e 1 Equação3-42. A saída da tangente hiperbólica irá gerar um vetor Ct com possíveis candidatos aserem lembrados pela rede como mostra a Equação 3-43. Após o fluxo da rede realizaro produto da saída das duas funções, a saída do sigmoide decidirá quais informações dasaída da tangente hiperbólica será mantida.

it = σ(Wi.[ht−1,xt ]+bi) (3-42)

Ct = tanh(WC.[ht−1,xt ]+bC) (3-43)

O próximo passo será atualizar o estado da célula conforme a Equação 3-44

Ct = ft ∗Ct−1 + it ∗Ct (3-44)

Page 50: Predição de Diâmetros e Cálculo de Volume de Clones de ...

3.8 Redes Neurais Recorrentes 49

Para finalizar o ciclo, após a célula recém atualizada o estado oculto tambémdeve ser atualizado e passado adiante na cadeia. Esse procedimento é realizado atravésdo output gate. Semelhante aos demais portões, ele recebe as informações do estadoanterior ht−1 e xt e as processa através da função sigmoide definida pela Equação 3-45. As informações da célula recém criada são passadas por uma tangente hiperbólica emultiplicada com a saída da função sigmoide conforme a Equação 3-46, atualizando oestado oculto.

ot = σ(Wo[ht−1,xt ]+bo) (3-45)

ht = ot ∗ tanh(Ct) (3-46)

Desta forma, as informações do estado da célula e do estado oculto atualizado sãopassados adiante para a próxima etapa de tempo mantendo as informações do gradiente.

Desde sua publicação, novas pesquisas apresentaram variações da LSTM. Dentreas variações mais conhecidas, a Gated Recurrent Unit - GRU introduzida por Cho et al.

(2014) vem apresentando bons resultados. Um estudo bem elaborado sobre as variaçõesde LSTM pode ser encontrado no trabalho de Greff et al. (2016)

Page 51: Predição de Diâmetros e Cálculo de Volume de Clones de ...

CAPÍTULO 4Aplicação de Redes Neurais na área Florestal

Abordagens que utilizam Redes Neurais no setor florestal para estimar parâme-tros, classificar espécies, doenças entre outros, já foram aplicadas com resultados bastantesatisfatórios.

Este capítulo apresenta uma revisão das aplicações de RNA na gestão de recursosflorestais. São mostradas diversas aplicações que vão desde as estimativas de medidas deárvores, manejo florestal, detecção de doenças até predições climáticas.

4.1 Predição de diâmetros, Altura e Volume em Árvores

Uma das principais vantagens da utilização de redes neurais na predição de pa-râmetros consiste na capacidade de aproximar funções. Muitos desses atributos possuemrelações não lineares, assim, as redes neurais apresentam ótimas opções em relação aosmétodos tradicionais.

O trabalho de Xiao et al. (1998) utiliza redes neurais de múltiplas camadaspara estimar a altura de árvores utilizando dados de alta frequência obtidos através deinstrumentos de interferometria.

Leduc et al. (2001) faz uso de redes neurais para estimar diâmetros de árvoresda espécie Pinus. Os autores realizam classificação de árvores, além de comparar comoutros métodos estatísticos.

Diamantopoulou (2005) apresenta uma arquitetura de rede neural para estimardiâmetros e calcular o volume de árvores do gênero Pinus. Os resultados obtidos nestetrabalho apresentam a rede neural como uma excelente alternativa aos métodos deregressão.

Huang et al. (2009) utiliza uma rede neural de para estimar a frequência dosdiâmetros de árvores do gênero Pinus. A estrutura é composta por três variáveis deentrada: diâmetro relativo, diâmetro médio e coeficiente de variação. A saída da rede éa frequência de haste da classe de diâmetro. Os resultados obtidos chagam a 98% deacurácia. Binoti et al. (2014) realiza ajuste do modelo de Schumacher e Hall para estimarvolume de eucaliptos através de redes neurais.

Page 52: Predição de Diâmetros e Cálculo de Volume de Clones de ...

4.2 Demais aplicações florestais 51

Niska et al. (2010) realizou a classificação de espécies e estimação do cálculo devolumes de árvores de três diferentes tipos através varreduras de laser e imagens aéreas.

Em Özçelik et al. (2010) redes neurais foram utilizadas para cálculo de volumede fustes de árvores de quatro diferentes espécies. Diamantopoulou (2010) realiza otratamento de lacunas de diâmetros com a árvore em pé. Dados faltantes são essenciaispara uma boa precisão no inventário florestal.

O trabalho de Guo et al. (2011) mostrou que redes neurais são eficientes pararesolver problemas complexos não lineares como a distribuição de diâmetros.

Os trabalhos Soares et al. (2010), Soares et al. (2011) abordaram a prediçãorecursiva para estimar diâmetros de clones do eucalipto pra o cálculo de volume. Aabordagem utilizada consiste dar como entrada para a rede, medidas a 0.3, 0.7 e 1.3 dealtura em relação ao solo. A saída da rede era o próximo diâmetro de 1 em 1 metro até aaltura total. Em Soares et al. (2013) essa mesma abordagem é utilizada para o cálculo devolume comercial de eucalipto sem o conhecimento prévio da altura da árvore.

Com o objetivo de diminuir a quantidade de árvores cubadas para o processo degeração de equações volumétricas, (Marques da Silva et al. , 2009) realizam a estimaçãode volumes de árvores de eucalipto. Como variáveis de entrada, os autores utilizaram odiâmetro à altura do peito 1,30 m (DAP), a altura e os diâmetros nas posições de 0,0; 0,5;1,0; 1,5; 2,0; e 4,0 m do solo e os volumes obtidos até 2 e 4 m.

Técnicas de redes neurais e lógica fuzzy são utilizadas em Vieira et al. (2018)para estimar o crescimento de florestas de eucalipto, predizendo diâmetro e altura de cadaárvore através do DAP.

Embora apliquem metodologia e espécies diferentes em seus trabalhos, um pontoem comum entre eles se dá na eficácia das RNAs e sua capacidade de trabalhar emaproximação de funções. Os resultados obtidos chegam próximos dos métodos manuaisde mensuração. Assim, o uso de RNAs tende a contribuir para a precisão e ganho detempo durante a elaboração de soluções florestais.

Mensurar parâmetros para uso direto em inventário florestal devem ser bastanteprecisos, visto que medições errôneas podem provocar problemas durante a avaliaçãodos resultados. Isto influência de maneira direta a construção do inventário florestal econsequentemente na tomada de decisão através dele.

4.2 Demais aplicações florestais

Os métodos utilizados nos diferentes trabalhos apresentados na seção anteriorapresentam resultados significativos para o setor florestal. Em comparação com os resul-tados obtidos através de técnicas tradicionais como regressão linear ou até mesmo por

Page 53: Predição de Diâmetros e Cálculo de Volume de Clones de ...

4.2 Demais aplicações florestais 52

técnicas manuais realizadas em campo as RNAs apresentam um caminho para a automa-ção destes processos.

O aumento do poder computacional permitiu a evolução de técnicas como oaprendizado profundo - Deep Learning. Embora as redes Multilayer Perceptron (MLP)sejam um tipo de aprendizado profundo, outras técnicas empregam abordagens com maisneurônios, camadas e outros mecanismos para moldar o comportamento dos neurônios.Tais abordagens requerem maior poder computacional.

Avaliação de áreas florestais após incêndios podem auxiliar profissionais flores-tais a utilizarem medidas prever a regeneração de árvores nas áreas queimadas. O trabalhode Debouk et al. (2013) aborda esse problema utilizando MLPs para analisar dados deLight Detection And Ranging - LiDAR , e classificar duas áreas em estágios de recupera-ção, através de medidas como altura das árvores. Os resultados obtidos chegam a 83% deprecisão. Isso fornece a administração florestal, dados importantes para auxiliar a regene-ração dessas áreas.

Favan (2015) utiliza a RNA aplicada na discriminação de padrões de doenças flo-restais, utilizado para isso o reconhecimento de padrões de manchas foliares de bacteriosee manchas foliares ocasionadas por Cylindrocladium spp. em Eucalipto.

O trabalho de Pohjankukka et al. (2016) utiliza MLPs para prever a capacidadedo solo em suportar a trafegabilidade de maquinários durante a colheita florestal, criandorotas planejadas para evitar danos as raízes.

Através deste princípio outras arquiteturas de RNAs mostraram bastante podero-sas em determinadas tarefas. Khan et al. (2017) utiliza Convolutional Neural Networks

(CNN) em imagens de satélite na detecção de mudanças em uma floresta. . Os resultadosobtidos se tornam o novo estado na arte na detecção de mudanças florestais.

Ayrey & Hayes (2018) utiliza CNNs para interpretar dados aéreos obtidosatravés da tecnologia LIDAR, para auxiliar na elaboração precisa de inventário florestalrealizando a contagem de árvores.

Técnicas de aprendizado profundo foram empregadas no trabalho Silva et al.

(2018), onde o autor utilizou técnicas de visão computacional para aquisição e tratamentode imagens e algoritmos clássicos de aprendizado de máquina e CNNs para a contagemde eucaliptos em uma determinada região. Os resultados alcançados por essa abordagemchegou a 95% de precisão.

Uma avaliação de métodos de classificação foram realizadas nos trabalhos dedos Reis et al. (2018) e Brosofske et al. (2013). Em ambos os artigos, classificadoresclássicos de aprendizado de máquina foram utilizados na estimação de atributos comoárea basal e volume.

Brosofske et al. (2013) realiza um mapeamento amplo de atributos florestais,considerando pontos negativos e positivos desde a extração de características até os

Page 54: Predição de Diâmetros e Cálculo de Volume de Clones de ...

4.2 Demais aplicações florestais 53

modelos que melhor atendem tais demandas. Em ambos trabalhos, as Redes NeuraisArtificiais apresentaram desempenhos ótimos para predição e classificação de diversosatributos florestais. Entretanto, ambas avaliações ressaltam que embora as RNAs tenhambastante êxito, muitas features são melhores trabalhadas com demais algoritmos queapresentam abordagens mais clássicas onde se tem um controle maior das variáveis.

Em relação aos benefícios práticos para o setor florestal, pode-se elencar autilização saudável dos recursos florestais, contagem de árvores, diminuição no tempoda seleção de madeira para produção, combate ao desmatamento ilegal, classificaçãode estágios da floresta e acompanhamento na regeneração de áreas queimadas como osprincipais elementos beneficiados de acordo com os trabalhos publicados.

Page 55: Predição de Diâmetros e Cálculo de Volume de Clones de ...

CAPÍTULO 5Metodologia Proposta para Estimativa deDiâmetros

Neste capítulo é apresentado a metodologia proposta neste trabalho. Além disso,são apresentados os dados e recursos utilizados além de alguns dos métodos tradicionaisutilizados no inventário florestal. Estes métodos são utilizados para fins comparativos.Também são apresentadas as métricas estatísticas utilizadas para avaliar os modelosgerados.

5.1 Predição de Diâmetros como uma série temporal

A predição é um dos elementos fundamentais para a tomada de decisão de váriasaplicações. Em um inventário florestal, predição de variáveis importantes como diâmetros,volume, altura, etc, são extremamente úteis para reduzir o custo do processo florestal eacelerar o levantamento de informações.

De acordo com Soares (2012) a predição de diâmetros pode ser entendida comoum problema de séries temporais. Portanto, o problema de predição pode ser encaradocomo um problema de modelagem. Basicamente, um modelo é construído através dasrelações de entrada e saída, nesse contexto, a predição direta e recursiva representamalguns dos modelos aplicados na previsão de séries temporais (Ji et al. , 2005).

A abordagem de predição direta constrói M+1, diferentes modelos para prevervalores de uma série,

di+m = fm(di−1,di−2, ...,di−n), (5-1)

onde m = 0,1, ...M, com M definido como o tamanho máximo do horizonte de predição.A variável di representa os diâmetros na altura i, que formam o regressor, onde n é otamanho do regressor.

A predição recursiva constrói o modelo realizando inicialmente um passo afrente.

Page 56: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.2 Metodologia utilizada 55

di = f (di−1,di−2, ...,di−n+1), (5-2)

Diferente da predição direta, na predição recursiva o próximo valor a ser preditotem como entrada o resultado dele mesmo no passo anterior como pode ser observado naEquação 5-3.

di+1 = f (di,di−1,di−2, ...,di−n) (5-3)

Algumas das vantagens da predição direta consistem na existência um modeloespecífico para cada passo, possuir entradas fixas e os erros de um passo não interfere naestimativa dos demais passos. Entretanto, existe a necessidade de criar um modelo a cadapasso e estabelecer um horizonte de predição. Além disso, entradas fixas com valoresiniciais com poucas diferenças podem produzir modelos tendenciosos.

Por outro lado, os valores na predição recursiva são estimados por um únicomodelo, suas entradas são substituídas a cada passo, assim, valores iniciais podem sertratados de forma diferente, não existindo a necessidade de estabelecer um horizonte deeventos e evita a criação de modelos com alguma tendência. No entanto, assim como osvalores de entrada são trocados a cada estimativa, os erros de predição são passos adiante.

5.2 Metodologia utilizada

Durante a revisão de literatura pode-se observar que muitos dos atributos quecompõe o inventário florestal não se relacionam de maneira linear. Como visto na seçãoanterior, a predição de diâmetros pode ser entendida como uma série temporal.

Dada a capacidade das redes neurais tratarem de problemas não-lineares e suaaplicação em diversos trabalhos na área florestal, foram elaborados 5 modelos de diferen-tes arquiteturas de redes neurais. Três modelos com o objetivo de estimar recursivamentediâmetros para posteriormente calcular volume de clones de eucalipto e dois modelos paracalcular diretamente o volume das árvores.

Soares (2012) mostra que os diâmetros nas alturas d0.3, d0.7 e d1.3, apresentamuma forte autocorrelação. Os modelos que utilizam o método de predição recursivarecebem como entrada esses mesmos parâmetros acima e retonam o diâmetro seguinte d

na altura d2.0, visto que a predição é recursiva, as próximas entradas para o modelo serãodi−1,di−2 e d, assim sucessivamente até que a altura da árvore seja alcançada gerando umvetor com todos os diâmetros estimados.

Dentre os modelos que utilizam o método de predição direta, um modelo tem porentrada em sua rede neural o DAP diâmetro na altura d1.3 e a altura total da árvore. Comoresultado, o modelo retornará o volume total da árvore v. O segundo modelo de predição

Page 57: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.3 Materiais e Métodos 56

direta receberá como entrada os valores dos diâmetros nas alturas d0.3, d0.7 e d1.3, masneste caso, não há a necessidade do conhecimento prévio da altura da árvore, a saída domodelo será assim como o anterior o volume v total da árvore.

5.3 Materiais e Métodos

5.3.1 Dados

Os dados totais utilizados nesse estudo consistem em 1.819 árvores de 48parcelas que foram abatidas e cubadas rigorosamente através do método de Smalian.Estas árvores são provenientes de 3 sítios florestais de propriedade de uma empresa depapel e celulose, localizada no município de Aracruz na região metropolitana do estadodo Espírito Santo (Cabacinha, 2003). A Tabela 5.1 mostra a distribuição das árvores emcada sítio.

Tabela 5.1: Distribuição das árvores

Sítio N. de árvores

I 585II 619III 615

Total 1819

Durante o processo de cubagem, foram medidaaas, com suta, os diâmetros nasalturas 0,10; 0,30; 0,50; 0,70; 0,90, 1,10; 1,30; 2,00m em relação ao solo, no restante dotronco em intervalos de 1 em 1m até a altura do diâmetro comercial de 4cm. O processode medição pode ser observado na Figura 5.1.

Com o objetivo de testar a capacidade de generalização dos modelos construídos,as 615 árvores do sítio 3 foram selecionadas para o treinamento das redes neurais, aescolha se deu por se tratar de um sítio que apresentou mais problemas em relação aosdemais quanto ao crescimento e mortalidade de árvores. Os demais sítios serão utilizadospara validação dos modelos treinados.

Embora os clones de eucalipto sejam de um mesmo sítio, diversos trabalhosmostraram que características das árvores variam de acordo com o DAP (Schneider et al.

, 1996; Machado & Calegario, 2007). Portanto, neste trabalho as árvores foram separadasem classes com a amplitude de 3 cm, que gerou 6 classes diamétricas. No entanto, aúltima classe ficou com apenas uma árvore, o que impossibilita o treinamento de maneiracoerentente de uma rede neural. Esta árvore foi incorporada a classe cinco dada suaproximidade diamétrica.

Page 58: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.3 Materiais e Métodos 57

h0

h0.3

h0.7

h1.3

h2

h3

ht

d0.3

d0.7

d1.3

d2

d3

d htd 4cm

.

.

....

y

x

Figura 5.1: Altura das medidas.

5.3.2 Estatísticas

A análise do conjunto de dados através da estatística é necessário para melhorcompreensão do conjunto de dados. As principais estatísticas levantadas são apresentadasna Tabela 5.2.

Tabela 5.2: Estatísticas do conjunto de dados.

Classe Limites Qtd. Autocorr(di) DAP AlturaInf. Sup. Min Max Média Var1 DP2 Min Max Média Var1 DP2 Min Max

1 7,15 10,15 14 0,63 0,84 8,68 0,95 0,97 7,15 10,10 17,60 3,49 1,87 14,20 19,702 10,15 13,15 106 0,77 0,87 12,01 0,54 0,73 10,32 13,14 22,83 2,75 1,66 18,00 26,703 13,15 16,15 302 0,78 0,89 14,62 0,68 0,82 13,15 16,14 25,74 1,57 1,25 18,40 29,404 16,15 19,15 178 0,83 0,90 17,23 0,64 0,80 16,15 19,14 27,52 1,39 1,18 24,20 30,105 19,15 22,15 15 0,82 0,90 20,21 1,7 1,31 19,31 24,55 29,23 1,06 1,03 27,20 30,60

1 Variância.2 Desvio Padrão.

Para analisar a relação de um diâmetro com seus vizinhos, foi utilizado o cálculode autocorrelação. O cálculo foi realizado para cada árvore com deslocamentos de 1 a 3.

Como pode ser observado na Tabela 5.2 a autocorrelação para 1 intervalo varioude 0,63 e 0,90. Já para 3 intervalos a menor e a maior autocorrelação foram de 0,55 e0,81, respectivamente.

Dada as estatísticas, observa-se que a correlação entre às três primeiras medi-das de uma árvore de uma classe aleatória é bastante forte e variam entre 0,78 a 0,88.A medida que os diâmetros se distanciam a correlação diminui, porém, ainda apresen-tam resultados superiores a 0,68. A Figura 5.2 mostra a relação entre os 10 primeirosdiâmetros.

Page 59: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.3 Materiais e Métodos 58

Figura 5.2: Relação entre os dez primeiros diâmetros de uma árvore.

5.3.3 Normalização

Para facilitar o processo de convergência das redes neurais e melhorar as previ-sões, os diâmetros das árvores de todas as classes passaram pelo processo de normaliza-ção. Os dados foram normalizados no intervalo de [-1,1] conforme a Equação 5-4.

X ′ = a+(X−Xmin)(b−a)

Xmax−Xmin, (5-4)

onde X ′ é o valor do diâmetro normalizado, a e b representam o intervalo de normalização,Xmin e Xmax representam o valor do menor e do maior diâmetro respectivamente doconjunto de dados.

5.3.4 Data Augmentation

Para que uma rede neural possa apresentar resultados eficientes, a qualidade e aquantidade de dados disponíveis para treinamento são elementos cruciais para este pro-cesso. Neste contexto, o data augmentation apresenta-se como uma técnica bastante di-fundida para realizar o incremento de dados além de auxilar a capacidade de generaliza-ção, reduzir o overfiting e melhorar a performance em problemas com dados desbalançe-ados (Simard et al. , 2003; Ciresan et al. , 2010).

O termo data augmentation refere-se a métodos para construir algoritmos deamostragem por meio da introdução de dados não observados ou variáveis latentes. É

Page 60: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.3 Materiais e Métodos 59

uma técnica que consiste em aumentar o volume de dados (Van Dyk & Meng, 2001). Emproblemas que envolvem classificação de imagens, uma imagem pode ser rotacionada,invertida, cortada, etc, esse processo gera novas imagens que podem ser adicionadas abase de dados (Perez & Wang, 2017).

Diferentes técnicas de data augmentation são utilizadas para trabalhar com dadostabulares. Neste trabalho, foram gerados novos valores de diâmetros para o treinamentodo modelo LSTM-DA. O valor do novo diâmetro foi obtido através da Equação 5-5.

dnovo = die

2,5, (5-5)

onde dnovo é o valor do novo diâmetro obtido, di é o valor do diâmetro lido na i-ésimaposição e e, é o valor da constante de euler.

O processo foi repetido por até 4 vezes. Os novos valores dos diâmetros atravésda técnica de data augmentation foram adicionados a base de dados original, quadrupli-cando a quantidade de diâmetros previamente existentes.

5.3.5 Modelagem e treinamento das redes neurais

Conforme descrito na Seção 5.2, foram gerados 5 modelos de diferentes arquite-turas de redes neurais.

Os modelos a seguir utilizam o método recursivo e buscam estimar a forma daárvore prevendo os diâmetros seguintes, são eles: O modelo Vanilla Long-Short Term

Memory - (LSTM-VA) consise em uma simples rede neural recorrente do tipo Long-

Short Term Memory sem modificações; o modelo Long-Short Term Memory com Data

Augmentation - (LSTM-DA) é semelhante à primeira, porém, durante a fase de treinamentoa mesma foi treinada com a técnica de Data Augumentation que amplia o conjuntode dados afim de alcançar melhor capacidade de generalização; e o modelo Multilayer

Perceptron de Predição Recursiva - (MLP-PR) é um modelo que utiliza uma rede neuralclássica do tipo feedforward, que assim como os demais modelos, prediz recursivamenteos diâmetros seguintes.

Os modelos descritos recebem como entrada os diâmetros nas alturas d0,3, d0,7,e d1,3 metros e retornam como saída o diâmetro seguinte a ser previsto de 1 em 1m atéque a altura da árvore seja alcançada.

Os modelos que utilizam a metodologia de predição direta, onde dado as entradasna rede é realizado o cálculo de volume da árvore, foram construídos sob a arquiteturaclássica feedforward de uma rede neural, são eles: O modelo Multilayer Perceptron de

Predição Direta - (MLP-PD) recebe como entrada os diâmetros nas alturas d0,3, d0,7, ed1,3 e retorna o volume total da árvore; por fim, o modelo Multilayer Perceptron com DAP

Page 61: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.3 Materiais e Métodos 60

e Altura Total - (MLP-DAPHT) recebe como entrada o diâmetro na altura do peito (DAP)e a altura total da árvore, retornando o volume total da mesma.

A topologia dos modelos utilizados neste trabalho são apresentados na Tabela5.3.

Tabela 5.3: Estrutura dos modelos construídos.

Modelo N1. CamadaEntrada

N1. CamadaOculta

N1. CamadaSaída

Função deAtivação

Variáveisde entrada

Variáveisde Saída

LSTM-VA 3 16 1 ReLU d0,3, d0,7, e d1,3 dLSTM-DA 3 32 1 ReLU d0,3, d0,7, e d1,3 dMLP-PR 3 20 1 Tanh d0,3, d0,7, e d1,3 dMLP-PD 3 25 1 Tanh d0,3, d0,7, e d1,3 vMLP-DAPHT 2 25 1 Tanh DAP e Altura Total v

1Número de neurônios na camada.

A escolha destes parâmetros foi realizada através de busca exaustiva em gradeGridSearch, onde foram submetidos ao grid: número de camadas ocultas, funções deativação, ciclos ou épocas e algoritmos de treinamento. Escolhas aleatórias de parâmetrostambém foram utilizadas para a parametrização (Bergstra & Bengio, 2012). A escolhafinal dos parâmetros considerou o menor erro quadrático médio (MSE).

O processo de treinamento consistiu em separar o conjunto de treino e teste em70% e 30% respectivamente. Visto que o treinamento das redes neurais foi realizado nosítio 3, o conjunto de validação da capacidade de generalização dos modelos foi testadonos sítios I e II.

Para os modelos que realizam a análise de modo recursivo foram geradasamostras de entrada [di−2,di−1,di] e a saída [di+1] conforme a Equação 5-3, os diâmetrosque serão utilizado como entrada para a os modelos, são constituídos dos diâmetros d0.3,d0.7 e d1.3, a resposta da rede será o diâmetro estimado na altura d2.0. A próxima entradado conjunto será constituída dos diâmetros d0.7, d1.3 e d2.0 para estimar o diâmetro naaltura d3.0. Este processo se repetirá até que a altura da total da árvore seja alcançada.

O algoritmos de treino escolhido para treinar as MLPs foi L-BFGS (Moritz et al.

, 2016). Nesta abordagem não foram utilizadas parâmetros como taxa de aprendizagem emomentum.

As redes LSTMs foram treinadas com Stochastic Gradient Descent (SGD) e oalgoritmo de otimização Adam com taxa de aprendizagem a de 0,0001.

O overfiting é um dos maiores problemas no treinamento de redes neurais, eleocorre quando há um sobre-ajuste dos dados o que prejudica a capacidade de generaliza-ção do modelo. O early stop é uma das principais técnicas utilizadas para tentar minimizaresse problema.

O coeficiente de determinação R2 é uma das métricas utilizadas para avaliar osmodelos de regressão. Ele indica o quanto da variável independente pode ser explicada

Page 62: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.3 Materiais e Métodos 61

pelo modelo. O Mean Absolute Percentage Error - MAPE mostra em termos percentuais adiferença média absoluta entre os valores reais e previstos. A Tabela 5.4 mostra os valoresde R2 e MAPE que os modelos alcançaram durante a fase de treinamento.

Tabela 5.4: Análise das métricas R2 e MAPE.

Treino TesteMétrica Classe LSTM MLP LSTM MLP

VA DA PR PD DAPHT VA DA PR PD DAPHT

1 0,86 0,89 0,82 0,59 0,59 0,90 0,90 0,89 0,61 0,632 0,97 0,98 0,94 0,74 0,87 0,97 0,98 0,95 0,66 0,84

R2 3 0,98 0,99 0,96 0,75 0,85 0,98 0,99 0,96 0,71 0,894 0,98 0,98 0,96 0,63 0,80 0,98 0,97 0,96 0,53 0,685 0,99 0,99 0,96 0,84 0,18 0,98 0,99 0,97 0,43 0,461 8,03 7,95 8,40 0,79 0,73 5,20 7,66 7,79 0,75 0,592 3,81 2,98 5,04 0,92 0,70 3,51 3,11 4,48 0,97 0,70

MAPE 3 2,71 2,44 4,08 1,49 1,01 2,74 2,41 4,17 1,19 0,774 2,74 2,95 3,75 1,93 1,32 2,68 3,14 3,90 1,91 1,545 2,95 2,981 3,96 2,28 4,47 3,32 2,91 4,14 2,35 2,66

O ciclo treinamento de uma rede neural seja é denominado época. Para otreinamento foi estipulado o total de 1.000 épocas para todos os modelos até alcançarema convergência ou o valor do MSE não diminuir por mais de 5 épocas seguidas.

Nos testes realizados, as curvas de treinamento apresentadas entre as Figuras5.3 a 5.7 mostram o quanto o valor da função de custo MSE diminui a cada época detreinamento. Pode-se observar que alguns modelos convergem com 35 épocas enquantooutros levaram as 1.000 épocas estipuladas.

As classes com um conjunto mais numeroso de árvores (letra a) apresentaramboas curvas, a medida que conjuntos menores (letra b) aparentaram treinamento maisruidoso.

(a) Classe 3 (b) Classe 1

Figura 5.3: Curvas de treinamento do modelo LSTM-VA.

Page 63: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.3 Materiais e Métodos 62

(a) Classe 4 (b) Classe 1

Figura 5.4: Curvas de treinamento do modelo LSTM-DA.

(a) Classe 1 (b) Classe 5

Figura 5.5: Curvas de treinamento do modelo MLP-PR.

(a) Classe 4 (b) Classe 5

Figura 5.6: Curvas de treinamento do modelo MLP-PD.

A maior parte dos treinamentos convergiu por volta das 250 épocas. Algunsmodelos como a MLP-PR na classe 1 levou apenas 35 épocas para convergir. Por outrolado, o modelo MLP-DP alcançou as 1.000 épocas até que o erro tornava-se aceitável..

Para a realização dos experimentos, os recursos computacionais utilizados nestetrabalho são apresentadas na Tabela 5.5.

Page 64: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.4 Métricas de Avaliação 63

(a) Classe 4 (b) Classe 5

Figura 5.7: Curvas de treinamento do modelo MLP-DAPHT.

Tabela 5.5: Recursos utilizados.

Recursos Descrição

Processador Intel i7 de 5o geraçãoMemória Ram 8 GBSitema Operacional Debian 9 Stretch

Ambiente de DesenvolvimentoPython 3.5, Spyder IDE, Jupyter Notebook,Sklearn e Tensorflow

5.4 Métricas de Avaliação

Os métodos utilizados para analisar o desempenho do modelo consiste emmétricas conhecidas e amplamente utilizadas para análises estatísticas.

5.4.1 Cálculo dos erros dos diâmetros

As métricas como Root Mean Square Error - (RMSE%) e a correlação linear (R)foram as métricas utilizadas para analisar os diâmetros estimados pelos modelos.

As métricas utilizadas são representadas pelas Equações 5-7 e 5-8 respectiva-mente.

RMSE =

√1n ∑(ya

i − yei )

2 (5-6)

RMSE% =

(RMSE

ya

)100, (5-7)

R =∑

ni=1(y

ai − ya)(ye

i − yie)√

∑ni=1(y

ai − ya)2

√∑

ni=1(y

ei − ye)2

, (5-8)

Page 65: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.4 Métricas de Avaliação 64

onde n é o total de diâmetros estimado pelo modelo, ya é o vetor dos diâmetros reais, ye

é o vetor dos diâmetros estimados, ya e ye são os valores médios dos diâmetros reais eestimados respectivamente.

5.4.2 Cálculo do volume das árvores

O volume real de todas as árvores cubadas do sítio e o volume calculado a partirdas estimativas realizadas pelos modelos foram calculados através do método de Smalianconforme as Equações 5-9 e 5-10.

v =n−1

∑i=1

gi +gi+1

2+

gnln3

, (5-9)

gi =(di/2)2π

10.000, (5-10)

onde v é o volume total da árvore, gi é a área basal na i-ésima posição, li é comprimentoda seção na i-ésima posição é a área basal do cone da árvore, ln é o comprimento do conee di é o diâmetro na i-ésima posição.

Os respectivos volumes das árvores reais e os volumes estimados pela MLPforam comparados com o modelo de Schumacher e Hall (log).

Como mencionado no Capítulo 2, o modelo de Schumacher e Hall (log) é ummodelo que calcula o volume das árvores a partir do DAP e da altura total (Ht), comodescrito na Equação 5-11.

lnV = β0 +β1 lnDAP+β2 lnHt + ε (5-11)

onde v é o volume da árvore, DAP é a média do diâmetro na altura do peito, Ht é a alturatotal da árvore e os coeficientes β0, β1 e β2 são parâmetros a serem ajustados.

O modelo de Schumacher e Hall (log) utilizado está ajustado para a altura totalda árvore e com os parâmetros β0, β1 e β2 definidos (Cabacinha, 2003). Os modelosaqui estudados estimam o volume da árvore até o diâmetro comercial de 4 centímetros,não totalizando o volume total da árvore. Logo, este modelo foi utilizado apenas para acomparação com os modelos elaborados neste trabalho.

5.4.3 Cálculo de estimativa de erros para volume

Para analisar a precisão dos volumes calculados pelos modelos, foram utilizadosas métricas de Desvio Médio Percentual (MAE%) Equação 5-12, Bias (Bias%) Equação5-13, (RMSE%) Equação 5-6 e a Correlação Linear (R) Equação 5-8,

Page 66: Predição de Diâmetros e Cálculo de Volume de Clones de ...

5.4 Métricas de Avaliação 65

MAE% =1n

n

∑i=1

(|ya

i − yei |

yai

)100, (5-12)

Bias% =∑

ni=1 ya

i −∑ni=1 ye

i

∑in=1 ya

i100, (5-13)

onde ya corresponde ao vetor dos volumes cubados, ya é o vetor dos volumes calculadospelo modelo e n é o total dos volumes informados.

5.4.4 Cálculo da diferença de volume percentual entre os modelos

As diferenças percentuais entre o volume total calculado pelo método de Smaliana partir dos diâmetros obtidos pela cubagem rigorosa e o volume estimado pelos modelosforam calculados pela Equação 5-14.

D% =|vc− ve|

vc.100 (5-14)

onde D% é o valor da diferença percentual, vc é o volume total cubado e ve é o volumetotal estimado pelo modelo.

5.4.5 Testes estatísticos

Conforme vários experimentos foram realizados, os resultados podem ser muitopróximos e eventualmente gerar dúvidas se há predominância de um modelo sobre o outroou se trata apenas de aleatoriedade.

Para verificar se houve diferenças significativas entre os modelos desenvolvidos,o modelo Schumacher e Hall (log) e os valores cubados reais foi realizado o teste deanálise de variância (ANOVA) de 2-critérios.

Os critérios exigidos pela ANOVA requerem que os dados tenham uma distribui-ção normal e independência de resíduos. Afim de analisar a normalidade dos dados foramrealizados testes de hipótese de homogeneidade através dos testes Lilliefors e Shapiro-Wilk. Nos testes realizados com o grau de significância de a = 0,05, os p-value obtidosforam superiores a 0,05, mostrando que há normalidade e homogeneidade das variâncias.Portanto, a ANOVA pode ser utilizada na análise dos experimentos.

Page 67: Predição de Diâmetros e Cálculo de Volume de Clones de ...

CAPÍTULO 6Resultados

Este capítulo abordará sobre os resultados alcançados pelos métodos descritosno capítulo anterior e a comparação com os demais sítios florestais para análise dacapacidade de generalização dos modelos desenvolvidos.

6.1 Predição de diâmetros

Consoante com o que foi mencionado na seção anterior, os modelos LSTM-VA,LSTM-DA, MLP-PR realizam a predição de diâmetros recursivamente até que a altura daárvore seja alcançada. As métricas utilizadas para analisar o desempenho foram a Raiz doerro quadrático médio RMSE% e a Correlação Linear (R).

Tabela 6.1: Erro de predição de diâmetros por classe.

Classe Modelo RMSE% RMin Máx Média DP1 Min Máx

LSTM-VA 3,36 7,97 5,44 1,53 0,97 0,991 LSTM-DA 1,55 13,94 5,66 3,72 0,97 0,99

MLP-PR 3,83 21,40 9,27 5,27 0,96 0,99

LSTM-VA 1,32 16,61 5,53 3,49 0,96 0,992 LSTM-DA 2,67 19,14 6,36 2,71 0,95 0,99

MLP-PR 2,17 18,76 6,91 4,22 0,96 0,99

LSTM-VA 1,24 15,29 5,37 2,57 0,97 0,993 LSTM-DA 2,61 16,94 7,23 2,70 0,96 0,99

MLP-PR 1,67 20,08 6,94 3,53 0,96 0,99

LSTM-VA 1,54 13,58 5,50 2,26 0,96 0,994 LSTM-DA 2,13 18,29 6,62 3,41 0,97 0,99

MLP-PR 1,51 16,84 6,58 3,16 0,98 0,99

LSTM-VA 2,64 7,55 4,86 1,57 0,97 0,995 LSTM-DA 3,42 7,79 5,39 1,33 0,98 0,99

MLP-PR 1,96 9,58 5,33 2,18 0,99 0,991Desvio Padrão.

Page 68: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.1 Predição de diâmetros 67

A Tabela 6.1 apresenta os resultados das estimativas de erros das prediçõesrealizadas pelos modelos. A classe 1 é composta por árvores dominadas que se encontramsob as demais classes e não recebem luz direta do sol, isto acaba prejudicando seudesenvolvimento. Elas apresentam o menor conjunto de dados em relação as demais.

Para a classe 1, o modelo LSTM-VA apresentou o menor desvio padrão emrelação aos demais modelos. Ainda sim devido aos poucos dados para o treinamentoapresentou um RMSE% de 7,97 e a MLP-PR apresentou um erro maior de 21,40.A LSTM-DA conseguiu um valor mínimo de 1,55 e máximo de 13,94 de RMSE%

beneficiada pelo data augumentation quanto a carência de amostras para a rede. Quantoa correlação linear todos os modelos aprestaram uma forte correlação que variou de 97%a 99%.

Diferentemente da classe 1, a classe 5 é composta por árvores dominantesque possuem maior altura e recebem mais luz do sol, consequentemente, são maisdesenvolvidas e atingem as maiores dimensões. A classe 5 possui poucas árvores parao conjunto de treinamento, porém, ela representa as árvores de maior altura em relação àclasse 1.

Em um inventário, as árvores de maior altura da classe 5 representam maismedidas de diâmetro, que durante o treinamento se mostra como mais dados. Assim, osmodelos acabam por estimar melhor os diâmetros visto que possuem mais informações.Todos os modelos apresentaram bons resultados com os menores desvios padrões emenores valores máximos para o RMSE% além de apresentarem variação de 97% a 99%em relação à correlação linear.

As classes 2, 3 e 4 são compostas por árvores codominantes; que recebem luzdiretamente tanto da copa quanto luz lateral, e as subdominantes que crescem entre asdominantes e codominantes. Elas representam as árvores mais numerosas e apresentarambons resultados durante a fase de treinamento. Estas classes alcançaram os valores maisaltos de RMSE%, no entanto, o motivo disso ocorrer se dar ao fato da predição recursivapassar adiante o próximo valor estimado e com isso o erro associado a ele. Ainda assim, osmodelos foram capazes de apresentar bons valores mínimos de RMSE% e baixos índicesde desvio padrão além de forte correlação.

A predição de diâmetros busca estimar a forma da árvore. As Figuras de (6.1) a(6.3) mostram os valores dos diâmetros reais e os diâmetros estimados para cada um dosmodelos.

Através dos gráficos pode-se notar que os melhores casos são estimados comárvores de maiores alturas enquanto os piores casos aparecem em árvores com menoresalturas, visto que quanto maior a árvore, mais medidas de diâmetros ela possui o querepresenta mais dados para as redes serem treinadas. O modelo LSTM-VA apresentao melhor caso entre todos os modelos com um RMSE% de 1,24 e o modelo MLP-PR

Page 69: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.1 Predição de diâmetros 68

0 5 10 15 20 25Altura (m)

0

2

4

6

8

10

12

14

Diâmetro (c

m)

REALLSTM-VA

(a) Classe 3 - RMSE% 1,24

0.0 2.5 5.0 7.5 10.0 12.5 15.0 17.5Altura (m)

0

2

4

6

8

10

12

Diâmetro (c

m)

REALLSTM-VA

(b) Classe 2 - RMSE% 16,61

Figura 6.1: Predição de diâmetros da LSTM-VA (melhor e pior caso).

0.0 2.5 5.0 7.5 10.0 12.5 15.0Altura (m)

0

2

4

6

8

Diâmetro (c

m)

REALLSTM-DA

(a) Classe 1 - RMSE% 1,55

0.0 2.5 5.0 7.5 10.0 12.5 15.0 17.5Altura (m)

0

2

4

6

8

10

12

14Diâmetro (c

m)

REALLSTM-DA

(b) Classe 2 - RMSE% 19,14

Figura 6.2: Predição de diâmetros da LSTM-DA (melhor e pior caso).

0 5 10 15 20 25 30Altura (m)

0.0

2.5

5.0

7.5

10.0

12.5

15.0

17.5

Diâmetro (c

m)

REALMLP-PR

(a) Classe 4 - RMSE% 1,51

0 2 4 6 8 10 12 14 16Altura (m)

0

2

4

6

8

10

Diâmetro (c

m)

REALMLP-PR

(b) Classe 1 - RMSE% 21,40

Figura 6.3: Predição de diâmetros da MLP-PR (melhor e pior caso).

Page 70: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.2 Comparação entre o volume calculado a partir dos diâmetros reais, diâmetros estimados pelos modelose o volume calculado através de Schumacher e Hall (log) 69

apresenta o pior caso chegando a um RMSE% de 21,40.Como pode ser observado na Tabela 6.1, existem resultados que apresentam os

valores de RMSE superiores a 10%. Porém, cabe ressaltar que os valores médios do RMSE

para todas as classes foram inferiores a 10%. Isto mostra que em média, todos os modelosapresentaram resultados dentro do nível de tolerância.

Quanto as Figuras de (6.1) a (6.3), percebe-se que há superestimação em todosos gráficos. No entanto, isso não se mostrou como uma tendência. Embora os maioresvalores de RMSE foram alcançados quando os modelos superestimavam os diâmetrosreais, durante os testes, os modelos variaram entre subestimar e superestimar os diâmetros,indicando que há alternâncias entre as estimações de diâmetros. Portanto, não há indíciosde tendência dos modelos em superestimar os valores reais.

6.2 Comparação entre o volume calculado a partir dosdiâmetros reais, diâmetros estimados pelos modelose o volume calculado através de Schumacher e Hall(log)

Os valores reais das árvores cubadas foram calculados através do método deSmalian descritas no Capítulo (5), Equação 5-9. Este mesmo método foi utilizado paracalcular o volume a partir dos diâmetros estimados para as mesmas alturas definidospara a cubagem rigorosa para todos os modelos recursivos. O método de Schumachere Hall (log) foi utilizado como medida de comparação, visto que é um modelo bastanteempregado no setor florestal.

Conforme a Equação 5-11 os parâmetros utilizados para realizar o cálculo devolume foram ajustados pelo trabalho de (Cabacinha, 2003). Os valores correspondentessão: β0 =−10,79449927, β1 = 1,942384069, β2 = 1,226015699 e ε = 0. Com R2(%) =99,44, erro padrão residual Syx = 0,011993 m, e Syx% = 5,81.

Após os diâmetros estimados pelas modelos da Tabela 6.1, o cálculo do volumepode ser estimado através do método de Smaliam, exceto os modelos MLP-PD e MLP-DAPHT que realizam o cálculo direto do volume de maneira direta. As comparaçõesdos volumes reais, calculados pelos modelos e por Schumacher e Hall (log) podemser observados na Tabela 6.2. Os valores apresentados correspondem ao volume totalestimado para cada classe.

Como pode ser observado na Tabela 6.2, o volume total calculado através dométodo de Smalian para os diâmetros obtidos através da cubagem rigorosa, o volumetotal calculado por Smalian a partir dos diâmetros estimados pelos modelos recursivos, o

Page 71: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.2 Comparação entre o volume calculado a partir dos diâmetros reais, diâmetros estimados pelos modelose o volume calculado através de Schumacher e Hall (log) 70

Tabela 6.2: Comparação entre o volume total calculado a partir dos diâmetros reais,diâmetros estimados pelos modelos e Schumacher e Hall (log).

Classe Real LSTM-VA LSTM-DA MLP-PR MLP-PD MLP-DAPHT Sch. e Hall (log)1 0,6560 0,6658 0,6519 0,6590 0,6571 0,6563 0,66362 12,7895 12,6827 13,2116 12,7707 12,7692 12,7424 12,71643 61,8668 61,0112 64,7209 61,8655 62,0930 61,4993 61,25594 53,1030 53,2896 51,7138 53,1205 53,1760 53,2596 53,78825 6,4467 6,6400 6,5084 6,5334 6,4523 6,5191 6,6646

Total 134,862 134,2893 136,0976 134,9491 135,1476 134,6767 135,0887

volume total calculado diretamente pelos modelos de predição direta e o volume estimadopor Schumacher e Hall (log) são bastante próximos.

Analisando a Tabela 6.2, percebe-se que a diferença percentual entre os volumetotal cubado e os volumes calculados pelos modelos que estimam diâmetros apresentaramalgumas variações.

O modelo LSTM-VA apresenta uma diferença percentual em 0,42% em relaçãoaos volumes cubados, os modelos LSTM-DA e MLP-PR apresentam 0,91% e 0,06%respectivamente.

Entre os modelos que estimam o volume de modo direto, a MLP-PD apresentoudiferença de 0,21%, enquanto que o modelo MLP-DAPHT ficou com 0,13%. Já o modelode Schumacher e Hall (log) apresentou uma variação de 0,17%.

Embora haja diferença entre os modelos, todos apresentaram diferenças percen-tuais abaixo de 1% mesmo que a LSTM-DA tenha apresentado a maior variação.

Com o objetivo de observar o quanto essas variações se mostram relevantes oserros de estimativa de volume foram calculados para cada modelo e os resultados podemser observados na Tabela 6.3.

Os desvios médios percentuais MAE% entre os modelos que utilizam a abor-dagem de predição recursiva apresentaram-se maiores em relação aos modelos que depredição direta, em especial a MLP-PR que na classe 1 atingiu um valor de 11,54%, jápara as demais classes mais numerosas os modelos apresentaram bons resultados.

Um dos efeitos do uso do data augumentation pode ser observado no comporta-mento do modelo LSTM-DA, no qual o Bias% apresentou as maiores varições em classesmais numerosas, no entanto, nas classes menores esse efeito foi positivo atingindo menostendência em superestimar os valores cubados. A maior parte dos modelos mantiveramum Bias% abaixo de 1, o que é positivo dado que o modelo Schumacher e Hall (log)(devidamente parametrizado) atingiu 3,37 na classe 5.

Para todos os modelos analisados os valores de correlação mostraram-se bastantealtos, evidenciado forte correlação entre o real e o estimado. Os valores de RMSE% sãobastantes próximos nos modelos de predição direta, em especial, a MLP-DAPHT, porse tratar de um modelo bastante semelhante ao modelo Schumacher e Hall (log) tendo

Page 72: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.2 Comparação entre o volume calculado a partir dos diâmetros reais, diâmetros estimados pelos modelose o volume calculado através de Schumacher e Hall (log) 71

Tabela 6.3: Estatísticas realizada entre os volumes reais, os modelos treinados e Schuma-cher e Hall (log).

Classe Modelo MAE% Bias% R RMSE%

LSTM-VA 6,57 1,52 0,95 9,05LSTM-DA 8,42 0,60 0,94 9,99

1 MLP-PR 11,54 0,44 0,88 15,32MLP-PD 8,57 0,16 0,92 11,39MLP-DAPHT 5,08 0,05 0,97 6,29Sch. Hall (log) 6,16 1,15 0,96 8,29

LSTM-VA 6,02 0,83 0,92 7,40LSTM-DA 6,14 3,29 0,94 6,14

2 MLP-PR 6,95 0,15 0,90 8,22MLP-PD 7,62 0,15 0,87 9,25MLP-DAPHT 5,07 0,36 0,95 5,07Sch. Hall (log) 4,75 0,57 0,95 5,53

LSTM-VA 6,01 1,54 0,89 7,57LSTM-DA 7,16 4,61 0,90 8,52

3 MLP-PR 6,49 0,02 0,87 7,94MLP-PD 6,77 0,37 0,86 8,20MLP-DAPHT 6,47 0,59 0,87 8,08Sch. Hall (log) 4,48 0,98 0,93 5,65

LSTM-VA 6,07 0,35 0,83 6,99LSTM-DA 6,86 2,62 0,81 6,86

4 MLP-PR 6,40 0,38 0,80 7,39MLP-PD 6,83 0,13 0,76 8,08MLP-DAPHT 8,03 0,29 0,87 9,51Sch. Hall (log) 4,25 1,29 0,91 5,22

LSTM-VA 5,07 2,99 0,94 7,70LSTM-DA 5,02 0,95 0,94 6,87

5 MLP-PR 4,78 1,34 0,94 6,45MLP-PD 3,30 0,08 0,95 4,14MLP-DAPHT 5,82 1,12 0,87 6,87Sch. Hall (log) 4,62 3,37 0,94 6,15

como entrada as mesmas variáveis. O modelo MLP-PD apresentou resultados bastantesinteressantes visto que o mesmo não utiliza a altura total da árvore como parâmetro.

Apesar disso, como pode ser observado na Tabela 6.2. A diferença percentualentre o volume total real e os modelos ficaram abaixo de 1%. Contudo, vale ressaltarque embora o volume tenha ficado bastante próximo, observou-se que em alguns casosos modelos tentam compensar as estimativas de diâmetro errôneas superestimando ousubestimando os diâmetros reais, principalmente nas classe 1 e 5, isso pode ser observadonos valores de RMSE% de ambas as classes. Por fim, os valores calculados para o volumeacaba por ser bastante próximos do real.

Cabe ressaltar que comparando os modelos testados com o modelo Schumachere Hall (log), este último estima o volume total da árvore, a medida que os modelos gerados

Page 73: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.2 Comparação entre o volume calculado a partir dos diâmetros reais, diâmetros estimados pelos modelose o volume calculado através de Schumacher e Hall (log) 72

pelas redes neurais calculam o volume até a altura do diâmetro comercial, essas diferençassão perceptíveis em medidas mais sensíveis como o MAE% e o RMSE%.

As Figuras de 6.4 a 6.6 ilustram a dispersão entre o volume cubado e o volumeestimado para cada um dos modelos em todas as classes analisadas.

0.0 0.2 0.4 0.6 0.8 1.0Observado (m3)

0.0

0.2

0.4

0.6

0.8

1.0

Estim

ado (m

3 )

(a) LSTM-VA

0.0 0.2 0.4 0.6 0.8 1.0Observado (m3)

0.0

0.2

0.4

0.6

0.8

1.0

Estim

ado (m

3 )

(b) LSTM-DA

Figura 6.4: Gráfico de dispersão de volume para LSTM-VA e LSTM-DA.

0.0 0.2 0.4 0.6 0.8 1.0Observado (m3)

0.0

0.2

0.4

0.6

0.8

1.0

Estim

ado (m

3 )

(a) MLP-PR

0.0 0.2 0.4 0.6 0.8 1.0Observado (m3)

0.0

0.2

0.4

0.6

0.8

1.0

Estim

ado (m

3 )

(b) MLP-PD

Figura 6.5: Gráfico de dispersão de volume para MLP-PR e MLP-PD.

Analisando o gráfico 6.4a observa-se que a dispersão para o modelo LSTM-VAfoi bastante reduzida. Porém, pode-se notar uma dispersão maior no modelo 6.4b, isto já

Page 74: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.2 Comparação entre o volume calculado a partir dos diâmetros reais, diâmetros estimados pelos modelose o volume calculado através de Schumacher e Hall (log) 73

0.0 0.2 0.4 0.6 0.8 1.0Observado (m3)

0.0

0.2

0.4

0.6

0.8

1.0Es

timad

o (m

3 )

(a) MLP-DAPHT

0.0 0.2 0.4 0.6 0.8 1.0Observado (m3)

0.0

0.2

0.4

0.6

0.8

1.0

Estim

ado (m

3 )(b) Schumacher e Hall (log)

Figura 6.6: Gráfico de dispersão de volume para MLP-DAPHT e Schumacher e Hall (log).

era esperado devido aos ruídos provenientes do data augmentation realizado no modeloLSTM-DA.

A dispersão entre os modelos 6.5a de predição recursiva e 6.5b de predição diretasão bastante semelhantes, mas é possível notar uma maior dispersão no modelo MLP-PD (6.5b). Ambas dispersões não mostraram diferenças significativas entre os volumescalculados.

Por fim, na Figura 6.6a o modelo MLP-DAPHT apresenta diferenças drásticasem relação ao modelo de Schumacher e Hall (log) (6.6b) embora tenha apresentado re-sultados interessantes no cálculo de volume, acabou apresentando uma dispersão bastanteruidosa onde os valores dos volumes estimados distanciam bastante e em outros momen-tos estão mais próximos. Isso mostra que há forte tendência no modelo e para fins degeneralização o mesmo pode não ser tão eficaz, além de deixar claro que o volume esti-mado não condizem com o volume cubado.

A análise de Variância (ANOVA) de 2-critérios com um nível de significânciade 5% foi realizada para avaliar o volume cubado, o volume estimados pelos modelos deredes neurais e o modelo de Schumacher e Hall (log). As classes de 1 a 5 foram utilizadascomo variáveis de controle. A biblioteca StatsModels (Seabold & Perktold, 2010) foiutilizada para a realização dos testes estatísticos devido sua capacidade de trabalhar comdados desbalanceados.

O resultado revelou um valor p de 0,0429 o que indica que existe diferençaestatística entre os grupos apresentados. Com o objetivo de analisar quais dos modelosapresentavam diferenças significativas foi realizado o teste de Turkey, conhecido como

Page 75: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.3 Análise residual de volume 74

o teste da diferença honestamente significativa (Honestly Significant Difference - HSD).Para um valor de significancia de 5% foram econtrados diferenças significativas entre omodelo LSTM-DA e o volume cubado em campo.

Diferente dos demais modelos, a LSTM-DA apresentou uma variação maiormediante o incremento de valores fictícios de diâmetros gerados pela técnica de data-

augumentation, que embora tenha apresentado bons resultados para conjuntos menores,por outro lado, elevou a variância em conjuntos maiores como pode ser constato pelaANOVA.

Quanto aos demais modelos, no entanto, pode-se afirmar com uma confiança de95% que não existem diferenças significativas entre os volumes estimados pelos modeloso volume cubado.

6.3 Análise residual de volume

O gráfico de resíduos é comumente utilizado para analisar a variância do erro dode um modelo. Resíduos dispersos aleatoriamente em torno de zero, indica o comporta-mento esperado para distribuição dos erros.

As Figuras de 6.7 a 6.11 apresentam o gráfico de resíduos de volume para cadaum dos modelos para todas as 615 árvores utilizadas no treinamento. A análise formal dadistribuição dos resíduos foi avaliada pelo teste de normalidade de Lilliefors.

0 100 200 300 400 500 600Árvores

−20

−10

0

10

20

Erro (%

)

Figura 6.7: Distribuição gráfica de resíduos para o modelo LSTM-VA.

A Figura 6.7 apresenta uma dispersão aleatória distribuída em torno de zero, istoindica que o modelo LSTM-VA possui boa capacidade de ajuste. Mesmo com presençade outliers todas as diferenças relativas ficaram abaixo de 20%. O teste de normalidadeindicou distribuição normal com valor p de 0,059 para os resíduos deste modelo.

Page 76: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.3 Análise residual de volume 75

0 100 200 300 400 500 600Árvores

−20

−10

0

10

20

Erro (%

)

Figura 6.8: Distribuição gráfica de resíduos para o modelo LSTM-DA.

Ao analisar a Figura 6.8, percebe-se uma distribuição parcialmente tendenciosado modelo em subestimar as três primeiras classes e em superestimar as árvores maioresdas classes 4 e 5. Isto se deve ao sobre-ajuste provocado pela influência do erro durantea predição dos diâmetros devido o data augumentation e, consequentemente, passado nocálculo de volume. Percebe-se a presença de outliers durante boa parte da distribuição.O teste de normalidade indicou um valor p de 0,07 e os erros relativos mantivenram-seabaixo de 20%.

0 100 200 300 400 500 600Árvores

−20

−10

0

10

20

Erro (%

)

Figura 6.9: Distribuição gráfica de resíduos para o modelo MLP-PR.

O modelo MLP-PR também apresentou boa capacidade de ajuste revelando umadistribuição semelhante ao observado no modelo da LSTM-VA, porém, com um melhorajuste em relação aos outliers. O modelo apresentou uma distribuição normal com umvalor p de 0,08.

Os modelos MLP-PD e MLP-DAPHT que calculam o volume final das árvoresdivergiram bastante quanto a distribuição residual.

Page 77: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.4 Comparação com os demais sítios 76

0 100 200 300 400 500 600Árvores

−20

−10

0

10

20

Erro (%

)

Figura 6.10: Distribuição gráfica de resíduos para o modelo MLP-PD.

0 100 200 300 400 500 600Árvores

−40

−20

0

20

40

Erro (%

)

Figura 6.11: Distribuição gráfica de resíduos para o modelo MLP-DAPHT.

O modelo MLP-PD apresenta uma distribuição aleatória em torno de zeromostrando um ajuste moderado aos dados mesmo com a presença de outliers. Os errosrelativos máximos variaram por volta de 20% e valor p de 0,058.

O modelo MLP-DAPHT apresentou bastante variação, indicando que o modelonão se adaptou muito bem ao conjunto de dados. Este modelo obteve outliers com valoresmaiores do que 45%. Isto também refletiu no teste de normalidade como um valor p de0,008, provando que a hipótese nula deve ser rejeitada.

6.4 Comparação com os demais sítios

Problemas de aprendizado de máquina geralmente dependem muito da qualidadee quantidade de dados. A capacidade de uma rede lidar com informações desconhecidascom respostas razoáveis é de grande importância.

Page 78: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.4 Comparação com os demais sítios 77

Levando isso em consideração, foram realizados análises de predição de diâme-tros e cálculo do volume com árvores dos sítios I e II para verificar a capacidade dosmodelos em trabalharem com dados diferentes do conjunto de treinamento.

6.4.1 Predição de diâmetros Sítio I

As árvores do sítio I são ligeiramente mais altas que a do sítio III utilizado nosexperimentos em que o modelo está adaptado para árvores menores, além da divisão porclasses apresentar amplitudes diferentes. Os resultados podem ser avaliados na Tabela 6.4.

Tabela 6.4: Avaliação dos modelos para estimação de diâmetros do sítio I.

Classe Modelo RMSE% RMin Máx Média DP Min Máx

LSTM-VA 5,27 7,81 6,40 0,95 0,98 0,991 LSTM-DA 1,98 7,64 4,56 2,59 0,98 0,99

MLP-PR 2,52 8,35 5,24 2,42 0,98 0,99

LSTM-VA 2,67 8,40 5,38 1,97 0,98 0,992 LSTM-DA 2,75 9,87 6,66 2,20 0,96 0,99

MLP-PR 2,64 9,07 5,36 1,88 0,98 0,99

LSTM-VA 2,09 24,90 7,18 4,74 0,93 0,993 LSTM-DA 2,41 17,47 5,82 2,39 0,95 0,99

MLP-PR 2,44 29,55 10,23 6,18 0,91 0,99

LSTM-VA 2,64 12,84 6,85 2,23 0,96 0,994 LSTM-DA 1,74 18,17 6,97 3,15 0,97 0,99

MLP-PR 2,27 21,25 10,82 5,12 0,92 0,99

LSTM-VA 2,45 18,83 9,52 3,78 0,94 0,995 LSTM-DA 2,77 19,33 9,52 3,74 0,95 0,99

MLP-PR 2,58 16,40 7,66 2,93 0,95 0,99

Consoante ao que foi apresentado na Tabela 6.4 pode-se observar que todos osmodelos mostraram valores razoavelmente próximos e apresentaram forte correlação. Asclasses 2 e 3 que possuem árvores mais numerosas apresentaram os maiores valores deRMSE%, tal como foi observado nas análises anteriores, o valor do erro é passado adiantepara estimar os próximos diâmetros e como consequência apresenta erros mais elevados.

O menor desempenho foi observado na MLP-PR que obteve maior erro em re-lação aos demais. Os modelos LSTM-VA e LSTM-DA conseguiram resultados bastantepróximos tal como foi observado anteriormente, em classes menores a LSTM-DA apre-senta vantagens com o aumento de dados.

Page 79: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.4 Comparação com os demais sítios 78

Embora os modelos tenham apresentado altos valores de RMSE devido a outliers,no geral, a média dos modelos LSTM-VA e LSTM-DA ficaram abaixo de 10%, mostrandoque a capacidade de generalização para predição de diâmetros apresentou bons resultados.

6.4.2 Predição de diâmetros Sítio II

As árvores do sítio II apresentam algumas características como a distribuiçãode classes e proximidade diamétrica em relação ao conjunto de treinamento. As análisesrealizadas são apresentadas na Tabela 6.5.

Tabela 6.5: Avaliação dos modelos para estimação de diâmetros do sítio II.

Classe Modelo RMSE% RMin Máx Média DP Min Máx

LSTM-VA 3,12 6,66 4,89 1,32 0,98 0,991 LSTM-DA 4,00 7,68 5,37 1,39 0,97 0,99

MLP-PR 3,15 7,22 5,15 1,84 0,96 0,99

LSTM-VA 4,61 22,83 12,57 4,24 0,92 0,992 LSTM-DA 2,60 8,18 4,70 1,40 0,98 0,99

MLP-PR 3,40 20,97 10,58 3,94 0,91 0,99

LSTM-VA 1,71 32,56 12,29 7,65 0,91 0,993 LSTM-DA 2,07 18,79 6,26 2,82 0,96 0,99

MLP-PR 2,25 37,68 17,77 8,33 0,90 0,99

LSTM-VA 2,61 17,20 6,98 2,76 0,96 0,994 LSTM-DA 2,47 16,34 6,43 2,11 0,98 0,99

MLP-PR 1,90 35,34 18,50 7,99 0,80 0,99

LSTM-VA 2,03 13,34 5,78 2,72 0,98 0,995 LSTM-DA 2,58 10,75 6,43 2,11 0,98 0,99

MLP-PR 4,92 17,15 10,46 3,20 0,95 0,99

O comportamento dos modelos em relação ao sítio I, possui semelhanças entreas classes 2, 3 e 4, onde ocorreram os maiores valores de RMSE% em todos os modelos.

Os modelos LSTMs apresentaram desempenho semelhante, enquanto a MLPapresentou o pior desempenho entre os modelos. Pode-se observar que as diferençasentre os diâmetros reais e estimados mostraram-se maiores como indicado pelos valoresde RMSE. Mesmo assim, com exceção das classes 2 e 3 para o modelo LSTM-VA, asmédias de RMSE ficaram abaixo dos 10% tolerados. O modelo LSTM-DA apresentouresultados abaixo de 10% para todas as classes observadas, mostrando boa capacidade degeneralização.

Pode-se concluir que se tratando de previsões de diâmetros como uma série tem-poral, a arquitetura recorrente dos modelos LSTMs mostraram-se mais eficazes mesmoem um conjunto diferente de dados.

Page 80: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.4 Comparação com os demais sítios 79

6.4.3 Comparação e análise estatística do cálculo de volume para ossítios I e II

Como mencionado anteriormente, todas as árvores foram cubadas e calculadaspelo método de Smalian. Os sítos I e II estavam parametrizados para o modelo deSchumacher e Hall (log) com os coeficientes β já estabelecidos (Cabacinha, 2003) talcomo o sítio III. A divisão por classes no sítio I resultou em 6 classes, no qual, a sextaclasse possuia medidas fora da amplitude definida para separação de classes. Essas árvoresapresentaram-se como fortes outliers e foram removidas para fins de comparação.

Para o sítio I, os valores correspondentes ao ajuste para o modelo de Schumachere Hall (log) foram: β0 = −10,5904, β1 = 1,8906, β2 = 1,2173 e ε = 0. Com R2(%)= 99,61, erro padrão residual Syx = 0,01189, e Syx% = 5,28. Para o sítio II, os valorescorrespondentes foram: β0 =−10,6390, β1 = 1,7762, β2 = 1,3261 e ε = 0. Com R2(%)= 99,64, erro padrão residual Syx = 0,01099, e Syx% = 4,45. A Tabela 6.6 apresenta oresultado para a comparação dos volumes de todos os modelos.

Tabela 6.6: Comparação entre os volumes totais calculados para o síto I.

Classe Real LSTM-VA LSTM-DA MLP-PR MLP-PD MLP-DAPHT Sch. e Hall (log)

1 0,0869 0,0926 0,9833 0,0946 0,0735 0,1930 0,08212 1,4335 1,4820 1,5062 1,4742 0,8054 0,7394 1,37293 21,1229 20,9958 20,8304 20,0445 18,7600 23,5379 21,34794 66,2907 64,6813 62,5992 59,28 59,4458 69,6962 66,43345 55,0128 56,6890 55,2270 60,50 53,0777 78,4189 55,2160

Total 143,9468 143,9407 141,1461 140,9443 141,3772 172,5854 144,4523

Por se tratar de um conjunto de dados não vistos durante a fase de treinamentopelos modelos, alguns volumes se distanciam bastante dos valores reais. Ainda sim, al-guns modelos apresentaram boa aproximação. A LSTM-VA apresentou uma excelenteaproximação de 0,01% em relação aos volumes cubados. O modelo LSTM-DA apresen-tou uma diferença percentual de 1,94% e o modelo MLP-PR alcançou 2,08%, valoresestes bem superiores em relação ao síto de treinamento. Entre os modelos de predição di-reta, a MLP-PD e MLP-DAPHT apresentaram diferenças percentuais de 1,78% e 19,89%.Este último em questão é um modelo inviável para o uso em campo, quando consideradoque o erro máximo tolerado no setor florestal é 10%.

De todos os modelos analisados, a LSTM-VA apresentou a melhor capacidadede generalização, o modelo de Schumacher e Hall (log) com os parâmetros ajustadospara o sítio I apresentou uma diferença de 0,35% contra 0,01% da rede neural. O mesmoprocesso foi realizado para analisar as árvores do sítio II. Os resultados são apresentadosna Tabela 6.7.

Page 81: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.4 Comparação com os demais sítios 80

Tabela 6.7: Comparação entre os volumes totais calculados para o síto II.

Classe Real LSTM-VA LSTM-DA MLP-PR MLP-PD MLP-DAPHT Sch. e Hall (log)

1 0,1587 0,1670 0,1621 0,1742 0,1736 0,1568 0,15832 6,8116 6,0744 6,6105 6,1240 6,4034 6,4564 6,97423 49,7618 47,7294 47,2327 45,3864 47,5062 50,4661 50,78824 69,4123 70,8067 66,5720 60,1668 66,4532 70,5456 70,60645 17,6997 17,5400 17,4133 18,4459 16,8859 19,8470 17,9236

Total 143,8441 142,3175 137,9906 130,2943 137,4223 147,4719 146,4507

Alguns dos modelos para o sítio II subestimaram os valores reais mostrandouma tendência em calcular volume menor que o esperado, o que levou a apresentaremdiferenças percentuais mais elevadas.

Ainda assim, a LSTM-VA apresentou uma diferença percentual de 1,06%, aLSTM-DA de 4,06% e a MLP-PR alcançou 9,41%. Resultados significativos em relaçãoao sítio I e III. Os modelos de cálculo direto de volume MLP-PD e MLP-DAPHTalcançaram 4,46% e 2,52% respectivamente. O modelo dendrométrico de Schumacher eHall(log) parametrizado para o sítio II alcançou diferença percentual de 1,81%. Portanto,dentre os modelos em ambos os sítios de comparação, a LSTM-VA apresentou boacapacidade de generalização alcançando bons resultados em todos os sítios comparados.

Observando a Tabela 6.8 pode-se notar que os menores valores para MAE% eRMSE% foram alcançados pelos modelos das LSTMs. Com exceção é claro do modelode Schumacher e Hall (log).

Por outro lado, os modelos de que realizam o cálculo de volume de maneiradireta MLP-PD e MLP-DAPHT apresentaram os piores valores em todas as métricasavaliadas. Isso mostra que esses modelos não são indicados para analisar sítios no qualeles não foram devidamente treinados. Estes modelos mostraram-se bastante tendenciososem superestimar os valores cubados, além de serem inviáveis para o uso em campo.

Em relação aos sítios I e II, o modelo de Schumacher e Hall (log) previamenteajustado para os sítios em questão, foi utilizado para comparar o contraste entre osmodelos que não foram treinados com os dados da cubagem rigorosa com um modelopreviamente ajustado, deixando evidente o poder de generalização dos modelos LSTMs.

Page 82: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.4 Comparação com os demais sítios 81

Tabela 6.8: Estatística de erros de estimativa de volume entre o volume cubado e estimadopelos modelos para os sítios I e II.

Sitio I Sitio II

Classe Modelo MAE% BIAS R RMSE% MAE% BIAS R RMSE%

LSTM-VA 7,16 6,66 0,98 8,18 4,99 5,22 0,99 5,80LSTM-DA 6,58 7,24 0,99 8,92 4,20 2,14 0,99 3,88

1 MLP-PR 9,01 8,85 0,98 12,39 8,17 9,76 0,98 17,08MLP-PD 46,25 19,08 0,49 52,38 11,51 9,36 0,97 11,76MLP-DAPHT 245,00 121,00 0,81 208,00 6,12 5,65 0,98 6,12Sch. Hall (log) 7,60 5,53 0,98 8,03 2,87 0,24 0,99 3,05

LSTM-VA 5,85 3,38 0,98 6,60 11,25 10,01 0,92 12,60LSTM-DA 6,29 5,08 0,89 7,38 5,39 2,95 0,94 6,59

2 MLP-PR 5,39 2,82 0,98 6,26 10,69 10,00 0,94 11,72MLP-PD 56,85 43,80 0,95 52,15 9,89 5,11 0,88 11,61MLP-DAPHT 66,67 48,31 0,97 57,33 8,14 5,21 0,96 9,04Sch. Hall (log) 6,43 4,22 0,92 8,00 4,29 2,38 0,97 5,26

LSTM-VA 7,63 0,59 0,89 9,14 7,24 4,08 0,88 8,80LSTM-DA 6,89 1,38 0,91 8,33 6,93 5,08 0,92 8,73

3 MLP-PR 8,82 5,10 0,90 10,21 9,58 8,79 0,92 11,03MLP-PD 13,79 11,18 0,86 15,63 7,74 4,53 0,87 9,79MLP-DAPHT 14,45 11,42 0,93 14,65 8,50 1,41 0,95 9,64Sch. Hall (log) 5,20 1,06 0,94 6,55 4,42 2,06 0,96 5,23

LSTM-VA 7,24 3,93 0,89 9,60 6,05 2,00 0,86 7,29LSTM-DA 8,52 7,07 0,98 10,01 6,49 4,14 0,87 8,18

4 MLP-PR 11,98 10,56 0,88 13,35 13,75 13,36 0,87 15,16MLP-PD 10,84 10,32 0,84 13,35 7,09 4,26 0,75 9,98MLP-DAPHT 11,14 5,13 0,90 12,29 8,84 1,63 0,90 10,34Sch. Hall (log) 4,38 0,20 0,94 5,20 3,82 1,72 0,95 4,65

LSTM-VA 6,88 5,19 0,78 8,48 5,38 0,90 0,82 6,68LSTM-DA 7,23 5,60 0,79 8,87 5,56 1,61 0,89 7,03

5 MLP-PR 5,89 0,01 0,76 6,97 6,42 4,21 0,86 7,73MLP-PD 14,92 14,37 0,66 17,17 7,92 4,59 0,66 10,28MLP-DAPHT 33,11 31,70 0,28 33,49 15,38 12,13 0,27 17,07Sch. Hall (log) 4,00 0,36 0,89 4,92 3,76 1,26 0,93 4,46

Page 83: Predição de Diâmetros e Cálculo de Volume de Clones de ...

6.5 Considerações finais do capítulo 82

6.5 Considerações finais do capítulo

Este capítulo apresentou os resultados obtidos através dos modelos construídospelas redes neurais.

Os resultados alcançados para o sítio de treinamento mostraram-se bastantesatisfatórios. Os modelos recursivos que realizam a predição de diâmetros, apresentaramboa capacidade em estimar a forma da árvore e a partir de então calcular o volume damesma. Já os modelos que calculam o volume de maneira direta mostraram-se razoáveispara o sítio de treinamento.

Quando realizado os testes para avaliar a capacidade de generalização dosmodelos, as redes LSTMs mostraram-se bastante poderosas em estimar diâmetros e ovolume das árvores até então desconhecidas pelo modelo sem a necessidade de um novotreinamento ou uso de árvores de outros sítios.

A LSTM-VA mostrou-se mais eficiente para o problema em questão com boacapacidade de generalização. No entanto, a LSTM-DA que embora tenha utilizado maisdados para o treinamento acabou por superestimar classes em que o número de árvoresjá era considerável. Embora, com classes que possuíam menos árvores como a classe 1e 5, esse modelo acabou por apresentar os melhores resultados com a técnica de data

augumentation.Para o cálculo de volume, a eficiência das redes foram avaliadas positivamente.

Embora que a MLP-PR tenha atingido 9,41% e o modelo MLP-DAPHT apresentado19,89% de diferença percentual, os demais modelos ficaram abaixo de 4% em especiala LSTM-VA que para todos os sítios testados, apresentou uma variação máxima de 1%o que mostra bom desempenho, visto que o erro máximo tolerado no setor florestal é de10%.

Page 84: Predição de Diâmetros e Cálculo de Volume de Clones de ...

CAPÍTULO 7Conclusões e Trabalhos Futuros

Muitos trabalhos que abordam o uso de redes neurais no setor florestal tem porobjetivo calcular parâmetros como altura, volume ou estimar diâmetros em diferentesalturas do fuste.

Os modelos utilizados neste trabalho que realizam o cálculo de volume direta-mente mostraram-se interessantes no sítio onde foram treinados por precisarem de poucasvariáveis de entrada e estimarem o volume das árvores com boa precisão. Por outro lado,não se mostraram tão eficientes nos demais sítios utilizados para validar os modelos, ondeapresentaram forte tendência em subestimar os valores reais.

Quanto aos modelos que estimam o volume com base nos diâmetros previstosde maneira recursiva mostraram-se bastantes eficientes. Inicialmente por serem capazesde estimar a forma da árvore com boa precisão, o que dá a indústria madeireira, infor-mações sobre o afilamento, características importantes que pode ser utilizada para avaliarbiológica e economicamente o maciço florestal.

Este trabalho objetivou efetuar uma análise de diferentes arquiteturas de redesneurais e alguns parâmetros do inventário florestal para estimar diâmetros e realizar ocálculo de volume de clones de eucalipto. As medidas iniciais dos diâmetros mostraramforte correlação como visto neste trabalho, em trabalhos anteriores e nos testes realizadosque revelaram que através deles, as redes puderam prever as demais medidas.

Analisando os diâmetros como uma série temporal a utilização de redes recor-rentes mostrou uma abordagem basante poderosa. Nos testes realizados as redes LSTMsdemostraram superiores aos modelos MLPs utilizados. Isso se deve ao fato destas redesserem capazes de armazenar temporariamente informações de um estado anterior que po-dem ser passadas adiantes.

A realização de testes nos sítios I e II para analisar a capacidade de generalizaçãomostrou resultados satisfatórios para os modelos de redes recorrentes, em especial, omodelo LSTM-VA. Este modelo apresentou resultados tão bons quanto ao modelo deSchumacher e Hall (log) já devidamente ajustados para os sítios em questão. Por outrolado, os modelos que utilizam a predição direta como o modelo MLP-PD e o modelo

Page 85: Predição de Diâmetros e Cálculo de Volume de Clones de ...

7.1 Trabalhos futuros 84

MLP-DAPHT, mostraram-se bastante tendenciosos em superestimar os valores reais, oque os tornam inviáveis para sítios desconhecidos durante o treinamento.

Esses resultados realçam que as redes LSTMs são uma alternativa bastantepromissora para auxiliar no desenvolvimento de um inventário florestal, além de não sernecessário o abate de árvores para a cubagem rigorosa e a possibilidade de obter taismedidas com a árvore em pé.

7.1 Trabalhos futuros

O setor florestal apresenta problemas bastante desafiadores que podem abrircaminho para diversas pesquisas com redes neurais. Assim, incluem-se alguns trabalhosfuturos podem ser investigados:

• Treinar modelos em um número maior de árvores, com o objetivo de representarmelhor classes que possuam menor quantidade de árvores.• Comparar as estimativas de diâmetros dos modelos com as funções de afilamento

utilizadas no setor florestal.• Analisar a possibilidade de utilizar o data augmentation apenas em classes com um

número mínimo de árvores para evitar ruídos que comprometam a rede como foivisto no decorrer do trabalho.• Analisar a possibilidade de utilizar outras variáveis além do DAP e da altura total,

visto que os modelos que as utilizam, mostrar-sem bastante tendenciosos.• Testar outras variações de redes recorrentes tais como a Gated recurrent units

(GRUs) e avaliar seu desempenho visto que as redes recorrentes revelaram-sebastante promissoras.

Page 86: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas

Amari, S-I. 1972. Learning patterns and pattern sequences by self-organizing nets ofthreshold elements. IEEE Transactions on Computers, 100(11), 1197–1206.

Anderson, James A, Silverstein, Jack W, Ritz, Stephen A, & Jones, Randall S. 1977. Dis-tinctive features, categorical perception, and probability learning: Some applications ofa neural model. Psychological review, 84(5), 413.

Ayrey, Elias, & Hayes, Daniel J. 2018. The Use of Three-Dimensional ConvolutionalNeural Networks to Interpret LiDAR for Forest Inventory. Remote Sensing, 10(4), 649.

Batista, João Luís Ferreira. 1998. Mensuração de árvores: uma introdução à dendrome-

tria. ESALQ/USP/LCF.

Belchior, Paulo Roberto Mendes. 1996. Estimação de volumes total, de fuste e de galhos

em mata secundária no município de Rio Vermelho, MG. Ph.D. thesis, UniversidadeFederal de Viçosa.

Bengio, Yoshua, Simard, Patrice, Frasconi, Paolo, et al. . 1994. Learning long-termdependencies with gradient descent is difficult. IEEE transactions on neural networks,5(2), 157–166.

Bergstra, James, & Bengio, Yoshua. 2012. Random search for hyper-parameter optimi-zation. Journal of Machine Learning Research, 13(Feb), 281–305.

Binoti, DHB, Binoti, MLM da S, Leite, HG, & Silva, A. 2012. Redução dos custosem inventário de povoamentos equiâneos utilizando redes neurais artificiais. Agrária,

Recife, 8, 125–129.

Binoti, Mayra Luiza Marques da Silva, Binoti, Daniel Henrique Breda, Leite, Hélio Gar-cia, Garcia, Silvana Lages Ribeiro, Ferreira, Maria Zelia, Rode, Rafael, & Silva, Anto-nilmar Araújo Lopes da. 2014. Redes neurais artificiais para estimação do volume deárvores. Revista Árvore, 38(2), 283–288.

Borges, João Fernando. 1981. Seccionamento do fuste de Pinus taeda L. para obtençãodo volume de madeira serrada, atraves da função de forma polinomial.

Page 87: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas 86

Brena, DA, & Péllico Neto, S. 1997. Inventário florestal. Curitiba.[Links].

Brosofske, Kimberley D, Froese, Robert E, Falkowski, Michael J, & Banskota, Asim.2013. A review of methods for mapping and prediction of inventory attributes foroperational forest management. Forest Science, 60(4), 733–756.

Byrd, Richard H, Lu, Peihuang, Nocedal, Jorge, & Zhu, Ciyou. 1995. A limited memoryalgorithm for bound constrained optimization. SIAM Journal on Scientific Computing,16(5), 1190–1208.

Cabacinha, Chistian Dias. 2003. Um método para a realização do inventário florestal

suprimindo a cubagem rigorosa. Ph.D. thesis, Universidade Federal de Lavras.

Campos, João Carlos Chagas. 1983. Dendrometria I. parte. Universidade Federal deViçosa.

Canto, Eduardo Leite. 2004. Ciências Naturais: aprendendo com o cotidiano, Vol. 1, 2, 3e 4. São Paulo.

Cho, Kyunghyun, Van Merriënboer, Bart, Gulcehre, Caglar, Bahdanau, Dzmitry, Bouga-res, Fethi, Schwenk, Holger, & Bengio, Yoshua. 2014. Learning phrase representa-tions using RNN encoder-decoder for statistical machine translation. arXiv preprint

arXiv:1406.1078.

Chung, Junyoung, Gulcehre, Caglar, Cho, KyungHyun, & Bengio, Yoshua. 2014. Empiri-cal evaluation of gated recurrent neural networks on sequence modeling. arXiv preprint

arXiv:1412.3555.

Ciresan, Dan Claudiu, Meier, Ueli, Gambardella, Luca Maria, & Schmidhuber, Jürgen.2010. Deep, big, simple neural nets for handwritten digit recognition. Neural

computation, 22(12), 3207–3220.

Cosenza, Ramon, & Guerra, Leonor. 2009. Neurociência e educação. Artmed Editora.

Couto, HTZ do, & Bastos, NELSON LUIZ MAGALHÃES. 1987. Modelos de equaçõesde volume e relações hipsométricas para plantações de Eucalyptus no Estado de SãoPaulo. IPEF, Piracicaba, 33–44.

Debouk, Haifa, Riera-Tatché, Ramon, & Vega-García, Cristina. 2013. Assessing post-fireregeneration in a Mediterranean mixed forest using LiDAR data and artificial neuralnetworks. Photogrammetric Engineering & Remote Sensing, 79(12), 1121–1130.

Diamantopoulou, Maria J. 2005. Artificial neural networks as an alternative tool in pinebark volume estimation. Computers and electronics in agriculture, 48(3), 235–244.

Page 88: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas 87

Diamantopoulou, Maria J. 2010. Filling gaps in diameter measurements on standingtree boles in the urban forest of Thessaloniki, Greece. Environmental Modelling &

Software, 25(12), 1857–1865.

Donahue, Jeffrey, Anne Hendricks, Lisa, Guadarrama, Sergio, Rohrbach, Marcus, Venu-gopalan, Subhashini, Saenko, Kate, & Darrell, Trevor. 2015 (June). Long-Term Recur-rent Convolutional Networks for Visual Recognition and Description. In: The IEEE

Conference on Computer Vision and Pattern Recognition (CVPR).

dos Reis, Aliny Aparecida, Carvalho, Mônica Canaan, de Mello, José Marcio, Gomide,Lucas Rezende, Ferraz Filho, Antônio Carlos, & Junior, Fausto Weimar Acerbi. 2018.Spatial prediction of basal area and volume in Eucalyptus stands using Landsat TMdata: an assessment of prediction methods. New Zealand Journal of Forestry Science,48(1), 1.

Dossa, Derli, da Silva, HD, Bellote, AFJ, & Rodigheri, HR. 2002. Produção e rentabi-lidade do eucaliptos em empresas florestais. Embrapa Florestas-Comunicado Técnico

(INFOTECA-E).

Favan, JOÃO RICARDO. 2015. UTILIZAÇÃO DE REDES NEURAIS ARTIFICIAS

APLICADAS NA DISCRIMINAÇÃO DE PADRÕES DE DOENÇAS FLORESTAIS.Ph.D. thesis, UNIVERSIDADE ESTADUAL PAULISTA â JULIO DE MESQUITAFILHO.

Figueiredo Filho, Afonso, Borders, Bruce E, & Hitch, Kenneth L. 1996. Taper equationsfor Pinus taeda plantations in Southern Brazil. Forest Ecology and Management, 83(1-2), 39–46.

Flynn, Robert, & Shield, Evan D. 1999. Eucalyptus: Progress in Higher Value Utilization:

a Global Review. Robert Flynn & Associates; Economic Forest Associates.

Gibson, Gavin J, Siu, Sammy, & Cowen, CFN. 1989. Multilayer perceptron structuresapplied to adaptive equalisers for data communications. Pages 1183–1186 of: Acous-

tics, Speech, and Signal Processing, 1989. ICASSP-89., 1989 International Conference

on. IEEE.

Gomes, AM de A. 1957. Medição dos arvoredos. Tech. rept. Livraria sá da Costa.

Goodfellow, Ian, Bengio, Yoshua, Courville, Aaron, & Bengio, Yoshua. 2016. Deep

learning. Vol. 1. MIT press Cambridge.

Greff, Klaus, Srivastava, Rupesh K, Koutník, Jan, Steunebrink, Bas R, & Schmidhuber,Jürgen. 2016. LSTM: A search space odyssey. IEEE transactions on neural networks

and learning systems, 28(10), 2222–2232.

Page 89: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas 88

Grossberg, Stephen. 1968. Some nonlinear networks capable of learning a spatial patternof arbitrary complexity. Proceedings of the National Academy of Sciences, 59(2), 368–372.

Guo, Fang, Gao, Guangqin, Huang, Jiarong, Wang, Liuxi, & Wang, Dandan. 2011.Diameter distribution prediction of populus shelterbelts based on artificial neuralnetwork. Pages 762–765 of: Natural Computation (ICNC), 2011 Seventh International

Conference on, vol. 2. IEEE.

Haykin, S.S. 2001. Redes Neurais - 2ed. BOOKMAN COMPANHIA ED.

Hebb, Donald O. 1949. The organization of behavior. A neuropsychological theory.

Hecht-Nielsen, Robert. 1992. Theory of the backpropagation neural network. Pages 65–

93 of: Neural networks for perception. Elsevier.

Hochreiter, Sepp, & Schmidhuber, Jürgen. 1997. Long short-term memory. Neural

computation, 9(8), 1735–1780.

Hopfield, John J. 1982. Neural networks and physical systems with emergent collectivecomputational abilities. Proceedings of the national academy of sciences, 79(8), 2554–2558.

Huang, Jiarong, Zhao, Junhui, Gao, Guangqin, Meng, Xianyu, & Guan, Yuxiu. 2009.Prediction of stand diameter distribution with artificial neural network. Pages 79–82

of: Natural Computation, 2009. ICNC’09. Fifth International Conference on, vol. 2.IEEE.

Husch, B, Miller, CI, & Beers, TW. 1972. Forest Mensuration (2nd Edit) Ronald PressCo. New York.

Ibá, Ibá Relatório. 2017. Indústria Brasileira de Árvores.

Ibá, Ibá Relatório. 2018. Indústria Brasileira de Árvores.

Jacobs, Robert A. 1988. Increased rates of convergence through learning rate adaptation.Neural networks, 1(4), 295–307.

Ji, Yongnan, Hao, Jin, Reyhani, Nima, & Lendasse, Amaury. 2005. Direct and recursiveprediction of time series using mutual information selection. Pages 1010–1017 of:

International Work-Conference on Artificial Neural Networks. Springer.

Juvenal, Thais Linhares, & Mattos, René Luiz Grion. 2002. O setor florestal no Brasil ea importância do reflorestamento.

Page 90: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas 89

Karlik, Bekir, & Olgac, A Vehbi. 2011. Performance analysis of various activationfunctions in generalized MLP architectures of neural networks. International Journal

of Artificial Intelligence and Expert Systems, 1(4), 111–122.

Khan, Salman H, He, Xuming, Porikli, Fatih, & Bennamoun, Mohammed. 2017. Forestchange detection in incomplete satellite images with deep neural networks. IEEE

Transactions on Geoscience and Remote Sensing, 55(9), 5407–5423.

Kohonen, Teuvo. 1982. Self-organized formation of topologically correct feature maps.Biological cybernetics, 43(1), 59–69.

Le, Quoc V, Ngiam, Jiquan, Coates, Adam, Lahiri, Abhik, Prochnow, Bobby, & Ng,Andrew Y. 2011. On optimization methods for deep learning. Pages 265–272 of:

Proceedings of the 28th International Conference on International Conference on

Machine Learning. Omnipress.

Leduc, Daniel J, Matney, Thomas G, Belli, Keith L, & Baldwin, V Clark. 2001. Predictingdiameter distributions of longleaf pine plantations: a comparison between artificialneural networks and other accepted methodologies. Res. Pap. SRS-25. Asheville, NC:

US Department of Agriculture, Forest Service, Southern Research Station. 24p., 25.

Leite, Helio Garcia, & Andrade, Valdir Carlos Lima de. 2002. Um método para conduçãode inventários florestais sem o uso de equações volumétricas.

Leung, Henry, & Haykin, Simon. 1991. The complex backpropagation algorithm. IEEE

Transactions on signal processing, 39(9), 2101–2104.

Lippmann, Richard. 1987. An introduction to computing with neural nets. IEEE Assp

magazine, 4(2), 4–22.

Little, WA, & Shaw, Gordon L. 1975. A statistical theory of short and long term memory.Behavioral biology, 14(2), 115–133.

Loetsch, F, Zohrer, F, & Haller, KE. 1973. Forest inventory. V. 2. Munique, B LV-

VerlagsgeselIschaft.

Lutinski, Junir Antonio, Lutinski, Cladis Juliana, & Garcia, Flávio Roberto Mello. 2006.Primeiro registro de Glycaspis brimblecombei Moore 1964,(Hemiptera: Psyllidae) emeucalipto no estado de Santa Catarina, Brasil. Ciência Rural, 36(2), 653–655.

Machado, Pires, Leonardo, & Calegario, Natalino. 2007. Ajuste de modelos estocásticoslineares e não-lineares para a descrição do perfil longitudinal de árvores. Revista

Árvore, 31(5).

Page 91: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas 90

Machado, do Amaral, Sebastião, Téo, Saulo Jorge, Urbano, Edilson, Figura, Marco Au-rélio, & da Silva, Luís César Rodrigues. 2006. Comparação de métodos de cuba-gem absolutos com o volume obtido pelo xilômetro para bracatinga (Mimosa scabrellaBentham). Cerne, 12(3), 239–253.

Marques da Silva, Mayra Luiza, Breda Binoti, Daniel Henrique, Gleriani, José Marinaldo,& Garcia Leite, Helio. 2009. Ajuste do modelo de Schumacher e Hall e aplicação deredes neurais artificiais para estimar volume de árvores de eucalipto. Revista Árvore,33(6).

Martens, James, & Sutskever, Ilya. 2011. Learning recurrent neural networks withhessian-free optimization. Pages 1033–1040 of: Proceedings of the 28th International

Conference on Machine Learning (ICML-11). Citeseer.

McCulloch, Warren S, & Pitts, Walter. 1943. A logical calculus of the ideas immanent innervous activity. The bulletin of mathematical biophysics, 5(4), 115–133.

Mello, José Marcio de. 2004. Geoestatística aplicada ao inventário florestal. Ph.D. thesis,Universidade de São Paulo.

Minski, Marvin L, & Papert, Seymour A. 1969. Perceptrons: an introduction to compu-tational geometry. MA: MIT Press, Cambridge.

MONTGOMERY, Eduardo, & JUNIOR, Oswaldo Ludwig. 2007. REDES NEURAIS:fundamentos e aplicações com programas em C. Rio de Janeiro: Ciência Moderna

LTDA.

Moritz, Philipp, Nishihara, Robert, & Jordan, Michael. 2016. A linearly-convergentstochastic L-BFGS algorithm. Pages 249–258 of: Artificial Intelligence and Statistics.

Nair, Vinod, & Hinton, Geoffrey E. 2010. Rectified linear units improve restricted boltz-mann machines. Pages 807–814 of: Proceedings of the 27th international conference

on machine learning (ICML-10).

Netto, Sylvio Péllico. 2004. Equivalência volumétrica: uma nova metodologia paraestimativa do volume de árvores. Revista Acadêmica Ciência Animal, 2(1), 17–30.

Niska, Harri, Skon, Jukka-Pekka, Packalen, Petteri, Tokola, Timo, Maltamo, Matti, &Kolehmainen, Mikko. 2010. Neural networks for the prediction of species-specific plotvolumes using airborne laser scanning and aerial photographs. IEEE Transactions on

Geoscience and Remote Sensing, 48(3), 1076–1085.

Nocedal, Jorge. 1980. Updating quasi-Newton matrices with limited storage. Mathema-

tics of computation, 35(151), 773–782.

Page 92: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas 91

Nocedal, Jorge, & Wright, Stephen J. 2006. Nonlinear Equations. Springer.

Özçelik, Ramazan, Diamantopoulou, Maria J, Brooks, John R, & Wiant Jr, Harry V. 2010.Estimating tree bole volume using artificial neural network models for four species inTurkey. Journal of environmental management, 91(3), 742–753.

Paludzyszyn Filho, Estefano, dos Santos, Paulo Eduardo Telles, & Ferreira, Carlos Al-berto. 2006. Eucaliptos indicados para plantio no Estado do Paraná. Embrapa

Florestas-Documentos (INFOTECA-E).

Pascanu, Razvan, Gulcehre, Caglar, Cho, Kyunghyun, & Bengio, Yoshua. 2013. How toconstruct deep recurrent neural networks. arXiv preprint arXiv:1312.6026.

Pavan, Bruno Ettore. 2009. Competição em testes de progênies de eucalipto e suasimplicações na seleção e no melhoramento.

Perez, Luis, & Wang, Jason. 2017. The effectiveness of data augmentation in imageclassification using deep learning. arXiv preprint arXiv:1712.04621.

Pohjankukka, J, Riihimäki, Henri, Nevalainen, P, Pahikkala, T, Ala-Ilomäki, Jari, Hyvö-nen, E, Varjo, J, & Heikkonen, J. 2016. Predictability of boreal forest soil bearingcapacity by machine learning. Journal of Terramechanics, 68, 1–8.

Raven, Peter H, Evert, Ray Franklin, Eichhorn, Susan E, et al. . 1978. Biologia vegetal.Guanabara Dois Rio de Janeiro.

Rosenblatt, Frank. 1958. The perceptron: a probabilistic model for information storageand organization in the brain. Psychological review, 65(6), 386.

Rumelhart, David E, & McClelland, James L. 1986. Parallel distributed processing:explorations in the microstructure of cognition. volume 1. foundations.

Rumelhart, David E, Hinton, Geoffrey E, & Williams, Ronald J. 1986. Learning repre-sentations by back-propagating errors. nature, 323(6088), 533.

Scarpinati, Edimar Aparecido. 2007. Influência do modelo de análise estatística e daforma das parcelas experimentais na seleção de clones de Eucalyptus spp.

Schneider, Paulo Renato, Finger, César Augusto Guimarães, Klein, Jorge Euclides Mayer,Totti, José Artemio, & Bazzo, José Luiz. 1996. Forma de tronco e sortimentos demadeira de Eucalyptus grandis Maiden para o estado do Rio Grande do Sul. Ciência

Florestal, 6(1), 79–88.

Schumacher, Francis Xavier. 1933. Logarithmic expression of timber-tree volume. J

Agric Res, 47, 719–734.

Page 93: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas 92

Scolforo, JRS, MELLO, JM de, & LIMA, CS de A. 1994. Obtenção de relaçõesquantitativas para estimativa de volume do fuste em floresta estacional semidecíduamontana. Cerne, 1(1), 123–134.

Scolforo, JRS, MACHADO, SA, & Silva, ST. 1997. O manejo da vegetação nativa atravésde cortes seletivos. EMBRAPA-CNPF. Documentos.

Seabold, Skipper, & Perktold, Josef. 2010. Statsmodels: Econometric and statisticalmodeling with python. In: 9th Python in Science Conference.

Shanno, David F. 1970. Conditioning of quasi-Newton methods for function minimiza-tion. Mathematics of computation, 24(111), 647–656.

Silva, Giovanni Cimolin da, et al. . 2018. Detecção e contagem de plantas utilizandotécnicas de inteligência artificial e machine learning.

Silva, IN da, Spatti, Danilo Hernane, & Flauzino, Rogério Andrade. 2010. Redes neuraisartificiais para engenharia e ciências aplicadas. São Paulo: Artliber, 23(5), 33–111.

SILVA, JAA da, & NETO, F de P. 1979. Princípios básicos de dendrometria. Recife:

Universidade Federal Rural de Pernambuco, Departamento de Ciência Florestal.

Silva, JN. 2001. Manejo florestal sustentável em escala comercial. In: Embrapa

Amazônia Oriental-Resumo em anais de congresso (ALICE). In: FORUM DE BELÉMDESAFIOS PARA A PESQUISA FLORESTAL NA AMAZÔNIA, 1999, Belém, PA.Palestras e resumos. Belém, PA: Embrapa Amazônia Oriental, 2001.

Silva, JOSÉ ANTÔNIO ALEIXO da, & Neto, Francisco de Paula. 1979. Princípios

básicos de dendrometria. UFRPE.

Simard, Patrice Y, Steinkraus, David, Platt, John C, et al. . 2003. Best practices forconvolutional neural networks applied to visual document analysis. In: Icdar, vol. 3.

Soares, FAAMN. 2012. Predição recursiva de diâmetro de clones de eucalipto utilizando

rede perceptron de múltiplas camadas para o cálculo de volume. 2012. 131p. Ph.D.thesis, Tese (Doutorado em Engenharias). Universidade Federal de Uberlândia, Uber-lândia.

Soares, Fabrizzio A. A. M. N., Flores, Edna L., Cabacinha, Christian D., Carrijo, Gil-berto A., Veiga, Antonio C. P., & Carneiro, Milena B. P. 2010 (October). MultilayerPercepton for Recursive Diameter Prediction of Eucalyptus Clones [Multi-Layer per-

ceptron na predicao recursiva de Diametros de clone de eucalipto]. In: Proceedings of

8th UFU Conference on Electrical Engineering Studies (CEEL). Electrical EngineeringFaculty / UFU, Uberlandia–MG, Brazil. Text in Portuguese.

Page 94: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas 93

Soares, Fabrizzio A. A. M. N., Flores, Edna L., Cabacinha, Christian D., Carrijo, Gil-berto A., & Veiga, Antonio C. P. 2011. Recursive diameter prediction and volumecalculation of eucalyptus trees using Multilayer Perceptron Networks. Computers and

electronics in agriculture, 78(1), 19–27.

Soares, Fabrízzio Alphonsus AMN, Flores, Edna Lúcia, Cabacinha, Christin Dias, Car-rijo, Gilberto Arantes, & Veiga, Antônio Cláudio Paschoarelli. 2013. Recursive diame-ter prediction for calculating merchantable volume of eucalyptus clones using Multi-layer Perceptron. Neural Computing and Applications, 22(7-8), 1407–1418.

Van Dyk, David A, & Meng, Xiao-Li. 2001. The art of data augmentation. Journal of

Computational and Graphical Statistics, 10(1), 1–50.

Vibrans, Alexander Christian, Sevgnani, Lúcia, Lingner, Débora Vanessa, de Gasper,André Luis, & Sabbagh, Shams. 2010. Inventário florístico florestal de Santa Catarina(IFFSC): aspectos metodológicos e operacionais. Pesquisa Florestal Brasileira, 30(64),291.

Vieira, Giovanni Correia, de Mendonça, Adriano Ribeiro, da Silva, Gilson Fernandes,Zanetti, Sidney Sára, da Silva, Mayra Marques, & dos Santos, Alexandre Rosa. 2018.Prognoses of diameter and height of trees of eucalyptus using artificial intelligence.Science of The Total Environment, 619, 1473–1481.

Werbos, Paul. 1974. Beyond Regression:"New Tools for Prediction and Analysis in theBehavioral Sciences. Ph. D. dissertation, Harvard University.

Werbos, Paul J, et al. . 1990. Backpropagation through time: what it does and how to doit. Proceedings of the IEEE, 78(10), 1550–1560.

Widrow, Bernard, & Hoff, Marcian E. 1994. Adaptive switching circuits (in IREWESCON Convention Record 1960). SPIE MILESTONE SERIES MS, 96, 105–105.

Williams, Ronald J, & Zipser, David. 1989. A learning algorithm for continually runningfully recurrent neural networks. Neural computation, 1(2), 270–280.

Wright, Stephen, & Nocedal, Jorge. 1999. Numerical optimization. Springer Science,35(67-68), 7.

Xavier, A. 2002. Silvicultura clonal I: princípios e técnicas de propagação vegetativa.Viçosa: UFV.

Xiao, Rongrui, Carande, Richard, & Ghiglia, Dennis. 1998. A neural network approachfor tree height estimation using IFSAR data. Pages 1565–1567 of: Geoscience and

Page 95: Predição de Diâmetros e Cálculo de Volume de Clones de ...

Referências Bibliográficas 94

Remote Sensing Symposium Proceedings, 1998. IGARSS’98. 1998 IEEE International,vol. 3. IEEE.