Post on 09-Nov-2018
MINERAÇÃO DE DADOS PARA ANÁLISE E DIAGNÓSTICO AMBIENTAL
Gilberto Carvalho Pereira
TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS
PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA UNIVERSIDADE
FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS
NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE DOUTOR EM CIÊNCIAS
EM ENGENHARIA CIVIL.
Aprovada por:
_____________________________________________________
Prof. Nelson Francisco Favilla Ebecken, D.Sc.
_____________________________________________________
Prof. Ricardo Coutinho, Ph. D.
_____________________________________________________
Prof. Alexandre Evsukoff, D.Sc.
_____________________________________________________
Prof. Eliane Gonzales Rodriguez, D.Sc.
_____________________________________________________
Prof. Fernando Pellon de Miranda, Ph. D.
_____________________________________________________
Prof. Eduardo Raul Hruschka, D.Sc.
RIO DE JANEIRO, RJ – BRASIL
DEZEMBRO DE 2005
PEREIRA, GILBERTO CARVALHO
Mineração de Dados para Análise e
Diagnóstico Ambiental [Rio de Janeiro]
2005
XIII, 194.p.29,7 cm (COPPE/UFRJ, D. Sc.,
Engenharia Civil, 2005)
Tese – Universidade Federal do Rio de
Janeiro, COPPE
1. Mineração de Dados
2. Sistemas Inteligentes
3. Diagnóstico Ambiental
I. COPPE/UFRJ II. Título (série)
ii
“Devemos desejar e procurar o
último grau de perfeição, não para
nos tornar-mos superiores aos
outros, mas colocar-mo-nos sob os
pés de todos”.
iii
À memória de meu pai
iv
Agradecimentos
Ao Prof. Nelson Ebecken, pela orientação e oportunidade dada para desenvolver
este trabalho.
A todos os colegas e funcionários da COPPE, pela assistência e agradável
convivência.
Ao Dr. Ricardo Coutinho, por ter fornecido os dados inéditos para execução
deste trabalho e por valiosas discussões neste período.
Á Capes, pela bolsa de estudos concedida, e a UFRJ, pela boa formação
acadêmica.
v
Resumo da Tese apresentada à COPPE/UFRJ como parte dos requisitos necessários
para a obtenção do grau de Doutor em Ciências (D. Sc.)
MINERAÇÃO DE DADOS PARA ANÁLISE E DIAGNÓSTICO AMBIENTAL
Gilberto Carvalho Pereira
Dezembro/2005
Orientadores: Nelson Francisco Favilla Ebecken
Ricardo Coutinho
Programa: Engenharia Civil
A zona costeira brasileira apresenta grande extensão e variedade de ambientes.
Nesta região, concentram-se mais de sessenta por cento da população e da atividade
econômica do país, o que causa enorme pressão nos recursos naturais. Contudo, pouco
se sabe sobre sua diversidade biológica e o funcionamento dos ecossistemas. Mudanças
ambientais são constantes, sendo importante distinguir entre variabilidade natural e
antrópica. Neste cenário, o objetivo deste trabalho é apresentar uma metodologia para o
desenvolvimento de um Sistema Inteligente de Gerenciamento Integrado do
Ecossistema Costeiro (SIGIEC), capaz de avaliar o nível de qualidade e saúde ambiental
através do conceito de Integridade Biológica. Foram usadas séries temporais de dez
anos de parâmetros físicos, químicos e biológicos para extrair conhecimento e gerar
modelos de regras de associação para classificar sete diferentes tipos de condições
ambientais, analisadas através da diversidade biológica, assim como um novo índice
trófico (PLIX). Redes neurais artificiais foram otimizadas por algoritmos genéticos para
fazer predições destes índices, apresentando um diagnóstico ambiental baseado na
análise dos mecanismos de controle da topologia, estabilidade e propriedades do
comportamento complexo de redes alimentares, além das possibilidades de extinções
em cascata.
vi
Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the
requirements for the degree of Doctor of Science (D. Sc.)
DATA MINING FOR ENVIRONMENTAL ANALYSIS AND DIAGNOSTIC
Gilberto Carvalho Pereira
December/2005
Advisors: Nelson Francisco Favilla Ebecken
Ricardo Coutinho
Department: Civil Engineering
The Brazilian coastal zone presents a large extension and a variety
environments. More than sixty percent of the population and economic activities in the
country take place in this region which is characterized by a huge pressure on
environmental resources. Nevertheless, little is known about biological diversity and
ecosystem dynamics. Environmental changes always occurs; however, it is important to
distinguish natural from anthropic variability. Under these scenarios, the aim of this
work is to present a methodology to develop an Intelligent System for Coastal
Ecosystem Integrated Management (SIGIEC), which is able to access the quality and
health levels of the environment through the biological integrity concept.Ten year time
series of physical, chemical and biological parameters were used to generate a
classification model based on association rules that recognizes seven different classes
based on biological diversity and a new trophic index (PLIX). Artificial neural networks
were evolved and optimized by genetic algorithms to forecast these indices, enabling
environmental diagnostic to be made taking into account control mechanisms of
topology, stability and complex behavioral properties of food web, as well as cascade
extinction possibilities.
vii
ÍNDICE
FICHA CATALOGRÁFICA ii
DEDICATÓRIA iv
AGRADECIMENTOS v
RESUMO vi
ABSTRACT vii
ÍNDICE viii
GLOSSÁRIO x
CAPÍTULO I
INTRODUÇÃO 1
1.1 - Objetivos 2
1.2 – Relevância 3
1.3 – Estado da Arte 5
CAPÍTULO II
ESTRATÉGIA E DEFINIÇÃO DO PROBLEMA 12
2.1 – Caracterização de Área de Estudo 14
2.2 – O Ecossistema da Ressurgência 16
2.3 – A Atividade Planctônica 17
2.3.1 - O Fitoplâncton 19
2.3.2 - Ecologia das Larvas Merozooplanctônicas 21
CAPÍTULO III
ANÁLISE E DESCRIÇÃO DOS DADOS DISPONÍVEIS 27
CAPÍTULO IV
CLASSIFICAÇÃO DE DADOS E EXTRAÇÃO DE REGRAS 48
4.1 – Aquisição de Conhecimento 48
4.2 – Regras de Associação de Dados 49
4.3 – Análise de Regras Interessantes 55
4.4 – Regras de Classificação de Dados 65
4.5 - Regras “Fuzzy” e Classificação de Dados 73
viii
4.6 – Redes Neurais 78
4.7 – Performance dos Classificadores 80
CAPÍTULO V
PREDIÇÃO DE GRANDEZAS E INDICADORES 83
5.1 – Estrutura Conceitual 84
5.2 - Interesses e Desafios 85
5.3 – Critérios para seleção de Indicadores 86
5.4 – Indicadores de Comunidade e Nível de Paisagem 90
5.5 – Natureza dos Índices Utilizados 91
5.6 - Índices e Gerenciamento de Ecossistemas 98
CAPÍTULO VI
SISTEMA INTELIGENTE E GERENCIAMENTO AMBIENTAL 101
6.1 – Arquitetura Geral do Sistema 102
6.2 – Tipos e Requerimentos dos Usuários 105
6.3 – Funcionalidade 106
CAPÍTULO VII
ANÁLISE DOS RESULTADOS E DIAGNÓSTICO AMBIENTAL 112
7.1 – Análise dos Resultados 112
7.2 – Diagnóstico Ambiental 116
7.2.1 – O Efeito da Presença de Consumidor na Diversidade de Presas 118
7.2.2 – O Efeito da Densidade de Prezas na Diversidade de Consumidores 120
7.3 – Sistemas Complexos, Propriedades Emergentes e Redes Alimentares 123
CAPÍTULO VII
CONCLUSÕES 129
REFERÊNCIAS BIBLIOGRÁFICAS 135
APÊNDICE – Entrevistas com especialistas 165
ANEXO – Séries históricas e histogramas das variáveis estudadas 175
ix
GLOSSÁRIO
Algoritmo – um procedimento sistemático (etapa-por-etapa) para solucionar um
problema.
Ambiente – (1) termo geral usado para descrever produtos, hardware e softwares que
constituem um sistema computacional; (2) termo geral que define as condições de
existência na natureza.
Aprendizado supervisionado – estratégia de treinar modelos para adquirir
conhecimento ou habilidade de entender através de educação ou experiência dada por
um professor ou procedimento sistemático.
Arquitetura recorrente – modelo cuja estrutura apresenta conexões com
retroalimentação de um ou mais de seus elementos.
Área costeira – área ao longo do litoral de abrangência dos efeitos naturais resultantes
das interações terra-mar-ar, que leva em conta a paisagem físico-ambiental, a
integridade e os processos de unidades ecossistêmicas litorâneas, incluindo atividades
sócio-econômicas.
Atributo – na linguagem de Mineração de Dados, significa uma variável. Propriedade
“própria” de um objeto.
Back-propagation – algoritmo de treinamento de modelos de redes neurais.
Banco de dados – ambiente computacional para armazenamento, manuseio e descrição
de relações de dados, composto por diversas tabelas.
Base de dados – coleção de dados estocados.
Base de regras – sistema que usa um conjunto de regras para definir situações e ações
apropriadas.
Bentos – organismos que vivem no substrato, fixos ou não.
Biosfera – conjunto de todos os seres e ecossistemas.
Biota – termo geral que se refere a todos os organismos de determinado lugar.
“Bottom-up” – tipo de controle de cadeias tróficas em que as condições ambientais ou
as espécies da base da rede determinam a composição e estrutura dos níveis mais
elevados do sistema.
Clorofila – pigmento responsável pelo processo de fotossíntese.
Competência – fase em que uma larva reúne as condições fisiológicas necessárias para
sua fixação.
x
Conhecimento – uma coleção de relações declarativas e de procedimentos extraída de
dados ou da experiência de um especialista.
Conectividade – padrão de distribuição das ligações entre os elementos de um sistema
ou modelo que define sua topologia.
Data mining – metodologia para aquisição de conhecimentos extraídos de bancos de
dados.
Dendrogama – estrutura em forma de “árvore”.
Ecossistema – conjunto de elementos bióticos arranjados hierarquicamente
(Comunidade) interagindo com a componente abiótica (Ambiente).
Eficiência trófica – eficiência de transferência de energia entre os níveis tróficos de
uma rede alimentar.
Epibentônico – termo que separa os organismos em categorias de tamanho de acordo
com sua posição usual na região de interface entre a coluna d`água e o sedimento
(boudary layer). Inclui, macro, meso e microfauna.
Espécie trófica – organismos que tem os mesmos hábitos alimentares e servem como
presas para os mesmos predadores.
Eutrofização – processo de enriquecimento de uma substância mineral ou orgânica em
ambientes aquáticos.
Feedback – mecanismos de ação positiva ou negativa comuns ao funcionamento de
redes alimentares.
Feedforward – tipo de arquitetura de modelo sem ligações de retroalimentações.
Fitoplâncton – conjunto de organismos microscópicos e clorofilados responsáveis pela
maioria da produção primária em ecossistemas aquáticos.
Fuzzy – lógica que aborda o tratamento qualitativo do conhecimento e é utilizada para
representar incertezas através da designação de valores relativos.
Gametas – células reprodutivas tanto femininas como masculinas.
Hiperplano - em geometria é um subespaço linear, afim ou projeção de co-dimensão.
No espaço tridimensional, é um plano habitual, no bidimensional é uma reta e no
monodimensional, um ponto.
Inteligência Artificial – ramo das ciências da computação dedicado a estudar a maneira
pela qual os computadores podem ser usados para simular ou reproduzir funções
humanas.
xi
Integridade biológica - habilidade do ecossistema de suportar e manter o balanço
integrado e adaptativo da organização estrutural, funcional e da diversidade da
comunidade.
Interface – em um sistema computacional, uma ligação que fornece comunicação entre
duas porções do processo.
Larva – organismo cujo desenvolvimento se encontra entre a eclosão do ovo e a
metamorfose para a fase de adulto.
Mapeamento – conjunto de associações entre elementos de uma base de dados.
Meroplâncton – conjunto de organismos que passam pelo menos uma fase de seu ciclo
de vida no plâncton.
Nécton – organismos que estão na coluna d’água e têm capacidade natatória para se
deslocar independentemente de correntes.
Nicho – lugar onde se pode encontrar determinado organismo ou sua posição na rede de
interações tróficas.
Objeto – entidade física ou conceitual que tem atributos e características definidas.
Ontogênico - todo o período de desenvolvimento de um organismo desde a
segmentação do zigoto até que ele próprio se complete como indivíduo adulto.
Pelágico – referente ao que está na coluna d’água.
Perceptron – um tipo de neurônio artificial.
Plâncton – conjunto de organismos que está na coluna d’água à deriva das correntes.
Recrutamento – processo de assentamento e fixação das larvas na colonização de um
substrato. Fase em que a larva deixa a vida planctônica para a bentônica.
Regra – uma declaração que consiste de duas partes, antecedente e conseqüente, que
define um particular objeto ou comportamento.
Rede alimentar – conjunto de interações tróficas que estruturam as comunidades
biológicas.
Rede neural – modelo conexionista com vários neurônios artificiais.
Ressurgência – movimento ascendente de água profunda.
Sistema especialista – um programa da área de inteligência artificial que consiste de
uma interface de usuário, um sistema de busca e uma base de conhecimento que
representa a solução de um problema específico.
Subsidência – período em que não ocorre o processo de ressurgência.
xii
“Top-down” – tipo de controle de redes alimentares em que a presença de organismos
de níveis mais elevados determinam a composição e biomassa dos níveis inferiores. Ex.
“trophic cascade”.
Trófico – relativo ao alimento.
Zona intertidal – zona situada entre as marés baixa e alta.
Zooplâncton – conjunto de animais microscópicos da coluna d’água.
xiii
1
Capítulo I
Introdução
O ambiente costeiro brasileiro apresenta grande variedade de ecossistemas,
desde áreas alagadas e pantanosas a manguesais, zonas de corais, como o arquipélago
de Abrolhos, até extensos bancos de algas do tipo kelp, além de inúmeras praias de
diversos tipos de areia separadas por costões rochosos. Apesar da enorme extensão da
zona costeira, pouco se sabe sobre os três níveis da nossa diversidade biológica:
genético, espécie e ecossistema. No entanto, sabe-se que a biodiversidade marinha é
extremamente valiosa para o gênero humano, contribuindo com mais de 60% do valor
econômico da biosfera (COSTANZA et al. 1997). A vida marinha fornece cinco
serviços básicos para o homem (COSTANZA et al., 1999 e DAILY, 1997):
− Serviços do ecossistema, como a “bomba biológica”, que retira o dióxido de
carbono da atmosfera e transporta o carbono para o fundo do mar, como
também o papel de recifes de corais e pântanos costeiros moderando a erosão
costeira;
- Alimento, pois aproximadamente 20% da proteína consumida no planeta é
proveniente da pesca (FAO, 1997);
− Medicamentos, como produtos biológicamente ativos, inclusive agentes
antitumorais;
− Minerais e químicos, abióticos, como os combustíveis fósseis, manganês e sal
e biótipos, como colóides de algas e quitina de crustáceos, para indústria de
alimentos, médica e tecnológica;
- Recreacional e ecoturismo, especialmente a vida marinha da megafauna
(mamíferos) e corais que suportam a economia de alguns locais.
Apesar do seu imenso valor, os ecossistemas marinhos estão se deteriorando
rapidamente pela alteração física do habitat, super exploração, introdução de espécies
exóticas, mudanças do clima global, e poluição marinha (HISON, 2001). Os sistemas
mais avançados estão na zona costeira, especialmente estuários, mangues, recifes de
corais e comunidades associadas com o fundo da plataforma continental e o costão
rochoso (CARLTON et al. 1991,1993,1999 e CULOTTA 1994).
O modo reprodutivo mais comum de organismos multicelulares no mar (com
exceção de tubarões, mamíferos e outros poucos grupos) é a disseminação da desova de
gametas com dispersão em correntes marinhas durante o estádio larval. Muito pouco se
sabe a respeito do grau de conectividade entre estes organismos (COWEN et al. 2000),
que tem importantes ramificações para a conservação das espécies. Será difícil
conservar alguma coisa que seja desconhecida. A questão chave é: o que se quer
conservar e como isso funciona? Existe uma grande necessidade de monitoramento a
longo prazo dos ecossistemas marinhos em múltiplas escalas. Neste sentido, este estudo
dedicará esforços a analisar dados físicos, químicos e biológicos da água do mar da
reserva extrativista de Arraial do Cabo, compreendendo séries temporais de medidas
semanais realizadas ao longo dos últimos 10 anos na ilha de Cabo Frio (230S, 420W).
1.1) Objetivos
Comunidades ecológicas representam uma complexa rede de interações entre
muitas espécies. Estas interações apresentam um desafio, tanto para os ecólogos
teóricos como para empíricos que tentam predizer como as comunidades mudam em
resposta às perturbações ambientais.
A inspeção de dados ecológicos relativos ao bentos, plâncton ou necton,
normalmente resulta em um complexo conjunto de dados bióticos e ambientais a partir
do qual padrões e relações precisam ser extraídos no intuito de aumentar o
entendimento sobre o funcionamento dos nossos ecossistemas (FIELD et al. 1982).
Este estudo tem como objetivos principais os seguntes tópicos:
- Acessar os padrões de comportamento trófico do ecossistema, explicitando este
conhecimento através de uma base de regras geradas de modelos para a
classificação e previsão destes padrões no ambiente estudado;
2
- Investigar os padrões de variabilidade temporal do suprimento de larvas;
- Examinar as relações destes padrões a disponibilidade de alimento e a relação
deste alimento com os parâmetros físicos e químicos de qualidade de água.
Estes objetivos correspondem a três questões básicas que devem ser respondidas:
1. É possível separar causas exógenas (ambientais) de causas endógenas (bióticas)
com respeito à variação de densidades populacionais a partir de séries temporais
de dados ?
2. Padrões temporais de longa duração da dinâmica populacional podem ser gerados
por processos endógenos? Estes processos podem ser caracterizados em um
conjunto de dados reais?
3. É possível predizer como mudanças ambientais afetam a média de densidade
populacional ?
1.2) Relevância
Segundo OLIVER et al. (2000), no sistema de costões rochosos, a dinâmica das
populações de indivíduos adultos está relacionada com os processos de pré e pós
assentamento. A estrutura das comunidades bentônicas marinhas varia espacial e
temporalmente com respeito à componente dos invertebrados dominantes; então,
determinar como os fatores ambientais que influenciam a dinâmica das comunidades
marinhas é de suma importância para se preservar os recursos naturais e renováveis da
área costeira.
APOLINÁRIO (1999), demonstrou que a disponibilidade de larvas e o baixo
recrutamento causam a não manutenção de populações da zona intertidal em costões
rochosos.
De acordo com VALANTIN (1988), as relações fitoplâncton/zooplâncton, em
linhas gerais, apresentam uma correlação positiva direta entre as variações de
3
abundância do fitoplâncton e do zooplâncton, que representam um estado de equilíbrio
entre esses níveis tróficos nas águas oligotróficas. Em regiões de ressurgência,
deveríamos ter uma relação negativa, característica de um ecossistema em desequilíbrio.
Entretanto, em Arraial do Cabo, esta correlação é positiva, devido à ocorrência de
simultaneidade de máximos, indicando um sistema em estágio avançado de maturidade
e mais complexo do ponto de vista dinâmico. Durante a ressurgência, o “bloom” algal
induz a desova e o desenvolvimento larval dos herbívoros, as larvas são levadas para o
alto mar pelas correntes de deriva da ressurgência e submetidas a um processo de
migração ontogênica. Esta migração permite que as larvas retornem na ocasião do ciclo
de ressurgência seguinte. Assim, se o espaço de tempo entre dois eventos de
ressurgência for igual ao ciclo de vida do herbívoro, pode haver simultaneidade de picos
de abundância do fitoplâncton e do zooplâncton. Esta simultaneidade é de grande
importância, pois do ponto de vista trófico, pode contribuir para o aumento da
herbivoria que, por sua vez, controla o desenvolvimento algal.
Portanto, fica claro que entender os padrões de comportamento do ecossistema e
estabelecer as regras que descrevem as relações tróficas existentes entre seus diversos
componentes a longo prazo é de vital importância para o desenvolvimento sustentável e
gerenciamento da zona costeira. Além disto, o próprio fato de se construir séries
temporais de diversos organismos marinhos, que passam um período de seus ciclos de
vida no plâncton, os torna excelentes indicadores biológicos das possíveis perturbações
que possam ocorrer no ecossistema, sendo possível usá-los como modelos para
previsões de qualquer efeito ao nível bentônico.
Outros fatos que despertam a atenção nestes organismos vêm da própria
atividade bioincrustante. Este comportamento faz com que estruturas como plataformas
tenham sua massa aumentada, embarcações aumentem o consumo de combustível em
até 10% e tubulações marítimas sejam obstruídas reduzindo as trocas de calor (usina
nuclear de Angra dos Reis).
4
1.3) Estado da Arte
SKINNER & COUTINHO (2002) demonstraram em seus resultados
preliminares que o assentamento de duas espécies de cirripédios do costão rochoso de
Arraial do Cabo ocorre durante o período de outono/inverno, quando uma maior
densidade de larvas do tipo cipris foi observada em amostras planctônicas. Neste
período, são verificadas na água do mar as temperaturas mais elevadas, devido à pouca
ocorrência do fenômeno de ressurgência. Contrastando com a primavera e verão,
período de menores temperaturas, são observadas as maiores densidades de larvas do
tipo náuplio em relação às do tipo cipris. Esses resultados sugerem que a temperatura
pode acelerar a taxa de metamorfose larval ou que as tormentas de inverno podem
aumentar o transporte e o suprimento de larvas para a costa.
Em 1989, vários autores (DAVIS et al., FOLSE et al., REINHARDT et al.,
RITCHIE, RYKIEL, e STARFIELD) discutiram o uso de sistemas especialistas, um
ramo da inteligência artificial, que usa essa abordagem para processar conhecimento
obtido em ecologia e gerenciamento de recursos naturais. Tal procedimento inclui uma
base de conhecimento que contém regras do tipo “se-então” e um sistema de inferência,
que é um procedimento para processar regras. Normalmente, um sistema especialista é
criado através de entrevistas com especialistas, que fornecem o conhecimento para a
geração de regras. No entanto, em determinados casos, o conhecimento sobre o
funcionamento de um sistema complexo nem sempre poderá ser percebido pelos
próprios especialistas. Com os avanços tecnológicos, os sistemas de armazenamento de
dados e monitoração de fenômenos observados têm acumulado grandes massas de
dados que escondem conhecimento incapaz de ser extraído pelo ser humano. Este tema
é tratado pela disciplina “KDD–Knowledge Discovery in Databases”(descoberta de
conhecimento em banco de dados),, que é um processo (Figura 1.1) interativo que se
vale de algoritmos eficientes de mineração de dados, i.e. “Data Mining”.
5
Estabelecer os objetivos
Selecionar os D ados
A valiar osR esultados
O ferecer Soluções
ExtrairC onhecim ento
M odelar os D ados
T ransform ar os D ados
P ré-processaros D ados
Problem asProblem asA m bientais ?A m bientais ?
Figura 1.1 - Fases do Processo de Extração de Conhecimento .
Data Mining é uma atividade multidisciplinar que envolve diversas áreas (Figura
1.2), fornecendo as ferramentas para a descoberta de conhecimento em grandes massas
de dados. Data Mining não é uma tecnologia nova, mas um campo de pesquisa
multidisciplinar fortemente acoplada, envolvendo estatística, aprendizado de máquinas,
banco de dados, sistemas especialistas, técnicas de visualização de dados e computação
de alto desempenho.
Figura 1.2 – Mineração de Dados
O aparecimento das redes neurais data dos anos 40 e se deu no âmbito da
neurofisiologia. Este tipo de modelo foi usado com sucesso por vários campos de
pesquisa, mas sua aplicação em ecologia é bastante recente e se verifica apenas em
6
meados dos anos 90 em uma variada gama de objetivos e notáveis exemplos, conforme
descrito a seguir:
- Estimativas de taxas de consumo de alimento foram feitas por LEK et al.,
(1995);
- CHON et al.(1996) usaram uma rede neural de Kohonen, que é um algoritmo
de aprendizado não supervisionado, para agrupamento de microinvertebrados
bentônicos com o intuito de acessar a estrutura da comunidade;
- SCARDI (1996) demonstrouou que redes neurais podem estimar melhor a
produção do fitoplâncton do que modelos tradicionais de regressão linear;
- LEVINE et al. (1996) utilizaram uma rede do tipo “feed forward” treinada com
o algoritmo “back propagation” para classificar a estrutura de solos;
- BARAN et al. (1996), utilizaram redes neurais para a estimativa de biomassa e
densidade de trutas;
- POFF et al. (1996) criaram um modelo de rede neural que conseguiu boa
concordância entre a previsão do modelo e o fluxo observado de descarga da correnteza
de um rio, tendo como entradas dados da média diária de precipitação e medidas de
temperatura;
- BOUDJEMA e CHAU (1996) demonstraram a utilidade das redes neurais para
previsão de picos em séries temporais contendo pouco e muito ruído; seus dados
continham medidas de parasitas de madeira de árvores e abundância de sardinhas;
- TAN e SMEINS (1996) usaram uma rede neural para previsão das mudanças
das espécies dominantes em comunidades de pastagem, tendo como entradas do modelo
variáveis climáticas;
- BREY et al. (1996) uutilizaram variáveis bióticas e abióticas para estimar a
razão produção/biomassa de invertebrados bentônicos e demonstraram que as redes
neurais tiveram melhor performance que modelos de regressão múltipla;
- LEK et al. (1996) fizeram associações das características físicas do habitat de
desova de trutas em rios da França;
7
- MASTRORILLO et al. (1997) realizaram previsões da abundância de espécies
de ciprinídeos com redes neurais também em rios da França;
- GUAN et al. (1997), utilizaram uma rede neural para gerar e ranquear
parâmetros importantes na variância de modelos do mecanismo de crescimento de
florestas;
- RECKNAGEL et al. (1997) usaram níveis de concentração de nutrientes,
medidas de irradiação incidente, temperatura, profundidade e tempo de retenção da água
como variáveis de entrada de modelos de redes neurais para predizer com sucesso
“blooms” algais em quatro sistemas de água doce;
- PARUELLO e TOMASEL (1997), verificaram que as redes neurais
apresentaram melhor performance que modelos de regressão linear para previsão de um
índice de vegetação de diferenças normalizadas (NDVI) usando sensoriamento remoto;
- GUÉGAN et al. (1998) realizaram previsões da diversidade de peixes com
modelos neurais;
- SCHREER et al. (1998) compararam de técnicas estatísticas de agrupamentos
de dados e um algoritmo de treinamento não supervisionado de redes neurais para
estudar perfis de mergulho de animais marinhos;
- ÖZESMI e ÖZESMI (1999) usaram uma abordagem de redes neurais para
modelar características espaciais do habitat com interações interespecíficas;
- AOKI et al. (1999) fizeram previsões da resposta da biomassa zooplanctônica
às mudanças climáticas e oceânicas utilizando redes neurais;
- BARCIELA et al. (1999) compararam um modelo convencional de estrutura
dinâmica e uma rede neural para modelar a produção primária em uma baía costeira
afetada por ressurgência;
- MANEL et al. (1999 a, b), realizaram uma comparação de análise
discriminante, redes neurais e regressão logística para previsão da distribuição de
espécies.
8
PEREIRA e EBECKEN (2002) apresentaram com sucesso modelos de rede
neurais do tipo “perceptron múltiplas camadas” treinadas com o algoritmo “back
propagation” para fazer previsões futuras de curto, médio e longo período da clorofila-a
usada como estimativa da biomassa algal a partir de dados físico/químicos da água do
mar de Arraial do Cabo. A arquitetura do modelo foi otimizada por um algoritmo
genético. O fato curioso é de que o modelo de melhor performance apresentou
arquitetura recorrente.
Procedimentos de modelagem convencional freqüentemente assumem relações
lineares entre variáveis ecológicas, o que não é o caso. Redes Neurais artificiais
oferecem uma vantagem sobre os modelos tradicionais e fornecem uma plataforma útil
na qual modelos não lineares podem ser desenvolvidos. Uma das vantagens das redes
neurais é sua habilidade de aprender e descobrir padrões nos dados que não são
prontamente observados pelos pesquisadores ou métodos estatísticos (MASTERS,
1993). É esta habilidade em aprender a partir de exemplos novos e a capacidade de
generalização que proporcionaram o aumento de sua popularidade e o desenvolvimento
de diversas arquiteturas e algoritmos de aprendizado, como ilustrado na Figura 1.3.
9
Figura 1.3 - Modelos de Redes Neurais
Feed-forwardAprendizado
Híbrido
Clustering and Bayesian Learning
Prob NN
Clustering and Least Square
Learning RBF
Madaline
Back-propagation Multi-Layer
Single Layer Adaline
Perceptron
Feed-forward
Aprendizado Supervisionado
RecorrentART MAP ART
Boltzman
Recurrent BP Multi-Layer
RTRL
BPTT
LVQ Competitive
Aprendizado ConetividadeArquiteturaParadigma
Aprendizado não Supervisionado
Recorrente
Memória Associativa Hopfield
SOM Kohonen
Willshaw, Malsberg´s
ARTART1
ART2
Vector Quantization Competitive
Linker´s SO Feature Extraction Multi-Layer
Sanger´s Method
Oja´s Method Single Layer
Feed-forward
10
Entretanto, os modelos de redes neurais geram saídas apropriadas para qualquer
tipo de base de dados de entrada, mas o usuário normalmente não tem acesso direto para
entender porque e como um particular resultado foi obtido. Por este motivo, as redes
neurais são consideradas modelos “caixa preta”. Nos últimos anos, vários esforços têm
sido feitos para achar efetivos algoritmos de extração de regras que explicitem o
conhecimento adquirido pelas redes após seu treinamento. A real contribuição deste
trabalho será dada pelo acesso às mudanças de produtividade do meio marinho que
podem levar a uma alta heterogeneidade da qualidade do habitat, a qual reflete o nível
de saúde do ecossistema, além de detalhes dos processos ecológicos, para uma análise
mais precisa e diagnóstico das condições ambientais.
As técnicas de extração de regras para classificação e previsão de padrões
apresentam extensa literatura. A título de aplicação desta metodologia em modelagem
ecológica, vale ressaltar os trabalhos de DRUMM et al.,(1999) e BRADSHAW et
al.,(2000, 2002). Ambos utilizam redes neurais em sistemas de informações geográficas
para, através da extração de regras, identificarem características dos respectivos habitats
para determinarem a preferência de espécies na escolha de locais de reprodução ou
potencial de recolonização.
O segundo capítulo deste trabalho apresentará especificamente o problema que
será estudado. O capítulo três trata da descrição da estrutura e preparação dos dados
disponíveis. A metodologia de extração de regras para classificação de padrões será
apresentada no quarto capítulo, enquanto que o capítulo cinco se preocupará em
apresentar as previsões dos modelos de redes neurais em índices de qualidade
ambiental. O capítulo seis demonstra como um sistema inteligente baseado nos
conhecimentos obtidos pelos modelos pode ser aplicado ao gerenciamento costeiro. O
capítulo de número sete é reservado para uma análise dos resultados e elaboração de um
diagnóstico ambiental. No capítulo oito, encontram-se as conclusões finais e
considerações para os trabalhos futuros.
11
Capítulo II
Estratégia e definição do Problema
O acesso ao estado ecológico (diagnóstico ecológico), introduzindo níveis
admissíveis de influência antrópica (padronização ecológica), e a detecção das
conseqüências dos vários cenários de distúrbio na biota (predição ecológica) são a
principal tarefa de um sistema de controle ambiental.
No Brasil, a determinação dos padrões de qualidade do ambiente está baseada no
conceito de concentrações máximas admissíveis de poluentes pelas normas do Conselho
Nacional de Meio Ambiente (CONAMA). Estes valores (padrões) são determinados em
condições de laboratório, durante um curto período de tempo (dias) ou experimentos
crônicos (semanas), com populações de organismos isolados pertencentes a um pequeno
número de “espécies teste” selecionadas, usando um conjunto limitado de respostas
fisiológicas e comportamentais.
A avaliação do estado ecológico é, deste ponto de vista, injustificada, pois é
inconsistente a extrapolação de limites de tolerância de organismos em ecossistemas
multiespecíficos, onde dezenas ou centenas de complexos fatores de diferentes origens
operam simultaneamente em vários backgrounds de funcionamento.
Atualmente, muitas agências ambientais internacionais têm apoiado o uso de
critérios biológicos como indicador de condições ambientais, mais especificamente de
saúde ecológica ou ambiental. Medidas biológicas têm se tornado o foco do grau de
integridade biológica. A determinação de qualidade da água não deve ser apoiada
somente em parâmetros físicos ou químicos. Este fato pode resultar em uma sub-
estimativa do estado de degradação, visto que estes critérios não detectam degradação
proveniente de fontes estressoras não químicas ou seus efeitos cumulativos, nem tam-
pouco todas as substâncias químicas podem ser monitoradas. Esforços têm sido feitos
para incorporar uma quantidade de “informação biológica” para estimar a qualidade dos
corpos d’água e integrar estas informações nos programas de monitoramento (Water
Quality Standards/US-EPA, European Environmental Agency - EEA, Japan
Environmental Management Association of Industry - JEMAI).
12
O conceito de uma tolerância ecológica propondo níveis admissíveis de
influência para a parte biótica do ecossistema poderia ser uma alternativa mais realista.
De acordo com esta abordagem, para qualquer sistema ecológico é possível achar o
limite de variação dos fatores ecológicos e o comportamento de seu funcionamento,
distinguindo um dado ecossistema de outro adjacente, salvo suas estabilidades relativas.
O conceito de tolerância é bem conhecido em ecologia e aplicado ao nível de indivíduo
e população. Porém, a transferência desta idéia para o nível de comunidade e
ecossistema é ímpar, pois estes diferem acima de tudo dos indivíduos e populações pelo
princípio de auto organização. Qualquer mudança nas condições ambientais causa em
primeiro lugar alterações estruturais (flutuações do número de espécies, tamanho e
composição dos grupos tróficos, etc.) da comunidade quanto à constância relativa de
seus índices funcionais de eficiência, taxa de destruição e outros processos do
metabolismo ecológico. Em virtude da excessiva variabilidade das condições
ambientais, a transformação gradual de um dito estado “normal” de um ecossistema em
outro pode ser observada e não ser caracterizada como sua morte. Por essa razão, a
realização de extensas e regulares observações no monitoramento da comunidade a
longo prazo podem ser a única maneira de estabelecer os limites de funcionamento do
ecossistema em relação a qualquer fator ecológico ou poluente. Em outras palavras,
estamos lidando com “experimentos passivos,” os quais são realizados por muito tempo
pelo gênero humano em locais de sua residência, influência e atividade econômica, não
em organismos e substâncias químicas separadas, mas com um completo e complexo
conjunto de fatores que impactam a biota em condições concretas em relação às
características locais. Esta abordagem assume a existência de relações de “causa e
efeito” conectando níveis de influência na biota e a resposta da mesma. O objetivo é
revelar a fronteira entre o funcionamento normal e o patológico no espaço dos fatores
abióticos. Tal limiar é chamado de nível de tolerância ecológica à influência dos
distúrbios.
Deve-se entender aqui o conceito de Integridade Biológica como sendo a
habilidade do ecossistema de suportar e manter o balanço integrado e adaptativo da
organização estrutural, funcional e da diversidade da comunidade.
A ênfase da construção de um cenário para a contextualização deste trabalho
será uma breve e muito resumida descrição dos fatores que podem influenciar as
relações tróficas existentes entre os organismos aquáticos, seus ciclos de vida e o
13
ambiente, com o objetivo de mostrar ao leitor o grau de complexidade e de dificuldade
para se fazer um diagnóstico das condições ambientais.
2.1) Caracterização da Área de Estudo
A região de Arraial do Cabo (Figura 2) está localizada na costa leste do Estado
do Rio de Janeiro. Costões rochosos de formação gnaisse-granito datados do pré-
cambriano dominam a paisagem. Existem poucos rios nesta região; um deles situa-se a
norte do litoral da Ilha Rasa, onde encontramos uma pequena população de manguezal,
o outro encontra-se a sul de Jaconé e corre através do canal de Ponta Negra. A região
continental adjacente tem um complexo lagunar bem desenvolvido e apresenta
formação de dunas com vegetação característica de restinga (SANTOS, 1996). O clima
é considerado uma transição entre tropical quente e subtropical e é dito como seco, se
comparado à umidade geral da costa sudeste brasileira. As condições do tempo são
influenciadas pela alternância de dois anticiclones marítimos, tropical e polar
(BARBIERI, 1975). As marés são regulares semidiurnas, com amplitudes de 0.8 e 1.0
metros, mas frentes frias podem elevar o nível médio do mar (YONESHIGUE, 1985).
Duas principais épocas podem ser identificadas:
1) Primavera-verão, com anticiclone marítimo tropical com ventos prevalecendo E-NE;
2) Outono-inverno com frentes frias polares com ventos SW (VALANTIN et al., 1987).
A cidade de Arraial do Cabo é uma reserva extrativista criada em 1997 e uma das mais
belas paisagens da costa do Estado do Rio de Janeiro, apresentando grande atividade
turística e recreacional, com a presença freqüente de várias operadoras de mergulho,
iatismo e pesca, que juntas contribuem de maneira significativa para a economia local.
O crescimento urbano ocorre de maneira desordenada, gerando problemas de
saneamento público. Uma das fontes de recursos financeiros da cidade vem de uma
indústria de extração e processamento de calcário, que usa a água do mar como fonte de
resfriamento do processo. A existência de um pequeno porto, usado como terminal
salineiro atraiu a atenção de companhias petroleiras que começam a fazer de Arraial do
Cabo uma base operacional. Devido à proximidade com os campos de petróleo da bacia
14
de Campos, tem se tornado comum o fundeio de plataformas para pequenos reparos.
Nos costões rochosos onde, é comum se deparar com várias pessoas das camadas
sociais menos favorecidas, que têm como fonte de renda a retirada de mexilhões e
outros organismos que vivem na zona intertidal. Verifica-se ainda a presença de uma
pequena fazenda marinha em uma das enseadas. Por todos esses motivos, fica clara a
necessidade urgente da gestão de tantos conflitos de interesses e de diferentes pontos de
vista da área costeira.
Figura 2 – Caracterização e localização da área de estudo e ponto de coleta.
15
2.2) O Ecossistema da Ressurgência
As primeiras evidências da ocorrência da ressurgência aparecem com os
trabalhos de MOREIRA DA SILVA (1968, 1971 e 1973), além de VALANTIN,
(1974). Este fenômeno se manifesta mais freqüentemente entre os meses de outubro e
abril, aproximadamente primavera-verão, a sudoeste da Ilha de Cabo Frio, em Arraial
do Cabo. Sua zona de influência pode se estender por mais de cinqüenta quilômetros,
de acordo com sua intensidade (GUIMARÃES & COUTINHO, 1996). Até a latitude
22oS, o litoral brasileiro apresenta uma larga plataforma continental. No entanto, por
causa de uma mudança na orientação da linha costeira a topografia submarina desta
região mostra as isóbatas de 50-100 metros se aproximando da costa e na latitude 23oS
esta distância é de menos de 3 milhas (Ilha de Cabo Frio). Nesta mesma latitude, a
hidrologia própria da região é diretamente dependente das condições meteorológicas,
com o regime de ventos determinando a distribuição das massas d’água. Os ventos E-
NE dominantes de um anticiclone marítimo tropical, provocam, em razão da força de
Coriolis (transporte de Ekman), uma deriva da água superficial da Corrente do Brasil
(CB), que é uma extensão da Corrente Equatorial Sul, que corre em direção sul. A
divergência desta corrente da costa contribui para a origem de uma água costeira (AC)
derivada da mistura com a Corrente de Água Central do Atlântico Sul (ACAS), em
ascensão de 200-300 metros de profundidade. Este padrão se inverte quando da
passagem das frentes frias, que proporcionam ventos SW indicadores do fenômeno
inverso chamado “subsidência” (retorno para a costa das águas superficiais da Corrente
do Brasil). O perfil vertical da temperatura mostra a formação de uma termoclina na
zona de encontro das duas massas d’água (superficial e profunda) que flutua de acordo
com a intensidade e duração dos ventos (VALANTIN et al., 1987).
PAIVA (1993) encontrou uma forte correlação entre o nível médio do mar, o
regime de ventos e a temperatura da superfície do mar. Períodos em que o nível médio
do mar está baixo estão associados a baixas temperaturas superficiais e ventos
predominantes E-NE, sugerindo que o transporte de Ekman é um importante mecanismo
que afeta a ressurgência local.
16
Em resumo, podem ser identificados três principais fatores que aparentemente
influenciam a ressurgência:
1) a topografia;
2) a posição da Corrente do Brasil;
3) o regime de ventos, associado com o transporte de Ekman.
2.3) A atividade planctônica
A comunidade do plâncton marinho representa um grupo de diversos
organismos. Essa diversidade que faceia uma aparente estabilidade é enigmática e tem
sido estendida além de considerações morfológicas à variações fisiológicas. O plâncton
se desenvolve nas massas d’água e sua distribuição obedece aos movimentos das
mesmas dentro de três componentes que caracterizam o meio pelágico: as componentes
zonal, meridional e vertical. As duas primeiras definem a distribuição geográfica, ou
seja, correspondem respectivamente às variações do plâncton ao longo da costa e ao
longo do eixo costa-oceano. A componente vertical é relevante nas áreas onde existe
forte turbulência e correntes ascendentes, tais como a ressurgência e as áreas de
divergência. Uma quarta componente nesta estrutura é a componente temporal,
primordial no estudo da dinâmica do plâncton, e deve ser bem estabelecida em função
do tipo de organismo e do grau de variabilidade dos fatores abióticos a serem
modelados (VALANTIN, 1988). Esta variabilidade provoca diferentes condições
oceanográficas, afetando de maneira importante todo o ecossistema quanto à sua
composição populacional e produtividade da biota ali presente (RODRIGUEZ, 1992).
A ressurgência imprime um estresse ao ecossistema que resulta no seu
“rejuvenescimento”, com populações abundantes de baixa diversidade específica
(MARGALEF, 1978; THIROT, 1978).
Durante os meses da estação primavera-verão, a ascensão de água profunda da
ACAS (Águas Centrais do Atlântico Sul), melhor caracterizada por temperaturas
17
18
inferiores a 18 P
oPC, alta concentração de nutrientes (10 µM de nitrato) e salinidade
variando entre 35 e 36 S%o (GUIMARÃES & COUTINHO, 1996), é responsável pela
ocorrência e desenvolvimento esporádico de formas planctônicas de origem subtropical,
temperada e até batipelágica, enquanto que nos meses da estação outono-inverno,
referentes ao período de subsidência, encontra-se o plâncton tropical de águas costeiras
de superfície com temperaturas acima de 21P
oPC, salinidade entre 35 e 36 S%o e baixo
teor de nutrientes (nitrato e fosfato abaixo de 1 µM). Este fenômeno constitui para o
sistema planctônico um fator geral de variação:
- pela alternância dos movimentos ascendentes e descendentes;
- pela amplitude da componente horizontal;
- pela variação de sua intensidade que caracteriza os ciclos temporais de
curtos e longos períodos.
Na variação sazonal, as maiores biomassas são registradas durante o verão, com
populações microplanctônicas de ordem de 500 a 2 milhões de células por litro. Os
ciclos curtos estão ligados à sucessão das fases de ressurgência e subsidência. Durante
esse período, o fitoplâncton é dominado por diversas populações de grande diversidade
de grupos e espécies (VALANTIN, 1988).
A ressurgência é potencialmente importante para a produtividade da biota local
(MOREIRA, 1971; COUTINHO et al.,1989, COSTA e HAIMOVICI, 1990; COSTA e
FERNANDES, 1993). Os níveis de radiação luminosa em regiões tropicais não são
exatamente limitantes para o crescimento algal quando comparados à luz nas altas
latitudes (LÜNNING, 1990). Quando a luz se torna favorável ao crescimento algal, os
nutrientes são consumidos e constituem então os principais fatores limitantes das
populações fitoplanctônicas. VALIELLA (1994) citou que, além da disponibilidade de
luz e nutrientes, outro fator potencial que limita o desenvolvimento das algas é o
herbivorismo pelo zooplâncton (grazing).
Os resultados obtidos por VALANTIN e COUTINHO (1990), a partir da
simulação de um máximo de clorofila durante um evento de ressurgência, reforçam a
hipótese de uma atuação preponderante dos fatores físicos (advecção lateral) e do
herbivorismo como limitantes do crescimento da biomassa primária nesta região.
2.3.1) O Fitoplâncton
A atividade fotossintética do fitoplâncton, além de variações sazonais
(HARRISON e PLATT, 1980; FALKOWSKY, 1984), é influenciada pela estratificação
da coluna d’água (GALLEGOS et al., 1983), tamanho das células (MALONE, 1977,
1980; HARRIS, 1983; TAKAHASHI e BIEFANG, 1983), temperatura (EPPLEY,
1972; HARRISON et al., 1982; SMITH et al., 1985) e turbulência (LEWIS et al., 1984).
É portanto, fundamental considerar a variação dos parâmetros ambientais na análise da
variação da atividade fitoplanctônica, que é de grande importância ecológica, uma vez
que compromete as medidas de produção diária.
RODRIGUEZ e TENEMBAUM (1995) observaram a variação diurna da
capacidade fotossintética (PmB) do fitoplâncton para duas estações de coleta com
diferentes graus de influência da ressurgência em Arraial do Cabo. Os valores de PmB
(mg C. mg Clor. a-1.h-1) variam de 0,05 a 23,8 para todos os resultados obtidos e a
amplitude máxima ao longo de um dia foi de 0,09 a 4,18. PmB apresentou uma relação
exponencial com a temperatura e com o nitrogênio. A fração nanoplanctônica
representou até 99% do fitoplâncton. A variação da capacidade fotossintética
apresentou na maior parte dos experimentos valores máximos no período entre as 10h e
14h. Os valores mínimos ocorreram em uma população constituída por 88% de
microplâncton e 12% de nanoplâncton. Segundo MAC CAULL e PLATT (1977), as
variações da fotossíntese em populações naturais resultam de uma oscilação intrínseca
do fitoplâncton e de flutuações dos fatores ambientais.
Os resultados de MALONE (1971) mostram que, quando as concentrações de
nitrogênio são limitantes, o nanoplâncton tende a apresentar o máximo de fotossíntese
de manhã e à tarde, quando as águas são ricas devido à sua baixa capacidade de estocar
nutrientes. Já o microplâncton, devido à sua maior capacidade de estocagem, apresenta
o máximo a tarde independentemente do regime de nutrientes. Segundo GLOVER
(1980), a relação entre nutriente limitante e a capacidade fotossintética é variável e
altamente dependente da espécie.
RODRIGUEZ (1994) examinou curvas de saturação de luz do fitoplâncton de
quatro estações da região de Cabo Frio e relatou as trocas das condições ambientais,
19
com base em 263 experimentos feitos semanalmente durante dois anos. Concluiu que
nenhuma diferença na produtividade específica entre as estações foi detectada. A
análise de correlação e regressão atribuiu a maioria das variações de PmB à temperatura,
à salinidade, nutrientes e à razão feoficina / clorofila-a. Não identificou um significante
padrão sazonal devido à enorme variabilidade temporal de PmB , mas esta apresenta
alguma tendência. Essa forte variabilidade pode ser explicada pela grande sensibilidade
deste ecossistema a trocas repentinas na velocidade e direção dos ventos e à alternância
das variáveis hidrológicas e biológicas. A força de estratificação pode também
influenciar a produtividade, já que isto age sobre a luz e o regime de nutrientes (JONES
et al., 1984; LEGENDRE e DEMERS, 1984).
GONZALEZ-RODRIGUEZ, et al.(1992) realizaram uma análise baseada em
diferentes fases de ressurgência e subsidência. Estabeleceram um modelo de análise de
componentes principais e regressão dos aspectos biológicos de Arraial do Cabo. Para
condições idênticas de ressurgência, ocorre uma resposta biológica de igual intervalo,
permitindo o estabelecimento de um padrão regional. Esses padrões são representados
pelos valores de clorofila variando entre 0,5 e 0,6 mg/m-3, e produção primária variando
entre 2 e 14 mg C m-3 h-1. Durante o inverno, na ausência de ressurgência, as águas
apresentam uma temperatura, nutrientes, biomassa primária e produção nos mesmos
níveis daquelas achadas nas fazes de pós-ressurgência. Mesmo na ausência de água
profunda, o enriquecimento orgânico parece ser importante, quando comparado as águas
oligotróficas da corrente do Brasil. A abundância de matéria orgânica nas águas de
inverno, principalmente a maioria oriunda do sedimento ressuspendido do fundo da
plataforma continental, constitui a principal fonte de energia mantendo altos níveis da
rede alimentar, especialmente a abundância do zooplâncton (110 mg/m-3/dia, média
anual, VALANTIN e MOREIRA, 1978), controlando o crescimento das populações do
fitoplâncton.
Num estudo sobre a fertilidade e os fatores nutricionais limitantes da biomassa
fitoplanctônica de Cabo Frio, RODRIGUEZ (1991), comenta que a fertilidade das águas
varia com as espécies consideradas e o período do ano. As águas mais ricas em
nutrientes minerais (N e P) não são sempre as mais férteis. No entanto, são as águas de
ressurgência que, globalmente, são as mais férteis. O nitrogênio e o fósforo são os dois
elementos principais que limitam a biomassa algal; as substâncias complexantes são o
terceiro fator limitante. Deduz-se que as algas podem absorver diretamente formas
20
químicas orgânicas dos elementos nutritivos e, desta forma, outros elementos podem se
tornar limitantes antes dos citados.
O conhecimento do teor mineral da água não é suficiente para se conhecer a
biomassa máxima potencial que ela pode suportar, pois outros elementos não dosados
podem igualmente ser absorvidos e ter papel importante na capacidade de produção
algal (MAESTRINI et al., 1984) influenciando assim, o número de espécies capazes de
se desenvolver sobre as condições presentes. Esta propriedade é conhecida como
“condicionamento biológico” (PROVASALI, 1963; JOHNSTON, 1964) e foi colocada
em evidência por BARBER e RYTHER (1969) e BARBER et al. (1971). BANSEN
(1977), mostra que as células no momento da densidade máxima são pobres em
clorofila-a, mesmo levando-se em consideração as numerosas variações de ordem
fisiológica.
RYTHER e GUILLARD (1959), GOLDMAN e MANSON (1962), CHARPY et
al., (1982) assinalaram que a presença de ferro associado com substâncias complexantes
pode acelerar a assimilação do carbono, conduzindo a uma sub-estimativa do papel do
nitrogênio e do fósforo. Além disso, o elemento limitante não é sempre aquele que está
presente nas águas nas concentrações mais fracas conhecidas (SMAYDA, 1970), pois as
análises levam freqüentemente em conta apenas a parte mineral, enquanto as algas
podem utilizar compostos orgânicos (RAYWCARD, 1965; SOLORZANO e
STRICKLAND, 1968 e ANITA et al., 1975). De outra forma, o efeito crítico de um
elemento depende mais das condições físico-químicas que controlam sua
disponibilidade do que sua concentração total (PROVASALI, 1963). Este processo é
importante para os metais, principalmente o ferro, como mostram HUNTSMAN e
SUNDA (1980). No entanto, um valor elevado de fertilidade a um dado momento não
corresponde forçosamente a um aporte de elementos biogênicos novos, pois formas
químicas regeneradas participam da produção da biomassa. Os elementos que limitam a
biomassa de Arraial do Cabo são o nitrogênio, o fósforo e, em menor grau, o ferro e o
molibdênio (RODRIGUEZ, 1991).
21
2.3.2) Introdução à Ecologia das Larvas Merozooplanctônicas
Este trabalho se propõe a analisar o comportamento da fração meroplanctônica
da fauna epibentônica de Arraial do Cabo, para tentar fornecer um diagnóstico do estado
ecológico e ambiental.
A existência de um estágio de larvas planctônicas no ciclo de vida de
invertebrados marinhos é uma opção e adaptação evolutiva. Em geral, parece que o
ambiente pelágico oferece oportunidades tróficas e dispersivas não disponíveis para
organismos bênticos. O sucesso em um estágio do ciclo de vida requer sucesso na
transição de todos os outros estágios. Um organismo como função do tempo pode ser
uma bem adaptada larva herbívora planctônica e igualmente especializado carnívoro
bentônico da zona intertidal. A gametogênese, desova e fertilização pelos estágios
bênticos são importantes determinantes do sucesso inicial nas formas planctônicas. Da
mesma maneira, o comportamento da larva pelágica determina o habitat dos adultos
bentônicos. É esta propriedade de integração do ciclo de vida que estabelece a própria
perspectiva de análise da componente meroplanctônica da comunidade zooplanctônica
marinha. A maioria dos taxons de invertebrados bênticos possui alguma espécie com
larvas pelágicas.
A descrição da ecologia da fração larval da comunidade planctônica se dará aqui
em três tópicos, como segue:
1) causas de mortalidade durante o período planctônico;
2) energia do desenvolvimento larval e,
3) dispersão.
Uma larva pode ser definida como o estágio de desenvolvimento entre a saída da
membrana dos ovos e a metamorfose para a fase adulta. Tipicamente, tais estágios
possuem estruturas larvais que existem e funcionam somente neste período do ciclo de
vida. Fica claro que a diversidade e variedade de formas apresentadas pelas várias
classes de invertebrados não pode ser adequadamente captada por uma simples e
concisa definição. A intenção aqui é indicar a fase do ciclo de vida que é planctônica.
22
Além disto, os termos pelágico e planctônico serão usados de forma intercambiável com
referência às larvas destes organismos. O período pelágico começa com a desova ou
eclosão. A desova de gametas livres por ambos os sexos resulta em zigotos pelágicos,
embriões e larvas. A duração do período pelágico pode variar de apenas alguns poucos
minutos, como é o caso de algumas ascídias, até anos, como no caso de lagostas. Em
geral, a fase pelágica é pequena se comparada com a fase bentônica dos indivíduos
juvenis e adultos. É observado que, entre a fase de fecundação e a fase de recrutamento,
existe uma taxa de mortalidade muito elevada. Por este motivo, é conhecido que
inúmeras fêmeas podem desovar até quarenta milhões de gametas por ano. MENGE
(1975) estimou que a taxa de mortalidade larval pode chegar em alguns casos a 99%. A
predação, fatores físicos ambientais, a escala de dispersão inapropriada e a inanição têm
sido sugeridos como as principais causas desta elevada taxa de mortalidade. A
influência dos fatores físicos ambientais (temperatura e salinidade) pode não ser a causa
letal direta, porém o estresse sub-letal pode retardar ou acelerar as taxas de
desenvolvimento e o período de permanência no plâncton (JOHNS I , II). HANS (1986)
demonstrou que nauplios de cirripédios apresentaram pouca atividade a baixa
salinidade. Por causa dessa inatividade, as larvas na natureza provavelmente
submergem para camadas com maior salinidade. Comportamento similar foi observado
em decapodas (ANGER, 1985). HANS (1986) atribuiu as diferenças de tamanho de
larvas à temperatura, porque foram achadas as menores larvas em regiões mais frias.
Estes resultados contrastam com os de BARNES (1965), que achou maiores tamanhos
em áreas geográficas mais quentes. Decerto, adaptações não genéticas podem
influenciar na aclimatação, no tamanho e no tempo de desenvolvimento naupliar.
O tempo de permanência no plâncton durante a vida pelágica está relacionado
com a escala de varredura no processo de dispersão da espécie e com o amadurecimento
da larva para encontrar os sítios de assentamento e a escolha do habitat apropriado. A
escala de dispersão está associada à ecologia da fase bentônica. Existe ainda diferentes
graus de respostas de diferentes espécies aos fatores que perturbam as taxas de
desenvolvimento larval. Temperatura, salinidade e estresse nutricional podem aumentar
ou diminuir o número e duração dos estágios larvais. Como conseqüência, é difícil
fazer previsões sobre os efeitos sub-letais do estresse ambiental na taxa de
desenvolvimento e potencial de dispersão.
23
A predação tem sido considerada a mais importante causa da perda de larvas.
Por exemplo, peixes planctívoros e ctenóforos são conhecidos como predadores de
muitas formas de larvas e embriões. É muito difícil estabelecer o efeito quantitativo de
tal predação na natureza, mas a evidência de que este é um importante processo vem da
ocorrência de estruturas de defesa como o desenvolvimento do espinho do rostro, setas e
setulas, bem como defesas químicas e sensibilidade à luz logo depois da eclosão, que
pode levar a larva a regiões isentas de predadores na coluna d’água. A suposição de que
a predação é a mais importante fonte de mortalidade levou a uma série de modelos da
história da vida marinha (CHRISTENSEN e FENCHEL, 1979, CASWELL, 1981,
dentre outros). A característica comum a esses modelos é a adoção de uma taxa de
mortalidade constante e significante, além da minimização do tempo de exposição à
predação.
Considerações energéticas sobre organismos vivendo com quantidades fixas de
combustível (energia) não são triviais. Qualquer fator que mude a taxa de
desenvolvimento, a taxa metabólica, ou o tempo requerido para encontrar o substrato
apropriado para o assentamento pode produzir energicamente uma equivalência à
inanição.
Estudos de laboratório demonstraram a susceptibilidade à inanição. Estes dados
são uma fonte de mortalidade para todas as larvas, exceto aquelas que encontram ricos
patches do plâncton (ANGER, 1981). A composição bioquímica do fitoplâncton mostra
uma maior quantidade de proteínas, carboidratos e alguns lipídios. A maioria das larvas
pode presumivelmente sintetizar todos os ácidos graxos a partir de carboidratos. O
estudo de WEST e COSTLOW (1987) revelou que a limitação da quantidade de
alimento fornecido a larvas com baixo estoque de energia pode resultar em reduzido
sucesso metamórfico. A extensão da vida larval reduz as reservas energéticas da larva
no estágio cipris (non-feedind larvae) e resulta em reduzido crescimento juvenil
(JAECKLE, 1994). A variação temporal do conteúdo orgânico em cipris pode refletir
diferenças na qualidade (FENAUX et al., 1994) e quantidade (MOYSE, 1963) do
alimento disponível nos estágios de nauplio. JARRETT e PECHENIK (1997) mostrou
que a variação temporal da qualidade da larva cipris e a capacidade de crescimento de
juvenis pode também ser por causa da qualidade dos ovos produzidos pelos adultos.
24
A escala de dispersão depende do movimento das massas d’água, do
comportamento larval e da duração dos estágios pelágicos. A longevidade larval e os
movimentos da água estabelecem o potencial de dispersão, enquanto o comportamento
da larva freqüentemente determina o atual grau de difusão e separação. Ambos
contribuem para a distribuição geográfica das espécies bentônicas sedentárias e sésseis,
enquanto as correntes e os fluxos de maré resultam em padrões cíclicos de translocação
e fornecimento de larvas para o processo de recrutamento e assentamento das
populações.
O desenvolvimento da fase larval planctônica é dividido em dois períodos, um
chamado de pré-competente, outro de competente. A duração do período pré-
competente depende das taxas de crescimento e desenvolvimento, as quais são
modificadas por fatores tais como variação genética, temperatura e disponibilidade de
alimento. A competência larval depende do período pré-competente e é um estado
fisiológico que estabelece a capacidade de assentamento. O comportamento de
assentamento é um fenômeno ecológico complexo. Nesta fase do ciclo de vida se
encontra o término da fase larval e envolve uma mudança morfológica e fisiológica
radical durante a transição para as formas adultas bentônicas. O assentamento de uma
larva é um processo de comportamento reversível associado com o contato e exploração
do substrato antes da metamorfose, que, diferentemente, é um fenômeno de
desenvolvimento irreversível mediado por várias transformações do indivíduo entre
formas de vida distintas, que inclui a permanente fixação através da liberação de
“cimento”. No processo de assentamento, ocorre uma resposta da larva à substâncias
indutoras (TAMBURRI et al., 1992). Estes compostos podem ser liberados na água por
indivíduos adultos da mesma espécie (conespecíficos) ou por microorganismos do
biofilme bacteriano. Na realidade, as larvas podem reconhecer locais favoráveis ou não
para o assentamento e metamorfose e exibem variada resposta à presença, ausência e
idade do biofilme (MAKI et al., 1992 e WIECZOREK e TODD, 1998).
MOORE et al., (1994) demonstrou que o processo de assentamento é governado
por forças físicas. As larvas são influenciadas pela interação entre o fluido em
movimento e a superfície do sólido estacionário. Esta interface é chamada boundary
layer, geralmente dividida em três regiões, cada qual caracterizada pela combinação de
forças particulares. A região imediatamente acima da superfície sólida é chamada bed
layer e consiste de duas sub-camadas. Na primeira, ocorre a difusão molecular e pode
25
ter apenas poucos micrômetros de espessura e se caracteriza pela ausência de fluxo. A
sub-camada mais externa (sub-camada viscosa) é caracterizada por um fluxo laminar
(quasilaminar flow), mas é dominada pela força de viscosidade do fluido, tendendo a
diminuir a turbulência. A segunda região, ainda mais externa, é chamada de buffer zone
ou log layer. Nela a força inercial e a viscosidade são importantes na manutenção do
fluxo. Seu nome é dado pelo fato de que a velocidade do fluxo nesta camada é uma
função da distância logarítmica sobre o sólido. A terceira e mais externa é chamada de
camada exterior (outer layer) ou camada de déficit logarítmico (log-deficit layer), onde
o fluxo é praticamente independente da força friccional e o fluido em movimento, se
caracteriza pela presença de grande turbulência.
26
Capítulo III
Análise e Descrição dos Dados Disponíveis
Neste estudo, foram reunidas séries temporais de pouco mais de dez anos,
compreendendo o período de novembro de 1994 até outubro de 2004, fornecidos pelo
Instituto de Estudos Almirante Paulo Moreira (IEAPM), instituição de pesquisa da
Marinha do Brasil. A base de dados é constituída por um conjunto de variáveis
abióticas e bióticas. As primeiras, físicas e químicas, demonstram a variabilidade das
características hidrológicas do ambiente marinho em termos de mudanças dos padrões
de qualidade de água, em função da alternância dos períodos de eutrofização e de
períodos de subsidência devido ao fenômeno da ressurgência. As variáveis biológicas
são compostas por medidas de concentração de clorofila-a (mg/l) como estimativa da
biomassa algal, que é diretamente influenciada, qualitativa e quantitativamente, pelo
aporte de nutrientes. Esta por sua vez, serve de alimento para as larvas zooplanctônicas
dos organismos epibentônicos, que são as variáveis que compõe o segundo nível trófico
deste estudo. Podem ainda ser incluídos nesta categoria todas as bactérias autotróficas
fotossintetizantes que residem na coluna d’água e os organismos mixotróficos que, em
algum momento, dependendo das condições ambientais, contribuem para a atividade
fotosintética.
As variáveis referentes às larvas zooplanctônicas compreendem a abundância de
ocorrência desses organismos e estão expressas em número de organismos por metro
cúbico de água. Este grupo de variáveis é composto de diversos níveis taxonômicos, o
que permitirá conhecer também qual a granulometria necessária e mais adequada para
futuros programas de gerenciamento ambiental. A variável da sub-classe Cirripédia
(cracas) se refere aos estágios de desenvolvimento larval do tipo nauplii, enquanto a
variável cypris se refere ao último estágio de desenvolvimento deste mesmo grupo. São
agrupados na classe Bivalvia todas as larvas deste grupo taxonômico com exceção das
famílias Mytilidae (mexilhões) e Ostreidae (ostras), que constituem elas próprias outras
duas variáveis da base de dados e de grande interesse econômico. Na variável Larva em
Desenvolvimento (LD), estão incluídos organismos com estágio de desenvolvimento
muito inicial, não permitindo então uma identificação precisa. A base de dados contém
27
28
ainda variáveis do filo Bryozoa, classe Polychaeta e Echinoidea (ouriço do mar), ordem
Decapoda (sirís) e família Ascidiaceae.
Foram retiradas da base de dados, já na fase inicial dos estudos, a variável das
larvas pertencentes à classe Ophiuroidea, por serem extremamente raras, as variáveis
das larvas da família Teredinidae, gênero Isognomon, e o grupo das larvas de tipo
Trocófora, por apresentarem mais de dois terços de suas contagens com valor zero e,
portanto, inferirem tendências.
Vale aqui ressaltar que a referida base de dados faz parte de um projeto de
monitoramento ambiental da Ilha de Cabo Frio mantido pelo IEAPM e não foi
produzida com o intuito de ser usada em um estudo de mineração de dados.
Estes dados consistem de amostragens semanais de água a aproximadamente 30
metros da linha de praia da Ilha de Cabo Frio (Figura 2). As coletas foram realizadas na
superfície da área de estudo e os parâmetros hidrológicos foram determinados como
segue: para a temperatura, foi utilizado um batitermógrafo e um termômetro de
inversão; para a salinidade, foi usado o salinômetro de indução Beckman modelo RS-
7C; para os nutrientes nitrato, nitrito, amônia e fosfato, além dos valores de oxigênio,
usou-se os métodos descritos em STICHKLAND e PARSONS (1968). A clorofila foi
determinada através do método espectrofotométrico de RICHARD e TOMPSON (1952)
e da equação de SCOR-UNESCO (1966). As amostras zooplanctônicas foram coletadas
através de arrasto horizontal em superfície, com rede tipo cilindro-cônica, com 100 µm
de abertura de malha, em torno do ponto de estudo, e fixadas com formol a 4% e
posteriormente contadas “in totum” sob lupa em cuba de Dollfus. O volume filtrado foi
estimado através de fluxômetro tipo TKS. Os resultados foram extrapolados para
organismo/mP
3P.
Para ilustrar a compreensão e visualização das relações entre as variáveis
envolvidas no funcionamento e controle do sistema em estudo, elaborou-se um
diagrama conceitual como ilustrado na Figura 3.1.
Figura 3.1 – Diagrama Conceitual
A radiação solar disponível é a principal fonte de energia para a
fotossíntese fitoplanctônica e o crescimento destas populações é função da quantidade
de radiação incidente e das propriedades ópticas da coluna d’água. A turbidez afeta a
penetração da luz e está envolvida na regulação da quantidade de luz no ambiente. Da
mesma forma, a estabilidade da coluna d’água é uma função da turbulência induzida
pelo fluxo de correntes e pelo vento. Os dados não incluem fatores como as interações
de competição interespecíficas, vento e fluxo de correntes.
As massas d’água são primeiramente caracterizadas pela temperatura e
salinidade próprias (Tabela 3.1) e transportam os nutrientes, que são uma segunda forma
de entrada de energia para a fotossíntese com posterior produção de oxigênio. Fatores
físicos, como a sedimentação e advecção; como também os biológicos, como a
mortalidade, predação, etc. são importantes e ocorrem simultaneamente no sistema.
Tabela 3.1 – Características T/S das massas d’águas de Arraial do Cabo
MASSAS D’ ÁGUA T °C S % ACAS T<18 S<36 ACAS/ÁGUA COSTEIRA 18<T<20 35,4<S<36 ÁGUA COSTEIRA T>20 S<35,4 ACAS/ÁGUA TROPICAL 18<T<20 S>36 ÁGUA COSTEIRA/ÁGUA TROPICAL T>20 35,4<S<36 ÁGUA TROPICAL T>20 S>36
29
30
Devido à grande transparência das águas no ponto de estudo, não se teve a
preocupação de incluir informações sobre a incidência de radiação luminosa, pois este
fator não constitui, neste caso, fator limitante para o desenvolvimento dos organismos
clorofilados.
Para se conhecer o comportamento e a distribuição dos dados, uma estatística
básica, contendo valores mínimos, máximos, média e desvio padrão, é apresentada na
Tabela 3.2.
Tabela 3.2 – Unidades, valores mínimos, máximos, média e desvio padrão das variáveis
Variáveis Unidade Mínimo Máximo Média Desv. Pad.Temperatura P
oPC 15.88 29.4 22.59 1.88
Salinidade g/l 32 39.14 35.48 0.62 Oxigênio ml/l 1.97 8.79 5.30 0.50
Fosfato (POB4 B) µg/l 0 3.69 0.27 0.21 Nitrito (NOB2B) µg/l 0 0.7 0.07 0.09 Nitrato (NOB3 B) µg/l 0 10.19 0.62 0.94 Amônia (NHB4 B) µg/l 0.07 6.61 1.25 0.80
pH - 6.81 10.44 8.07 0.38 Clorofila-a mg/l 0 6.36 0.95 0.84 Cirripedia Org/mP
3P 0 3641 155.12 308.71
Mytilidae Org/mP
3P 0 9309 99.01 424.93
Polychaeta Org/mP
3P 0 1683 18.06 82.54
Decapoda Org/mP
3P 0 478 17.71 42.67
LD Org/mP
3P 0 2229 72.19 195.95
Ostreidae Org/mP
3P 0 1132 28.64 82.38
Cypris Org/mP
3P 0 5537 49.41 450.45
Ascidiaceae Org/mP
3P 0 1115 17.08 73.32
Bryozoa Org/mP
3P 0 101 2.45 8.58
Echinoidea Org/mP
3P 0 201 3.34 13.95
Bivalvia Org/mP
3P 0 277 9.92 28.80
Pela inspeção da Tabela 3.2, verifica-se que as variáveis ambientais
(físico e químicas) apresentam pequenos valores de desvio padrão, apesar de os
nutrientes mostrarem valores mínimos indicando a ausência destes no ambiente
(concentrações provavelmente abaixo dos limites de detecção dos equipamentos
utilizados) e valores máximos dentro de intervalos já sugeridos na literatura por outros
autores. Porém, também pode ser observado valores mínimos indicando a ausência das
larvas zooplanctônicas, mas valores de desvio padrão muito elevados. Esta situação
será utilizada neste trabalho como critério para a detecção e definição de outliers para
31
estas variáveis. Portanto, os valores que excederem três vezes seu desvio padrão serão
automaticamente substituídos pela maior das médias entre as variáveis. Espera-se com
esta medida minimizar o efeito numérico destes valores sobre o funcionamento dos
algoritmos que serão utilizados preservando ainda o comportamento do sistema. Estes
valores poder ser resultantes de atividade de desova, caracterizando estados especiais e
“raros” nos dados, ou serem resultado dos arrastos de rede terem ocasionalmente
acontecido em zonas de maior concentração destes organismos no patch planctônico,
determinando assim algum nível de ruído inerente a esta base de dados. Através da
observação dos gráficos de flutuações interanuais (vide anexo), pode-se verificar que
esta estratégia foi utilizada, na realidade, em muito poucos casos, evitando a exclusão
destes da base de dados. Outra preocupação importante na fase de assistência à base de
dados foi preencher os valores faltantes (PYLE,1999). A variável salinidade
apresentava o intervalo de 27/04/04 a 05/10/04 com este problema; a solução usada foi a
aplicação da técnica de KNN (50 vizinhos mais próximos) descrita por FUKUNAGA
(1972). Na variável oxigênio, foram encontrados três valores errados apresentando
sinais negativos. Uma consulta ao pessoal do IEAPM sanou o problema prontamente.
A variável nitrito apresentou apenas dois valores faltantes; neste caso, o procedimento
adotado foi o de uma média móvel dos últimos quatro valores. O procedimento
seguinte foi o de normalizar os dados segundo a fórmula abaixo descrita, para
minimizar o efeito das altas concentrações e abundâncias, estabilizando a variância,
padronizando-os com média zero e tendo a unidade como desvio padrão para a
execução de análise multivariada efetuada:
P ...
MINMAXMINatualValornormValor
−−
= (1)
As flutuações das variáveis ao longo do período de estudo e as variações médias
interanuais são apresentadas no Anexo.
A flutuação da temperatura na Figura 3.1a no Anexo demonstra a forma de uma
senoide e, a partir do ano de 1998, seus valores máximos têm um aumento gradual,
evidenciando alguma tendência, mas este comportamento não se verifica no ano de
32
2004. Porém, quando se observa a Figura 3.1b do mesmo anexo, pode-se observar que
os valores das médias interanuais têm um comportamento em forma de U. Isto pode ser
explicado pelo fato do ano de 1995 ter sido um ano de ocorrência do fenômeno “El
Ninho”, mas pode também ser especulado como um comportamento referente a padrões
de longo período.
A flutuação de salinidade é apresentada na Figura 3.2a do anexo, onde se pode
notar que, no período de agosto/setembro de1995, são verificados seus menores valores,
enquanto que, em abril de 1997 e maio de 2004, acontece situação inversa. Os menores
valores médios interanuais da salinidade são verificados nos anos de 1995 e 1998, talvez
pela maior permanência de água costeira, de acordo com os valores apresentados pela
Tabela 3.1 (S<35.4).
A flutuação do oxigênio pode se verificada na Figura 3.3a, onde se constata uma
enorme variabilidade. Seu valor máximo se dá no ano de 1999, a segunda maior média
anual, de acordo com a Figura 3.3b. Seu comportamento, com valores médios em torno
de 5 ml/l, demonstra um ambiente sadio. Apesar do oxigênio ser um produto da
fotossíntese, este não necessariamente acompanha o mesmo padrão da clorofila, devido
ao consumo pelos processos de respiração, oxidação geoquímica e de matéria orgânica,
além da grande maioria ser exportada para a atmosfera. Por este fato, as menores
concentrações são verificadas nos anos de 1998 e 2000 e podem estar ligadas a
processos de regulação interna do sistema. De outra maneira, redução mais acentuada
de valores médios anuais ocorre em 1996, com valores pontuais acima de 5 ml/l.
Verifica-se na Figura 3.4a a incidência de fosfato nas águas. O maior valor é
encontrado em setembro de 2002. Porém seus valores médios interanuais mostrados na
Figura 3.4b indicam adequada disponibilidade deste nutriente para o crescimento da
biomassa algal, de acordo com RODRIGUEZ (1991), salvo possíveis limitações pela
razão nitrogênio/fósforo como demonstrada em PEREIRA 2002.
Das três formas de nitrogênio inorgânico medidas durante o período estudado,
foi o nitrato que apresentou o maior valor, 10,19µg l P
-1P. A amônia mostra um valor de
6.61 µg lP
-1P, enquanto o nitrito tem a menor participação, com 0,70 µg l P
-1 Pde acordo com
as Figuras 3, números 5a, 6a e 7a respectivamente. Porém, pode ser observado que as
maiores médias interanuais do nitrato ocorrem a partir de 1999 (Figura 3.6b), enquanto
que as maiores médias interanuais da amônia se dão nos anos anteriores a 1999 (Figura
3.7b). O nitrito apresenta comportamento variado, segundo a Figura 3.5a.
A observação da flutuação da variável pH, na Figura 3.8a, revela um valor
máximo de 10.44 em setembro de 2001, algo totalmente atípico para este local, se
comparado com a variação média na Figura 3.8b.
A flutuação das concentrações de clorofila-a ao longo do período de tempo
estudado são apresentada na Figura 3.9a. Existe uma significante variação no tempo e
uma relativa magnitude de incidência de “blooms” algais, que geralmente acontecem
nos meses de primavera-verão, demonstrando um padrão sazonal dos ciclos de curto
período. Verifica-se ainda que os maiores valores de clorofila-a ocorrem nos anos de
1996 a 1999. Os outros anos apresentam picos de menor magnitude. Porém, a inspeção
da Figura 3.9b revela que a variação média de clorofila-a está de acordo com valores já
propostos na literatura para esta região. A explicação para tal comportamento pode
estar ligada aos ciclos de médio período.
Pode ser facilmente visualizada na Figura 3.10a a presença de um valor extremo
(outlier) e variação real no ano de 2002 para a variável Cirripedia, este valor será um
dos valores tratados como outlier. Na análise dos gráficos das variações das médias
interanuais (Figura 3.10b), deve-se também ter cuidado nos anos de 1994, pois, apenas
se referem aos dois últimos meses deste ano.
De forma semelhante, a Figura 3.11a apresenta uma única ocorrência com valor
extremo, entre os anos de 2000 e 2001, de larvas da família Mytilidae. Pode-se dizer,
por este motivo, que, na Figura 3.11b, a média referente ao ano 2000 deve ter sido
puxada para cima pela presença deste valor e que a menor ocorrência média de
mexilhões se deu no ano de 1997.
Quanto aos organismos da ordem Decapoda (Figura 3.12a), estes apresentam
uma flutuação mais comportada, com as maiores variações médias, ocorrendo a partir
do ano de 1999.
Também na variável dos organismos Polychaetas, encontramos outliers (ano de
2002 na Figura 3.13a); seu efeito na média anual da Figura 3.13b.
33
34
As larvas em D apresentam grande variação na Figura 3.14a, porém observa-se
que, na Figura 3.14b, com exceção do ano de 1994, as maiores médias anuais ocorrem
nos anos de 2000 e 2001, semelhante às larvas da família Mytilidae (Figura 3.11b) e
Ostreidae, como pode ser verificado na Figura 3.15b.
Para as larvas da sub-classe Cirripedia em estágio de desenvolvimento avançado
e em fase de assentamento, larvas cypris na Figura 3.16a, podemos também detectar a
presença de outliers no ano de 2003 e sua média anual alterada na Figura 3.16b. No ano
de 1997, parece não haver ocorrência deste tipo larval.
Na análise das larvas pertencentes à família Ascidiaceae , Figuras 3.17a e 3.17b,
também ocorrem valores altos.
A maior ocorrência média de organismos do grupo dos briozoários se dá no ano
de 2003, como pode ser verificado nas Figuras 3.18a e 3.18b. Situação semelhante se
ocorre com os organismos da variável Equinoide (Figuras 3.19a e 3.19b).
A variável da classe Bivalvia apresenta, na Figura 3.20a, uma grande
variabilidade, estando mais presente no período compreendido entre 1994 e início de
1997, além de 1998. Ocorre a maior média no ano de 1996, segundo a Figura 3.20b.
De uma forma geral, pode-se dizer que o ano de 1997 foi um ano de ocorrência de
baixas temperaturas médias e salinidade alta, acompanhadas de baixa ocorrência larval.
A matriz apresentada na Tabela 3.3, demonstra as correlações lineares existentes entre
as variáveis ambientais, a concentração de clorofila e as densidades larvais.
35
Tabela 3.3 – Correlação das variáveis
Matriz de Correlações Variáveis Temp Sal O2 PO4 NO2 NO3 NH4 PH Clorofila Cirripedia Mytilidae Decapoda Polychaeta LD Osteidae Cipris Ascidiaceae Bryozoa Equinoide Bivalvia
Temp 1.00 -0.18 -0.29 -0.24 -0.30 -0.20 0.02 0.05 -0.29 0.08 0.01 0.02 0.04 0.08 0.00 -0.03 0.10 0.04 0.04 0.14 Sal -0.18 1.00 0.07 -0.07 0.01 0.06 -0.02 0.04 -0.01 0.00 -0.08 0.03 0.00 -0.01 -0.04 0.00 0.07 -0.07 0.01 -0.33O2 -0.29 0.07 1.00 0.00 0.01 0.03 -0.06 -0.08 0.21 -0.02 0.05 -0.01 -0.01 -0.09 0.01 -0.01 0.06 0.00 -0.04 -0.01
PO4 -0.24 -0.07 0.00 1.00 0.28 0.19 0.03 0.05 0.06 -0.03 -0.02 -0.05 0.01 0.05 -0.02 -0.01 -0.04 0.23 0.08 -0.02NO2 -0.30 0.01 0.01 0.28 1.00 0.35 0.05 0.00 0.05 0.02 -0.01 -0.04 0.00 -0.02 0.00 -0.02 -0.07 -0.03 0.04 -0.09NO3 -0.20 0.06 0.03 0.19 0.35 1.00 -0.02 -0.03 -0.03 0.06 -0.02 -0.04 0.00 0.03 0.01 -0.01 -0.03 0.04 -0.01 -0.09NH4 0.02 -0.02 -0.06 0.03 0.05 -0.02 1.00 0.01 0.01 -0.05 -0.05 -0.04 -0.05 -0.03 0.04 0.03 0.06 -0.03 -0.02 0.02 PH 0.05 0.04 -0.08 0.05 0.00 -0.03 0.01 1.00 0.00 -0.08 0.01 -0.11 -0.08 0.14 0.04 -0.17 0.00 -0.05 -0.02 0.11
Clorofila-a -0.29 -0.01 0.21 0.06 0.05 -0.03 0.01 0.00 1.00 -0.04 -0.02 -0.06 0.01 -0.06 -0.01 -0.01 0.05 -0.01 0.00 0.02 Cirripedia 0.08 0.00 -0.02 -0.03 0.02 0.06 -0.05 -0.08 -0.04 1.00 0.11 0.20 0.57 0.27 0.14 0.07 0.11 -0.03 0.04 -0.01Mytilidae 0.01 -0.08 0.05 -0.02 -0.01 -0.02 -0.05 0.01 -0.02 0.11 1.00 0.21 0.09 0.25 0.67 0.00 0.00 0.48 0.03 0.04Decapoda 0.02 0.03 -0.01 -0.05 -0.04 -0.04 -0.04 -0.11 -0.06 0.20 0.21 1.00 0.19 0.20 0.24 0.50 0.29 0.30 0.20 -0.08Polychaeta 0.04 0.00 -0.01 0.01 0.00 0.00 -0.05 -0.08 0.01 0.57 0.09 0.19 1.00 0.20 0.16 0.00 0.18 0.04 0.07 0.00
LD 0.08 -0.01 -0.09 0.05 -0.02 0.03 -0.03 0.14 -0.06 0.27 0.25 0.20 0.20 1.00 0.33 -0.03 0.27 0.12 0.05 0.17 Ostreidae 0.00 -0.04 0.01 -0.02 0.00 0.01 0.04 0.04 -0.01 0.14 0.67 0.24 0.16 0.33 1.00 0.00 0.14 0.30 0.03 0.02
Cypris -0.03 0.00 -0.01 -0.01 -0.02 -0.01 0.03 -0.17 -0.01 0.07 0.00 0.50 0.00 -0.03 0.00 1.00 -0.02 -0.01 -0.02 -0.03Ascidiaceae 0.10 0.07 0.06 -0.04 -0.07 -0.03 0.06 0.00 0.05 0.11 0.00 0.29 0.18 0.27 0.14 -0.02 1.00 0.08 0.07 -0.04
Bryozoa 0.04 -0.07 0.00 0.23 -0.03 0.04 -0.03 -0.05 -0.01 -0.03 0.48 0.30 0.04 0.12 0.30 -0.01 0.08 1.00 0.16 0.13 Equinoidea 0.04 0.01 -0.04 0.08 0.04 -0.01 -0.02 -0.02 0.00 0.04 0.03 0.20 0.07 0.05 0.03 -0.02 0.07 0.16 1.00 0.06
Bivalvia 0.14 -0.33 -0.01 -0.02 -0.09 -0.09 0.02 0.11 0.02 -0.01 0.04 -0.08 0.00 0.17 0.02 -0.03 -0.04 0.13 0.06 1.00
Primeiramente, pode ser constatado que a temperatura apresenta uma correlação
negativa com os valores de salinidade, oxigênio, com os nutrientes e clorofila
(respectivamente r = - 0.18; r = -0.29; r = - 0.24; r = - 0.30; r = - 0.20; r = - 0.29). Este
fato pode ser explicado devido ao próprio fenômeno da ressurgência onde as águas
profundas, mais frias e ricas em nutrientes, aflorem sendo assim inversamente
proporcionais. Pode ser verificada também a significativa correlação positiva entre
clorofila e oxigênio (r = 0.21) pois o oxigênio é um produto da atividade fotossintética.
Dentre os nutrientes, o nitrato parece ser preferencialmente a principal forma
nitrogenada por apresentar correlação negativa com a clorofila (r = - 0.003). Pode-se
verificar ainda a completa ausência de correlação entre a clorofila, pH e Equinoide.
Quando se observa as relações entre a temperatura e as variáveis larvais pode-se
observar que somente a família Ascidiaceae e a classe Bivalvia apresenta alguma
correlação (r= 0.10 e r = 0.14 respectivamente). Já com a salinidade, somente a classe
Bivalvia apresenta alguma correlação, ainda que negativa (r = - 0.33). A família
Mytilidae demonstra a maior correlação positiva com a família Ostreidae (r = 0.67)
seguida do filo Bryozoa (r = 0.48). A sub classe Cirripedia apresenta uma forte
correlação com a variável Polychaeta (r = 0.57) enquanto que a ordem Decapoda
apresenta forte correlação com as larvas do tipo Cypris (r = 0.50). As larvas em D se
mostram correlacionadas com a família Ostreidae (r = 0.33) e, a família Ascidiaceae
também se correlaciona, em menor grau, com a ordem Decapoda (r = 0.29).
No intuito de reduzir a dimensionalidade dos dados e acessar sua estrutura, em
primeiro lugar, aplicaremos a método de análise de “comunidades” (cumunality),
introduzida por THURSTONE (1947). Esta técnica procura a parte da variância
explicada apenas pelos fatores comuns, excluindo, assim, a parte da variância ligada aos
fatores específicos, próprios e exclusivos de cada variável. A Tabela 3.4 demonstra o
resultado deste estudo como segue.
36
Tabela 3.4 – Estudo de cumunalidade
Variáveis Fator 1 Fator 2 R2 Temperatura 0.002958 0.571368 0.313240
Salinidade 0.002685 0.065353 0.167630 Oxigênio 0.000019 0.131208 0.139543 Fosfato 0.008022 0.264896 0.241564 Nitrito 0.000024 0.397138 0.228264 Nitrato 0.002430 0.287916 0.166661 Amônia 0.002528 0.002796 0.041070
pH 0.002843 0.014504 0.097596 Clorofila-a 0.001443 0.116339 0.130027 Cirripedia 0.216652 0.221610 0.383922 Mytilidae 0.462575 0.462862 0.567870 Decapoda 0.380456 0.380919 0.501787 Polychaeta 0.224656 0.226973 0.360251
LD 0.310766 0.329603 0.283530 Ostreidae 0.493834 0.493962 0.500564
Cipris 0.035854 0.037059 0.352950 Ascidiaceae 0.133321 0.143935 0.225388
Bryozoa 0.305460 0.312273 0.415182 Equinoidea 0.049999 0.050363 0.086347
Bivalvia 0.004976 0.106181 0.212759
Como pode ser observado as variáveis Amônia e pH, apesar de serem
quase que unanimemente consideradas como importantes descritores das condições de
qualidade ambiental, não contribuem de maneira significativa para a variância fatores 1
e 2 (R2 = 0.041070 e 0.097596 respectivamente). O mesmo ocorre com relação com a
variável da classe Equinoide cujo valor R2 é de 0.086347. Assim sendo, este teste
também passa a ser usado como critério de exclusão de variáveis no problema em
estudo.
Afim de visualizar à estrutura dos dados restantes, e como estes encontram-se
ordenados, passamos a demonstrar os resultados da técnica estatística de Análise de
Componentes Principais (APC), que também pode ser usada para a redução da
dimensão dos dados. A primeira aplicação desta técnica em estudos ecológicos é
relatada por GOODALL (1954) e provavelmente continua sendo o método de
ordenação mais usado. A ACP estabelece, com base em uma matriz de semelhança
(correlações, variâncias-covariâncias ou até de similaridades), um conjunto de eixos
(componentes ou fatores) ortogonais. Estes eixos representam a totalidade da variância
dos dados, cada um contribuindo com uma determinada fração. Cada componente
37
38
corresponde a um autovetor dessa matriz. Assim, com base em uma matriz com m
variáveis, serão calculados m autovetores (= eixos fatoriais) de comprimento λ1, λ2,......
λm decrescente em razão da sua contribuição à variância total de dados. Esses
comprimentos correspondem aos m autovalores (= raízes latentes) da matriz. O
resultado disso é um sistema reduzido de coordenadas, proporcionando informações
sobre as semelhanças ecológicas das amostras como pode ser visto na Tabela 3.5
abaixo.
Tabela 3.5 – Matriz reduzida apresentando as sete componentes principais.
Variáveis Fator 1 Fator 2 Fator 3 Fator 4 Fator 5 Fator 6 Fator 7 Temperatura -0.01526 0.438974 0.042074 -0.03489 -0.61646 0.222757 0.147892Salilinidade -0.0413 0.010708 -0.03088 -0.03397 0.074022 -0.77989 0.121073
Oxigênio 0.05243 0.058959 -0.00121 -0.01063 0.717425 -0.07693 -0.0089 PO4 0.033359 -0.69605 -0.12586 0.029123 0.068003 0.20494 0.135587NO2 -0.02423 -0.74020 0.067472 -0.02516 0.056542 -0.06867 -0.11146NO3 0.010184 -0.67343 0.070083 -0.04332 -0.06991 -0.1587 -0.02735
Clorofila-a -0.05441 0.000942 -0.00419 -0.02502 0.745648 0.124475 0.063845Cirripedia 0.044237 -0.02226 0.877982 0.087916 -0.05515 0.003237 0.048265Mytillidae 0.910663 0.052887 0.0785 0.017311 0.021604 0.013369 -0.06695Decapoda 0.25986 0.044231 0.137367 0.792501 -0.03531 -0.08866 0.287693Polychaeta 0.056358 -0.00506 0.824314 0.040364 0.038222 0.024274 0.14484
LD 0.306453 -0.07542 0.299894 -0.05914 -0.14375 0.120434 0.555725Osteidae 0.822054 0.037852 0.180147 -0.00789 0.01522 -0.05596 0.086852Cypris -0.06507 0.010937 0.025042 0.893926 0.003344 0.013917 -0.13204
Ascidiaceae -0.01127 0.091166 0.063857 0.085879 0.072653 -0.11072 0.874755Bryozoa 0.650738 -0.14575 -0.20175 0.17108 -0.02188 0.196483 0.186756Bivalvia 0.037816 0.098235 0.003916 -0.08131 0.0245 0.779906 0.076564
Var. Expl. 2.110354 1.733892 1.671236 1.490104 1.502387 1.436741 1.322542Prp.Total 0.124138 0.101994 0.098308 0.087653 0.088376 0.084514 0.077797
A análise da Tabela 3.5 revela como primeira componente principal, estão
agrupadas as variáveis Mytilidae e Osteidae, as variáveis de maior interesse econômico.
Em seguida aparece a variável nitrito (NOB2 B) como a segunda componente principal.
Cirripedia e Polychaeta são agrupados como terceiro fator enquanto a ordem Decapoda
está agrupada com as larvas do tipo Cypris no quarto fator. O quinto fator é composto
pelo agrupamento da clorofila e do oxigênio. Bivalvia e salinidade fazem parte do
sexto fator e no sétimo fator encontra-se a família Ascidiaceae. Esta estrutura de
agrupamento está de acordo com os resultados obtidos na Tabela 3.3 de correlações.
Tabela 3.6 – Autovalores, % da variância total e % acumulada.
Valor Autovalor % variância total Autovalor acumulado % acumulada1 2.628875 15.46397 2.62887 15.46397 2 1.949888 11.46993 4.57876 26.93390 3 1.645749 9.68088 6.22451 36.61478 4 1.440500 8.47353 7.66501 45.08831 5 1.327102 7.80648 8.99211 52.89479 6 1.236225 7.27191 10.22834 60.16671 7 1.038916 6.11127 11.26726 66.27798
Como pode ser observado, na Tabela 3.6, mostrada acima, o trabalho de limpeza
dos dados resultou em um sistema em que os sete autovalores representam 66 % da
variância total dos dados. A distribuição espacial dos agrupamentos nos planos fatoriais
1, 2 e 3 são apresentados a seguir nas Figuras 3.21 e 3.22.
Temp
Sal
O2
PO4
NO2NO3
Cloro
CirripedioMytillidae
DecapodaPolychaetaLD
OstreaCipris
Ascidia
Bryozoa
Bivalvia
-0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0
Fator 1
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
Fato
r 2
Figura 3.21 – Análise de Componentes Principais, fatores 1 e 2, varimax mormalizado.
39
A Figura 3.21 apresenta a projeção do plano fatorial formado pelos eixos
fatoriais 1 e 2. Conforme a Tabela 3.6, pode-se observar que o eixo fatorial 1
corresponde somente a 15,46% da variância total dos dados enquanto o segundo eixo,
participa com 11,46% dessa variância. Portanto este plano fatorial representa apenas
26,93% da variância total acumulada. Esta projeção, permite uma visualização global
das condições tróficas existentes. Segundo a Tabela 3.5, o eixo 1 representa fatores
biológicos quando agrupa a família Mytilidae e Ostreidae por terem fortes e positivas
coordenadas (fatores de carga) enquanto que a temperatura, salinidade, nitrito, clorofila,
cypris e a família ascidiaceae apresentam-se negativas para este eixo. O eixo 2,
representa uma componente ambiental química desde que a variável nitrito apresenta
uma forte coordenada negativa que é acompanhada de perto pelos nutrientes nitrato e
fosfato. Ainda com relação à este eixo pode-se notar uma fraca e positiva contribuição
da variável temperatura.
Temp
Sal
O2
PO4
NO2
NO3
Cloro
Cirripedio
Mytillidae
DecapodaPolychaeta
LD
Ostrea
Cipris
Ascidia
Bryozoa
Bivalvia
-1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8
Fator 2
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
Fato
r 3
Figura 3.22 – Análise de Componentes Principais, fatores 1 e 3, varimax normalizado.
40
O fator 3, novamente se apresenta como uma componente biológica
tendo como fortes coordenadas positivas as variáveis cirripedia e polychaeta, enquanto a
salinidade, oxigênio, fosfato e clorofila são negativas para este eixo.
Como comentário da análise de componentes principais pode-se dizer que:
1) A representatividade das variáveis individuais estudadas e eixos fatoriais que se
fizeram evidentes para a variância total dos dados não permite redução do espaço de
busca para a soluções do problema;
2) O eixo fatorial 1 é um eixo de representação biológica e as variáveis de coordenadas
negativas em relação ao mesmo podem ser consideradas superposições de pontos
(variáveis)
3) O eixo fatorial 2 é um eixo de representação dos fatores ambientais ligados às
características químicas e mais fracamente físicas do habitat marinho.
A não ser que o meio ambiente físico seja fortemente descontínuo e que as
amostragens efetuadas pelo programa de gerenciamento tenham sido realizadas de cada
lado de um forte gradiente, qualquer analista terá dificuldades em definir nitidamente
grupos de amostras ou espécies, em virtude do conceito de continuum que caracteriza os
ecossistemas. Para tentar descrever, de maneira mais clara e sintética possível, a
estrutura de um conjunto de dados que representam o funcionamento de um ecossistema
determinando a composição e a extensão das suas unidades funcionais, passa-se agora a
demonstrar a técnica de Análise de Agrupamentos ou “Cluster Analysis”. Esta técnica
pode identificar regiões mais densas ou esparsas na base de dados, por conseguinte,
descobrir padrões de distribuição global e correlações interessantes entre as variáveis.
“Clustering”, ou agrupamento segundo COLE (1998), é um procedimento exploratório
que procura estruturas “naturais” em um conjunto de dados e envolve a separação dos
próprios dados (casos) ou objetos em grupos. Agrupar dados é útil na redução dos
dados, esquemas de classificação e sugerindo ou sustentando hipóteses sobre sua
estrutura. Técnicas de agrupamento tem sido usadas em uma grande variedade de
disciplinas. Na psiquiatria, LEVINE e BOLTON (1969) usaram “clustering” para
desenvolver uma classificação de tipos de depressão. Na pesquisa de mercado, GREEM
(1967) usou algoritmos de agrupamento na identificação de conjuntos homogêneos de
testes de mercados. Na arqueologia, HODSON (1971) aplicou “clustering” ao
41
42
problema de classificação “British Hand-Axes”. No reconhecimento de padrões,
LEVRAT et all. (1992) usou “fuzzy-clustering” para segmentar uma imagem. Na
engenharia, RECH e FENVES (1991) usaram um algoritmo para criar uma hierarquia
de especificações e desenhos associados para pontes e, na medicina, FUNK et al. (1987)
usou técnicas de agrupamento de dados como um método de aquisição de conhecimento
para sistemas especialistas no auxílio a diagnósticos.
No problema de agrupamento, o conjunto de n objetos X = {XB1 B, XB2 B,.....,XBn B} é
separado em grupos de objetos similares. Cada XBi B ∈ ℜP
pP é um vetor atributo consistindo
de p medidas reais que descrevem o objeto. Os objetos são agrupados em grupos não
superpostos C = {CB1 B, CB2 B,.....,CBkB} (C é um grupo), onde k é o número de grupos CB1 B ∪ CB2 B
∪.........∪ CBkB = X, CBi B ≠ φ e CBi B ∩ CBj B = φ para i ≠j. Os objetos (casos) separados em cada
grupo devem ser mais similares entre si do que entre os objetos de qualquer outro grupo,
de maneira que o valor de k pode ser desconhecido. Caso contrário, se k é conhecido,
trata-se de um problema de k grupos (clusters). A separação dos dados ocorre através de
cálculos de similaridades sem que nenhuma suposição sobre a possível estrutura
existente seja feita. A similaridade entre objetos (dados) é uma medida que compara
quão próximos (ou parecidos) são os objetos em questão. Portanto, uma pequena
distância entre objetos deverá indicar uma alta similaridade. Sendo assim, pode-se usar
as medidas de similaridade também de forma inversa, como medida de dissimilaridade
(diferença). De acordo com EVERITT (1993) e RICHARD (1992) várias medidas de
distância podem ser empregadas no problema de agrupamento de dados. As medidas
mais comumente usadas são a distância euclidiana,
d (XBi B, XBj B) = )()'( XjXiXjXi −− = [ ( )∑=
−p
l
xjlxil1
P
2P]P
1/2P , (2)
esta medida de distância é perfeitamente métrica, é uma linha reta entre dois pontos.
Uma medida alternativa é a distância de Manhattan (“city-block”) que soma as
diferenças entre todos os atributos,
d (XBi B, XBj B) = ∑=
−p
l
xjlxil1
(3)
Esta medida é problemática se as variáveis são correlacionadas. Na literatura, diversas
outras medidas são utilizadas, como medidas de PEARSON (1901), SPEARMAN
(1904), SORENSEN (1948) e BRAY-CURTIS (1957).
Existe um grande número de algoritmos de agrupamento na literatura e a escolha
depende do tipo dos dados disponíveis, da aplicação e do objetivo que se quer alcançar.
Em geral, os métodos podem ser classificados em métodos hierárquicos, métodos de
partição, métodos baseados em densidade, baseados em “grid” ou baseados em
modelos. Neste estudo apenas serão usados um método hierárquico e outro de partição
de acordo com a abordagem na matriz de dados. De qualquer forma, ambos resultam
em uma estrutura em forma de árvore chamada Dendrogama.
Os métodos hierárquicos podem também por sua vez serem classificados de
acordo com o tipo de seu funcionamento. Os do tipo aglomerativo, também chamados
“bottom-up” começam com cada objeto formando um grupo separado. Esses objetos
(grupos) são então sucessivamente agrupados de acordo com suas similaridades até
permanecer apenas um único grupo ou qualquer critério de parada ser satisfeito. Já os
métodos hierárquicos denominados de divisivos também chamados de “top-down”
funcionam de maneira oposta, começam com todos os objetos em um mesmo grupo e
baseados em suas dissimilaridades dividem os dados sucessivamente em sub grupos até
cada objeto ser ele próprio um grupo ou um critério de parada ser alcançado. Para
ambos os métodos o número de grupos (k) tem de ser indicado, entretanto, a diferença
entre os níveis de hierarquia pode ser uma indicação do correto número de grupos. Os
métodos do tipo aglomerativo são mais populares e devido sua característica funcional é
usado para agrupar as variáveis neste estudo.
Existem quatro importantes algoritmos nesta categoria, comentados a seguir.
O método de ligações simples (single-linkage) também chamado de “nearest
neighbour” ou “método do visinho mais próximo” (FLOREK, 1951), a distância entre
dois grupos é a distância entre os objetos mais próximos destes grupos.
Método de ligações completas (complete-linkage) também chamado “furthest
neighbour” ou “método do vizinho mais distante” (SORENSEN, 1948) junta os grupos
com a distância mínima entre seus objetos mais distantes.
43
Método pela associação média (average-linkage) também chamado “group-
linkage” (SOKAL,1963) calcula a média aritmética da similaridade (ou da distância)
entre o objeto que se quer incluir num grupo e cada objeto desse grupo. O objeto é
atribuído ao grupo com o qual ele tem a maior similaridade média (ou menor distância
média) com todos os objetos. Uma variação desse método é chamado de “centroid
clustering” (LANCE, 1966) agrupando de acordo com a distâncias entre os centróides.
Diferentemente dos métodos acima, o método de variância mínima (WARD,
1963) otimiza um objetivo estatístico, a soma das distâncias quadradas entre objetos e o
centro de seu cluster. Um grupo será reunido a outro se essa reunião proporcionar o
menor aumento da variância intragrupo. A variância é calculada para todas as
alternativas de aglomeração, escolhendo a que proporciona a menor variância. Este
método é altamente eficiente na formação de grupos. Por essas características foi o
método escolhido para agrupar as variáveis deste trabalho como pode ser visto no
dendograma da Figura 3.23.
Método WardCoeficiente de Spearman
NO
3
NO
2
PO
4
Clo
ro O2
Sal
Bry
ozoa
Ost
rea
Myt
illid
ae
Cip
ris
Dec
apod
a
Asc
idia LD
Pol
ycha
eta
Cirr
iped
io
Biv
alvi
a
Tem
p0.0
0.5
1.0
1.5
2.0
Dis
tânc
ia d
e Li
gaçã
o 2 5
7
4
3
16
I II
Método WardCoeficiente de Spearman
NO
3
NO
2
PO
4
Clo
ro O2
Sal
Bry
ozoa
Ost
rea
Myt
illid
ae
Cip
ris
Dec
apod
a
Asc
idia LD
Pol
ycha
eta
Cirr
iped
io
Biv
alvi
a
Tem
p0.0
0.5
1.0
1.5
2.0
Dis
tânc
ia d
e Li
gaçã
o 2 5
7
4
3
16
I IIFigura 3.23 – Dendrogama das variáveis, método Ward, coeficiente de Spearman.
44
45
Pode-se interpretar à partir da Figura 3.23 dois grandes grupos que
representam a macroestrutura do ecossistema, ligadas as componentes abiótica (grupo I)
e biótica (grupo II). Este fato pode ser explicado devido ao fato dos grupos
apresentarem dados com características muito diferentes. Os primeiros são dados
provenientes de medidas laboratoriais (dosagens químicas), enquanto que no grupo II
estes dados partem da visualização e contagem do número de indivíduos nas amostras
sob lupa. Observa-se que a ordenação dos eixos fatoriais apresentados na Tabela 3.5 e
Figura 3.22 são evidentes, a primeira componente principal , grupo 1 (Myitilidae,
Ostreidae e Bryozoa) e a terceira componente principal, grupo 3 (Cirripedia e
Polychaeta) além dos grupo 4 (Decapoda e Cypris) e grupo 7 (Ascidiaceae e LD) estão
todos na componente biótica sugerindo uma possível estrutura da comunidade. Existe
uma grande subjetividade na decisão de destacar e interpretar os grupos que poderiam,
aparentemente, constituir uma realidade ecológica. Do outro lado, componente abiótica
(grupo I), encontram-se a segunda componente principal composta pelos nutrientes no
grupo 2 (NOB2 B, NOB3 B NHB4 B e POB4 B) seguida do grupo 5 (clorofila, oxigênio e salinidade). A
salinidade encontra-se agrupada com a clorofila de acordo com os valores da Tabela 3.3
de autocorrelações, pois esta variável se apresenta bastante significante (r = -0.01, p
<0.05). O fato da variável temperatura estar no grupo das componentes biológicas se
deve ao fato das larvas terem uma maior sensibilidade a esta variável física, ou ser
apenas um efeito numérico devido ao funcionamento do algoritmo utilizado.
Dando prosseguimento aos métodos de agrupamento, passa-se agora a
aplicação dos métodos de partição. Estes métodos também são chamados de métodos
de otimização. Dado uma base de dados de n objetos, o método constrói k clusters de
dados, cada partição representa um grupo e k ≤ n. Ou seja, o método classifica os dados
em k grupos, que juntos satisfazem o seguinte critério: todo grupo tem que conter no
mínimo um objeto, e cada objeto tem de pertencer a exatamente um grupo. A segunda
premissa pode ser relaxada no caso de métodos de fuzzy-clustering. O número de
grupos é também especificado a priori ou é determinado como parte do método de
agrupamento. A partição inicial pode ser randômica à partir de pontos chamados de
sementes (“seed”). Os objetos são então alocados a um grupo de acordo com uma
função objetivo até um critério de parada ser alcançado. Para chegar a uma otimização
global efetua-se uma exaustiva busca cedendo e redirecionando os objetos de acordo
com suas similaridades e os pontos semente. Os vários métodos diferem em relação a
partição inicial, função objetivo, critérios de concessão, redirecionamento e parada. Os
métodos mais populares são o algoritmo K-means, onde cada grupo é representado pelo
valor médio em cada grupo, e o algoritmo k-medoids, onde cada cluster é representado
pelo objeto mais próximo do centro do cluster. Apesar da sensibilidade à partição
inicial, a técnica K-means, tem segundo PUNJ & STEWART (1983) um desempenho
melhor que os métodos hierárquicos devido ao fato de serem menos afetados por
“outliers”, a escolha da medida de distância e a presença de variáveis irrelevantes, sendo
por este motivo a técnica escolhida para acessar a estrutura dos dados estudados, como
(objetos ou linhas) apresentado no dendrogama da Figura 3.24.
Objects
Dis
sim
ilar
ity
406 146 151 46 467 470 159 439 77 28 347 504 395 86 113 8 273 172 377 228 71
0.0
2.0
4.0
6.0
8.0
Objetos
Dis
sim
ilari
dade
Figura 3.24 – Dendrogama dos objetos, método k-means, distância euclidiana.
Pela observação da Figura 3.24, pode-se determinar que ao nível
aleatório de dissimilaridade 2, pode ocorrer sete grupos. Quando se implementa a
Tabela 3.1 que classifica as massas d’água segundo os valores de temperatura e
salinidade em forma de regra (executado em Excel e não demonstrado) encontra-se um
intervalo não contemplado. O número de agrupamentos encontrado neste dendrogama
coincidentemente é o mesmo da referida implementação, além deste fato, pode ser
verificado na Figura 3.25 que o número máximo possível de autovalores determinado
pelo critério de Kaiser também é sete. Este critério de Kaiser será usado então para
definir o número correto de grupos no caso estudado.
46
A Figura 3.25 mostra a contribuição percentual de cada autovalor dentro dos 66,27 % da
variância apresentada pela Tabela 3.6.
Número de Autovalores0.0
0.5
1.0
1.5
2.0
2.5
3.0
Val
or d
e K
aise
r
15,46%
26.93%
36.61%
45.08%52.89%
60.16%
66.27%
Número de Autovalores0.0
0.5
1.0
1.5
2.0
2.5
3.0
Val
or d
e K
aise
r
15,46%
Número de Autovalores0.0
0.5
1.0
1.5
2.0
2.5
3.0
Val
or d
e K
aise
r
15,46%
26.93%
36.61%
45.08%52.89%
60.16%
66.27%
26.93%
36.61%
45.08%52.89%
60.16%
66.27%
Figura 3.25 - Número de clusters segundo critério de Kaiser
47
Capítulo IV
Classificação de Dados e Extração de Regras
4.1) Aquisição de Conhecimento
Segundo TUHILL (1990), conhecimento é a informação refinada que os
especialistas usam para resolver problemas. O conhecimento humano está relacionado
com a linguagem e uma inteligência que adquire, processa, armazena, acessa e
comunica esse conhecimento. Existem muitas técnicas de aquisição de conhecimento
dentre as quais podemos citar: entrevistas, protocolos, programação neurolingüística e,
análise e aquisição de conhecimento automática (machine learning).
Fazer entrevistas com um especialista é a técnica mais comum de aquisição de
conhecimento sobre um dado domínio e será aqui utilizada. Porém, apresenta duas
falhas básicas. A primeira é a falta de direção, isto é, um especialista faz o que faz, sob
quais circunstâncias. A outra é saber qual o momento mais apropriado. Na segunda, a
não ser que se prepare uma estrutura bem definida sobre o objetivo a ser alcançado, o
encontro pode resultar em fracasso levando a grande perda de tempo. Entretanto,
entrevistas contribuem para a formação de uma base de conhecimento de duas maneiras.
Primeiramente, chamam a atenção para aspectos de conhecimento pouco profundo.
Este conhecimento superficial permite ao entrevistador adquirir mais familiaridade com
o assunto discutido e gerar uma forma de maior interação com o especialista. Em
segundo, entrevistas com especialistas podem preencher lacunas resultantes de aspectos
mais profundos do domínio em questão. Esse conhecimento declarativo é usado para
fornecer relações e classificar objetos. A equipe de especialistas foi constituída pelos
doutores Ricardo Coutinho, Jean Valantin e Dra. Vanda Maria Monteiro Ribas e as
biólogas Jurema Quintanilha e Fabiana Figueiredo, todos pesquisadores do Instituto de
Estudos Almirante Paulo Moreira reconhecidos conhecedores do ambiente focado neste
trabalho e o conhecimento adquirido neste processo foi estruturado no apêndice.
Uma das estratégias mais usadas para representar o conhecimento é através de
uma base de regras. Desta maneira, o capítulo a seguir é dedicado fundamentalmente à
dois objetivos principais: o primeiro, aplica um algoritmo para a geração de regras de
48
associação entre os atributos (variáveis) da base de dados estudada a fim de extrair
conhecimento não explicitado por ferramentas de análise convencional, seguido da
geração de regras de classificação baseadas nas associações “interessantes” encontradas
para desenvolver um sistema baseado em conhecimento.
4.2) Regras de Associação de Dados
As regras de associação são acima de tudo uma classe de importantes
regularidades encontradas em um conjunto de dados e buscam por relações interessantes
entre os itens (atributos). A descoberta dessas relações de associações pode ajudar em
processos de tomada de decisão ou na classificação de padrões. Uma variável Booleana
representa a presença ou ausência de um item. Cada registro pode ser representado por
um vetor Booleano de valores atribuídos para essas variáveis, (LIU et al., 2000). Os
vetores booleanos podem ser usados para identificar padrões que refletem os itens que
são freqüentemente associados. Esses padrões podem ser representados na forma de
regras de associação. Uma regra é uma implicação lógica: É composta de uma parte
contendo uma premissa chamada de antecedente que descreve as condições da regra e
outra parte chamada de conseqüente que realiza a conclusão da informação. A parte
antecedente é formada por argumentos reunidos por operadores lógicos (se, e, ou, etc.),
gerando uma expressão de conclusão lógica representada por então. Se essa expressão
for verdadeira, isto é, se as condições da regra forem satisfeitas, então a parte
conseqüente determinará a ação a ser executada. Por exemplo, a informação de que um
determinado conjunto de indicadores e descritores ambientais (X) seja apresentado,
implique em um índice de qualidade da condição de saúde ambiental (Y), ou numa
determinada composição estrutural de populações é representado na regra de associação
abaixo:
Regra n:
“X” -> “Y” (4.1)
(S% C% s s’)
49
Onde os índices da regra acima são:
S% - é o valor suporte da regra [P (X U Y)].
C% - é a confiança da regra [P (Y|X)].
s - é o valor suporte da regra expresso em número de vezes que ocorre X ou Y.
s´ – é o número de vezes em que os dois itens X e Y ocorrem simultaneamente.
Medidas de relacionamento entre as partes antecedente e conseqüente das regras
tais como o grau de certeza, o grau de interesse e acurácia (YAO & ZONG, 1999), e a
qualidade interpretativa de uma base de regras podem ser avaliadas pela quantidade de
condições e conclusões presentes na estrutura de representação. Neste caso, quanto
mais elementos uma regra possuir, mais difícil será seu entendimento. Por exemplo,
uma regra que em sua parte antecedente possua apenas duas ou três condições é mais
fácil de entender que outra com dezenas de condições.
Fatores também importantes são: a quantidade de regras na base de
conhecimento e a presença de qualificadores lingüísticos para descrevê-los. Uma regra
que utilize esses elementos lingüísticos é nitidamente mais compreensível que outra que
apresenta comparações numéricas, já que a maioria do conhecimento humano se
encontra armazenado de forma lingüística (GUILLAUME, 2001, NAKASHIMA et al.,
2003).
O suporte e confiança das regras são medidas que refletem respectivamente a
utilidade e o grau de certeza das regras descobertas. Isto quer dizer, que um suporte de
por exemplo, 20 % para uma regra de associação, significa que se 20 % de todos
registros que um determinado conjunto de indicadores e descritores ambientais (X)
tenha sido atingido, também tendem a deflagrar uma implicação em um determinado
índice de qualidade da condição de saúde ambiental (Y), ou numa determinada
composição estrutural de populações em estudo. Uma confiança de 90% significa que
90% dos registros de deflagração dos (Y), ocorreram dado que um determinado (X)
também tenha sido atingido. Tipicamente regras de associação são consideradas
interessantes quando satisfazem um limiar mínimo de ambos, suporte e confiança. Tais
limiares podem ser estabelecidos por usuários do sistema ou especialistas no domínio
(HRUSCHA, 2003).
50
51
Entretanto, a base de dados estudada e anteriormente descrita neste trabalho é
formada por um conjunto de séries temporais de atributos quantitativos (variáveis de
valores contínuos) enquanto que, a tarefa de minerar associações ou regularidades é na
maioria das vezes, segundo BAY (2000), executada por algoritmos que foram
projetados para operar em intervalos. De acordo com este mesmo autor, estes intervalos
pertencem na realidade a atributos discretos podendo também ser chamados de
categóricos onde, apresentam um número fixo de valores. O problema central para
minerar as possíveis associações nos dados está em, como se deve manipular variáveis
de valores contínuos. A abordagem mais comum segundo AGRAWAL (1993) e AN
(1999), é discretizar os dados.
De acordo com YANG & WEBB 2004, discretização é o processo de
transformar dados quantitativos em dados qualitativos e é uma área de pesquisa no
próprio processo de mineração de dados. Diversos métodos de discretização tem sido
propostos na literatura, os principais são:
• Métodos supervisionados e não supervisionados (DOUGHERTY et al.,
1995);
• Métodos paramétricos e não paramétricos;
• Hierárquicos e não hierárquicos (KERBER, 1992);
• Uni ou multivariados (BAY, 2000);
• “Disjoint vs. Non-disjoint” (YANG & WEBB, 2002);
• Global vs. Local (DOUGHERTY et al., 1995);
• “Eaguer” (“zeloso”) vs. “Lazy” (“relaxado”) (HSU et al., 2000,2003);
• Ordinal vs. Nominal;
• “Fuzzy vs. Non-Fuzzy” (WU, 1999; ISHIBUCHI et al.,2001).
Todos estes métodos apresentam suas vantagens ou desvantagens e nenhum
deles pode ser considerado como um método universal. O critério de escolha de qual
método será mais adequado depende do contexto de aprendizagem, em particular, do
algoritmo de aprendizagem, a natureza dos dados, e do objetivo da aprendizagem.
Diferentes contextos de aprendizagem tem diferentes características, o que requer
diferentes estratégias de discretização.
Na maioria dos métodos de discretização, é criada uma função de mapeamento
para os valores quantitativos dos atributos originais (variáveis contínuas) transportando-
os para um espaço de intervalos discretos (variável qualitativa). Primeiramente, a
discretização divide os valores dos atributos quantitativos em um número determinado e
finito de intervalos. A função de mapeamento associa todos os valores quantitativos em
um intervalo para um único valor qualitativo. Um determinado valor do atributo
quantitativo será eleito como “cut point”, ponto que será usado pela função de
mapeamento como fronteira entre dois intervalos no espaço discreto. O critério que
estabelece estes pontos de corte ou fronteiras podem variar de acordo com cada método.
Neste trabalho a abordagem para estabelecer os pontos de corte para a
determinação dos intervalos de discretização de cada variável foi o uso do próprio
conhecimento dos especialistas entrevistados. Mediante a apresentação das
distribuições das estatísticas de cada variável (Tabela 3.2), foram perguntados a partir
de que valores se pode considerar a presença ou ausência de determinado organismo, ou
se no caso de presença, consideram pouca, média ou muita ocorrência. Normalmente
existe alguma divergência pela própria natureza relativa do conceito de pouco, médio ou
muito, porém o consenso dos especialistas, pode ser obtido. Assim, foram estabelecidos
cinco intervalos para cada atributo. Para os dados de temperatura e salinidade os
especialistas se basearam na Tabela 3.1 que define as massas d’água de acordo com
estes dois critérios. Para os dados químicos e biológicos se basearam na Tabela 3.2.
Portanto, os cinco intervalos para os atributos físicos e químicos se referem a: Baixo
(1), baixo/médio (2), média (3), médio-alta (4) e alta (5) concentração de ,por exemplo,
oxigênio ou nutrientes enquanto que, para os dados biológicos estes intervalos se
referem a ausência, valores iguais a zero (1), poucos (2), média ocorrência (3),
freqüentes (4) e abundantes (5). Os valores estabelecidos como pontos de corte das
variáveis podem ser encontrados na Tabela 4.1.
52
53
Tabela 4.1 – Intervalos e pontos de corte das variáveis discretizadas
Variáveis Intervalo 1 Intervalo 2 Intervalo 3 Intervalo 4 Intervalo 5
Baixo Baixo/médio Médio Médio/alto Alto Temperatura P
oPC ≤ 18.1 De 18.2 à20 De 20.1 à25 De 25.1 à27 ≥ 27
Salinidade ‰ ≤ 34 De 34.1 à 35.4 De 35.5 à 36 De 36.1 à 37 ≥ 37 Oxigênio mg/l ≤ 3 De 3.1 à 4.5 De 4.6 à 5.5 De 5.6 à 6.5 ≥ 6.5 Fosfato µg/l ≤ 0.1 De 0.11 à 0.35 De 0.36 à 0.5 De 0.51 à 1 ≥ 1.1 Nitrito µg/l ≤ 0.1 De 0.11 à 0.3 De 0.31 à 0.4 De 0.41 à 0.5 ≥ 0.51 Nitrato µg/l ≤ 0.3 De 0.31 à 0.7 De 0.71 à 1 De 1.1 à 2 ≥ 2.1
Clorofila-a mg/l ≤ 0.6 De 0.61 à 1 De 1.1 à 2 De 2.1 à 3 ≥ 3.1
Org/mP
3P Ausente Pouco Médio Freqüente Abundante
Cirripedia = 0 De 1 à 150 De 151 à 500 De 500 à 800 ≥ 801 Mytilidae = 0 De 1 à 50 De 51 à 200 De 201 à 600 ≥ 601
Polychaeta = 0 De 1 à 20 De 21 à 40 De 41 à 80 ≥ 81 Decapoda = 0 De 1 à 10 De 11 à 30 De 31 à 70 ≥ 71
LD = 0 De 1 à 40 De 41 à 150 De 151 à 300 ≥ 301 Osteidae = 0 De 1 à 25 De 26 à 50 De 51 à 100 ≥ 101 Cypris = 0 De 1 à 50 De 51 à 100 De 101 à 250 ≥ 251
Ascidiaceae = 0 De 1 à 5 De 6 à 10 De 11 à 20 ≥ 21 Bryozoa = 0 De 1 à 2 De 3 à 4 De 4 à 5 ≥ 6 Bivalvia = 0 De 1 à 6 De 7 à 8 De 9 à 10 ≥ 11
De acordo com este critério e segundo os pontos de corte estabelecidos, cada
variável foi tratada de forma independente e não levou em consideração qualquer
possível relação com as demais. Esta abordagem de discretização foi uma forma de
trazer o conhecimento especialista existente para o espaço de busca, e ao mesmo tempo
uma estratégia de se colocar em evidência de forma ranqueada a ocorrência estatística
dos intervalos da nova matriz (discretizada), como demonstrada pela Tabela 4.2. Os
nomes dos atributos foram abreviados de acordo com Temperatura, TEMP; Salinidade,
SAL; Oxigênio, OX; Fosfato, PO; Nitrito, NTI; Nitrato, NTO; Clorofila-a, CLO;
Cirripédia, CIR; Mytilidae, MIT; Decapoda, DEC; Polychaeta, POL; Larva D, LD;
Ostreidae, OST; Cipris, CIP; Ascidiaceae, ASC; Bryozoa, BRY; Bivalvia, BIV;
acompanhados de seus respectivos intervalos 1, 2, 3, 4 e 5 e seguidos da percentagem de
ocorrência na matriz.
Tabela 4.2 – Estatística de ocorrência dos intervalos na matriz discretizada
TEMP3 82.8 NTI1 78.9 OX3 73.8 BIV1 71 PO2 69.5BRY1 66.9 CIR2 66.5 POL2 64.8 CIP2 54.4 LD2 54OST2 52.1 MIT2 51.7 SAL3 48.7 DEC2 44.2 ASC1 42.9CIP1 40.9 NTO1 38.6 SAL2 35.8 CLO1 35.2 NTO2 34.6MIT3 33.1 CLO2 30.3 CLO3 28.2 LD3 24.3 DEC3 24.1OST1 23.5 ASC2 21.3 CIR3 19.6 BIV5 18.4 NTI2 17.6PO3 17.6 PO1 17.6 POL1 17.4 OX4 16.8 DEC1 16.6
ASC5 14.7 SAL4 12.3 ASC4 11.7 LD1 11.5 OST3 11.4DEC4 11.4 NTO3 10.0 POL3 9.6 BRY2 9.6 ASC3 9.4BRY3 9.2 TEMP4 9.0 BRY4 8.0 MIT4 8.0 BIV2 7.8OST5 7.0 OX5 6.7 TEMP2 6.3 CIR1 6.3 BRY5 6.3MIT1 6.1 LD4 6.1 OST4 6.1 POL5 5.5 PO4 4.7CIR5 4.1 LD5 4.1 DEC5 3.7 CLO4 3.7 CIR4 3.5CIP3 2.7 POL4 2.7 SAL1 2.5 CLO5 2.5 OX2 2.3BIV4 1.6 NTI3 1.6 TEMP 1 1.4 NTI5 1.4 BIV3 1.2MIT5 1.2 CIP4 1.0 CIP5 1.0 PO5 0.6 SAL5 0.6OX1 0.4 SAL5 0.3 TEMP5 0.3 NTO4 0.09 NTO5 0.09
Segundo NIIMI & TAZAKI (2000), várias técnicas para descobrir regras de
associação foram descritas na literatura, porém o algoritmo Apriori desenvolvido por
AGRAWAL e SRIKANT (1994), é o mais comumente utilizado como ferramenta de
mineração, pois explora as propriedades de um nível discreto. Este algoritmo é uma
técnica criada para gerar regras sobre itens freqüentes em grandes bases de dados e usa
os parâmetros de suporte e confiança já descritos anteriormente. Dependendo de qual o
nível de suporte e confiança estabelecidos, o espaço de busca pode ser reduzido, ou o
número de regra de associação candidatas pode ser aumentando. Estes índices
determinarão entre outras palavras, o número de regras geradas e o grau de certeza em
que a regra pode ocorrer. Assim, de acordo com a estatística de ocorrência dos
intervalos gerados pelo processo de discretização, minerar itens com baixa ocorrência,
como por exemplo, a presença de águas de frias oriundas da ressurgência na superfície
constitui um evento raro e precisará de ser usado um suporte muito baixo, e para tal
deve-se usar um índice de confiança elevado.
Na linguagem da comunidade de mineração de dados, um item pode ser um
atributo que compõe a base de dados e um conjunto de itens é normalmente tratado
como um “itemset”. Um “frequent itemset” é um “itemset” que o suporte é maior que o
especificado por um usuário é denotado por Lk onde k é o tamanho do “itemset”. Um
54
“cadidate itemset” é um “frequent itenset,” representado por Ck, onde k é o tamanho do
“itemset”. O algoritmo Apriori usa a propriedade downward closure (encerramento
descendente) para podar ramos desnecessários para posterior consideração e opera como
segue:
1 K = 1;
2 Acha frequent itemset, Lk à partir de Ck, o conjunto de todos itemsets;
3 Forma Ck+1 à partir de Lk;
4 k = k+1;
5 Repete as etapas 2 à 4 até Ck estar vazio;
A etapa 2 é chamada de geradora de “frequent itemset”. A etapa 3 é chamada como a
geradora de “candidate itemset”.
A k-ésima iteração (para > 1) forma freqüente (k+1) “itemset” candidatos
baseados nos freqüentes k-itemsets, e varre a base de dados uma vez para encontrar o
conjunto completo de freqüentes (k+1)-itemsets, Lk+l. As variações envolvendo redução
de amostras e transações podem ser usadas para fazer o procedimento mais eficiente.
Outras variações incluem: particionar (dividir) os dados (minerando cada partição e
então combinando os resultados), e amostrar os dados (minerando em um subconjunto
dos dados). Essas variações podem reduzir o número de iterações requeridas para um
pequeno número, tal como dois ou um, como sugerido por Agrawal, (1994). Porém, os
algoritmos de mineração de regras de associação tendem a produzir um grande número
de regras, a maioria delas apresentando redundâncias, ou sem grande interesse tornando,
muito difícil a inspeção manual do que é realmente interessante.
4.3) Análise de Regras Interessantes
Para resolver tal problema, LIU et al., (2000) desenvolveram uma
aproximação para ajudar a reduzir o grande número de regras geradas e selecionar
55
apenas as regras interessantes (em particular, regras inesperadas). Através de uma
análise de interessabilidade, alavanca-se o conhecimento do domínio existente e então
classificam-se as regras descobertas de acordo com alguns critérios tais como:
conformidade e imprevisibilidade. Pesquisas em mineração de dados
(SILBERSCHATZ, 1996) têm mostrado que se pode medir o grau de interesse de regras
através de medidas objetivas e subjetivas. Medidas objetivas analisam a estrutura da
regra, sua performance preditiva, e a significância estatística (BAYARDO &
AGRAWAL, 1999). Tais medidas incluem os índices de suporte e confiança. No
entanto, medidas objetivas não são suficientes para determinar o grau de interesse de
uma regra, sendo então necessário, o uso de medidas subjetivas. As duas principais
medidas subjetivas são:
• Inesperabilidade ou imprevisibilidade (LIU,1996): as regras são interessantes
se elas são desconhecidas ou contradizem o conhecimento existente (ou expectativas do
usuário);
• Acionabilidade (PIATESKY-SHAPIRO,1994): as regras são interessantes se
podem ser usadas de forma a obter alguma vantagem ou benefício.
As regras interessantes podem ser classificadas dentro de três categorias:
• Regras que são inesperadas e acionáveis,
• Regras inesperadas, e não acionáveis e,
• Regras acionáveis, mas esperadas.
O foco deste trabalho está no inesperado, porque a acionabilidade é parcialmente
manuseada através da imprevisibilidade, já que as regras acionáveis são ou esperadas ou
inesperadas. Regras esperadas são também chamadas de “conforming rules” porque
elas estão de acordo com o conhecimento ou expectativas existentes. Este modelo de
regra é mais geral que o modelo original proposto por AGRAWAL et al. (1994).
Define-se como regra de associação generalizada em mineração (SRIKANT,
1995):
56
57
Seja I = {iBl B, . . ., i BwB} um conjunto de itens, e G um grafo acíclico direcionado nos itens.
Uma extremidade em G representa um “é”, uma relação. Então, G é um conjunto de
taxonomias. Um exemplo de taxonomia é apresentado na Figura 4.1
Figura 4.1 – Exemplo de possível taxonomia nos dados.
Seja T um conjunto de relações (transações), onde cada relação t reúne um
conjunto de itens tal que t⊆ I. Uma regra de associação generalizada é uma implicação
da forma X→Y, onde X⊂ I, Y⊂ I, e X∩Y = Ø. A regra X→Y será válida no conjunto
de relações T com confiança c, se c% de relações em T que suporta X também suporta
Y. A regra tem suporte s em T se s% das relações em T contiverem X∪Y. Por
exemplo:
Ostreidae → Mytilidae [suporte 10%, confiança 60%],
Significa que em 10% das ocorrências, tanto ostras e mexilhões aparecem juntos, e que
60% das ostras sempre ocorrerão com mexilhões.
A análise de interessabilidade proposto por LIU (2000), é uma técnica interativa.
Em cada iteração, deve-se especificar os conhecimentos existentes sobre o domínio.
Então, o sistema usa este conhecimento para analisar as regras descobertas de acordo
com algum critério de interessabilidade, e através de tal análise identifica aquelas regras
potencialmente interessantes. Basicamente o algoritmo funciona como segue:
Repetir até que o usuário decida parar:
CLASSEBIVALVIA
FAMÍLIAMYTILIDAE
FAMÍLIAOSTREIDAE
CLASSEBIVALVIA
FAMÍLIAMYTILIDAE
FAMÍLIAOSTREIDAE
1 - o usuário especifica ou modifica algum conhecimento previamente existente;
2 – o sistema analisa as regras descobertas de acordo com a conformidade do
conhecimento prévio e imprevisibilidade e identifica as potencialmente interessantes;
3 - o usuário inspeciona e analisa os resultados através de um sistema de
visualização, salva as regras interessantes, e remove aquelas indesejáveis.
A linguagem permite especificar três tipos de conhecimento representando
diferentes graus de precisão:
• impressões gerais (IG),
• conceitos razoavelmente precisos (CRP) e,
• conhecimento preciso (CP).
Os dois primeiros tipos de conhecimento demonstram sentimentos vagos do
especialista, enquanto o último, o conhecimento preciso. Esta divisão é importante
porque o conhecimento humano tem granularidades. É crucial permitir a especificação
de diferentes tipos de conhecimento. Isto não somente determina como se pode fazer
uso do conhecimento, mas também como fazer uso de todo conhecimento possível. A
linguagem de especificação também faz uso da idéia da clássica hierarquia (ou
taxonomia), que é a mesma usada em regras de associação generalizadas (SRIKANT,
1995). O objetivo é mostrar os aspectos essenciais das regras de maneira que possam
oferecer vantagem às capacidades visuais humanas de identificação daquelas
verdadeiramente interessantes com rapidez e facilidade.
Os aspectos essenciais são:
• Tipos de regras potencialmente interessantes: diferentes tipos de regras
interessantes devem ser separadas porque dão ao usuário diferentes tipos de
conhecimento.
• Graus de Interessabilidade: as regras devem ser agrupadas de acordo com seus
graus de Interessabilidade. Isto permite ao usuário focalizar primeiramente as regras
maximamente inesperadas e decidir se olha às regras de menor grau de interesse.
58
59
• Itens interessantes: mostrar os itens interessantes numa regra é mais
importante que toda a regra. Por exemplo, quando se olha para regras com partes
conseqüentes inesperadas, é natural que a primeira coisa que se deseja saber é qual o
item mais inesperado na parte conseqüente. Maiores detalhes podem ser obtidos em
LIU (2000).
Considere U um conjunto de especificações representando o espaço de
conhecimento, e A um conjunto de regras descobertas. A técnica proposta une e
ranqueia as regras em A em um número de maneiras para achar diferentes tipos de
regras interessantes, “conforming rules”, regras com partes conseqüentes inesperadas,
regras com condições inesperadas e regras com ambos os lados interessantes.
Regras em conformidade: uma regra descoberta em ABi B∈A está em
conformidade com o espaço do conhecimento UBi B∈U do especialista se ambas as partes
de ABi B se unem adequadamente com UBi B∈U. Utiliza-se “confmBij B” para indicar o grau de
conformidade. Ranquear as regras que estão em conformidade mostra a consistência do
conhecimento existente.
Regras com partes conseqüentes inesperadas: uma regra ABi B∈A tem uma
conseqüência inesperada com respeito a UBj∈ BU se a parte condicional ABi B se une com UBj
Bmas não à parte conseqüente. Usa-se “unexpConsqBijB” para indicar o grau de
imprevisibilidade da parte conseqüente. Ranquear regras com partes conseqüentes
inesperadas mostra aquelas regras descobertas que são contrárias ao conhecimento
existente. São freqüentemente interessantes.
Regras com partes condicionais interessantes: uma regra ABi∈ BA tem parte
condicional inesperada com respeito a UBj∈ BU se a parte conseqüente de ABi B se emparelha
bem com U Bj B,B Bmas não à parte condicional. Emprega-se “unexpCondBijB” para indicar o
grau de condições inesperadas. Ranquear as regras pela parte condicional mostra que
existem outras condições que podem levar a parte conseqüente do conhecimento. Está-
se explorando território desconhecido, outras associações que estão relacionados com o
conhecimento existente.
Regras de ambas as partes inesperadas: uma regra ABi B∈A é inesperada com
ambas as partes com respeito a UBj B∈U se ambas as partes da regra ABi B não se une com
aquelas de UBj B. Utiliza-se “bsUnexp BijB” para indicar o grau de imprevisibilidade por
60
ambas as partes. Ranquear regras por ambas as partes mostra que existem outras regras
em que ambas partes nunca foram mencionadas pelo conhecimento especificado.
Se os valores de “confmBijB”, “unexpConsqBijB”, “unexpCondBijB” e “bsUnexpBijB” for
entre 0 e 1, 1 representará uma completa união, completa conformidade ou
imprevisibilidade e, 0 representará nenhuma união.
Considerando LBijB e RBijB graus de condições e conseqüências da união da regra ABi
Bcontra UBj B respectivamente, estes valores são computados de acordo:
ijijij RLconfm ∗= (4.1)
⎩⎨⎧
>−−≤−
=000
ijijijij
ijijij RLRL
RLqunexpconse (4.2)
⎩⎨⎧
>−−<−
=000
ijijijij
ijijij LRLR
LRunexpcond (4.3)
( )ijijijij unexpcond,qunexpconse,confmmax1bsUnexp −= (4.4)
Este procedimento foi utilizado para extrair as regras interessantes da base de
dados estudada.
Segue-se a apresentação de alguns conjuntos de regras identificadas e
selecionadas como interessantes de acordo com a variação de índices de suporte e
confiança. Esta variação é necessária para se acessar a base de dados em diferentes
níveis e tentar minerar regras que possam cobrir o espaço de busca e descrever a
ocorrência de fenômenos raros (ocorrência de classes pequenas). O objetivo aqui é o de
tentar estabelecer uma descrição das diferentes massas d’águas estabelecidas pela
Tabela 3.1 através de regras de associação. Por exemplo:
Se TEMP3 e POL2 e SAL4 então BIV1 [8.2%, 100%, 42, 42, 8.12%]; (2)
Se NTI1 e NTO1 SAL4 então TEMP3 [8.2%, 100%, 42, 42, 8.12%]; (3)
Se TEMP3 e PO2 e POL2 então DEC1 [7.3%, 100%, 40, 32, 7.3%]; (4)
Se TEMP3 e OST2 e SAL4 então NTI1 [5.8%, 100%, 30, 30, 5.8%]; (5)
SE CIR2 e CIP1 e SAL4 então TEMP3 [5.8%, 100%, 30, 30, 5.8%]; (6)
Se CLO1 e PO3 e SAL4 então TEMP3 [5.8%, 100%, 30, 30, 5.8%]; (7)
Se SAL4 e CLO1 ePOL1 então TEMP3 e OX3 [5.8%, 100%, 30, 30, 5.8%]; (8)
Se TEMP3 e ASC5 e CLO1 então BRY1 [5.8%, 100%, 30, 30, 5.8%]; (9)
Se LD2 e DEC2 POL2 então TEMP3 [5.8%, 100%, 30, 30, 5.8%]; (10)
A presença dos intervalos TEMP3 e SAL4 na parte condicional da primeira
regra apresentada demonstra que esta situação corresponde aos intervalos de
discretização e a Tabela 3.1 das massas d’água à águas da Corrente do Brasil. Este
conjunto de regras demonstra uma condição da estrutura trófica pois, pode-se perceber
que são águas oligotróficas que se caracterizam pela presença de poucos nutrientes
nitrogenados de acordo com a regra número três. Porém, ainda com relação ao nutriente
fosfato, a regra quatro apresenta um intervalo de PO2 enquanto que a regra de número
sete mostra a possibilidade deste nutriente atingir valores médios (PO3), no entanto, a
mesma regra apresenta um intervalo de clorofila baixo (CLO1), demonstrando que a
produção primária pode estar limitada pelo desbalanceamento da razão N/P. Quanto a
componente das larvas merozooplanctônicas, o que se pode observar é a ausência de
larvas de Bivalvia (BIV1, regra 1), e Briozoários (BRY1, regra 1). De acordo com as
regras de número 1, 4, 8 e 10, fica claro que os poliquetas (POL1 e POL2) podem estar
ausentes ou se presentes, com baixa densidade larval. Caso semelhante, são os nauplios
de cirripédios que na regra número 3 estão ausentes mas, na regra 6, apresenta baixa
densidade populacional, enquanto as larvas do tipo cipris estão ausentes. O fato mais
interessante é demonstrado pela regra 9, onde pode-se perceber a grande abundância das
larvas das ascídias (ASC5). Neste conjunto de regras fica demonstrado um exemplo do
caráter oligotrófico da Corrente do Brasil e uma possível composição do arranjo
populacional.
Um fato curioso é saber o que e quando acontece em uma situação de
concentração de oxigênio baixa. Esta situação ocorre muito poucas vezes na base de
dados, e o que se deveria esperar é uma baixa concentração de larvas, já que são acima
de tudo animais e sensíveis a este fator ambiental. A seguinte base de regras mostra
esta situação:
61
Se TEMP3 e SAL2 e OST4 então LD5 [0.19%, 100%, 1, 1 0.19%] (11)
Se ASC1 e LD5 e OST4 então OX1 [0.19%, 100%, 1, 1 0.19%] (12)
Se BIV5 eOX1 então OST4 e LD5 [0.19%, 100%, 1, 1 0.19%] (13)
Se OST4 e LD5 e OX1 então BRY1 [0.19%, 100%, 1, 1 0.19%] (14)
Se LD5 e OST4 então POL3 e SAL2 [0.19%, 100%, 1, 1 0.19%] (15)
Se OST4 e LD5 e MIT3 então NTI1 e PO2 [0.19%, 100%, 1, 1 0.19%] (16)
Se BIV5 e CLO2 e OX1 então DEC2 [0.19%, 100%, 1, 1 0.19%] (17)
Se OST4 e LD5 e OX1 então NTO1 [0.19%, 100%, 1, 1 0.19%] (18)
A presença dos intervalos TEMP3 e SAL2 na regra 11 caracteriza a massa
d’água costeira. Segundo as regras 16 e 18 percebe-se que se trata de águas também
pobres em nutrientes, devido a existência dos intervalos NTI1 e NTO1 o que demonstra
baixos níveis de nitrogênio, enquanto que a presença de PO2 mostra uma concentração
pouco mais elevada do grupo fosfato. Este fato explica a pequena ocorrência de
clorofila (intervalo CLO2, regra 17). Porém a estrutura populacional muda
radicalmente em relação ao conjunto de regras anterior. Pode-se observar agora a
presença freqüente de larvas de ostras (OST4) e a abundância de larvas do tipo LD
(LD5) e Bivalvia (BIV5). Fica fácil de observar que estas três categorias estão
associadas a níveis baixos de oxigênio (regras 12, 13 14 e 18). Ainda pode ser
verificado a presença de poucos decapodas (DEC2, regra 17) e uma média ocorrência
larvas de mexilhões (MIT3, regra 16) e poliquetas (POL3), enquanto que os briozoários
permanecem ausentes (BRY1, regra 14), tanto quanto as ascídias (ASC1, regra 12).
Não foram detectadas regras que descrevem o comportamento das outras populações
nesta situação. Mas a inspeção das regras que seguem:
Se SAL2 e CIR2 e POL4 então TEMP4 [0.19%, 100%, 1, 1 0.19%] (19)
Se PO1 e TEMP4 então ASC2 [0.19%, 100%, 1, 1 0.19%] (20)
Se OX3 e TEMP5 então ASC4 [0.19%, 100%, 1, 1 0.19%] (21)
Se OX3 e TEMP5 então CIR4 e DEC5 [0.19%, 100%, 1, 1 0.19%] (22)
62
Se SAL2 e CIP1 e MIT4 entãoTEMP5 [0.19%, 100%, 1, 1 0.19%] (23)
Se CLO1 e CIP1 então CIR4 e OST5 [0.19%, 100%, 1, 1 0.19%] (24)
demonstra que neste tipo de massa d’água (água costeira) a pequena presença de
nauplios de cirripédios (CIR2) com o aumento da temperatura para o intervalo TEMP4
(regra 19) e o aparecimento de ascídias (ASC2, regra 20). Desta forma, temperaturas
muito elevadas, intervalo TEMP5, e de níveis médios de oxigênio verifica-se a
freqüente ocorrência de cirripédios (CIR4, regra 22) e a abundância de decápodes. Este
conjunto de regras demonstra dentre outras coisas que são a temperatura e o oxigênio os
fatores ambientais determinantes para a estruturação populacional na massa d´água
costeira.
De acordo com o conhecimento do fenômeno da ressurgência procurou-se por
regras que continham em alguma de suas partes o intervalo TEMP1 (pelo processo de
discretização inclui temperaturas menores que 18 graus). Neste contexto foram
descobertas apenas cinco regras como segue:
Se CIP2 e OST1 e OX5 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (25)
Se NTI2 e POL3 e OX4 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (26)
Se NTI2 e POL3 e NTO4 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (27)
Se CIP1 e NTI2 e POL3 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (28)
Se ASC1 e NTI2 e POL3 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (29)
Neste conjunto pode-se concluir que trata-se de uma massa d’água com
características de poucas larvas devido a ocorrência de OST1 e CIP2na regra 25 e ASC1
na regra 29. Porém pode ser observado a presença de níveis médios de poliquetas
(POL3) pelas regras 26, 27 e 29. A regra 27 também apresenta um elevado nível de
nitrato (NTO4) enquanto são observados pequena concentração de nitrito (NTI2) nas
regras 26 e 27. Ainda fica evidente a ocorrência de elevados teores de oxigênio,
intervalos OX5 e OX4 das regras 25 e 26 respectivamente.
Normalmente, ao longo do ano, o mais comum é encontrar a presença de uma
massa d’água costeira “estacionária” junto ao continente e a presença de águas da
63
Corrente do Brasil fluindo em direção sul, que se misturam. Esta mistura dá origem
outra água com característica diferentes. Neste exemplo foram usados um valor suporte
de 30% e um valor de confiança de 80%. As regras originadas deste experimento foram
ranqueadas por ambas as partes como segue:
Se TEMP3 e PO2 e BRY1 então NTI1 [10.7%, 96.8%, 55, 53, 10.3%] (30)
Se BRY1 e CLO2 e SAL3 então TEMP3 [12.3%, 96.8%, 63, 61, 11.93%] (31)
Se PO2 e NTO1 e SAL3 então NTI1 [12.5%, 98.4%, 64, 63, 12.32%] (32)
Se PO2 e LD2 e OST2 e MIT2 então NTI1 [15.3%, 96.4%, 64, 63, 12.3%] (33)
Se TEMP3 então SAL3 [78.8%, 85.1%, 403, 336, 65.7%] (34)
Se TEMP3 então OX3 [73.8%, 83.1%, 377, 316, 61.8%] (35)
Esta situação mostra novamente um ambiente de poucos nutrientes e pobre
diversidade biológica. Os intervalos TEMP3, SAL3 e OX3 são os mais freqüentes no
ambiente dado aos altos valores de suporte das regras.
No entanto, durante o processo de emergência das Águas Profundas do Atlântico
Sul (ACAS), esta massa d’água pode ter contato direto com a água costeira ou com a
água tropical produzindo assim outros ambientes de misturas de características
diferentes como se demonstra à seguir:
Se TEMP2 e MTI4 então SAL4 [0.19%, 100%, 2, 2, 0.19%] (36)
Se NTO2 e MTI4 então SAL4 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (37)
Se PO3 e MTI4 então SAL4 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (38)
Se CLO3 e MTI4 então SAL4 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (39)
Se NTO2 e NTI4 e PO3 então SAL4 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (40)
Se CLO3 e ASC5 e MIT5 então SAL4 e DEC 4 [0.19%, 100%, 2, 2, 0.19%] (41)
Se OX3 e OST2 e LD2 então CIP2 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (42)
64
Se POL2 e CIR2 e MIT3 então SAL4 [0.19%, 100%, 2, 2, 0.19%] (43)
Estas águas se caracterizam por serem uma mistura das águas da ACAS e da
água tropical da Corrente do Brasil. É evidente a presença de grande concentração do
nutriente, nitrito, intervalos de MTI4, MTI5 sugerindo uma intensa atividade bacteriana
devido a este nutriente ser uma forma de transição do metabolismo entre a amônia e o
nitrato. Este último se encontra ainda em um intervalo de baixa concentração. O fosfato
se encontra em níveis médios juntamente com a clorofila. São encontrados nestas águas
baixas densidade de poliquetas, cirripédios, ostras e larvas em D. Verifica-se ainda uma
ocorrência abundante de mexilhões, ascídias e decápodes.
Noutra situação verifica-se:
Se BRY1 e NTO1 e TEMP2 então CLO5 [0.78%, 100%, 5, 4, 0.78%] (44)
Se SAL3 e TEMP2 e CLO5 então MIT1 [0.78%, 100%, 5, 4, 0.78%] (45)
Se PO2 e NTI1 e TEMP2 então SAL3 OX5 [0.78%, 100%, 5, 4, 0.78%] (46)
Se OST2 e NTI1 e BIV3 então LD2 e DEC1 [0.78%, 100%, 5, 4, 0.78%] (47)
Se BIV3 e CIR2 e CIP1 então POL2 e CLO5 [0.78%, 100%, 5, 4, 0.78%] (48)
A presença de intervalos TEMP2 e SAL3 neste conjunto de regras caracteriza
um situação de mistura das águas da ACAS e a água costeira. Percebe-se que são águas
de alta produção primária devido ao intervalo CLO5, no entanto verifica-se a baixa
concentração de nutrientes pois os mesmos devem já ter sido depletados pelo sistema
clorofiliano. Observa-se também a baixa ocorrência de larvas que provavelmente ainda
não tiveram tempo suficiente para se verificar um pulso de produção secundária.
4.4) Regras de Classificação de Dados
No momento em que as tecnologias oriundas da área de “machine learning”
passaram a ser empregadas em conjuntos de dados do mundo real, verificou-se a
65
66
emergência de um novo problema (CHAWLA, 2004), isto é, o desbalanceamento dos
dados ou de classes.
Este problema tem sido o responsável pela degradação da performance de
classificadores (TAEHO 2004). Na tarefa de minerar dados e gerar um classificador
que possa operar no gerenciamento ambiental costeiro, este problema deverá ser
enfrentado e solucionado. Portanto, o objetivo aqui é construir um classificador capaz
de cobrir o espaço de busca contemplando todas as possibilidades ou casos raros, como
a ocorrência da ressurgência e os diversos ambientes provocados pelo transiente
resultante do processo de mistura das diversas massas d’águas. É importante determinar
o que é exatamente considerado raro e o efeito que este problema pode causar nos
modelos de classificação.
Segundo WEISS (2004), muitas das pesquisas da área de mineração de dados
estão relacionadas com classes raras e casos ou exemplos raros. O problema de casos
raros está relacionado com a distribuição dos dados, enquanto que o problema de classes
raras ocorre quando existem mais exemplos em uma classe do que em outra, neste caso,
os classificadores tendem a ser subjugados pela maior classe e ignorar a menor. Porém,
vale notar que, dentro das classes mais comuns (maiores) pode também haver casos
raros de acordo com a distribuição interna das classes. Ambos os tipos de raridade têm
sido referidos como responsáveis pelo problema de desbalanceamento dos dados. Isto
torna difícil a tarefa de mineração e indução de classificadores devido a :
• Escolha da métrica adequada para avaliação dos classificadores;
• Carência de dados;
• Fragmentação dos dados;
• Estabelecer o nível indutivo apropriado para gerar o classificador (bias);
• Ruído;
Alguns autores comentam a interação de classes desbalanceadas com outros
problemas tais como pequenas disjunções, “small disjunct” encontrado em
JAPKOWICZ (2003), e a sobreposição de classes em VISA (2003). O
desbalanceamento de classes está relacionado com a sobreposição, devido ao fato das
classificações erradas ocorrerem freqüentemente perto da “fronteira” ou do limite da
sobreposição, enquanto que, “small disjuncts” são aquelas disjunções dos
classificadores que cobrem poucos exemplos de treinamento. O problema é que
pequenas disjunções geralmente causam uma taxa de erro maior. A natureza da
propensão ao erro é um resultado direto da raridade WEISS (2004).
Uma série de abordagens ao nível dos dados e de algoritmos tem sido propostas
na literatura para solucionar este problema. Estas soluções incluem muitas formas
diferentes de re-amostragem tais como, sub-amostrar (under-sample) os exemplos da
classe majoritária (KUBAT et al., 1997), sobre-amostrar (over-sample) os exemplos da
classe minoritária (MALOOF, 1998), sobre-amostrar a classe majoritária e sub-amostrar
a classe minoritária (CHAWLA, 2002), atribuir pesos a exemplos da classe minoritária
(CARDIE et al., 2003), evoluir algoritmos de “boosting” para classificar classes raras
(JOSHI et al., 2001), combinar dados sintéticos com algoritmos de “boosting” para
melhorar a predição da classe minoritária (CHAWLA, 2003).
Para a determinação das classes a abordagem deste trabalho consistiu na aplicação do
algoritmo de agrupamento de dados K-means descrito anteriormente e seus resultados,
colocados na matriz de intervalos discretos. A Tabela 4.3, mostra o número de classes,
a freqüência ou número de registros em cada classe, a porcentagem que cada classe
representa em relação a base de dados e o número de regras obtidas pelo classificador
gerado.
Tabela 4.3 – Número de classes, freqüência, probabilidade e regras geradas.
Classe Freqüência Probabilidade Nº Regras1 203 39.70% 742 21 4.20% 53 183 35.80% 634 14 2.70% 35 43 8.40% 146 15 2.90% 47 32 6.30% 12
Segundo QUILAN (1992), o objetivo de minerar regras de classificação é
descobrir um pequeno conjunto de regras capaz de atuar como classificador preciso. Na
mineração de regras de associação, não existe alvo predeterminado mas, para regras de
67
68
classificação isto se faz necessário pois o alvo é a classe que se deseja prever. A
particularidade do conjunto de regras de classificação é, portanto, possuir o atributo
classe posicionado na parte conseqüente da regra. LIU (1998), propõe a integração do
sistema que busca todas as regras de associação com outro para descobrir regras de
classificação em uma estrutura que chamou de classificação associativa, que busca por
um sub conjunto de regras de associação especial chamado de regras de associação de
classe (CARs). Este autor adaptou o algoritmo Apriori de AGRAWAL & SRIKANT
(1994), para minerar o sub conjunto “CARs” que satisfaça um pré-determinado nível de
suporte e confiança mínimas. Esta adaptação se fez necessária por dois motivos: o
primeiro é evitar a explosão combinatorial do algoritmo e em segundo, foi adotar a
estratégia de discretização de atributos contínuos desenvolvida por FAYYAD e IRANI
(1993). Portanto, seu sistema funciona em três etapas:
• Discretiza atributos contínuos;
• Gera todas as regras de associação de classes (CARs);
• Constrói um classificador baseado em CARs.
Esta metodologia de classificação assume que a base de dados é uma tabela
relacional, que consiste de N casos descritos por l distintos atributos. Estes N casos são
classificados dentro de q classes conhecidas. Durante a classificação, todos os atributos
são tratados uniformemente. Para um atributo categórico, todos os possíveis valores são
mapeados para um conjunto de números inteiros positivos e consecutivos. Para um
atributo contínuo, seus valores são discretizados dentro de intervalos, e os intervalos
também são mapeados em um conjunto de números inteiros positivos consecutivos.
Com esses mapeamentos, pode-se tratar um caso (objeto ou registro) como um conjunto
de pares (atributo, valor inteiro) e uma classe alvo. Cada par (atributo, valor inteiro) é
chamado de item.
Seja D o conjunto de dados, I o conjunto de todos os itens em D, e Y o conjunto
de classes alvo. Pode-se dizer que um caso d ∈ D contém X ⊆ I, um subconjunto de
itens, se YX ⊆ . Uma regra de associação de classe (CAR) é uma implicação da forma
X → y, onde DX ⊆ , e y є Y. Uma regra X → y é válida em (ou está contida em) D
com confiança c se c% dos casos em D que contém X são marcados com a classe y. A
69
regra X → y tem suporte s em D se s % dos casos em D que contém X são rotulados
com a classe y.
Vale ressaltar novamente que o primeira etapa de discretização usada neste
trabalho foi a mesma do processo de extração de regras de associação.
Para produzir o melhor classificador de todo o conjunto de regras é efetuada uma
avaliação sobre os possíveis subconjuntos de CARs gerados durante a fase de
treinamento e a seleção da seqüência de regras que fornece menor erro.
O conceito básico empregado na operação de geração de CARSs é achar todos
os “ruleitems” (regra dos items atributos) que tem suporte mínimo (“minsup”) acima do
especificado. Um ruleitem tem a forma de:
< condset, y >
onde “condset” (condições) é um conjunto de items, y є Y, é uma classe alvo.
“Ruleitems” que satisfaçam “minsup” são chamados “frequent ruleitems” (regras
freqüentes). Para todos “ruleitems” que tem o mesmo “condset”, o “ruleitem” com a
mais alta confiança é escolhido como uma “possible rule”, possível regra (PR) que
representa este conjunto de “ruleitems”. Se existir mais do que um ruleitem com o
mesmo nível de confiança, é randomicamente selecionado um ruleitem. Se a confiança
é maior do que “minconf”, diz-se que a regra tem acurácia. O conjunto de regras de
associação de classe (CARs) então consiste de todas as regras possíveis (PRs) que são
tanto freqüentes e precisas.
O algoritmo gera todos os items freqüentes fazendo múltiplos passos sobre os
dados. No primeiro passo, estabelece o suporte individual de cada item e determina se
este é freqüente. Em cada passo subseqüente, escolhe um conjunto de items “semente”
(“seeds”) eleito como freqüentes no passo anterior. Essa semente é usada para gerar
novos “ruleitems” possivelmente freqüentes, chamados de “candidate ruleitems”
(regras de itens candidatas) O atual suporte desses candidatos são calculados durante o
passo sobre os dados. No final do passo, determina quais candidatos são realmente
freqüentes. A partir deste conjunto de regras freqüentes, produzam-se as regras CARs.
Para se selecionar qual conjunto de CARs será o melhor classificador, torna-se
necessário definir uma ordem nas regras geradas.
70
Dado duas regras, rBi B e rBj B, r Bi B f rBj B (também chamado r Bi B que precede rBj B ou r Bi B tem
uma maior precedência que r Bj B) se:
1. a confiança de rBi B é maior do que a de r Bj B ou,
2. suas confianças são as mesmas, mas o suporte de r Bi B é maior que a de rBj B, ou
3. ambos confiança e suporte de r e r Bj B são os mesmos, mas r Bi B é gerado antes que rBj B.
Considere R ser o conjunto de regras geradas (CARs), e D os dados de
treinamento. A idéia básica do algoritmo é escolher um conjunto de regras de alta
precedência em R para cobrir D. O algoritmo do classificador é construído em três
etapas:
1 - Classifica o conjunto de regras R geradas de acordo com a relação “f ”. Isto
assegura a escolha das regras de maior precedência;
2 - Seleciona regras para o classificador a partir de R seguindo a seqüência
classificada. Para cada regra r, o algoritmo varre D para encontrar aqueles casos
“cobertos” por r (que satisfazem as condições de r). Se a regra r classifica corretamente
o caso d, a regra é marcada e considerada uma regra potencial para o classificador. d.id
é o único número de identificação de d. Se r pode classificar corretamente no mínimo
um caso (se r está marcado), será uma regra potencial para o classificador. Os casos
cobertos por estas regras são então retirados de D. Uma classe “default” é também
selecionada (a classe majoritária nos dados restantes), que significa que se se parar a
seleção, mais regras para o classificador C esta classe será a classe “default” de C.
Computa-se então o número total de erros feitos pelo corrente C e a classe “default”.
Isto é a soma do números de erros que foi feito por todas as regras selecionadas em C e
o número de erros feitos pela classe “default”nos dados de treinamentos. Quando não
existir nenhum caso à ser treinado ou regra , o processo de seleção é terminado.
3 - São descartadas todas as regras em C que não melhoram a acurácia do classificador.
A primeira regra contendo o número mínimo de erros registrados em D é a regra que
limita a poda (“cutoff rule”). Todas as regras depois desta regra podem ser descartadas
porque elas irão produzir mais erros. As regras não descartadas e a classe da última
regra selecionada em C formam o classificador. As regras não descartadas e a classe
71
“default” da última regra em C formam o classificador. Esta técnica de classificação é
muito eficiente, maiores detalhes podem ser encontrados em LIU (1998).
A Tabela 4.4 apresenta a matriz de confusão ou matriz de erro usada para avaliar
o resultado de um experimento de classificação. Os componentes da diagonal principal
da matriz fornece o número de registros ou casos classificados corretamente.
Tabela 4.4 – Matriz de Confusão do Classificador
A acurácia deste modelo foi estimada em 87.63% sendo a taxa média de erro estimada
em 12.37%.
Na seção anterior tentou-se apresentar regras de associação e relacioná-las com
as classes de intervalos de temperatura e salinidade para estabelecer uma comparação.
No caso de regras de classificação, esta comparação não pode ser feita pois, as classes
foram estabelecidas pelo algoritmo K-means. Vale a pena lembrar que esta
classificação leva em conta o espaço multidimensional dos dados e não apenas duas
variáveis. A seguir apresentam-se alguns exemplos das regras de classificação mais
interessantes:
Se OX3 e PO2 e POL2 TEMP4 então CLASSE 1 [3.13%, 100%] (49)
Se TEMP3 e BRY1 e PO1 CLO1 então CLASSE 1 [1.76%, 100%] (50)
Se BRY1 e POL4 então CLASSE 1 [1.76%, 100%] (51)
(1) (2) (3) (4) (5) (6) (7) Classificadocomo:
172 0 19 0 1 0 1 (1): 15 8 5 0 2 0 0 (2): 219 2 156 0 1 0 0 (3): 31 0 1 12 0 0 0 (4): 42 0 1 0 33 0 0 (5): 50 0 0 0 0 15 0 (6): 61 0 0 0 0 0 29 (7): 7
(1) (2) (3) (4) (5) (6) (7) Classificadocomo:
172 0 19 0 1 0 1 (1): 15 8 5 0 2 0 0 (2): 219 2 156 0 1 0 0 (3): 31 0 1 12 0 0 0 (4): 42 0 1 0 33 0 0 (5): 50 0 0 0 0 15 0 (6): 61 0 0 0 0 0 29 (7): 7
Se NTI1 e BIV1 e CIP2 e SAL2 então CLASSE 1 [8.06%, 92%] (52)
Se DEC3 e BRY5 e POL4 então CLASSE 2 [0.57%, 100%] (53)
Se CLO2 e POL5 e CIP4 então CLASSE 2 [0.47%, 100%] (54)
Se ASC2 e SAL5 então CLASSE 2 [0.26%, 100%] (55)
Se LD2 e TEMP1 então CLASSE 2 [0.26%, 100%] (56)
Se LD2 e MIT2 e CIP1 e CLO3 então CLASSE 3 [6.26%, 85%] (57)
Se BIV1 e CIR2 e POL2 e ASC1 então CLASSE 3 [12.52%, 81%] (58)
Se NTO2 e NTI3 então CLASSE 4 [1.37%, 100%] (59)
Se BIV5 e NTI1 e MIT4 e então CLASSE 5 [12.52%, 81%] (60)
Se OX4 e PO5 então CLASSE 5 [12.52%, 81%] (62)
Se BRY1 e CLO5 e então CLASSE 6 [2.52%, 100%] (63)
Se TEMP2 e CLO5 e OST5 então CLASSE 6 [1.52%, 100%] (64)
Se TEMP3 e CIR5 e DEC3 então CLASSE 7 [0.96%, 100%] (65)
Se DEC4 e CIP5 e OST5 então CLASSE 7 [0.96%, 100%] (66)
A análise das regras de classificação demonstra que dentre este pequeno número
de regras selecionadas o classificador apresenta como CLASSE 1 intervalos de
temperaturas 3 e 4 e salinidade 2 indicado pelo conhecimento dos especialistas e Tabela
3.1 se tratar de uma massa d’água costeira e os demais intervalos tanto químicos e
biológicos correspondendo a características oligotróficas. A CLASSE 2 apresenta na
regra número 55 o intervalo de salinidade 5 característica de águas tropicais, enquanto
que a regra de número 56 apresenta a temperatura com intervalo 1 sugerindo a transição
devido ao encontro de duas massas d’água, Acas e tropical com elevadas densidades
larvais. A CLASSE 3 apresenta apenas regras com variáveis biológicas não sendo
possível, neste momento, estabelecer correlação direta com parâmetros físico-químicos
das massas d’águas, porém se trata de ambiente com médios teores de clorofila e baixa
incidência larval. A CLASSE 4 pode ser considerada como caso inverso, demonstrando
72
níveis médios do nutriente nitrito e baixo-médio de nitrato. A CLASSE 5 representa um
ambiente muito oxigenado e com altas concentrações de fosfato; a ocorrência de
abundantes larvas de bivalvias pode explicar a grande freqüência de larvas de
mexilhões, intervalo MIT4. A ocorrência do intervalo de número dois indica que a
CLASSE 6 pode corresponder a águas resultantes de mistura da ACAS com a água
costeira ou com águas tropicais; de qualquer forma demonstra-se um ambiente com alta
concentração de clorofila, abundância de larvas de ostras e ausência de briozoários. Já a
CLASSE 7, é encontrado o intervalo TEMP3 característico de águas costeiras ou
tropicais e um ambiente marcado pela dominância de larvas dos cirripédios (CIR5 e
CIP5) e ostras com média para alta ocorrência dos decápodes.
4.5) Regras “Fuzzy” e classificação de dados
As pesquisas por novos classificadores têm encontrado motivação não só na
melhoria da performance de precisão de classificação mas também na aquisição e
representação de novos conhecimentos associados à classificação.
Segundo ZADEH (1973), o cérebro humano processa e interpreta informações
incompletas e imprecisas fornecidas pelos órgãos sensoriais. A medida que a
complexidade de um sistema aumenta, a habilidade humana de fazer “declarações”
precisas e significantes sobre seu comportamento diminui até um determinado nível
além do qual a precisão se torna quase uma característica inacessível. Por causa desta
crença Zadeh introduziu o conceito de variável lingüística.
De acordo com este autor, uma variável lingüística é caracterizada por um
conjunto (x, T(x), X, G, M) no qual x é o nome da variável; T(x) é o “term set”,ou o
conjunto de valores lingüísticos; X é o universo de discussão; G é uma regra sintática
que gera os termos em T(x); e M è uma regra semântica que se associa com cada valor
lingüístico A significando M(A), onde M(A) indica um conjunto “fuzzy” em X. Por
exemplo:
73
Se a concentração de oxigênio é interpretada como uma variável lingüística,
então seu conjunto de valores lingüísticos T(OX) poderia ser:
T(OX) = {baixo, médio-baixo, médio, médio-alto, alto}
onde o termo T(OX) é caracterizado pelo conjunto “fuzzy” do universo X = [0, 10]. A
regra sintática se refere à maneira pela qual os valores lingüísticos são gerados no
conjunto de valores T(OX) enquanto que as regras semânticas definem a função de
pertinência de cada valor lingüístico no conjunto de valores. A Figura 4.2 ilustra uma
típica função de pertinência do tipo triangular.
0 2,5 5,0 7,5 10,0
0.5
0.75
1.00
0.25
0.00
Baixo Médio-baixo Médio Médio-alto Alto
Concentração de Oxigênio
Gra
u de
Per
tinên
cia
0 2,5 5,0 7,5 10,0
0.5
0.75
1.00
0.25
0.00
Baixo Médio-baixo Médio Médio-alto Alto
Concentração de Oxigênio
Gra
u de
Per
tinên
cia
Figura 4.2 – Função de pertinência típica
A teoria de conjuntos fuzzy fornece um cálculo sistemático para lidar com
tais informações lingüísticas e desempenha computação numérica usando alvos
lingüísticos estipulados por funções de pertinência. Além disso, a obtenção e seleção de
conhecimento estruturado na forma de regras “fuzzy” (if-then), se-então, forma a
componente chave de um sistema de inferência “fuzzy”que pode modelar
eficientemente a perícia humana de um domínio específico.
A transformação de informações numéricas, precisas, da base de dados em
informações lingüísticas, imprecisas, ocorre com sucesso por meio das técnicas de
conjuntos “fuzzy” (PEDRYCZ & GOMIDE, 1998), originando o sistema de regras.
Esta abordagem se faz interessante pois as informações contidas na base de dados pode
74
ter um certo grau de imprecisão devido ao ruído inerente de qualquer processo de
medição.
O processo de geração de regras, pode utilizar o esquema de decomposição
proposto por KOSKO (1992) e regras do tipo TKS de ordem zero como indicado em
EVSUKOFF et. al. (1997). A Tabela 4.5 ilustra a estrutura de regras “fuzzy” do tipo
TSK para uma base de dados com dois atributos.
Tabela 4.5 – Regras fuzzy TSK
Takagi-Sugeno-Kang (TSK): Se x1 é Ai e x2 é Aj, então yi = f(x1, x2)
TSK de ordem zero: Se x1 é Ai e x2 é Aj, então yi = cij
TSK de ordem zero decomposta: Se x1 é Ai, então yi = ci
Se x2 é Aj, então yi = cj
Modelo Exemplo
Takagi-Sugeno-Kang (TSK): Se x1 é Ai e x2 é Aj, então yi = f(x1, x2)
TSK de ordem zero: Se x1 é Ai e x2 é Aj, então yi = cij
TSK de ordem zero decomposta: Se x1 é Ai, então yi = ci
Se x2 é Aj, então yi = cj
Modelo Exemplo
Neste estudo, o espaço dos dados normalizados foi também dividido em
cinco intervalos, mas não seguindo o conhecimento dos especialistas. Desta vez, os
pontos de corte dos atributos foram distribuídos de forma eqüitativa, intervalos variando
de 0 à 0,25; 0,26 à 0,5; 0,51 à 0,75 e 0,76 à 1,00 como o exemplo da Figura 4.2 acima.
Estes intervalos foram usados para definir funções de pertinência triangulares,
trapezoidais ou multi-sigmoidais associados aos valores lingüísticos baixo, baixo-médio,
médio, médio-alto e alto.
As regras são geradas de tal modo que suas respostas informam além da classe, um
valor de inclusão no conjunto “fuzzy”estabelecido em YUAN e SHAWN (1995).
Por outro lado, muitos algoritmos genéticos têm sido aplicados aos conceitos da
teoria “fuzzy” com a intenção de otimizar o desempenho de sistemas baseados em
regras deste tipo na tarefa de ajustar funções de pertinência, estrutura das regras e
tamanho da base de regras (CORDÓN et al., 1996, HERRERA et al., 1995). Seguindo
75
esta linha, neste trabalho foi usada a abordagem apresentada por ESPÍNOLA &
EBECKEN (2000), com o objetivo de extrair um pequeno subconjunto da base de
regras que utilize a menor quantidade de atributos e que tenha a maior acurácia possível.
O melhor modelo apresentou um subconjunto com apenas onze regras mostradas a
seguir.
Se Temperatura é média baixa então CLASSE 1 [sup. 0.11%, int. 31.78%] (67)
Se Temperatura é média baixa então CLASSE 3 [sup. 0.13%, int. 28.04%] (68)
Se Temperatura é baixa então CLASSE 4 [sup. 0.003%, int. 1.28.%] (69)
Se Temperatura é médio alto então CLASSE 6 [sup. 0.0002%, int. 2.58%] (70)
Se Nitrito é médio alto então CLASSE 4 [sup. 0.0002%, int. 2.58%] (71)
Se Nitrito é alto então CLASSE 4 [sup. 0.0041%, int. 1.83%] (72)
Se Ostras é médio alto então CLASSE 7 [sup. 0.0041%, int. 1.83%] (73)
Se Ascídias é alto então CLASSE 2 [sup. 0.0119%, int. 5.21%] (74)
Se Bivalvia é médio pequeno então CLASSE 5 [sup. 0.0034%, int. 1.75%] (75)
Se Bivalvia é médio alto então CLASSE 5 [sup. 0.0281%, int. 11.70%] (76)
Se Bivalvia é alto então CLASSE 5 [sup. 0.0304%, int. 11.70%] (77)
Quando se analisa estas regras fica evidente que o algoritmo genético realmente
é uma ferramenta eficiente no que diz respeito a extração de um pequeno subconjunto
do total de regras geradas. Esta abordagem promoveu também uma drástica seleção de
atributos mostrando quais os realmente mais relevantes na decisão de resolver o
problema de classificação.
A variável Temperatura parece ser o fator ambiental mais importante devido ao
fato de seus intervalos (suas funções de pertinência) ser responsáveis pela separação de
quatro classes, 1, 3, 4 e 6 respectivamente. A variável Nitrito foi a responsável pela
76
77
separação da classe 4 enquanto que o atributo Ostra separou a classe 7. A variável
Ascídia separa a classe 2 e Bivalvia separará a classe de número 5. É importante notar
que do ponto de vista de monitoramento biológico a variável Bivalvia constitui uma
Classe, categoria taxonômica bastante elevada e apresentou sensibilidade para um
atributo potencial em termos de indicador ecológico. O mesmo pode ser dito para a
família Ascidiaceae que apesar de numericamente inferior pode ser considerada como
um “item-espécie chave”. A seleção da variável nitrito como separador sugere que a
classe 4 podem ser águas de grande atividade de metabolismo microbiano já que é uma
forma nitrogenada intermediária na interconversão da amônia e nitrato operando
fortemente na ciclagem interna de nutrientes do sistema.
A Tabela 4.6 mostra a matriz de confusão deste modelo de classificação
“fuzzy”gerado pelo algoritmo genético.
Tabela 4.6 - Matriz de confusão do modelo “fuzzy”
A acurácia deste modelo de regras é de 85.33% e sua taxa média de erro
estimada em 14.67%. Deve-se considerar que o algoritmo genético faz uma
amostragem aleatória e que nesta amostragem não necessariamente estarão presentes
representantes de todas as classes. Sendo assim, a matriz acima apresenta valor zero no
que se refere aos acertos da classe de número 6 e ao mesmo tempo apresenta uma
unidade caracterizando erro de omissão da classe seis em detrimento da classe três.
Este fato demonstra que se deve ter cautela quando da avaliação da performance de
classificadores mesmo quando se usa uma estratégia de validação cruzada como foi o
caso tanto da avaliação do modelo “crisp” e “fuzzy”. O modelo de regras “fuzzy”
(1) (2) (3) (4) (5) (6) (7) Classificadocomo:
19 0 2 0 0 0 0 (1): 10 2 0 0 0 0 0 (2): 21 2 17 0 0 0 0 (3): 30 0 0 2 0 0 0 (4): 40 0 0 0 4 0 0 (5): 50 0 1 0 0 0 0 (6): 62 0 0 0 0 0 2 (7): 7
(1) (2) (3) (4) (5) (6) (7) Classificadocomo:
19 0 2 0 0 0 0 (1): 10 2 0 0 0 0 0 (2): 21 2 17 0 0 0 0 (3): 30 0 0 2 0 0 0 (4): 40 0 0 0 4 0 0 (5): 50 0 1 0 0 0 0 (6): 62 0 0 0 0 0 2 (7): 7
contempla esta classe através da regra de número 70, porém seu suporte é extremamente
baixo (0.0002).
4.6) Redes Neurais
O processo de aprendizagem do homem se dá no cérebro que é um sistema de
processamento de informações altamente complexo, fazendo cálculos não lineares
distribuídos pelos neurônios. Estima-se em dez bilhões o número de neurônios do
córtex cerebral com aproximadamente sessenta trilhões de conexões sinápticas,
tornando-o uma estrutura altamente eficiente no que se refere à tarefa de percepção de
sinais, controle motor e reconhecimento de padrões. O funcionamento desta estrutura é
ainda mais complexo quando se leva em consideração a propriedade de plasticidade
devido à capacidade de geração de novas conexões ou modificação das já existentes.
Neste sentido, esta seção tem como objetivo testar a tecnologia de redes neurais
artificiais (HAYKIN, 1994), que tem a capacidade intrínseca de aprender padrões à
partir do treinamento de dados de entrada adaptando-se ao ambiente através do
algoritmo de aprendizagem, ser modelos não paramétricos capazes de formar fronteiras
de decisão altamente não lineares no mapa de entrada e saída do espaço de
características e fluxo de informação distribuída na matriz de pesos, o que permite
pequena perda de eficiência no caso de dano em algum de seus componentes. Existem
diversos tipos de redes empregadas na tarefa de classificar padrões dentre as quis pode-
se citar, classificadores probabilísticos (PNN), classificadores de hiperplano (MLP),
classificadores de Kernel (RBF), classificadores de exemplos (KNN), todos com
diferentes estruturas e filosofia. Para cada problema existe um classificador ideal, a
questão é identificar este classificador. Uma boa performance de classificação requer a
seleção de atributos efetivos e escolha da arquitetura correta que faça bom uso dessas
características. Na tarefa de classificação de padrões o objetivo é atribuir padrões de
entrada para uma classe, dentre um número finito M de classes. Padrões de entrada
podem ser vistos como pontos em um espaço multidimensional definido pelas medidas
das características (atributos) de entrada. O objetivo do classificador é a partição deste
espaço multidimensional em regiões de decisão que indiquem a qual classe pertence
78
uma determinada entrada. Devido a este grande número de possibilidades, será usado a
metodologia de algoritmos genéticos para a otimização do processo de geração do
classificador.
Algoritmos genéticos têm sido usados em combinação com redes neurais de
diversas maneiras. Eles podem selecionar atributos como em BRILL (1992) ou evoluir
o vetor de pesos de uma arquitetura fixa de rede segundo YAO (1993). Neste
experimento, as duas abordagens são utilizadas de maneira combinada como
apresentado por PEREIRA & EBECKEN (2005). Foi deixado que o algoritmo
dividisse aleatoriamente a base de dados em três partes: um para conjunto de
treinamento consistindo de 85% dos dados, outro para teste com 10% dos dados e os 5%
restantes deixados para a validação do modelo. Devido ao pequeno número de registros
e a grande dependência deste tipo de modelo por dados de treinamento teve-se a
preocupação de adotar novamente o procedimento de validação cruzada. Os três
melhores resultados desta evolução apresentou redes do tipo MLP (Perceptron Multi
Camadas) cuja arquiteturas e respectivos erros (RMS) em cada fase de desenvolvimento
é apresentado na Tabela 4.7. Pode ainda ser observado que todos os três modelos
apresentaram duas camadas “escondidas” demonstrando que se tratar de padrão muito
complexo. O primeiro modelo mostra uma redução significativa do número de
variáveis de entrada selecionadas, este modelo tem a menor arquitetura demonstrando
grande otimização, porém é também o que apresenta o maior erro. O modelo mostrado
na segunda linha da Tabela 4.7 pode ser eleito como “o melhor” devido ao fato de
apresentar arquitetura bastante otimizada, se comparado com o terceiro modelo, que
consegue os menores erros mas tem de usar todo o espaço de busca, tendo então maior
custo computacional.
Tabela 4.7 – Arquiteturas MLPs e erros de treinamento, teste e validação
T ipo de A rquitetura T reinam ento T este V alidaçãoM L P- 2/4 /7 /1M L P- 5/9 /7 /1M L P- 19/17/7 /1
0.10250.05550.0192
0.11410.00370.0221
0.10660.00700.0553
T ipo de A rquitetura T reinam ento T este V alidaçãoM L P- 2/4 /7 /1M L P- 5/9 /7 /1M L P- 19/17/7 /1
0.10250.05550.0192
0.11410.00370.0221
0.10660.00700.0553
79
Vale notar que todos os modelos apresentam sete nós na segunda camada
computacional. O algoritmo de treinamento utilizado foi o retropropagação de erro
proposto por RUMELHART (1986), em que a transformação do espaço de entrada é
feita sobre os nós formados por uma soma ponderada das entradas que passam através
da não linearidade de uma função sigmoidal ou tangente hiperbólica. Os nós das
camadas “escondidas”, formam hiperplanos que atuam como funções discriminantes das
fronteiras de decisão no processo de separação.
4.7) Performance dos Classificadores
Para avaliar a performance de todos os modelos propostos, adotou-se a estratégia
de validação cruzada em 10 vezes. Muitas pesquisas na construção de classificadores
tem focado o erro mínimo de classificação mas, em aplicações do mundo real,
diferentes tipos de erros podem ter custos diferentes. O custo das predições incorretas
muitas vezes é mais importante do que o número de predições incorretas A estimativa
da acurácia de um classificador é importante para avaliar o quão preciso determinado
classificador é e como se comportará na presença de dados desconhecidos (HAN, 2001).
Este autor cita que outras técnicas para melhorar a acurácia de um classificador, são
conhecidos por “Bagging” (bootsrap aggregation) e o “boosting”. Estas técnicas
combinam uma série de classificadores treinados, C1, C2, ..., CT com o objetivo de criar
um classificador composto melhorado, C*. Supondo que certo diagnóstico ambiental
seja dado por um modelo ou um especialista, alguém ao invés de consultar um único
especialista ou modelo, pode consultar ou perguntar para vários. A idéia é de que se um
certo diagnóstico ocorre mais do que outros, então esse poderá ser o melhor. Este é o
princípio bagging enquanto que se atribuir pesos ou importâncias aos “valores” de cada
diagnóstico, baseado na acurácia dos diagnósticos prévios o diagnóstico final será então,
uma combinação dos diagnósticos ponderados. Esta é a essência de um boosting.
Dado um conjunto S de s amostras, pode-se utilizar “bagging” quando: Para
uma iteração t (t= 1, 2, ..., T), um determinado conjunto de treinamento St é amostrado.
Uma vez que na amostragem alguns registros que rotulam uma classe podem não estar
incluídos em St, outros podem ocorrer várias vezes. Um classificador Ct será treinado
80
para cada conjunto de treinamento St. Para classificar uma amostra não conhecida, X,
cada classificador Ct indica uma classe de predição, e atribui um voto. O classificador
bagged, C*, conta os votos e assim a classe com o maior número de votos é
determinada para X. Bagging pode ser aplicado à predição de valores contínuos
utilizando o valor médio da predição de cada classificador.
Em Boosting, são fixados pesos para cada amostra de treinamento. Um série de
classificadores é treinado. Depois que um classificador Ct é treinado, os pesos são
atualizados para permitir o classificador subseqüente, C t+1, “corrigir” os erros de
classificação feitos por Ct. O classificador boosted, C*, combina os votos de cada
classificador individual, onde o peso de cada voto do é uma função acurácia. O
algoritmo boosting pode ser estendido para a predição de valores contínuos.
A Figura 4.8 apresenta o histograma da performance da acurácia dos diversos
classificadores por classe expresso em porcentagem. Pode-se observar que para todas
as classes a rede neural apresentou o melhor índice de acertos. Já quando se analisa o
comportamento do modelo de regras crisp” nas classes de número 1, 2, 3 e 5 percebe-se
baixa performance em relação ao modelo de regras “fuzzy” e uma equivalência quanto a
classe de número 3. Porém, o modelo de regras “fuzzy” simplesmente ignora a classe 6
enquanto mostra performance semelhante ao modelo de rede neural na classe número 7.
0
20
40
60
80
100
1 2 3 4 5 6 7Classes
% a
curá
cia
crisp fuzzy nn
Figura 4.8 – Acurácia dos classificadores “Crisp”, “Fuzzy” e Neural por classe
81
Este capítulo dedicou esforços para analisar o desempenho dos modelos de
classificação aplicados aos padrões existentes no transiente originado pelas diferentes
massas d’águas. Restaria analisar o conhecimento escondido no modelo de redes
neurais artificiais. Apesar de existirem metodologias consagradas para a extração de
regras de redes neurais, a complexidade do modelo escolhido não recomenda esforços
nesta atividade, pois demandaria extensos estudos para resultar em conhecimento
explícito e interessante.
82
Capítulo V
Predição de Grandezas e Indicadores
Mudanças ambientais são constantes nos ecossistemas de todo o planeta e os
ecossistemas marinhos não são exceção á regra. O importante é distinguir entre
mudanças naturais e importantes mudanças provocadas pelo homem (JACKSON,
2001). Estas mudanças devem ser monitoradas e comparadas com aproximações das
condições originais. A escolha apropriada de indicadores, o projeto do sistema de
monitoramento e o processo de modelagem é crítico para o sucesso (JAKEMAN et al.
1993). A questão é como melhor identificar, monitorar, antecipar, reportar, interpretar e
responder à rede de mudanças no ecossistema, (ZELANY, 2001). Este capítulo tem por
objetivo analisar os problemas referentes à identificação, adoção e aplicação de
indicadores biológicos e ecológicos para o acesso e predição da saúde do ecossistema e
qualidade do ambiente costeiro. De acordo com RAY and McCORMIC (2004), mais da
metade da população mundial reside na faixa de linha costeira. Este desenvolvimento
resultou em acelerada pressão ambiental. Os sintomas nos ecossistemas incluem desde
deterioração da qualidade da água através da entrada de nutrientes, sedimentos e
substâncias tóxicas alterando as condições hidrológicas à perdas de habitat e
biodiversidade, interdição de praias, sobrepesca e declínio global das condições de vida
(HOBBIE, 2000; NRC, 2000; BOESCH et al., 2001). É evidente que a saúde do
ecossistema e a saúde humana estão intrincadamente ligadas (STEGEMAN and
SOLOW 2002). Por exemplo, “blooms” de algas tóxicas podem causar muitas doenças
ao homem, desde desordem neurotóxica aguda à perturbações crônicas no fígado.
Pessoas podem ser contaminadas numa atividade recreativa através do contato com
agentes bacterianos, viroses, protistas ou pela ingestão de frutos do mar contaminados e
até pela simples inalação de toxinas presentes no “spray” marinho.
83
5.1) Estrutura Conceitual
Várias abordagens de estruturas conceituais têm sido propostas para acessar a
saúde do ecossistema e a qualidade ambiental no últimos anos. RAPPORT (1986), por
exemplo, descreve uma estrutura baseada na relação estresse/resposta que foi adotada
pelo “Marine Environmental Quality (MEQ) Working Group of Canadá”. Esta
abordagem está baseada em quatro componentes.
1) Características e usos,
2) Fatores de Estresse,
3) Respostas do Ecossistema (usando indicadores),
4) Saúde ou condição ambiental.
HARDING (1992), apresenta um modelo de Qualidade do Ambiente Marinho (QAM =
MEQ) incluindo fontes estressoras (contaminantes químicos), características de
exposição, medidas de efeitos e indicadores de qualidade. Este foi um avanço
importante ligando fontes estressoras à efeito para ações de gerenciamento através de
análise de risco. Mais recentemente, SMILEY et al. (1998), aplica uma estrutura de
MEQ modificada na área do Estreito da Geórgia (EUA) enquanto CANG & WELLS
(2001), implementam na “Bay of Fund” uma abordagem baseada em
“objetive/guidelines”. As fontes estressoras e efeitos monitorados são da concentração
de bifenil-policlorados (PCBs), mercúrio e toxinas algais. O objetivo é fazer medidas
de variáveis do ecossistema e compará-las com valores de condições originais.
Ao mesmo tempo, verifica-se o uso do termo “Saúde do Ecossistema Marinho”
ou MEH (Marine Ecosystem Health) por VANDERMEULEN (1999), SHERMAN
(2000) dentre vários outros. Este termo deu origem a programas com abordagens
patológicas e epidemiológicas principalmente no “Gulf of Maine”. Por outro lado, Karr
e HOLLING (1992), NIELSEN (1999) e CAMPBELL (2000) usam a expressão
integridade ecológica. Com o uso de tantos termos usados na área, e não
necessariamente referindo-se a mesma coisa, tornou-se evidente a necessidade de
promover “workshops” para definição de conceitos. Atualmente, o termo MEQ se
84
refere à mudanças históricas nas condições ambientais e MEH, refere-se á presente
condição e direção das mudanças enquanto que Integridade Ecológica ou do
ecossistema (IE), é a dimensão da saúde que reflete a capacidade de manter a
organização, incorporando a idéia de resiliência e homeostase. Segundo a Agência de
proteção ambiental dos Estados Unidos (EPA) o desenvolvimento de indicadores para
medir a saúde do ambiente marinho e costeiro envolve as seguintes etapas:
1) definir o escopo do problema,
2) analisar a base de conhecimento,
3) selecionar indicadores,
4) conduzir pesquisa e monitoramento dos indicadores.
5.2) Interesses e Desafios
Devido à intensa demanda por recursos financeiros o acesso às condições
da região costeira, tem largamente adotado o uso de indicadores (WHITTIER et al.,
2002). Entretanto, SIMBERLOFF (1997), apresenta três dificuldades principais na
adoção de indicadores como ferramentas de gerenciamento de recursos:
1) Programas de monitoramento dependem freqüentemente de um pequeno número de
indicadores, conseqüentemente, falham em considerar a complexidade do sistema
ecológico;
2) A escolha de indicadores ecológicos é freqüentemente confundida nos programas de
gerenciamento que tem vagos ou obscuros objetivos de longo prazo;
3) Programas de monitoramento e gerenciamento normalmente não têm rigor científico,
portanto, falham no uso de um protocolo definido para identificar indicadores
ecológicos.
Por tudo isto, existe atualmente grande necessidade para o desenvolvimento de
indicadores capazes de detectar e diagnosticar sinais das condições ambientais sobre
85
escalas espaço-temporais ao nível celular, organismo, habitat, ecossistema e regional,
podendo-se citar como principais desafios:
1) Perturbação x Resposta - a maioria dos atuais indicadores das condições costeiras não
estão “ligados” com as fontes específicas de perturbação. Conseqüentemente, não está
claro que causas refletem mudanças no indicador ou que soluções de gerenciamento
devem ser implementadas. A maioria dos estudos que lidam com aspectos da
comunidade estão relacionados com a diversidade de espécies. Uma variedade de
índices de diversidade tem sido propostos.
2) Múltiplos Impactantes – desde os de origem antrópica como também perturbações
naturais.
3) Espaço e Tempo – fontes perturbadoras operam sobre escalas espaciais (de metros à
paisagens inteiras) e de tempo (segundos à décadas). Os indicadores atuais nem sempre
explicitam como eles relacionam condições com estas fontes perturbadoras nestas
diferentes escalas.
4) Condições de Referência – a interpretação de condições ou mudanças de um
indicador está baseada na comparação com uma condição de referência ou
“benchmark”. Freqüentemente as condições de referência não são definidas, ficando
então o julgamento da mudança do indicador limitada e sujeita a interpretações e
debates.
5.3) Critérios para Seleção de Indicadores
Indicadores ao nível de explotação de recursos ou espécies alvo são centrais em
qualquer programa de gerenciamento. A partir de uma perspectiva ecológica, especial
interesse tem as “espécies chave”. Estas, podem ser definidas como espécies de alta
conectividade de interações, sendo assim, suas abundâncias relativas tem um grande
impacto nos ecossistemas. A questão é quem são elas e quais são as funções
desempenhadas? A seleção de indicadores é crucial para o sucesso global de qualquer
programa de monitoramento. Em geral, indicadores ecológicos precisam capturar a
86
87
complexidade do ecossistema (KELLY & HARWELL, 1990) e ainda permanecer
simples o suficiente para ser fácil e rotineiramente monitorado (CAIRNS et al., 1993).
A fim de definir indicadores ecológicos DALE (2001), sugere um conjunto “ideal” de
critérios como segue:
• Ser de fácil mensuração;
• Ser sensível ao agente perturbador do sistema;
• Responder de maneira previsível às perturbações;
• Antecipador, mudanças no indicador devem ser medidas antes que ocorram
substanciais mudanças na integridade do sistema;
• Predizer mudanças que possam ser evitadas por ações de gerenciamento;
• Ser integrativo: todo o conjunto de indicadores fornece medidas da cobertura
dos principais gradientes do sistema;
• Ter uma resposta conhecida aos distúrbios naturais, perturbações
antropogênicas e mudanças temporais;
• Ter baixa variabilidade de resposta.
A clorofila-a tem sido usada por muitos anos como um indicador da biomassa do
fitoplâncton. A Figura 5.1 (PEREIRA,2002), apresenta a predição de modelos de redes
neurais artificiais do tipo Multi Layer Perceptron (MLP) quanto ao comportamento
desta variável no local estudado.
Entretanto, desde que virtualmente todo fitoplâncton contém este pigmento, este
sozinho não pode ser usado para determinar a composição da comunidade. Avanços
têm sido feitos para integrar conhecimento a partir de uma variedade de níveis tróficos
tão bem quanto escalas espaço temporais.
Indicadores ecológicos aplicados em diferentes contextos, para diferentes
ecossistemas, e para diferentes problemas podem ser classificados em oito níveis, desde
os mais reducionista aos mais holísticos:
0
0.2
0.4
0.6
0.8
1
1.2
10/1
/01
24/1
/01
7/2/
01
21/2
/01
7/3/
01
21/3
/01
4/4/
01
18/4
/01
2/5/
01
16/5
/01
30/5
/01
12/6
/01
26/6
/01
11/7
/01
25/7
/01
8/8/
01
22/8
/01
4/9/
01
26/9
/01
24/1
0/01
14/1
1/01
0
0.2
0.4
0.6
0.8
1
1.2
Clorofila-aMod 4-sMod 5-sMod 6-s
Figura 5.1 – Predição de clorofila-a por três modelos de redes neurais.
Nível 1 – referem-se à presença ou ausência de espécies específicas. A aplicação mais
conhecida deste tipo de indicador é o índice saprobiano, que classifica córregos em
quatro classes de acordo com seus níveis de poluição orgânica. As espécies que foram
aplicadas para acessar as classes de poluição foram divididas em quatro grupos:
Organismos característicos de águas não poluídas, espécies dominantes em águas
poluídas, indicadores de poluição e espécies indiferentes à poluição. Experimentos com
redes neurais têm sido feitos em rios europeus para achar a relação entre qualidade de
água e a presença ou ausência de peixes, já que este grupo é tido como forte indicador
das condições ambientais.
Nível 2 – Este nível de indicadores usa a razão entre classes de organismos. Um
exemplo característico é o índice de algas Nyggard.
Nível 3 – Este nível é baseado em concentrações de compostos químicos. Os exemplos
são o acesso do nível de eutrofização na base da concentração total de fósforo
(assumindo que este elemento é o fator limitante para a eutrofização).
88
Nível 4 – Neste nível se aplica concentrações de níveis tróficos inteiros, por exemplo a
concentração de fitoplâncton (como clorofila-a ou como biomassa por m3) é usado
como indicador para a eutrofização. Uma alta concentração de peixes tem também sido
aplicada como indicador de boa qualidade de água ou pássaros como indicadores para
um saudável ecossistema florestal.
Nível 5 – Este nível usa taxas de processos com indicadores. Por exemplo,
determinações de produção primária são usadas como indicadores de eutrofização ou
um alto crescimento anual de uma determinada árvore em uma floresta é usado como
indicador de saúde do ecossistema ou ambiental. Altas taxas de respiração podem ser
usadas como indicadores da tendência dos ecossistemas aquáticos para a depleção de
oxigênio.
Nível 6 – Usam-se indicadores compostos ou combinados. Por exemplo,
respiração/biomassa, respiração/produção, produção/biomassa ou a razão dos
produtores primários e consumidores. ODUM (1983), usa essas combinações de
indicadores para acessar se um ecossistema está nos estágios primordiais de
desenvolvimento ou no clímax.
Nível 7 – este nível compreende indicadores considerados holísticos tais como
resistência, resiliência, capacidade de tamponamento, biodiversidade, todas as formas
de diversidade, tamanho e conectividade da rede ecológica e “turnover rate” de carbono,
nitrogênio e energia.
Nível 8 – compreendem indicadores de variáveis termodinâmicas, também chamados
indicadores super-holíticos, já que tentam capturar a imagem total do ecossistema sem
inclusão de detalhes. Tais indicadores são a exergia, energia, destruição exergética,
produção de entropia, força, massa, e sistema de tempo de retenção de energia.
Indicadores econômicos de custo benefício (que incluem todos benefícios ecológicos, e
não somente os benefícios econômicos da sociedade) também pertencem a este nível.
Novos potenciais indicadores: um que ligue a produtividade e hidrologia e outro a
comunidade e padrões de paisagem. Esses dois tipos de indicadores serão essenciais
para melhor medir e entender a complexidade, resposta e condição dos sistemas
costeiros.
89
5.4) Indicadores de Comunidade e Nível de Paisagem
Uma tarefa particularmente duvidosa no desenvolvimento de indicadores tem sido a
escala e a resposta da população agregada ao nível local para refletir as condições da
comunidade biológica para táxons específicos ou fornecer acesso a padrões de larga
escala como IBI (KARR, 1981) (índice of biological integrity), perfil de espécies
biológicas (Simon et al., 2001), multi-taxa índices (O’CONNOR et al., 2000), ou
índices de integridade ambiental (PAUL, 2003). Estas abordagens possuem enorme
potencial como indicadores para acessar as condições ambientais e sobre grande
paisagem ou áreas regionais tão bem quanto para detecção de mudanças temporais.
Entretanto, existe a necessidade de consideráveis desenvolvimentos entre estes três tipos
de indicadores tais como:
1) fornecer ligação com específicos e múltiplas fontes de perturbação,
2) exploração de técnicas analíticas para integrar e sintetizar o complexo sinal
biológico,
3) comunicar os resultados dessas respostas multivariadas e,
4) fornecer escalas espaço temporais explicitas no qual os indicadores podem ser
agregados para escalas de ações de gerenciamento (WARDROP et al., 2003).
A estrutura e função de comunidades vegetais e animais têm sido extremamente
medidas para descrever as condições de sistemas terrestres e aquáticos. A força dessas
abordagens mais integradoras é a maior probabilidade de identificar respostas biológicas
sensíveis a uma grande variedade de perturbações que existem em qualquer ambiente e
a possibilidade de amostrar grande variedade de táxons; cada qual com uma única
história de vida capaz de ser “rompida” pelo agente perturbador. Por exemplo, o
fitoplâncton é particularmente sensível aos nutrientes (DIXT et al., 1992). Comunidade
de invertebrados bentônicos são sensíveis à contaminação nos sedimentos (BAILEY et
al., 1995). Comunidades de peixes integram informação do desenvolvimento humano
90
(BRAZNER, 1997) e espécies exóticas (RAHEL, 2000). Áreas alagadas são
diretamente afetadas por modificações hidrológicas tais como diques e construção de
rodovias (HERDENDORF, 1992). Anfíbios são sensíveis a qualidade da água
(KUTKA and BACHAMAN, 1990). Pássaros são afetados por mudanças no habitat e
fragmentação em escala de paisagem (ROBINSON et al., 1995). No entanto, muitos
destes táxons tem disponíveis refinados métodos de amostragem.
O desenvolvimento destes indicadores evoluiu substancialmente nas últimas
décadas. Atualmente, medidas das condições ambientais estão mais sofisticadas e
incluem três dimensões: espaço, tempo e organização biológica (COTTINGHAM,
2003). Porém, apesar de representar impressionante avanço científico e tecnológico,
ainda há limitações para seu uso distribuído e integrado.
5.5) Natureza dos Índices Utilizados
O plâncton é freqüentemente submetido a variações de abundância e
composição. ARHONDITSIS (2003), apresenta inúmeros exemplos de índices para a
análise da estrutura de comunidades submetidas a diferentes níveis de eutrofização em
ecossistemas costeiros. Neste trabalho, os dados relativos as contagens das larvas
merozooplanctônicas servirão de exemplo neste capítulo. Um parâmetro
freqüentemente utilizado no estudo da ecologia do plâncton é a diversidade específica,
cujas variações informam sobre a estrutura e a dinâmica do sistema. VALENTIN et al.
(1991), apresenta um estudo comparativo de diversos índices de diversidade específica
na região de Cabo Frio. O autor demonstra uma análise de sucessão de populações
fitoplanctônicas e constata que o índice de Margalef (usado como referencial de
comparação) e o índice de Shannon são naquele caso muito próximos e correlacionados
(r = 0.959) e que, este último apresenta-se sempre com valores pouco superiores.
Ambas medidas são baseadas na teoria da informação, entretanto o índice de
MARGALEF (1951), se destina a medir a riqueza de espécies em uma definida amostra
e é apresentado como segue:
91
D = (S – 1) / log2 N (5.1)
onde S é o número de espécies e N é o número total de indivíduos. O autor não
estabeleceu um valor de referência.
MARGALEF (1958), estabeleceu uma teoria sobre a evolução de um
ecossistema. Segundo este autor, um ecossistema evolui para uma complexidade maior
à medida que aumenta seu grau de maturidade, o qual será avaliado através do estado de
sua estrutura, ou seja, através da análise quantitativa e qualitativa das populações. No
início do desenvolvimento, o sistema planctônico apresenta uma estrutura simples e sua
composição específica é caracterizada pela presença de um reduzido número de
espécies, com elevadas taxas de multiplicação e predominância acentuada de uma ou
duas espécies apenas, chamadas de “oportunistas”. É o primeiro estágio da sucessão de
Margalef. A medida que o plâncton se desenvolve, outras espécies aparecem juntando-
se às primeiras. A introdução progressiva dessas espécies no sistema equilibra a
repartição dos indivíduos entre as espécies provocando um aumento do índice de
diversidade específica. Até que não exista uma dominância nítida, o índice
permanecerá superior a fase de “plateau” onde o sistema é caracterizado por uma
estrutura estável e equilibrada atingindo seu máximo de maturidade e um elevado grau
de complexidade. De acordo com VALENTIN et al. (1991), este padrão geral de
sucessão de populações planctônicas só pode ser observado na íntegra dentro de uma
mesma massa d’água. Esta exigência não é preenchida pelos métodos clássicos de
observação no mar (coletas periódicas discretas em uma ou várias estações), pois
raramente permitem acompanhar o ciclo evolutivo completo das populações, mas
apenas uma seqüência de estágios unicamente interpretáveis num contexto geográfico
mais amplo. Para PIELOU (1966), a diversidade, com suas duas componentes, o
número de espécies e a regularidade de repartição dos indivíduos entre as espécies, são
aspectos estruturais da comunidade, enquanto que a estabilidade está relacionada com o
funcionamento da comunidade. O trabalho de VALANTIN et al. (1991), demonstra que
os valores da diversidade do fitoplâncton mantém-se acima de 2 bits.cel-1, e que os
valores do índice entre 1 e 2 bits.cel-1 estão relacionados com a dominância dos gêneros
Leptocylindrus e Rhizosolenia em períodos de ressurgência. O autor cita ainda que o
índice médio anual é alto, situando-se entre 3 e 4 bits.cel-1 e que as sucessões das
populações fitoplanctônicas seguem em linhas gerais o modelo proposto por Margalef e
92
que, raramente o índice atingiu valores inferiores a 1 bits.cel-1 (0.85), devido neste caso
a um “bloom” de Concinodiscus, uma diatomácea de grande porte (200 µm). Pelo
demonstrado, o índice de Margalef será utilizado neste trabalho na análise da
diversidade da populações meroplanctônicas (segundo nível trófico) como apresentado
na Figura 5.2 que segue:
0
1
2
3
4
5
6
7
30/1
1/94
19/0
4/95
06/0
9/95
24/0
1/96
13/0
6/9
6
06/
11/9
6
27/0
3/97
13/0
8/97
30/1
2/9
7
20/0
5/98
07/1
0/98
24/0
2/99
14/0
7/99
01/1
2/99
19/0
4/00
06/0
9/00
24/0
1/01
12/0
6/01
07/1
1/0
1
03/
04/0
2
22/0
8/02
09/0
1/03
29/0
5/0
3
14/1
0/03
09/0
3/04
27/0
7/04
Clo
rofi
la-a
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
Índ
ice
de M
arga
lef
Cloro fila-a
Índic e de Margalef
Figura 5.2 – Variação temporal do Índice de Margalef e clorofila-a.
A análise da variação temporal do índice de Margalef apresentado na Figura 5.2 acima
demonstra, quando aplicados às larvas merozooplanctônicas, valores compatíveis com
os apresentados por VALANTIN et al. (1991) para as populações fitoplanctônicas. O
índice varia normalmente entre 1 e 2 bits.cel-1, mas apresenta uma variação média
interanual em torno de 1.5 bits.cel-1, valor muito abaixo dos encontrados para as
populações vegetais. Pode-se também verificar a ocorrência de alguns poucos valores
acima de 2 bits.cel-1. Nestes casos, uma dominância alternada foi encontrada nas larvas
merozooplanctônicas devido a presença do tipo cipris e cirripédia no dia 30/05/96,
família mytilidae como por exemplo o dia 22/10/97 e larvas de decapodas no dia
26/11/97. O menor valor do índice (0.94), foi verificado no dia 1/11/00 com a
predominância de mitilídeos seguido do valor 1.03 em 8/12/03 com a predominância de
larvas do tipo cipris. Vale notar que, nos dias 15/12/99, 20/10/00 e 14/00/02 não foram
encontradas larvas nestas amostras.
93
94
Por outro lado, a partir de um ponto de vista mais holístico, alguns estudos
propuseram índices capazes de no mínimo tentar integrar informação da totalidade do
ambiente. A primeira abordagem se deve a SATMASJADIS (1982) que relaciona o
tamanho de partículas do sedimento e a diversidade de organismos bentônicos fazendo
inferência a níveis de poluição. Seguindo nesta linha, WOLLENWEIDER et al. (1998),
desenvolveu o índice trófico (TRIX) integrando a clorofila-a, saturação de oxigênio,
nitrogênio total e fósforo para caracterizar o estado trófico de águas costeiras. Como
pode ser observado, o índice Trix caracteriza-se por fazer a ligação entre a parte físico-
química do sistema e o primeiro nível trófico (clorofila). Por tratar-se de um índice que
pode ser testado na natureza dos dados atualmente disponíveis, este será, também
utilizado neste trabalho por entender-se que no processo de decisão do gerenciamento
costeiro, não basta apenas saber a diversidade biológica de uma determinada amostra de
água mas, em que condições tróficas esta diversidade se apresenta. Desta maneira, é
apresentada a seguir a formulação do índice Trix:
TRIX = k/n * Σ (M Bi B – LBi B) / (UBi B – LBi B) (5.2)
onde k = 10 (escalando e resultado entre zero e dez), n = 4 é o número de variáveis a
serem integradas, M Bi B é o valor medido da variável i, UBi B é o limite superior da variável i,
e LBi B é o limite inferior de i. Os valores resultantes do índice Trix são dependentes dos
valores máximos e mínimos das variáveis integradas e expressão a condição trófica do
ambiente. Progressivamente, índices mais complexos como por exemplo o Índice de
Integridade Biótica (IBI), “Chesapeake Bay index” (B-BI), ou “Estuarine Biological
Index” (BHI) não podem ser usados no atual momento dos dados deste trabalho. A
Figura 5.3 apresenta a variação temporal dos valores de clorofila e o índice Trix quando
aplicados aos dados da ponto estudado.
Pode-se observar na Figura 5.3, que o índice Trix é correlacionado com
os valores de clorofila-a devido aos “picos” de ambas as variáveis serem coincidentes.
Porém, a base de dados deste trabalho contém diversas variáveis de contagens de larvas,
estas constituem neste caso outro nível trófico que também deve ser integrado.
0
1
2
3
4
5
6
7
30/1
1/94
26/0
4/95
20/0
9/95
13/0
2/96
11/0
7/9
6
12/1
2/96
07/0
5/97
01/1
0/97
26/0
2/98
22/0
7/98
16/
12/9
8
12/0
5/99
06/1
0/99
01/0
3/0
0
26/0
7/00
20/1
2/00
16/0
5/01
17/1
0/01
20/0
3/0
2
15/0
8/02
09/0
1/03
03/0
6/03
28/1
0/03
30/0
3/04
24/
08/0
4
Clo
rofi
la-a
0.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
Índi
ce T
RIX
ClorofilaTrix
Figura 5.3 – Variação temporal de clorofila-a e índice Trix.
A estratégia de abordagem para este fato foi a de manter a mesma formulação do
índice Trix mas ao invés de usar as variáveis fosfato e nitrogênio, foi utilizado a razão
nitrogênio/fósforo e o somatório de todas as variáveis de contagens de larvas. Desta
maneira, foi gerado um outro índice que foi chamado de PLIX constituído pelas
variáveis: oxigênio, razão N/P, clorofila e larvas totais. A Tabela 5.1 mostra as
correlações entre os índices utilizados, suas variáveis constituintes e agrupamentos de
massas d’águas.
Tabela 5.1 – Correlações dos índices.
Variáveis Oxigênio Fósforo Nitrogênio N/P Clorofila Larva Total Prod./Cons. Margalef TRIX PLIX K-means Classe TSOxigênio 1 0 0.03 0.02 0.21 -0.03 -0.01 0.03 0.4 0.11 0.18 -0.03Fósforo 0 1 0.28
0.05
0.580.97
0.3 -0.250.5 -0.11
-0.16 0.06 0.05 0.01 0.03 0.44 0.04 0.08 -0.09Nitrogênio 0.03 0.28 1 -0.06 -0.07 -0.01 0.02 0.55 -0.02 0.15 -0.16
N/P 0.02 -0.16 -0.06 1 0.02 0.01 -0.02 -0.01 -0.1 0.14 -0.09 0Clorofila 0.21 0.06 0.05 0.02 1 -0.05 0.01 0.04 0.15 0.31 -0.22
Larva Total -0.03 0.05 -0.07 0.01 -0.05 1 -0.06 -0.12 -0.06 0.45 -0.07Prod./Cons. -0.01 0.01 -0.01 -0.02 0.01 -0.06 1 0.81 0 -0.06 0.01 0.04
Margalef 0.03 0.03 0.02 -0.01 0.04 -0.12 0.81 1 0.05 -0.01 0.01 0.07TRIX 0.4 0.44 0.55 -0.1 0.58 -0.06 0 0.05 1 0.07PLIX 0.11 0.04 -0.02 0.14 0.15 0.97 -0.06 -0.01 0.07 1
K-means 0.18 0.08 0.15 -0.09 0.31 0.45 0.01 0.01 0.3 0.5 1 -0.12Clase TS -0.03 -0.09 -0.16 0 -0.22 -0.07 0.04 0.07 -0.25 -0.11 -0.12 1
Conforme pode-se observar, a Tabela 5.1 apresenta uma coluna chamada de
balanço “produtores/consumidores (Prod./Cons.). Verifica-se que esta coluna é a única
que apresenta relação (r = 0.81) com o índice de Margalef além do fato de ambas
mostrarem-se fracamente correlacionadas com os outros índices (Trix e Plix) e
agrupamentos de massas d’águas pelos métodos K-means e diagramas T/S. Pode-se
também verificar que o índice Trix apresenta grande correlação (r = 0.58) com a
variável clorofila, correlação positiva de r = 0.30 com o agrupamento k means e relação
95
inversa (r = -0.25) com o agrupamento do diagrama T/S. Quando se observa as
correlações do índice Plix, observa-se que este é muito correlacionado com o somatório
das larvas, e que quando comparado com o agrupamento K-means apresenta maior
correlação que o índice Trix (r = 0.50) e menor correlação negativa se comparado com o
agrupamento das classes de águas do diagrama T/S (r = -0.11). Este fato em si, pode ser
considerado como ganho real na representação do estado ambiental corrente e poder de
previsibilidade.
Duas situações devem ser avaliadas por qualquer gerente ambiental em seu
processo de decisão. Na primeira, pode-se imaginar por exemplo, que no decorrer do
dia, o suposto gerente tenha que fazer uma descarga de um efluente industrial. Neste
momento, o gerente deverá avaliar como estão as condições ambientais e decidir se é ou
não, o melhor momento para a execução de tal operação tentando, mitigar os possíveis
efeitos de impactos ambientais. Esta situação caracteriza-se como um problema de
classificação na qual o gerente deverá utilizar modelos que operam com índices que
possam acessar as condições ambientais. Desta forma, a Tabela 5.2 apresenta os erros
de modelos de redes neurais artificiais desenvolvidas para classificação dos índices
utilizados neste trabalho.
Tabela 5.2 – Comparação do erro (RMS) de redes neurais na classificação de índices.
Índices Treinamento Teste Validação Correlação R2
TRIX 0.6272 0.3457 0.5362 0.6818
PLIX 0.0027 0.0027 0.0030 0.9999
MARGALEF 0.8369 0.1905 0.2651 0.9355
Como pode ser observado, redes neurais são excelentes modelos para a classificação do
estado trófico através do índice Plix (R2 = 0.9999) e ainda apresentam performance
muito boa para a classificação do índice de diversidade biológica específica de Margalef
(R2 = 0.9355). O índice Trix apresentou a menor capacidade para classificação (R2 =
0.6818), este comportamento pode ser devido ao fato que no experimento
96
computacional, os modelos apenas consideram as variáveis biológicas de clorofila e
contagens de larvas como variáveis de entrada, ou seja, o objetivo é classificar o estado
ambiental à partir de dados biológicos.
Noutra abordagem, testou-se a capacidade destes modelos de fazerem predições
de quais seriam as condições futuras de diversidade biológica e sua condição trófica se o
gerente ambiental anteriormente citado tivesse decidido que era o melhor momento para
efetuar a operação de descarga do efluente. Deve-se chamar a atenção que o tratamento
dos índices pelos modelos neste caso são o de séries temporais, diferentemente do
experimento anterior que foram tratados como uma classe ligada a uma amostra
ambiental. A Tabela 5.3 mostra a comparação dos erros (RMS) de treinamento, teste e
validação dos modelos neurais utilizados para predição futura dos índices e grau de
correlação da função real e modelada.
Tabela 5.3 - Comparação do erro (RMS) de redes neurais na predição futura de índices.
Índices Treinamento Teste Validação Correlação R2
TRIX 0.7114 0.3445 0.6001 0.3275
PLIX 1.1711 0.8348 0.8167 0.7407
MARGALEF 0.8889 0.4177 0.7295 0.6239
Pode-se novamente observar que o índice Plix (R2 = 0.7407), tem uma capacidade e
previsibilidade muito maior se comparado com o índice Trix (R2 = 0.3275) enquanto
que o modelo neural apresenta boa capacidade para prever como estará o nível de
diversidade biológica. A Figura 5.4 mostra a variação temporal dos valores médios
mensais da predição do modelo de rede neural artificial e os valores do índice Plix.
Pode-se verificar que apesar de não conseguir “ajustamento perfeito” entre a curva real
e a projetada, o modelo foi capaz de acompanhar as tendências do estado trófico geral.
97
0.00
1.00
2.00
3.00
4.00
5.00
6.00
fev/
95
jul/9
5
dez/
95
mai
/96
out
/96
mar
/97
ago/
97
jan/
98
jun
/98
nov/
98
abr/
99
out/
99
mar
/00
ago
/00
jan/
01
jun/
01
nov/
01
abr/
02
set/
02
fev/
03
jul/0
3
dez/
03
ma
i/04
out/
04
Mod
elo
de
Red
e
0.00
1.00
2.00
3.00
4.00
5.00
6.00
Índi
ce P
LIX
RedePLIX
Figura 5.4 – Predição do modelo neural e índice Plix.
5.6 - Índices e Gerenciamento de Ecossistemas
O gerenciamento da zona costeira é um processo que integra fatores biológicos,
sociais e econômicos em uma estratégia compreensiva com o objetivo de proteger e
aumentar a sustentabilidade, diversidade e produtividade dos recursos naturais. São
descritos a seguir oito elementos que podem ser empregados no gerenciamento de
ecossistemas:
1. Sustentabilidade: não está focado primeiramente em discurso mas, pelo
contrário, considera a sustentabilidade como pré-condição;
2. Metas: estabelece objetivos mensuráveis que especificam processos e resultados
futuros necessários para a sustentabilidade;
3. Usa modelos ecológicos compreensíveis: o gerenciamento de ecossistemas
conta com pesquisas que consideram todos os níveis de organização ecológica;
4. Complexidade e conectividade: o gerenciamento de ecossistemas reconhece a
diversidade biológica e reforça a complexidade estrutural do ecossistema contra
98
99
distúrbios e fornece os recursos genéticos necessários para o ajuste (adaptação)
de mudanças de longa duração;
5. O caráter dinâmico do ecossistema: reconhece que tanto mudanças e evolução
são inerentes na sustentabilidade de ecossistemas tentando evitar o
“congelamento” de um estado particular de configuração;
6. Contexto e Escala: processos do ecossistema operam sobre um longo gradiente
espaço-temporal, e seu comportamento em qualquer localização é grandemente
afetado pelos sistemas adjacentes. Então, não existe uma única escala
apropriada ou organização temporal (“timeframe”) para gerenciar;
7. O homem como componente do ecossistema: valoriza-se o papel ativo do
homem em conseguir objetivos e metas de gerenciamento sustentável;
8. Adaptabilidade e Responsabilidade: admite que o corrente conhecimento e
paradigmas de funções do ecossistema são provisórios, incompletos, e sujeitos a
mudanças. Abordagens de gerenciamento tem de ser vistas como hipóteses a
serem testadas pro pesquisas e programas de gerenciamento.
Desta maneira, e de acordo com a teoria ecológica, o gerenciamento baseado no
conceito de ecossistema é dependente de pesquisa científica que determina as interações
e processos necessários que sustentam a composição, estrutura e função no ambiente. O
entendimento destes fatores fornecerá a base científica necessária para informar as
decisões de gerenciamento. Esta abordagem pode ser vista como um processo
sistemático, baseado no bom julgamento de sensibilidade ecológica e contando com os
seguintes princípios básicos:
• Parcerias (participação da sociedade): trabalhar junto com os cidadãos
comuns, empresários, governantes locais e organizações para achar
soluções em conjunto;
• Usar o melhor conhecimento científico disponível (social, econômico e
ecológico) como fundamento para a tomada de decisão, entende o inter-
100
relacionamento dos recursos naturais, e foca na sustentabilidade do
sistema ecológico como um todo;
• Estabelece objetivos de longa duração das condições desejadas mantendo
a capacidade costeira de sustentar os benefícios públicos e oportunidades
futuras de prosperidade econômica, permanente subsistência e saúde
ecológica.
Capítulo VI
Sistema Inteligente e Gerenciamento Ambiental
Como anteriormente citado, a zona costeira representa o centro da
atividade econômica com mais de 60% da população mundial residindo nesta região.
Apesar da frágil saúde ecológica desta área, novas atividades estão sempre sob
desenvolvimento contínuo. O crescimento demográfico e sócio-econômico estimula
investimentos em infraestrutura, transportes, indústrias, etc. Ainda que pretendendo
melhorar o padrão de qualidade de vida, essas mudanças induzem o aumento da pressão
no ambiente natural. Por causa disto, o gerenciamento da zona costeira é um plano de
ação necessário para se conseguir o objetivo fundamental de preservação. O preciso
entendimento das interações dos mecanismos dos processos físicos e biológicos
representa um significante melhoramento na capacidade de gerenciamento ambiental e
permitirá o desenvolvimento de uma nova geração de ferramentas preditivas cujas
aplicações são muito diversas, por exemplo, dragagens em operações portuárias,
atividade petrolífera, pesqueira, projetos de conservação e restauração ou recreacional e
turismo. Segundo RUNGE et al. (2004), o conhecimento das dinâmicas e interações,
determinando a abundância das populações planctônicas, tornou possível a predição da
variação e mudanças no ecossistema pelágico. Pode-se agora vislumbrar a aplicação
destes modelos, por exemplo, em questões de gerenciamento baseado no conceito de
ecossistemas (PERSHING et al., 2004), ou no papel do oceano costeiro na ciclagem do
carbono. Os dois autores descrevem o desenvolvimento de sistemas acoplados de
modelos físicos e biológicos ligados ao processo de recrutamento em sistemas costeiros.
Este capítulo se destina a apresentar uma visão geral sobre um sistema inteligente a fim
de ser usado como sistema de suporte de decisão para o gerenciamento integrado da
qualidade do ecossistema costeiro. A metodologia é baseada numa abordagem de
análise de sistemas ecológicos e na integridade da estrutura hierárquica da comunidade.
Sistemas inteligentes são sistemas computacionais que avisam ou ajudam
a resolver problemas do mundo real usando modelos que alcançam a mesma conclusão
que o raciocínio de um especialista se faceado com problema semelhante (WEISS and
101
KULIKOWSKI, 1984). Atualmente, segundo HOUHOULIS and MICHENER (2000),
pode-se observar o desenvolvimento desses sistemas como resposta à sua escassez nesta
área e a emergência de forte nicho potencial nas ciências do mar (MOORE et al., 2001).
O Projeto MONCOZE, por exemplo, encontra-se em desenvolvimento na Noruega, o
sistema COAMES, é desenvolvido no âmbito do projeto ICZM (Integrated Coastal
Zone Management) da Comunidade Européia (EC, 1999, 2000), o sistema THETIS por
uma empresa italiana, o F-ECTS (Feed-backs of Estuarine Circulation and Transport of
Sediments on phytobentos), será um sistema para o gerenciamento de zonas estuarinas
desenvolvido por um consórcio entre Portugal, Alemanha, Itália Dinamarca e Inglaterra.
O sistema de modelos voltados para o estudo do impacto e gerenciamento de atividades
de pesca, ECOPATH, pelo Chesapeake Research Consortium nos Estados Unidos, um
grupo de universidades americanas lideradas pelo centro de excelência da universidade
de New Hampshire desenvolvem o sistema GoMOOS – Gulf of Maine Ocean
Observing System como parte integrante do U.S. Integrated Observing System.
6.1 - Arquitetura geral do Sistema
A filosofia do projeto do Sistema Inteligente de Gerenciamento Integrado do
Ecossistema Costeiro (SIGIEC) proposto neste trabalho, é a de seguir a tendência
(MOORE et al., 1996, 2001; HOUSTIS, 1997 dentre outros) de um sistema hierárquico
orientado a objeto constituído basicamente de uma interface de usuário, um banco de
dados, uma base de conhecimento, um módulo que contém funções e modelos, e um motor de inferência e integração cuja configuração pode ser observada na Figura 6.1.
A partir de um ponto de vista mais conservativo, o objetivo do sistema é permitir
que a explotação de vários recursos (espécies) do ecossistema com sua biodiversidade e
integridade estrutural, permita sua manutenção e disponibilidade futura através de
técnicas de manejo mais abrangentes e sustentável.
102
B a se d e C o n h e c im e n to
F u n ç õ e s e M o d e lo s
Serv
idor
Web
I n te r fa c ed o u su á r io
U su á r io sc o m u n s
B a n c o d eD a d o s
M o to r d eIn te g r a ç ã o
G e r e n teA m b ie n ta l
C ie n tis ta s
S e n so re sS e n so re s G e o g rá f ic oG e o g rá f ic o S ó c ioS ó c ioE c o n ô m ic oE c o n ô m ic o
D o c u m e n to sD o c u m e n to s
Figura 6.1 – Principais componentes da arquitetura geral do sistema.
POWRVAKHSHOURI & MANSOR (2003), comparou vários modelos de
suporte de decisão e classifica as obrigações do operador do sistema como sendo a de,
primeiramente, definir a presente condição do ambiente seguido da identificação de
conflitos ou problemas e a sugestão de soluções alternativas. Porém, de acordo com
CAMPBELL (2005), a abordagem de um sistema de observação para monitoramento do
ecossistema propõe cinco questões. Como são as mudanças no ecossistema? Quais os
fatores forçantes destas mudanças? Como o ecossistema responde às forçantes naturais
e humanas? É possível predizer mudanças futuras? Quais as conseqüências para os
vários usuários do ecossistema em questão?
O sistema SIGIEC pode ser visto como uma biblioteca digital de coleções de
informações multimídia, modelos científicos de simulação, técnicas de interpretação de
dados e métodos de visualização. Um esquema simplificado da hierarquia do banco de
dados é apresentada na Figura 6.2 a seguir.
Segundo COLWEL (2004), a nova fronteira e desafio na exploração científica é,
integrar e minerar grandes conjuntos de dados acumulados por diversos pesquisadores,
nomeadamente, ecólogos, biólogos da área de conservação, toxicólogos, cientistas da
área de saúde pública, climatólogos e engenheiros de sistemas, para produzir novos
entendimentos e princípios fundamentais não conhecidos anteriormente por causa das
limitações de sistemas desacoplados.
103
Banco de dadosBanco de dados
SócioSócio--EconômicoEconômicoGeográficoGeográfico QuímicoQuímicoBiológicoBiológico FísicoFísico
MapasMapas
SIGSIG
ImagensImagens
Linha costeiraLinha costeira
TransportesTransportes FloraFlora PoluentesPoluentes
FaunaFauna MetaisMetais HidrodinâmicaHidrodinâmica
GeofísicaGeofísica
RecreativoRecreativo
HistóricoHistórico
PopulacionalPopulacional
PaisagísticoPaisagístico
BiotiposBiotipos
SensibilidadeSensibilidade
NutrientesNutrientes HidrografiaHidrografia
TemperaturaTemperatura
SalinidadeSalinidade
CorrentesCorrentes
ConservaçãoConservaçãoSaúde AmbientalSaúde Ambiental
DBODBO Planos/relatóriosPlanos/relatórios
BacteriológicoBacteriológico
Figura 6.2 – Estrutura simplificada de informações multimídia do banco de dados.
Sendo assim, numa classe de dados geográficos, podem ser armazenados por exemplo,
mapas de diversas áreas, imagens de satélites, perfis da linha costeira e um sistema de
informações geográficas para servir de interface com o usuário que quiser acessar dados
espaciais e georeferenciados. Uma classe de informações sócio-econômicas pode
conter informações sobre a malha de transportes referentes aos mapas existentes,
localização de locais para recreação (praias por exemplo), informações de sítios
arqueológicos, dados populacionais e até informações paisagísticas. Na classe de dados
biológicos pode-se encontrar séries temporais de dados florísticos, faunísticos ou
microbiológicos além de sub-classes de dados de saúde ambiental ou planos de
conservação. Na classe de atributos químicos, encontram-se dados de poluentes, metais
pesados ou nutrientes. Noutra classe, dados físicos podem conter informações
geofísicas, oceanográficas, hidrológicas ou hidrodinâmicas. Uma classe de dados
textuais pode conter também documentos sobre a legislação vigente da região
contemplada e arquivos com critérios de qualidade ambiental.
O módulo de funções e modelos, é destinado ao gerenciamento de dados
na tarefa de receber e identificar dados de diferentes fontes, pré processá-los e distribuí-
los nas diversas áreas temáticas (classes) do banco de dados e específicas sub-categorias
de armazenamento. Ficam também armazenados neste módulo diversos modelos que
acessam bases de dados específicas para solucionar um determinado problema.
104
No módulo da base de conhecimento estão armazenadas conjuntos de
regras de associação e regras de classificação com seus respectivos índices de suporte e
confiança para utilização dos métodos visualização e diagnóstico ambiental.
O módulo de interface do usuário é dividido em duas partes. A primeira,
uma caixa de diálogo, permite que os diferentes usuários acessem a resposta do sistema
através de “queries” escritas. A segunda (“display”), é uma caixa de resposta e
informação diagnóstica (saídas do sistema).
Finalmente, o motor de inferência e integração é o coração do sistema,
assimilando as “queries” do usuário, dados e conhecimento associado para fornecer
significativas respostas.
6.2 – Tipos e Requerimentos dos Usuários
As necessidades dos usuários são introduzidas pelo exame de um cenário
de uso do sistema. Três principais grupos de usuários são considerados nesta
abordagem.
Suponha uma extensiva base de dados de propriedades físicas, químicas e
biológicas de uma determinada região costeira. Esta base de dados inclui propriedades
como batimetria, correntes, ondas, espectro de ventos, salinidade, temperatura, e
concentrações químicas e biológicas. Uma “query” típica da base de dados poderia ser,
“Ache a região do espaço em um dado local e intervalo de tempo, em que a
concentração de uma certa espécie de microorganismo ou química pode exceder a certo
valor”. Cientistas podem estar interessados em questões desta forma a fim de ser
capazes de melhor entender os processos físicos e químicos em uma região costeira.
Autoridades civis locais, podem estar interessadas em permissões para pesca ou
declarações sobre risco à saúde identificando locais impróprios ao turismo, natação etc.
Mais geralmente, a interrogação da base de dados está na forma de uma “query” do tipo
“ache um subconjunto de um dado conjunto contendo pontos com uma propriedade
específica”. Relevantes dados podem envolver medidas tais como imagens de satélites
e medidas “in situ” a partir de bóias ou sondas. Os processos envolvidos podem incluir,
por exemplo, difusão de químicos ou poluentes, convecção de microorganismos etc.
105
106
Conseqüentemente a base de dados pode também ser composta de dados de resultados
de simulação. Um usuário final (público em geral ou um formador de opinião)
necessita localizar o exato dado que satisfaz seus interesses ou, resgatar dados de um
desejado nível de qualidade. Por exemplo, pode-se querer acessar o “ranking” de
classificação das praias de sua cidade. Então, pode-se perguntar por que sua cidade não
apresenta praias seguras. Como resultado, pode ter uma definição do que é considerado
uma praia segura, no apropriado nível de detalhe, e os dados que a definição é
dependente. Por exemplo, segurança pode ser definida como um conjunto de critérios
tais como a altura de ondas ou o nível de concentração de determinada substância ou
microorganismo.
6.3 – Funcionalidade
De acordo com NIKOLAO (1996, 1997), um sistema de informações
distribuídas pode conectar vários usuários via internet. Os principais blocos
componentes do sistema são:
• Acesso a vários tipos de bases de dados baseados em WWW, por
exemplo, documentos HTML (relatórios, publicações, imagens, arquivos
de dados numéricos de sensores, etc.).
• Acessar ferramentas como simuladores, visualização de dados
(STONEBRAKER, 1993), sistemas de informações geográficas (SIG) e
de interpretação de dados. Ferramentas gráficas são necessárias em
aplicações de SIG, e linguagem de modelagem em realidade virtual
(VRML) é incorporada como visualização (CLEMATIS, 1996).
• Banco de dados podem ser largamente usados para guardar informações
da zona costeira e seu acesso pode ser feito através da internet. Podem
ser usados os já existentes “off the shelf” DBMSs tais como Sybase,
Oracle ou Arq/Info.
• Integração de serviços existentes por indexação/buscador com SIG tais
como mapas e imagens de áreas ou regiões selecionados pelo usuário
107
(HOUSTIS, 1996) através de um servidor de biblioteca digital tal como a
documentação NCSTRL’s DIENST 4.0 server
(http://www.ncstrl.org/Dient/htdocs/document_menu.html.).
• Uma interface para fontes de informação tais como dados de sensores e
imagens requisitados pelo usuário via “web-browse” (Netscape
Navigator, Microsoft Explorer, Sum Hotjava).
• Segurança e acesso restrito – mecanismos de controle e restrição de
acesso as bases de dados de acordo com o tipo de usuário.
O usuário submete uma simples ou complexa “query” via “web browser” para o
servidor que acessa o sistema selecionando os diversos serviços disponíveis tais como
dados, indexação e busca para localizar objetos, que se adequam as “queries”
submetidas. Por exemplo, pode-se requerer uma imagem de satélite (WOODRUFF,
1994) e ser capaz de fazer aproximações (“zoom”) de determinadas áreas selecionadas
pelo usuário. A interface inclui uma extensão para suportar a funcionalidade com o SIG
além de ser capaz de indexar documentos HTML distribuídos em vários arquivos de
maneira interativa do banco de dados como por exemplo séries temporais de dados das
componentes físicas químicas e biológicas do ambiente para caracterização das
condições do habitat. Ao mesmo tempo, algoritmos de regras de classificação operam
sobre estes dados para informar a que classe ou estado do considerado ambiente (água)
pertence, de acordo com consulta a documentos e critérios oficiais também
armazenados no banco de dados. Concomitantemente, algoritmos de regras de
associação acessam os dados biológicos e produzem informações sobre as interações
existentes entre os diversos organismos disponibilizando esta informação de forma
visual como a estrutura da comunidade e topologia da rede trófica. Podem ser
apresentados nesta interface os índices de diversidade biológica (Margalef) e condição
do estado trófico (Plix). Esta rede pode ser investigada em maiores detalhes se
disponibilizada em VRML. As abundâncias ou biomassas relativas de cada elemento
(organismo) da rede, pode ser representado através de um código de intensidades de
cores ou intervalos “fuzzy” como limiar de ativação para uso da estrutura como possível
simulador, toda esta janela, na realidade, informa ao usuário as condições do ambiente
como um todo. O acoplamento com modelos relativos aos padrões de circulação local e
o processamento de dados que caracterizem as condições hidrológicas confere a
topologia e estrutura da comunidade o caráter dinâmico. Quando o usuário seleciona
uma região do mapa ou imagem através do “browser”, as coordenadas da região são
usadas para indexar a informação apropriada sobre a região e pode efetuar algumas
operações “on line” com dados de sensores “in situ” transmitidos por telemetria em
“tempo real”.
Diversos modelos tróficos do ecossistema aquático são baseados no acoplamento
de equações diferenciais (MAY, 1972, POLOVINA, 1984; WALTERS, 1996;
SHANNON, 2000), entretanto, todos possuem uma série de parâmetros a ser
estabelecidos e a resolução do sistema de equações foi apresentado por MACKAY
(1981). Porém, estes parâmetros são estabelecidos pelo usuário e a conjugação dos
mesmos não necessariamente corresponde a realidade das relações entre a biomassa de
um grupo e a vulnerabilidade da espécie presa para com a predadora nem suas
respectivas eficiências de transferência. No entanto, uma vez que soluções algébricas
foram disponibilizadas, uma rede de fluxo pode ser construída a partir da biomasa dos
organismos (CHRISTENSEN and PAULY, 1993).
A Figura 6.3 a, b e c apresentam os arranjos estruturais da comunidade
merozooplanctônica encontrada pela aplicação do algoritmo “A priori” de regras de
associação nos dados disponíveis para execução deste trabalho.
Classe = XX = Água CosteiraClasse = XX = Água CosteiraTemp Temp 4 e 5 / Sal 2 / 4 e 5 / Sal 2 / Ox Ox 33
Classe = XX = Água TropicalClasse = XX = Água TropicalTemp Temp 3 / Sal 3 / 3 / Sal 3 / Ox Ox 33
CLO 1CLO 1
MIT 4MIT 4
CIP1CIP1
DEC 5DEC 5
POL 4POL 4
CIR 4CIR 4
ASC4ASC4
OST 5OST 5
NTI 1 / NTO 2 / PO 1NTI 1 / NTO 2 / PO 1 NTI 1 / NTO 1 / PO 2NTI 1 / NTO 1 / PO 2
CLO 2CLO 2
MIT 2MIT 2
LD 2LD 2
CIR 3CIR 3
POL 2POL 2
BRY 1BRY 1
DEC 3DEC 3
OST 2OST 2
aa bb
Classe = XX =ACAS Classe = XX =ACAS Temp Temp 1 / Sal 3 / 1 / Sal 3 / Ox Ox 4 e 54 e 5
CLO 1CLO 1
CIR 2CIR 2
MIT 1MIT 1
CIP 2CIP 2
ASC 1ASC 1
POL 3 POL 3 \\
OST 1OST 1
NTI 2 / NTO 4 / PO 2NTI 2 / NTO 4 / PO 2cc
Classe = XX = Água CosteiraClasse = XX = Água CosteiraTemp Temp 4 e 5 / Sal 2 / 4 e 5 / Sal 2 / Ox Ox 33
Classe = XX = Água TropicalClasse = XX = Água TropicalTemp Temp 3 / Sal 3 / 3 / Sal 3 / Ox Ox 33
CLO 1CLO 1
MIT 4MIT 4
CIP1CIP1
DEC 5DEC 5
POL 4POL 4
CIR 4CIR 4
ASC4ASC4
OST 5OST 5
NTI 1 / NTO 2 / PO 1NTI 1 / NTO 2 / PO 1 NTI 1 / NTO 1 / PO 2NTI 1 / NTO 1 / PO 2
CLO 2CLO 2
MIT 2MIT 2
LD 2LD 2
CIR 3CIR 3
POL 2POL 2
BRY 1BRY 1
DEC 3DEC 3
OST 2OST 2
aa bb
Classe = XX =ACAS Classe = XX =ACAS Temp Temp 1 / Sal 3 / 1 / Sal 3 / Ox Ox 4 e 54 e 5
CLO 1CLO 1
CIR 2CIR 2
MIT 1MIT 1
CIP 2CIP 2
ASC 1ASC 1
POL 3 POL 3 \\
OST 1OST 1
NTI 2 / NTO 4 / PO 2NTI 2 / NTO 4 / PO 2cc
Figura 6.3 – Estrutura populacional em três diferentes condições ambientais: a, água
costeira; b, água tropical da corrente do Brasil; c, água de ressurgência.
108
Estas estruturas populacionais podem ser consideradas como modelos de redes
neurais artificiais onde algoritmos genéticos podem ser usados para otimizar a matriz
dos pesos sinápticos. Os valores dos pesos otimizados representam a força das
interações ecológicas entre as espécies envolvidas; interações representadas por linhas
tracejadas indicam a não presença de uma das referidas populações. A adoção desta
metodologia e técnica de visualização permite o usuário estudar aspectos sobre a
importância e contribuição efetiva de determinado organismo ou grupo de organismos
para a comunidade como um todo. A análise da matriz de pesos otimizados pode
permitir também a estimativa mais precisa da eficiência trófica entre as camadas da
rede. Baixos valores de eficiência trófica podem indicar que um ecossistema está
vulnerável a invasões por espécies exóticas ou que alguma forma de predação,
mortalidade ou doença não foi considerada. A possibilidade de usar estas
representações gráficas implementadas como modelos de simulação permite também
inferir conhecimentos sobre a relação entre complexidade e estabilidade estrutural do
comportamento dos ecossistemas e evita o grande problema de super parametrização
comuns aos modelos convencionais. A análise da saída do modelo permitirá determinar
se o arranjo arquitetônico apresentará comportamento caótico, “saddle points”, situação
em que um distúrbio causa um estado estacionário mais simplificado da comunidade
menos diversa, ou sustentabilidade estrutural capaz de reação ao longo do tempo.
A rede alimentar representa o fluxo de energia biológica entre as diversas
populações no ecossistema. Nas últimas décadas, o conceito de rede com bifurcações,
“loops”, e fluxos multidirecionais de materiais tem recolocado o simples paradigma de
uma cadeia alimentar linear. Na base da rede, o fitoplâncton transforma a energia solar
em biomassa. O fitoplâncton serve de pasto para o zooplâncton herbívoro além de
exudar moléculas orgânicas que são consumidas pelas bactérias. As bactérias são
absorvidas pelo microzooplâncton. O microzooplâncton e o zooplâncton herbívoro são
predados pelo zooplâncton maior e assim sucessivamente. Forças físicas modulam a
eficiência de transferência energética de um componente para outro (ROTSHILD,
1988). Estudos de campo e laboratório tem evidenciado estas rotas e adicionando
valiosa informação com respeito a especificação de taxas destas transformações em
muitos ecossistemas marinhos (HARRIS, 1995).
Nos últimos quinze anos, ecologistas de ecossistemas tem desenvolvido
uma abordagem e um conjunto de métodos computacionais denominados “análise de
109
redes ecológicas” (ULANOWICZ, 1986; KAY et al., 1996). MONACO and
ULANOWICZ (1997) empregaram esta abordagem para a comparação de estrutura
trófica e a produtividade total do sistema de três estuários nos Estados Unidos
(Narragansett Bay, Delaware Bay e Chesapeake Bay). Na pesquisa de redes
alimentares, YODZIS and WINEMILLER (1999), propuseram recentemente uma nova
definição e operacionalização do conceito de “espécie trófica” que é um conjunto de
espécies na rede que tem fontes alimentares similares e também predadores similares.
Sua definição pode ser considerada idêntica a noção de “equivalência estrutural “ na
análise de redes sociais concebida por BURT and TALMUD (1993). A estrutura de
grafo da Figura 6.4 a seguir ilustra este conceito.
Figura 6.4 – Estrutura de grafo representativa do conceito de “equivalência estrutural”.
22
11 33
4455
77
8866
{2,3}{2,3}11
5577
8866
44
aa
bb
Nas estruturas da Figura 6.4, as setas estão sempre direcionadas dos nós que
representam as espécies predadoras para as espécies presas. Na Figura 6.4 a, observa-se
que tanto a espécie do nó de número dois e três apresentam o mesmo predador, nó um, e
concorrem pelo mesma presa no caso do nó de número seis. Desta maneira podem ser
agrupadas em um mesmo elemento da rede, pois desempenham o mesmo papel
funcional. Por outro lado, os nós cinco e seis também sofrem a predação das mesmas
espécies, nós dois e quatro, porém não disputam as mesmas presas ou recursos, nós sete
110
e oito respectivamente. Neste caso não desempenham o mesmo papel e não podem ser
agrupadas, Figura 6.4 b.
Nos modelos de HIRATA and ULANOWICZ (1985) e ULANOWICZ
(1986), a informação em uma rede é definida como a quantidade de incertezas
solucionadas pelo conhecimento da estrutura da rede. Os autores usam um algoritmo de
distância heurística muito parecido com um algoritmo de “clustering” hierárquico para
aglomerar espécies em um número arbitrário de classes desejadas. Noutra abordagem,
coloração regular, BATAGALJ (1992), apresenta uma abordagem alternativa usando
procedimentos de otimização combinatorial para classificar nós diretamente em grupos
e utiliza uma medida de penalidade para minimizar o erro. Deve-se ressaltar que essas
agregações ou agrupamentos de espécies troficamente análogas, também chamadas de
espécies isotróficas, são úteis pois reduzem a complexidade, mas devem ser
consideradas com cautela para apresentarem significado e critérios biológicos para
evitar que ocorram-se em erros por efeitos puramente numéricos.
111
Capítulo VII
Análise dos Resultados e Diagnóstico Ambiental
Será apresentado neste capítulo, uma análise das diversas abordagens do
processo de assistência e estruturação da base de dados e dos resultados dos modelos de
regras de associação e de classificação além dos modelos de redes neurais utilizados
para a predição das condições ambientais do caso estudado e uma abordagem para um
diagnóstico ambiental baseado na estrutura de redes biológicas.
7.1 – Análise dos Resultados
A matriz de correlações das variáveis (Tabela 3.3), apresenta valores
negativos entre os nutrientes fosfato, amônia, nitrito e nitrato com a variável
temperatura. Isto sugere que a origem destes nutrientes deve-se ao processo de
ressurgência. Este fato é reforçado pela ocorrência de correlação também negativa entre
a variável clorofila e a temperatura, sendo o nitrato o nutriente preferencial devido a
apresentar correlação negativa com a clorofila. Ao mesmo tempo, pode ser observado
que a variável amônia tem uma correlação negativa com a variável nitrito que por sua
vez tem a maior correlação (positiva) com a variável nitrato. Portanto, este conjunto de
fatos sugerem que o processo de ressurgência desempenha importante papel no
metabolismo ambiental da região pois, retorna uma importante quantidade de minerais
reciclados pelo sistema microbiano. Devido a região não possuir influência de rios,
possivelmente a matéria orgânica disponível para a remineralização seja oriunda da
própria “chuva biológica”, que em sendo degradada, torna-se parte de um processo de
“feedback positivo” para a manutenção do sistema. Por outro lado, não são observadas
correlações entre as diversas variáveis larvais com a clorofila. Este fato (ausência de
correlação), foi também descrito a nível global por IRIGOIEN et al., (2004). No caso
em estudo, uma possível explicação é que o ponto de coleta, é muito próximo da linha
de praia. Seria esperado que a população algal fosse dominada por espécies de grandes
112
diatomáceas ou discutível organismos formadores de filamentos coloniais. Desta forma,
a capacidade das larvas absorverem partículas algais estaria limitada pelo tamanho,
levando-as a usar outras fontes de energia alimentar.
Observa-se que a Tabela 3.2, apresenta para a variável pH um valor máximo de
10.19, e pode ser considerado um erro que foi corrigido pelo estudo de análise de
“comunidade” (Tabela 3.4), que identificou a contribuição individual de cada variável
estudada, permitindo assim uma redução da dimensionalidade da base de dados.
Noutra abordagem, a análise de componentes principais demonstrou o
ordenamento dos componentes fatoriais (autovetores). Este procedimento mostra na
Tabela 3.5 que o principal fator (1) é composto por duas variáveis larvais (Mytillidae e
Ostreidae) e o segundo fator apresenta a variável nitrito como sendo a variável química
mais relevante, confirmando o apresentado na matriz de correlações da Tabela 3.3. O
posicionamento das variáveis apresentadas nas projeções dos planos fatoriais 1 e 2 e, 2 e
3 nas Figuras 3.21 e 3.22 respectivamente foram confirmadas pela análise de
agrupamentos através do método Ward, como pode ser visto na Figura 3.23. A
utilização da técnica de agrupamento K-means demonstrou através da inspeção da
Figura 3.24 ao nível dois de dissimilaridade aleatória, a ocorrência de sete “clusters,”
que foi confirmada pelo critério de Kaiser apresentado na Figura 3.25 e Tabela 3.5. A
aplicação das diversas técnicas demonstrou que a base de dados tem uma estrutura de
sete grupos tanto quando acessada pelas variáveis descritoras do sistema (colunas)
quanto pelo número de casos observados (linhas) e que representam 66.27% da
variância total dos dados, valor bastante significativo levando-se em consideração a
natureza ecológica do problema.
Uma vez que se conheceu a estrutura dos dados, o passo seguinte foi extrair
conhecimento mais refinado e escondido. Como uma base de regras é a maneira mais
comum de se representar conhecimento, a estratégia adotada foi a aplicação do
algoritmo Apriori para gerar regras de associação de padrões regulares normalmente
não explicitados. Porém, como a maioria dos algoritmos de minerar associações não
operam em espaço contínuo, as variáveis da base de dados foram discretizadas em
intervalos segundo o conhecimento de especialistas, apresentados na Tabela 4.1. Para
evitar o problema de explosão combinatorial e redundância de regras, foi efetuado uma
análise de interessabilidade (LIU et al., 2000) que permitiu acessar o espaço discreto
113
dos dados em diversos níveis através da manipulação dos parâmetros de suporte e
confiança. As regras resultantes deste procedimento (regras 2 à 48) são apresentadas no
capítulo 4 e demonstraram uma partição das populações merozooplanctônicas em
relação das diferentes condições do ambiente. Na realidade, o procedimento de regras
de associação além de tudo, serve como estratégia ou método de visualização ou
inicialização da estrutura trófica demonstrando não apenas uma possível topologia da
complexa rede de interações, mas também as quantidades relativas de cada elemento.
Um exemplo é demonstrado na Figura 6.3 a, b e c, onde pode ser observado que na água
costeira, são encontradas altas densidades de alguns grupos de larvas, no entanto,
noutras classes de água as quantidades relativas dos mesmos grupos apresentam-se
diferentes. Desta maneira, estes organismos podem ser usados como indicadores
biológicos para a classificação das diversas massas d’águas. Para efetuar tal
classificação, foi aplicado a abordagem de regras de associação de classes (CARs), uma
modificação do algoritmo Apriori desenvolvida por LIU (1998). Estas regras de
classificação (regras 49 à 66) são apresentadas também no capítulo 4 e a performance
deste tipo de modelo de classificação é apresentado na matriz de confusão da Tabela
4.4. Pode-se observar que este modelo de regras contemplou todas as classes do
problema e obteve uma acurácia de 87.63%.
Noutra abordagem de desenvolver classificadores, tentou-se como alternativa a
metodologia de geração de regras “fuzzy” (regras 67 à 77). Este técnica demonstrou
grande poder de seleção de atributos porém, apesar de conseguir uma acurácia de
85.33% como demonstrado na matriz de confusão da Tabela 4.6, este modelo não
contemplou a classe de número seis, provavelmente, devido ao fato do algoritmo
genético não ter amostrado aleatoriamente elementos raros da base de dados. Outro
agravante observado foi que as regras 67 e 68 apresentam ambas o atributo temperatura
média baixa como separador das classes 1 e 3. Por outro lado, a metodologia de
algoritmos genéticos foi utilizada para evoluir e otimizar arquiteturas de modelos de
redes neurais artificiais. O resultados deste experimento são apresentado na Tabela 4.7,
enquanto que uma comparação da performance dos três tipos de modelos de
classificação pode ser contemplada na Tabela 4.8. Fica claro que o modelo de redes
neurais é o mais preciso.
Deve-se ressaltar no entanto, que na atividade de gerenciamento, não basta
apenas determinar qual a classe de um dado estado ambiental. Normalmente, a
114
caracterização é feita com a utilização de índices, e uma tarefa muito importante é a de
fazer predições das condições futuras. Neste intuito, os modelos de redes neurais não só
foram utilizados para classificar o estado ambiental, mas também para fazer predições
dos mesmos.
O índice de diversidade biológica de Margalef (equação 5.1) foi utilizado para
determinar o grau de complexidade de um determinado nível trófico e caracterizar a
estrutura da comunidade. Como a base de dados é composta de larvas que normalmente
são herbívoras, a Figura 5.2 mostra a variação temporal deste índice plotado contra a
variação da clorofila. O valor médio deste índice (1.5 bits.cel-1) aplicado para as larvas
merozooplanctônicas confirma a teoria que a diversidade biológica diminui quanto mais
elevado o nível trófico, quando comparado com o mesmo índice aplicado para as
populações fitoplanctônicas (2 bits.cel-1), encontrado por VALENTIN (1991). Para
fazer a ligação entre a “produtividade” e as condições hidrológicas foi calculado o
índice Trix (equação 5.2) introduzido por WOLLENWEIDER et al. (1998), cuja
variação temporal é mostrada na Figura 5.3 juntamente com a clorofila. Observa-se que
os picos das duas variáveis são coincidentes e portanto sugerindo boa correlação.
Porém, pela necessidade de integrar todas as variáveis da base de dados, ligando
“produtividade, hidrologia e as diversas populações, o índice Trix foi modificado em
sua composição de variáveis formadoras, dando origem a um novo índice em potencial,
que passou a ser chamado de Plix. A Tabela 5.1, apresenta uma matriz de correlações
entre os índices utililazados, variáveis componentes e estratégias de agrupamento de
classes de água. Observa-se que realmente o índice Trix possui elevada correlação com
a clorofila (r = 0.58), confirmando o apresentado na Figura 5.3, enquanto que o índice
de Margalef é mais correlacionado com a razão produção/consumo (r = 0.81) mas, o
índice Plix apresentou altíssimo grau de correlação (r = 0.97) com a totalidade das
populações de larvas. Desta maneira, se o objetivo é classificar o ambiente aquático
através de critérios mais holísticos e biológicos levando-se em consideração uma
abordagem multidimensional (k-means) e não apoiada apenas em diagramas de
temperatura e salinidade, a Tabela 5.1 demonstra que o índice Plix apresenta mais
segurança e confiabilidade pois não só diminuiu o grau de correlação negativa com as
Classes TS, mas aumentou sensivelmente sua linearidade com as classes geradas pelo
algoritmo k-means em relação com o índice Trix. Este fato é sem dúvida, uma real e
significativa contribuição deste trabalho e confere maior capacidade de melhorar a
115
performance de modelos neurais no que tange a problemas de classificação como
demonstra a Tabela 5.2 ou problemas de predição das tendências das condições tróficas
futuras, como na Tabela 5.3 e Figura 5.4.
Pode-se então disponibilizar os valores de tais índices juntamente com a
visualização da estrutura da rede de interações populacionais mostrada na Figura 6.3
como informação adicional da interface do usuário do sistema proposto no capítulo 6.
Esta estrutura de rede torna-se a partir deste ponto um simulador para diagnóstico das
condições de saúde ambiental voltado para o conceito de integridade biológica que na
realidade é a própria expressão da estrutura hierárquica da comunidade.
Como pode ser observado na Figura 6.3, trata-se de uma estrutura onde os dados
disponíveis para este trabalho contemplam apenas uma única fonte de recurso (clorofila
= presas) para diversas populações de consumidores (larvas). Este tipo de estrutura foi
anteriormente implementada e testada computacionalmente por FUSSMAN &
HERBER (2002) que não encontraram pontos de equilíbrio para permitir a
sustentabilidade e coexistência de tal situação devido a extinção da fonte de recurso e
exclusão competitiva de consumidores. Por este motivo, neste trabalho não serão
investidos esforços para a execução de tal tarefa. Porém, passa-se a fazer considerações
sobre propriedades de redes alimentares e efeitos sobre seu comportamento para um
diagnóstico ambiental.
7.2 – Diagnóstico Ambiental
A teoria ecológica diz que o aumento da riqueza de espécies e/ou o
aumento das interações interespecíficas desestabiliza as populações, sugerindo que uma
rede alimentar complexa é mais frágil, PIMM (1991). Analiticamente, MAY (1972,
1973), analisou a estabilidade local de matrizes de comunidades randomicamente
agrupadas e demonstrou matematicamente que a estabilidade da rede decresce com a
complexidade. Essas predições contradizem a intuição que redes alimentares
complexas, que na realidade persistem na natureza, devem ser estáveis. O mecanismo
de manutenção de uma rede alimentar complexa na natureza tem sido o foco central em
116
117
ecologia de comunidades. Esta área de investigação tem-se preocupado em responder
questões relevantes tais como:
• O ecossistema marinho apresenta múltiplos estados de estabilidade ?
• A remoção de predadores do topo da rede resulta em mudanças fundamentais no
plâncton (top down control “trophic cascades”) ?
• Os ecossistemas marinhos são caracterizados por controle “bottom up” de
maneira que a retirada de um predador não promove distúrbios no
funcionamento e estrutura da comunidade ?
• A pesada exploração de espécies forrageiras, por exemplo anchovas e sardinhas,
nichos intermediários na cadeia alimentar, causam mudanças no funcionamento
do ecossistema de ressurgência ?
• Qual o grau de controle exercido pelas espécies dominantes (wasp-waist control)
A chave para responder estas questões está no entendimento dos diferentes
mecanismos responsáveis pelas propriedades e padrões emergentes das redes
alimentares. A alteração e distúrbio de um ou vários componentes do ecossistema pode
ter um forte efeito em níveis tróficos mais ou menos elevados dependendo se as redes
alimentares são controladas pela disponibilidade de recursos ou pelas espécies
consumidoras e predadoras. Recentemente, a maioria dos debates sobre a relação entre
diversidade e estabilidade (NAEEM et al. 1994, HECTOR et al. 1999, TILMAN et al.
2001), esteve focado na riqueza de espécies de plantas e produtividade primária.
Entender a estrutura e a dinâmica de redes ecológicas é crucial para entender a
persistência e estabilidade dos ecossistemas. Determinar a interação entre estrutura de
rede, sua dinâmica, e vários aspectos da estabilidade tais como persistência, robustez, e
resiliência de redes do mundo real é um dos maiores desafios de uma área
interdisciplinar das ciências naturais em expansão (STROGATZ, 2001).
7.2.1 - O Efeito da Presença de Consumidores na Diversidade de Presas
O efeito da presença de consumidores na coexistência de espécies
competidoras se dá por meio de dois mecanismos opostos que mediam o efeito do
consumo (PAINE, 1966; GUREVITCH et al., 2000; CHASE et al., 2002).
Primeiramente, os consumidores reduzem a biomassa das presas pelo aumento da taxa
de mortalidade e, potencialmente governam a nível local a extinção das espécies de
presas, reduzindo então a diversidade das mesmas. No segundo mecanismo,
consumidores também previnem a exclusão competitiva de espécies de presas mantendo
desta forma a diversidade local. Essas forças contrastantes resultam em “grandes”
efeitos divergentes (positivos e negativos) dos consumidores na diversidade das presas
(CHASE et al., 2002). Efeitos positivos da presença do consumidor foram achados na
interação planta-herbívoro em habitat pelágico (PROULX et al., 1996) e no habitat
bentônico de lagos (HILLEBRAND et al., 2003). É então da maior importância
descobrir as circunstâncias sob as quais ocorre a coexistência mediada por
consumidores (CHASE et al., 2002). Esses fatores dizem respeito a própria interação
presa-predador (fatores intrínsecos), ou a características abióticas ou bióticas do habitat
(fatores extrínsecos).
Fatores Intrínsecos:
É esperado que os consumidores promovam a diversidade de presas quando seus
impactos é maior no competidor dominante. A seleção ativa de consumidores pode
estar focada para a mais abundante presa e agir como um fator de estabilização
mantendo a diversidade de presas (CHESSON, 2000). A mesma conseqüência,
manutenção da diversidade de presas, também prevalece quando os consumidores são
especialistas e os consumidores de presas abundantes são mais comuns, considerando
que, espécies raras de presas sofrem baixa perda per capta para os consumidores
(PACALA and CRAWLEY, 1992). Consumidores podem também prevenir a exclusão
de presas alimentando-se principalmente sobre a espécie competidora dominante e
limitando seu crescimento (CHASE et al., 2002), um efeito conhecido como “Keystone
predation” (PAINE, 1966; LUBCHENCO, 1978; LEIBOLD, 1996). “Keystone
predation” não requer a seleção ativa dos consumidores, mas pode ocorrer quando a
118
dominância correlaciona-se à alta susceptibilidade para o consumo por causa da forma
de crescimento ou composição química (HILLEBRAND et al., 2000; CHASE et al.,
2002).
A probabilidade de coexistência mediada por consumidores é, além
disso, afetada por fatores intrínsecos tais como a razão de tamanho consumidor/presa,
que determina o efeito do consumidor na estrutura espacial do conjunto de presas
(STEINMAN, 1996; HILLEBRAND, 2003). Além disso, a presença de consumidores
pode enfraquecer as interações competitivas entre as espécies de presas pelo efeito
indireto na manutenção de recursos (ABRAMS, 2001), a regeneração de nutrientes
(ATTAYDE and VANKOOTEN, 2001; WERNER and PEACOR, 2003). Esses efeitos
indiretos promovem a diversidade de presas se eles reduzem o impacto da
competitividade da espécie da presa dominante. A diversidade de presas também
aumenta com a presença de consumidores se o efeito de consumidores é distribuído
heterogeneamente no espaço e no tempo (PACALA and CRAWLEY, 1992). Presas
podem persistir pela repetida dispersão em uma meta comunidade.
Fatores Extrínsecos:
A densidade de consumidores e a produtividade de presas são dois fatores
bióticos que mediam o efeito do consumidor na densidade de presas. A densidade de
consumidores e suas taxas de alimentação regulam o quão fortemente os consumidores
afetam a mortalidade de presas. Em analogia à hipótese de distúrbio intermediários
(CONNELL, 1978; FLODER and SOMMER, 1999), a mais alta densidade de presas foi
observada em densidades intermediárias de consumidores (SOMMER, 1999) e também
observada neste trabalho (Figura 5.2). Consumidores raros e ineficientes não previnem
exclusão competitiva de suas presas, ao passo que consumidores abundantes e eficientes
podem aumentar a mortalidade a níveis que inibem a existência local de presas.
Segundo, a produtividade afeta a taxa de exclusão competitiva, que determina se os
consumidores promovem a coexistência de presas (HUSTON, 1994). Os efeitos
positivos dos consumidores na diversidade de presas são mais plausíveis quando a
exclusão competitiva é rápida (em alta produtividade). A produtividade aumenta a taxa
de crescimento das espécies competidoras e intensifica a dominância competitiva.
Consumidores e distúrbios desempenham papéis similares na manutenção da
diversidade em que a resposta depende de se seus efeitos caem na espécie dominante ou
119
nas espécies subordinadas, e a taxa na qual se processa a ocorrência do limite da
diversidade (exclusão competitiva). Os papéis da produtividade e dos distúrbios tem
sido incorporados nos modelos de não-equilíbrio (HUSTON, 1994) e equilíbrio
(KONDOH, 2001).
Estes modelos oferecem predições da dinâmica presa-predador. Essa predições
foram testadas em revisões quantitativas em estudos de sistemas terrestres, marinhos e
dulcícolas. A predominância de efeitos positivos de consumidores na diversidade de
presas foi encontrada em ambientes de alta produtividade que sofre com altas taxas de
exclusão, no entanto, efeitos negativos ocorreram em sistemas de baixa produtividade
onde os consumidores reduzem a diversidade de presas aumentando sua mortalidade
numa situação que poucas espécies de presas podem existir. Corroborando com as
predições de modelos, nos experimentos de WORM et al (2002), os consumidores
promoveram a diversidade de presas em alta disponibilidade de nutrientes e diminuiu no
caso contrário. O termo de interação entre consumo e disponibilidade de nutrientes foi
maior (mais forte) do que o principal efeito de cada um dos fatores, sugerindo que o
“feedback” entre consumidores e recursos é da maior importância para a regulação da
diversidade de presas.
7.2.2 - O Efeito da Densidade de Presas na Diversidade de Consumidores
Outra questão na discussão das relações entre produtividade e
diversidade é a de como a densidade de recursos afeta a diversidade de consumidores.
O aumento da produtividade resulta em maiores tamanhos de populações e menor risco
de extinção (ROSENZWEIG and ABRAMSKY, 1993; ABRAMS, 1995).
Adicionalmente, a diversidade aumenta com a produtividade se a maior produtividade
promover densidades mais altas de espécies de presas raras, permitindo a existência de
consumidores mais especializados, ou se a produtividade resultar em maior dependência
intraespecífica da densidade (ABRAMS, 1995). ROSENZWEIG and ABRAMSKY
(1993), revisaram nove hipóteses para o decréscimo da diversidade em ambiente de alta
produtividade e propuseram que a exclusão de espécies de consumidores aumentou por
causa da reduzida heterogeneidade espacial e temporal no suprimento de presas em
120
maiores densidades. Mais recentemente, WILSON et al. (2003), mostraram que o
enriquecimento (de culturas) pode diminuir a regularidade e a riqueza de espécies se a
variância interespecífica na capacidade de suporte média aumentar com a produtividade.
Neste caso, poucas espécies dominam a comunidade em alta produtividade e a relação
entre diversidade e produtividade depende de como os efeitos dos fatores abióticos
(nutrientes) estão distribuídos entre as espécies. CHASE and LEIBOLD (2002),
acharam que diferentes relações operam em diferentes escalas em tanques, com uma
relação unimodal entre a produtividade e a riqueza local do sistema, e uma relação
monotônica positiva com a riqueza regional. Esse padrão indica que o efeito da
produtividade na coexistência das espécies é dependente da escala; aumentando o
suprimento de nutrientes enriquece a diversidade local em sistemas oligotróficos e
decresce sob condições eutróficas, enquanto a maior produtividade sempre promove a
diversidade regional.
A teoria prediz que a alta diversidade de presas corresponde a maior
variância em comestibilidade desse modo, maior probabilidade de incluir espécies não
comestíveis (DUFFY, 2002). Alternativamente, os consumidores podem obter
benefícios nutricionais a partir de uma comunidade mais diversa (hipótese da dieta
balanceada, DeMOTT, 1998) e portanto, ser mais abundantes em áreas com mais
variados recursos. Qualquer aumento na diversidade de presas intensifica a resistência
do consumo (e reduz a eficiência do consumidor), ou aumentando a diversidade de
presas aumenta a abundância de consumidores (e intensifica os efeitos do consumidor).
STEINER (2001), encontrou fraco controle de consumidores sobre a
biomassa algal pelo zooplâncton em ambiente com diversidade algal mais alta, o que
atribuiu à presença de fitoplâncton não comestível em alta diversidade que foi capaz de
compensar para a redução da taxa de vulnerabilidade. Em uma meta-análise
quantitativa o efeito da herbivoria decresceu significativamente com o aumento da
diversidade algal (HILLEBRAND and CARDINALE 2004). Essa relação do efeito do
consumidor na diversidade de presas permanece consistente mesmo depois de
cuidadoso cálculo de complexas e diversas variáveis tais como o tipo de habitat,
desenho experimental, ou biomassa de consumidores e presas. Em contraste, uma meta
análise de experimentos de cascata trófica através do ecossistema mostrou que a
diversidade de produtores não explicam a variabilidade na força de interação do
controle “top-down” (BORER, 2002). Desta maneira, a alta diversidade de presas pode
121
amortecer o controle “top-down” sobre a biomassa da comunidade no sistema,
entretanto esses efeitos podem ser obscurecidos por fontes de variabilidade entre os
sistemas.
Prediz-se normalmente que a diversidade de presas aumenta a
diversidade de consumidores através de maiores oportunidade de diferenciação e
especialização do nicho. Esta predição aplica-se para recursos não sustentáveis
(nutrientes, luz) e recursos sustentáveis tais como presas biológicas para consumidores
heterotróficos. Entretanto, os mecanismos podem diferir para esses dois tipos de presas.
Recursos não renováveis:
A clássica teoria de competição diz que o número de espécies coexistindo
em equilíbrio não pode exceder o número de recursos limitantes em ambientes
homogêneos (TILMAN, 1982), esta predição tem sido constatada por experimentos
controlados. Conseqüentemente, INTERLANDI and KILHAM (2001) acharam que a
diversidade do fitoplâncton em lagos foi maior quando mais recursos (luz e nutrientes)
estavam abaixo dos níveis limitantes. O equilíbrio dinâmico então sugere uma ligação
linear entre diversidade de recursos e diversidade de consumidores. Análises de
modelos em estado de não equilíbrio mostram que a dinâmica não linear permite a
coexistência de espécies em poucos recursos (ARMSTRONG and McGEHEE, 1980).
Usando modelos com três recursos limitantes e um grande número de espécies
competidoras, a dinâmica em estado de não equilíbrio com oscilações e flutuações
caóticas reduziu a exclusão competitiva e manteve alta diversidade (HUISMAN and
WEISSING, 1999).
Recursos renováveis:
Pela ingestão de partículas orgânicas, consumidores heterotróficos
adquirem recursos adicionais, que são (parcialmente) sustentáveis mas diferem em
qualidade. Enquanto que espécies produtoras variam tremendamente no conteúdo de
nutrientes, consumidores vertebrados e invertebrados são menos variáveis em suas
composições bioquímicas. Conseqüentemente, o crescimento e sobrevivência de
consumidores é determinada pela combinação ou inadequação entre a demanda de
nutrientes do consumidor e a composição de nutrientes da presa (STERNER and
ELSER, 2002). Além disso, a diversidade aumentada de presas pode aumentar a
122
sobrevivência, o crescimento e a reprodução de consumidores por causa de uma dieta
mais balanceada (DeMOTT, 1998). Finalmente, a alta diversidade de presas
substituíveis permite que mais consumidores coexistam, dado que consumidores
apresentam especialização para um tipo de presa e a proporção de tais especialistas
permanece constante ou aumenta com a diversidade de presas. Além disso, também a
diversidade do fitoplâncton e zooplâncton marinho não se correlacionam em escala
global (IRIGOIEN et al., 2004). No entanto alta diversidade de presas promove a
coexistência pelo maior fornecimento de oportunidades de diferenciação do nicho.
A crise global de biodiversidade tem gerado um intenso e controverso
debate sobre o funcionamento do ecossistema, motivada pela corrente alta de perda de
espécies, por motivos antrópicos, é importante perguntar se a diversidade de uma rede
alimentar afeta a probabilidade de perdas secundárias pela deleção de uma ou várias
espécies e se estas perdas comprometem a estabilidade dos sistemas ecológicos. Então
a questão geral é determinar se redes com maior diversidade são mais persistentes e
resistentes contra diferentes tipos de perturbações e extinções. Este fato fez surgir a
necessidade de estudos para a análise da estrutura e topologia das redes alimentares.
Novos métodos de estudo vieram da própria teoria de redes e mais recentemente da área
de sistemas complexos tornando-se importantes ferramentas de análise.
7.3 - Sistemas Complexos, Propriedades Emergentes e Redes Alimentares
Segundo a enciclopédia Wikipedia (2005), um sistema complexo é um
sistema cujas propriedades não são totalmente explicadas pelo entendimento de suas
partes componentes. Estes sistemas consistem de um grande número de partes,
entidades ou agentes entrelaçados interagindo mutuamente. O termo “sistemas
complexos” é também freqüentemente usado como termo geral dirigido a abordagem de
pesquisa que inclui idéias e técnicas desde a teoria do caos, vida artificial e, computação
evolutiva. De acordo com uma edição especial da revista Science (1999), várias
definições podem ser usadas para sistemas complexos dentre as quais destacam-se.
123
"Um sistema complexo é altamente estruturado. É um sistema cuja evolução é
muito sensível às condições iniciais ou a pequenas perturbações, o número de
componentes interdependentes e interatuantes é grande e, existem níveis pelo qual o
sistema pode evoluir e “desdobrar-se” através do tempo”.
Sistemas complexos são tidos como sendo sistemas abertos cujas fronteiras são
difíceis de determinar apresentando propriedades tais como emergência, relações não-
lineares entre as partes interatuantes e entrelaçadas formando complexas redes que
contém alças de retroalimentação de maneira que a descrição independente das partes
estruturais interdependentes não descrevem o comportamento adaptativo do todo. A
história de um sistema complexo é muito importante e não pode ser ignorada pois,
mesmo pequenas mudanças nas “circunstâncias” podem levar a grandes desvios no
futuro. Isto tem sido referido como o “Butterfly effect” (efeito borboleta). Um aspecto
dos sistemas complexos é que seus componentes são também considerados como
sistemas adaptativos complexos, de maneira que a biosfera é composta por complexos
ecossistemas, que tem diversas estruturas de comunidade (rede alimentar) formadas por
diferentes populações nas quais atua o processo de evolução que determina a adaptação
dos organismos através do processo de seleção natural. No caso de populações
humanas, que vivem em sociedade, estabelecem-se economias formadas de
organizações, compostas por pessoas, que são sistemas de órgãos controlados por seus
sistemas nervosos e endócrino, que respondem à redes de genes etc., todos em cada
nível de hierarquia, são sistemas complexos. Portanto, a área de sistemas complexos
estende-se por um variado campo de ação desde redes de interações sociais, redes
ecológicas, redes de interações metabólicas, interações protéicas, genéticas,
epidemiológicas, fluxos financeiros, redes de computadores, internet etc.
De acordo com STROGATZ (2001), toda década ou mais, surge uma grandiosa
teoria trazendo aspirações similares. Nos anos 60, foi a cibernética, nos anos 70, veio a
teoria da catástrofe, os anos 80, foi marcado pela teoria do caos e nos anos 90, a teoria
da complexidade.
A estrutura e o funcionamento de uma rede complexa forma o “esqueleto” dos
sistemas complexos. Estas redes são especiais pois trabalham no limite do caos (the
edge of caos) onde o grau de conectividade não é regular nem aleatório. A maioria das
redes complexas do mundo real são “small-world networks” ou “scale-free networks”
124
na margem entre a ordem e a aleatoriedade. Estas redes podem ser descritas
matematicamente ou através da teoria de grafos. Ambas as classes de redes apresentam
características comuns. Grafos “small-world” emergem através de reconexões
aleatórias de “grids” regulares (adição de aleatoriedade à ordem), enquanto que
estruturas “scale-free” (livres de escala) manifestam-se em redes se um certo grau de
ordem é adicionado a aleatoriedade: em vez de se considerar um crescimento
puramente randômico da rede, considera-se um crescimento randômico com conexões
preferenciais.
Uma rede é chamada de “small-world” por analogia ao fenômeno “small-world”.
Essas redes foram descritas por WATTS and STROGATZ (1998), e parecem ser
“small” (pequenas) por causa de um curto caminho médio, entre dois elementos
escolhidos aleatoriamente, (small average and characteristic path length) como grafos
randômicos e apresentam alto grau de agrupamento (clustering) como malhas regulares.
O fenômeno “small-world”, também conhecido como “small-world effect”, descrito
pelo psicólogo MILGRAM em 1967, é a hipótese de todos no mundo podem ser
alcançados através de uma curta cadeia de conhecidos (amigos). O conceito ascendeu a
frase “seis graus de separação” (six degree of separation). A propriedade “small-world”
pode estar associada com a conectividade global e o caminho mais curto (shortest path
length), surge em redes regulares através da adição de atalhos aleatórios (random
shortcuts). Depois da descrição destas redes, BARABÁSI (1999), achou um modelo
para explicar a emergência do fenômeno “small-world”, a propriedade “scale-free”, que
pode estar associada com a conectividade local da rede estas, surgem em redes
randômicas através de agrupamento (clustering).
Uma rede é chamada “scale-free” se não tem uma escala exata ou fixa. Uma
rede com uma única escala (single scale) é similar a um “grid” onde, todo nó tem o
mesmo grau ou mesmo número de conexões. Em uma rede “scale-free”, alguns nós tem
um grande número de conexões se comparados aos demais. Tipicamente, o grau de
conectividade pode ser descrito por uma lei de força (power law) e normalmente
apresentam robustez contra falhas acidentais e são normalmente vulneráveis ao ataque
contra “hubs” ou supernós (nós com grande conectividade) que influenciam fortemente
a maneira de funcionamento dessas arquiteturas. Estes nós situam-se em locais
“especiais” da rede pois atraem muitas ligações e isto tem sido chamado do fenômeno
“the winer take all” ou o ganhador leva tudo. Estas redes também exibem o fenômeno
125
126
“small-world”, em que dois nós médios são separados por um número muito pequeno de
conexões e geralmente também tem alto grau de agrupamento. O mundo real é repleto
de redes “scale-free”, por exemplo redes de computador, padrões sexuais em humanos,
que afetam a dispersão de doenças sexualmente transmissíveis, redes de interações
protéicas etc. Segundo o modelo de BARABÁSI (1999), para se produzir uma rede
“scale-free” artificial processando-se propriedades “small-world”, duas regras tem de
ser seguidas:
• Crescimento : a rede é semeada com pequeno número de nós iniciais. Em cada
etapa, um novo nó é adicionado. Este nó é conectado a m nós já existentes.
• Conexão Preferencial: a probabilidade de um novo nó adicionado se conectar a
um nó n já existente depende do grau de conectividade de n (número de
conexões de n com os outros nós).
Parece que modelos de redes “scale-free” podem ser o fundamento de uma lei
natural que governa a formação de redes “smal-world” naturais.
As primeiras análises de propriedades topológicas de redes alimentares emergiu
a partir das pesquisas ecológicas sobre a relação entre diversidade e estabilidade
(MacARTHUR, 1955; MAY, 1973) e tipicamente usou baixa resolução (poucas
espécies). Uma dramática melhoria nos dados (WINEMILLER, 1990; MARTINEZ,
1991), levou a bem sucedidas descrições e modelagem das propriedades gerais de
cadeias alimentares entre ecossistemas (MARTINEZ, 1999) incluindo como as
propriedades das redes alimentares variam com a riqueza de espécies, a resolução, e
esforço de amostragem. Todos estes achados revitalizaram o estudo ecológico das redes
alimentares e pesquisadores têm explicitamente examinado as propriedades “small-
world” para redes alimentares. MONTOYA & SOLÉ (2001), examinaram quatro redes
alimentares e apresentaram “short path length” e maior grau de “clustering” do que
redes randômicas e uma sobreposição de sete redes alimentares com “short path length”
que são pouco, mas significantemente mais longas que “path length” de redes
randômicas mostradas por WILLIAMS, et al. (2001), que demonstrou que esta
propriedade decresce com o aumento da riqueza de espécies. Em 2002, MONTOYA &
SOLÉ, analisaram outros três sistemas (Ythan estuary web, Silwood web e Little Rock
lake web) com diferentes níveis de resolução taxonômica, mas todas envolvendo alto
grau de “clustering” e “short path length” (com dois graus de separação) entre as
espécies, e comentam que estas características sugerem que as comunidades podem ser
auto organizadas de uma maneira não aleatória podendo ter importantes conseqüências
em sua resistência à perturbações tais como a remoção de uma espécie. DUNNE
(2002), explorou o papel da conectividade e o tamanho de redes através da comparação
de dezesseis redes alimentares variando entre 25 e 172 espécies e cita que, redes
alimentares geralmente têm muito maior complexidade, medida como conectividade (a
fração de todos possíveis ligações realizadas numa rede) e muito menor tamanho que
outras redes estudadas. A autora verificou que o “characteristic path length” de redes
alimentares eram curtos e pouco maiores do que outras redes randômicas estudadas
anteriormente (WILLIAMS et al. 2001), e que apesar do grau de distribuição de redes
alimentares não apresentarem uma forma funcional universal, as distribuições são
sistematicamente relacionadas com a conectividade e o tamanho da rede. Redes
alimentares com relativa alta conectividade tipicamente apresentaram uma distribuição
uniforme, redes com média conectividade tendem a ter uma distribuição exponencial
enquanto que, redes com baixa conectividade, mostram uma distribuição “power-law”
ou parcial. Entretanto, graus uniformes de distribuição não tinham sido reportados
anteriormente em qualquer tipo de rede do mundo real. A falha em se observar
topologias “scale-free” na maioria das redes alimentares parece estar relacionada ao
relativo pequeno tamanho (número de níveis tróficos) e a alta conectividade.
Em outra abordagem, integrando a complexidade estrutural e a dinâmica de
redes alimentares, FUSSMANN (2002) mostra que oscilações caóticas, equilíbrio
estável e regular e oscilações estáveis no limite do caos, são os principais estados
dinâmicos gerados por modelos de comunidade multi específicas. Este autor, testando
diversas arquiteturas, achou que a dinâmica caótica aumenta com o número de níveis
tróficos de uma rede alimentar, mas decresce com o grau de complexidade e que a
existência de múltiplos pontos de atração (nós com maior grau de conectividade) podem
levar a diferentes estados dinâmicos do sistema, dependendo das condições iniciais. O
autor testou a força de interação entre os elementos das redes e verificou que a produção
primária disponível para consumo aumenta com o número de produtores. Um aumento
na produção primária é normalmente considerado como tendo um efeito
desestabilizador na dinâmica da comunidade (ROSENZWEIN, 1971), mas demonstrou
que interações do tipo onivoria, principalmente em diferentes níveis tróficos, têm o
127
efeito um estabilizador. De acordo com BORER (2002), a direção e a força de
interação entre duas espécies depende do tipo de interação em questão.
O surgimento de análises de redes alimentares baseados em consumidores com
comportamento com dieta flexível e adaptativa (KONDOH, 2003), sustentam a chave
para a manutenção de redes complexas. Na ausência de forrajamento adaptativo, a
arquitetura da rede é fixa e é menos provável a persistência da população em uma rede
mais complexa. A presença de consumidores capazes de rápida adaptação, torna
possível a flexibilidade da arquitetura e sua mudança ao longo do tempo. Esta
flexibilidade resulta em uma relação positiva entre a complexidade da rede e a
persistência das populações. O efeito estabilizador da complexidade implica que uma
rede complexa e adaptativa seja auto-sustentável. Esta auto sustentabilidade, entretanto,
não necessariamente significa que uma redes mais complexa será mais sustentável para
perda de espécies. Em uma rede complexa e adaptativa, uma vez que as espécies são
perdidas, isto abaixa a persistência da população, desta maneira aumentando a
possibilidade de extinções posteriores. Este “feedback” positivo abaixa a riqueza de
espécies e a persistência das populações ao mesmo tempo, resultando em extinções em
cascata. Isto sugere que redes complexas e adaptativas podem ser mais frágeis quando
estão sob forte pressão, abaixando a riqueza das espécies.
Numa análise da estrutura e robustez de redes alimentares marinhas DUNNE,
(2004), apresenta resultados preliminares sugerindo que ecossistemas com variável
diversidade e complexidade dividem características fundamentais. Por causa da “short
average path lengh” os efeitos de perturbações podem ser largamente transmitidos ao
longo das redes.
128
Capítulo VIII
Conclusões
Este trabalho apresentou inicialmente a grande variedade, valor e tipos de
ecossistemas costeiros, o desconhecimento atual acerca da diversidade biológica, uma
breve descrição dos serviços básicos que a vida marinha fornece para o homem, a rápida
deterioração dos diversos habitats e a enorme necessidade de se desenvolver programas
de monitoramento e gerenciamento ambiental para se tentar alcançar um
desenvolvimento sustentável. Este último deve ser entendido como sendo a harmonia
entre a manutenção e crescimento da atividade econômica capaz de promover o
desenvolvimento social com a preservação e conservação ambiental. A questão chave
foi, é e continua sendo: O que conservar e como isso funciona? Como resposta para a
primeira parte da pergunta, fica claro que é o próprio ambiente no seu sentido maior –
Ecossistema – em que se espera ter demonstrado as fortes tendências e tentativas à nível
mundial na adoção e extensão deste conceito para os programas de gerenciamento
ambiental. Porém, a segunda parte da pergunta, procurou-se demonstrar ao leitor que o
funcionamento dos ecossistemas são extremamente complexos devido ao grande
número de componentes e interações operando em diversas escalas de tempo e espaço, e
a necessidade de desenvolver índices mais abrangentes que reflitam as condições reais
do ambiente como um todo.
Com o objetivo de conhecer e acessar os padrões de comportamento
trófico pela variação temporal do suprimento de diferentes tipos de larvas, clorofila e
parâmetros físicos e químicos da água, os métodos de extração de conhecimento através
de regras, permitiram demonstrar a existência de uma partição na comunidade
meroplanctônica, tornando possível classificar a corrente classe de estado ambiental e
fazer predições futuras.
Três questões básicas foram levantadas.
A primeira é, seria possível separar fontes exógenas (ambientais) de fontes
endógenas (bióticas) de variação de densidades populacionais à partir de séries
129
temporais de dados? A resposta para esta questão é não, pois o modelo de regras de
classificação através de associações (LIU, 1998), demonstrou que ambos os dados são
contemplados tanto nas partes antecedentes como conseqüentes dos conjuntos de regras.
Este tipo de modelo demonstrou os níveis ou sob que condições físico e químicas, os
diversos tipos de larvas formam uma dada composição populacional, em outras
palavras, ficou demonstrado as fronteiras que separam determinado estado ambiental de
outro, e que em certos casos, a estrutura da rede alimentar pode estar sob forte
influência de um controle do tipo “bottom-up” já que determinados conjuntos
populacionais estão relacionadas a níveis específicos de clorofila e esta, por sua vez,
responde a certa conjuntura de nutrientes.
A segunda questão foi se padrões temporais de longa duração da
dinâmica populacional poderiam ser gerados por processos endógenos, e estes processos
poderiam ser caracterizados em conjuntos de dados reais. Apesar da resposta desta
questão ser sim, não se teve a possibilidade com a atual base de dados de demonstrar tal
fato. Porém , como demonstrado por FUSSMANN & HERBER (2002), interações do
tipo onivoria que ocorre no controle “top-down,” principalmente em níveis tróficos
diferentes, promovem efeito estabilizador das redes alimentares, aliado a ocorrência de
consumidores com forrageamento adaptativo (KONDOH, 2003), mantém a persistência
e sustentabilidade da rede no longo prazo. A base de dados atual, só apresenta a
clorofila como única fonte de recursos para as larvas, excluindo assim, a possibilidade
de evidenciar suas preferências alimentares nem tão pouco, contém dados sobre os
possíveis predadores das larvas.
A terceira e última questão diz respeito com a possibilidade de predizer
como mudanças ambientais afetam a média de densidades populacionais. A resposta
também é sim, pois uma vez que foi possível determinar os intervalos de ocorrência das
diferentes densidades populacionais específicas e composições relacionadas aos
intervalos físicos e químicos, as regras por si nos demonstram este fato. Outra
abordagem para acessar tal condição poderia ser a aplicação da metodologia de extração
de regras de modelos de redes neurais.
O principal foco desses conceitos (bottom-up, top-down, trophic cascade
etc.) tem sido explicar a distribuição e controle da biomassa em diferentes níveis
tróficos, enquanto que o controle da diversidade recebeu menos atenção. A presença de
130
predadores altera a diversidade de consumidores intermediários e conseqüentemente a
diversidade de presas basais. Simultaneamente, a densidade de presas basais afetará a
diversidade de predadores via mudanças no nível de consumidores intermediários.
Sobre OLIVER (2000), que cita que a estrutura e dinâmica das
comunidades bentônicas nos costões rochosos varia espacial e temporalmente com
respeito aos invertebrados dominantes e processos de pré e pós assentamento, e que
segundo APOLINÁRIO (1999), a disponibilidade de larvas e o baixo recrutamento
causam a não manutenção das populações da zona intertidal, os dados disponíveis
apresentaram uma dominância numérica para as populações de larvas de cirripédios e
mytilidae com densidades médias interanuais bastante flutuantes.
VALANTIN (1988), citou que as relações fitoplâncton/zooplâncton, em
linhas gerais, apresentam uma correlação positiva direta entre esses dois níveis tróficos
em águas oligotróficas e que, em regiões de ressurgência, por causa do estado de
desequilíbrio dever-se-ia encontrar uma correlação negativa, mas que, na ressurgência
de Arraial do Cabo, devido ao que chamou de simultaneidade de máximos, esta
correlação seria positiva. De acordo com o apresentado na Tabela 3.3 de correlações, as
larvas de Cirripédia, Mytilidae, Decapoda, Larva em D, Ostreidae, Cipris e Bryozoa,
apresentam todas correlações negativas com a clorofila enquanto que as larvas de
Polychaeta, Ascidiaceae, Equinoide e Bivalvia apresentam-se com sinal positivo porém,
não correlacionadas como o encontrado por IRIGOIEN (2004).
SKINNER & COUTINHO (2002), demonstraram um maior
assentamento de duas espécies de cirripédios no período outono/inverno quando
observaram uma maior densidade de larvas do tipo cipris e a maior ocorrência de larvas
do tipo náuplio no período de primavera/verão e sugerem que a variação temporal da
temperatura seria o fator ambiental responsável por tal fato. Na realidade, a maior
densidade de larvas do tipo cipris foi observada no período estudado pelos dois autores
mas, não se pode dizer que o encontrado constitui um padrão de comportamento do
ecossistema da ressurgência de Arraial do Cabo uma vez que não se verifica o mesmo
nos anos antecedentes e subseqüentes.
Pode-se dizer que a fase de preparação de dados é crucial para o processo
de modelagem e extração de conhecimento e que a metodologia de análise estatística
131
multivariada constitui ferramenta indispensável no que se refere a depuração e
conhecimento da estrutura da base de dados enquanto que, a metodologia de algoritmos
para geração de regras demonstrou grande capacidade de gerar modelos de regras
capazes de classificar e predições das condições ambientais e potencial como
ferramenta de inicialização de redes alimentares.
Como o ecossistema é composto por diversos componentes e impactado
por diversas fontes perturbadoras, o melhor indicador ecológico é o próprio conjunto de
elementos da rede alimentar. Para acessar as diferentes condições e estados ambientais
foi desenvolvido o índice PLIX que demonstra as condições tróficas globais da rede
alimentar enquanto que o índice de diversidade de Margalef pode ser usado para acessar
o grau de perda global de diversidade do sistema ou aplicado a cada nível da rede
trófica. Juntos estes índices podem ser usados para interpretar a resposta do sistema
biológico às perturbações ambientais. Neste sentido, o sistema proposto pode ser usado
como simulador e comparar os efeitos de possíveis modificações das condições
ambientais na rede de interações tróficas e seus efeitos na perda de biodiversidade e
estabilidade do ecossistema com condições de referência. Observou-se que o índice de
diversidade de Margalef (Tabela 5.1), aplicado às larvas meroplanctônicas foi altamente
variável ao longo do tempo e que esta diversidade apresenta baixa correlação positiva
com os fatores físicos e químicos e a clorofila mas, fortemente correlacionada com a
razão de produção/consumo. Este fato sugere uma situação de competição por recursos
por parte dos organismos. Constatou-se ainda que o mais alto valor de diversidade
larval ocorreu juntamente com alta densidade de clorofila. Este fato demonstra que o
aumento de densidade algal se deu provavelmente pelas espécies normalmente menos
abundantes ou raras, permitindo assim a coexistência de uma mais diversa composição
de larvas como o verificado anteriormente por ABRAMS (1995), estando também de
acordo com a hipótese de uma dieta mais diversificada e balanceada de DeMOTT
(1998). Porém, os valores mais baixos de diversidade larval estão freqüentemente
associados a baixos valores de clorofila demonstrando que as larvas exercem fraca
pressão de herbivoria sobre a biomassa algal como relatado por STEINER (2001) e
HILLEBRAND (2004).
A arquitetura do Sistema de Gerenciamento Integrado do Ecossistema
Costeiro proposto neste trabalho, usada como ferramenta de apoio e suporte de decisão,
definindo as condições ambientais e identificando conflitos ou problemas, satisfaz os
132
requerimentos propostos por POWRVAKHSHOURI (2003), COLWEL (2004) e
CAMPBELL (2005).
A pequena revisão sobre a biodiversidade e a ecologia de redes alimentares
mostrou um íntimo acoplamento e vários níveis de organização. A maioria das
pesquisas foram feitas na “clássica rede alimentar” compreendendo o fitoplâncton,
zooplâncton, planctívoros e predadores no meio pelágico e em alguns casos
comparações com sistemas terrestres. Entretanto, muito da diversidade nos sistemas
aquáticos ocorre em cadeias alimentares microbianas. A falta de informação neste nível
é extraordinária, principalmente entre a ligação do microscópico com o macroscópico.
A inclusão de conexões com cadeias alimentares baseadas em detrito em estudo de
biodiversidade mudará certamente a percepção de padrões entre diversidade e interações
tróficas.
O sucesso do gerenciamento de ecossistemas futuro dependerá de pesquisa direta
nos mecanismos básicos que governam a dinâmica das interações do ecossistema. O
controle “bottom-up e top-down” alteram o funcionamento do ecossistema entretanto,
um ecossistema não é governado inteiramente por um ou outro tipo de controle mas, por
uma súbita mudança de combinações destes que pode depender do seu estado,
diversidade e integridade. Nenhuma teoria geral pode ser atribuída ao funcionamento
do ecossistema, exceto à luz da teoria da evolução. Afim de entender a relação entre
diversidade e relações tróficas tem-se que estender a estrutura temporal para incluir
processos evolutivos. A importância da competição na especiação e micro-evolução.
Os trabalhos futuros incluirão o emprego da tecnologia de citometria de fluxo
focada a laser para a geração de dados das partículas em suspensão e organismos da
água para acessar a estrutura de cadeias alimentares microbianas e a importância das
relações de interações infecciosas e parasitárias. O reconhecimento e classificação das
assinaturas ópticas desta partículas e organismos será feito com o auxílio de modelos de
redes neurais artificiais como apresentado por PEREIRA et al. (2003). Os dados
gerados serão armazenados em ambiente de banco de dados que será acessado por
algoritmos geradores de regras de associação para a indução de uma estrutura de rede
como o exposto neste trabalho. Esta rede deverá ser implementada por algoritmos
evolutivos que permitam um aprendizado por reforço em tempo “quase real”.
133
Investigar se supostas mudanças na diversidade estão relacionadas com
propriedades emergentes da rede alimentar tais como o número global de ligações da
rede, número de ligações por espécie e a relação complexidade e estabilidade.
Redes alimentares “sempre” foram consideradas como tendo um curto tamanho,
“Small networks but not small worlds,” como se comportarão quando acoplar o macro e
o micro ? “Big world and big networks” ? Permanece obscuro se a conectividade está
relacionada com o tamanho da rede ou diminui com a diversidade.
Explorar a importância da direcionalidade de ligações, força de ligações e tipos
de interações além da importância da perda de diversidade e os fatores que mantém o
funcionamento de estruturas auto adaptativas será uma etapa valiosa no entendimento e
aplicação da teoria da complexidade em comunidades ecológicas.
134
Referências Bibliográficas
ABRAMS, P.A. 1995. "Monotonic or unimodal diversity-productivity gradients: what
does competition theory predicts?" Ecology 76: pp. 2019-2027.
ABRAMS, P.A. 2001. "Modeling the adaptive dynamics of traits involved in inter-and-
intra-specific competition: An assessment of three methods". Ecology Letters 4: pp.166-
175.
AGRAWAL, R., IMIELINSKI, T., & SWAMI, A. (1993). "Mining Associations
between sets of items in massive databases." Proceedings of the 1993 ACM-SIGMOD
International Conference on Management of Data, pp.207-216.
AGRAWAL, R., and SRIKANT, R. Fast algorithm for mining association rules. VLDB-
94, 1994.
AN, A. & CERCONE, N. (1999). "Discretization of continuos attributes for learning
classification rules". Proceedings of the 3rd Pacific-Asia Conference on Methodologies
for Knowledge Discovery and Data Mining, 509-514.
ANGER, K., DAWIRS, R. R., 1981. Influence of starvation on the larval development
of Hyas araneus (Decapoda: Majidae), Helgol. Wiss. Meeresunter., 34, 287.
ANGER, K., 1985. Influence of salinity on larval development of the spider crab, Hyas
araneus, reared in the laboratory. – In: Marine biology of polar regions and effects of
stress on marine organisms. Ed. By J. S. Gray & M. E. Christiansen. Wiley, Chichester,
pp. 463-473.
ANITA, N. J., BERLAND, B.R., BONIN, D.J. and MAESTRINI, S.Y., 1975,
“Comparative evaluation of certain organic and inorganic sources of nitrogen for
phototrophic growth of marine algae”. J. Mar. Biol. Ass. U.K., v.55, pp. 519-539.
AOKY, T., KOMATSU, T., HWANG, K., 1999. "Prediction of response of
zooplankton biomass to climatic and oceanic changes". Ecological Modelling 120, pp.
261-270
135
APOLINÁRIO, M., 1999. "The role of pre-recruitment processes in the maintenance of
a barnacle (Chtamalus challengeri Hoek) patch on an intertidal pebble shore in Japan".
Rer. Brasil. Bio., 59 (2): 225-237.
ARHONDITSIS, G., KARYDIS, M., TSIRTSIS, G., 2003. "Analysis of Phytoplankton
Community Structure Using Similarity Indices: A New Methodology for Discriminating
among Eutrophication Levels in coastal Marine Ecosystems". Environmental
Management, vol. 31, No. 5, pp. 619-632.
ARMSTRONG, R.A., McGREHEE, R. 1980. "Competitive exclusion". American
Naturalist 115: pp.151-170.
ATTAYDE, J.L., HANSON, A. "A relative importance of fish predation and excretion
effects on planktonic communities". Limnol. Oceanogr. 46: pp. 1001-1012.
BAILEY, R.C., DAY, K.E., NORRIS, R.H., REYNOLDSON, T.B., 1995.
"Macroinvertebrate community structure and sediment bioassay results from nearshore
areas of North American Great Lakes." J Gt Lakes Res. 21: pp. 45-52.
BANSEN, K., 1977 “Determining the carbon-chlorophyll ratio of natural
phytoplankton.” Mar. Biol., 41, pp. 199-212.
BARAN, P., LEK, S., DELACOSTE, M., BELAUD, A, 1996. "Stochastic models that
predict trout population density or biomass on a mesohabitat scale." Hydrobiologia 337,
pp. 1-9.
BARABASI, A.L. 1999. “Emergence of scaling in random networks.” Science 286: pp.
509-512.
BARBIERI, E.B., 1975. “Ritmo climático e extração de sal em Cabo Frio”. Revista
Brasileira de Geografia, v. 37, pp.23-109.
BARCIELA, R.M., GARCIA, E., FERNANDEZ, E., 1999. "Modelling primary
production in a coastal embayment affected by upwelling using dynamic ecosystem
models and artificial neural networks". Ecological Modelling 120, pp. 199-211.
136
BARNES, H. & BARNES, M., 1965. "Egg size, nauplius size and their variation with
local, geographical, and specific factors in some common cirripedes." J. Anim. Ecol. 34,
p. 391-402.
BATAGALJ, V., DOREIAN, P., FERLIGOJ, A, 1992. "An optimization approach to
regular equivalence." Social networks 14: pp. 121-135.
BAY, S. D. (2000). "Multivariate discretization of continuos variables for set mining".
Proceedings of the 6th ACM SIGKDD International Conference on Knowledge
Discovery and Data Mining, 315-319.
BAYARDO, R., and AGRAWAL, R. “Mining the most interesting rules.”KDD-99,
1999.
BOESCH, D. F., BURRESON, E., DENNISION, W., HOUDE, E., KEMP, M.,
KENNEDY, V. 2001. Factors in the decline of coastal ecosystems. Science 293: pp.
629-638.
BORER, E.T., AMDERSON, C., BLANCHETTE, C., BROITMAN, B., COOPER, S.,
HALPEN, B. 2002. "Topological approaches to food web analyses: a few modifications
may improve our insights". Oikos 99: pp. 397-401.
BRADSHAW,C.J.A, PURVIS, M., RAYCOV, R., ZHOU, Q., DAVIS, L.S., 2000.
Predicting patters in spatial ecology using neural networks: modelling colonization by
New Zealand fur seal. In: Denzer, R., Swayne, D.A, Purvis, M., Schimak, G. (Eds.),
Environmental Software Systems. Environmental Information and Decision Support,
167. Kluwer Academic Publishers, Dordrecht, Netherlands, pp. 57-65.
BRADSHAW,C.J.A, DAVIS, L.S., PURVIS, M., ZHOU, Q., BENWELL, G.L., 2002.
"Using artificial neural network to model the suitability of coastline for breeding by
New Zealand fur seals (Arccephalus forsteri)". Ecological Modeling 148, pp. 111-131.
BRETT, M., GOLDMAN, C.R. 1997. "Consumer versus resources control in
Freshwater pelagic food web". Science, 275 issue 5298, pp.384-386.
BRAY, R. J. & CURTIS, J. T. 1957. "An ordination on the upland forests communities
of southern Winsconsin". Ecological Monography, 27: pp. 325-349.
137
BRAZNER, J.C., 1997. "Regional, habitat and human development influences on
coastal wetlands and beach fish assemblages in Green Bay, Lake Michigan". J Gt Lakes
Res. 23: pp. 36-51.
BREY, T., JARRE-TEICHMANN, A., BORLICH, O. , 1996. "Artificial neural network
versus multiple linear regression: predicting P/B ratios from empirical data". Marine
Ecological Progress Series 140, pp. 251-256.
BOUDJEMA, G., CHAU, N.P., 1996. "Revealing dynamics of ecological systems from
natural recordings". Ecological Modelling 91, pp.15-23.
BRILL, F., Z., BROWN, D. E., MARTIN, W. N. 1992 "Fast genetic selection of
features for neural network classifiers". IEEE Transactions on Neural Networks,3(2):
pp. 324-328.
BURT, R.S., TALMUD, I., 1993. "Market niche". Social Networks 15: pp. 133-149.
CAIRNS, J., McCORMICK, P.V., NIDERLEHNER, B.R., 1993. "A proposed
framework for developing indicators of ecosystem health". Hydrobiologia 236, pp. 1-
44.
CHESSON, P. 2000. "A need for niches?" Trends in Ecology and Evolution 9: pp. 26-
28.
CAMPBELL, J.W., 2005. The University of New Hampshire Center of Excellence for
Coastal Ocean Observation and Analysis. Semi-Annual Technical Report:
NA16OC2740. Ocean Process Analysis Laboratory, Durham, New Hampshire, USA.
CARLTON, J. T., G. J. VERMEIJ, D. R. LINDBERG, D. A, CARLTON, E. DUDLEY.
1991. "The first historical extinction of a marine invertebrate in an ocean basin: the
demise of the eelgrass limpet Lottia alvens". Biological Bulletin 180: pp. 72-80.
CARLTON, J. T. 1993. "Neoextintions of marine invertebrates". American Zoologist
33: pp. 499-509.
CARLTON, J. T. 1999a. The scale and ecological consequences of biological invasions
in the world’s oceans. Pages 195-212 In º T. Sandlund, P. J. Schei, A Viken, eds.
138
Invasive species and biodiversity management. Kluwer Academic Publishers,
Dordrecht, Netherlands.
CARLTON, J. T., J. B. GELLER, M. L. REAKA-KUDLA, E. A. NORSE. 1999b.
"Historical extinctions in the sea". Annual Review of Ecology and Systematics 30: pp.
515-538.
CASWELL, H., 1981. "The evolution of mixed life histories in marine invertebrate and
elsewhere", Am. Nat., pp. 117, 529.
CLEMANTIS, A., FALCIDIENO, B., SPAGNUOLO, M. 1996 "Parallel processing on
heterogeneous networks for GIS Applications", Int. Journal of Geographical
Information Systems, special issue on Parallel Processing in GIS, vol. 10, No. 6.
CHANG, C. P., WELLS, P. G. A marine environment quality (MEQ) framework and
the Bay of Fundy. Opportunities and Challenges for Protecting, Restoring and
Enhancing coastal Habitats in the Bay of Fundy: Proceedings of the 4th Bay of Fundy
Science Workshop, Saint John, NB, 2000, Chopin, T., and Wells, P. G., Eds.
Environment Canada – Atlantic Region, Occasional report No. 17, Sackvill, NB, 2001,
127 p.
CHARPY.R., CHARPY, L.J., MAESTRINI, S.Y., 1982, “Fertilité des eaux côtieres
Nord-patagoniques: facteurs limitant la prodution du phytoplankton et potentialities
d’explotation myticole”. Oceanol. Acta, v.5, n.2, pp.179-188.
CHASE, J.M., LEIBOLD, M.A. 2002. "Spatial scale dictates productivity-biodiversity
relationship". Nature 416: pp. 427-230.
CHAWLA, N. V., JAPKOWICZ, N., KOLCZ, A. "Special issue on learning from
imbalanced data sets". SIGKDD Explorations, 6 (1): 1-6, 2004.
CHAWLA, N. V. "C4.5 and imbalanced datasets: Investigating the effect of sampling
method, probabilistic estimate, and decision tree structure." In Proceedings of the
ICML’03 Workshop on Class Imbalances, 2003.
139
CHAWLA, N. V., HALL, L. O., BOWYER, K. W., KEGELMEYER, W. P. SMOTE:
2002 "Synthetic Minority Oversampling technique". Journal of Artificial Intelligence
Research, 16:pp. 321-357.
CHON, T.S., PARK, Y.S., MOON, K.H., CHA, E.Y., 1996. "Patternizing communities
by using an artificial neural network". Ecological Modelling 90, pp. 69-78.
CHRITENSEN, F. B., FENCHEL, T. M., 1979. "Evolution of marine invertebrate
reproductive patterns", Theor. Popul. Biol. 16: pp. 267
CHRISTENSEN, V., PAULY, D., (ed.) 1993a. "Trophic models of aquatic ecosystem".
ICLAM Conference Proceedings, No. 26. 390p.
CHRISTENSEN, V., PAULY, D., 1993b. "Flow characteristics of aquatic ecosystems"
In Trophic Models of Aquatic Ecosystems, pp. 339-355. Ed. By Christensen, and D.
Pauly. ICLAM Conference Proceedings, No. 26.
COLE, M. R., 1998, Clustering with Genetic Algorithms (Western – Australia). Ph.D.
dissertation, University of Western Australia, Australia.
COLWELL, R.R., 2004. Biocomplexity and a New Public Health Domain. EcoHealth
Journal Consortium, 10.1007/s10393-004-0067-9,
http://www.springerlink.com/media/contrib…/fulltext.htm
CONNEL, J.H. 1978. "Diversity in tropical raim forests and coral reefs". Science 199:
pp. 1302-1310.
COSTANZA, R. R., D’ARGE, R. D., GROOT, S., FARBER, M., GRASSO, B.,
HAMNON, K., LIMBURG, S., NAEEM, R. V., O’NEILL, J., PARUELO, R. G.,
RASKIN, P., SUTTON, M. Van Den BELT. 1997. "The value of the world’s ecosystem
services and natural capital". Nature 387: 253-260.
COSTANZA, R., ANDRADE P., ANTUNES, M., Van Den BELT., D., BOCSCH, D.,
BOCRSMA, F., CATARINO, S., HANNA, L., LIMBURG, B., LOW, M., MOLITOR,
J. G., PEREIRA, S., RAYNER, R., SANTOS, J., WILSON M., YOUNG, 1999.
"Ecological economics and sustainable governance of the oceans". Ecological
Economics 31: pp. 171-187
140
COSTANZA, R. 1999. "The ecological, economic, and social importance of the
oceans". Ecological Economics 31: pp. 199-213.
COTTINGHAM, K.L., 2002. "Tackling biocomplexity: the role of people, tools, and
scale". Bioscience 52: pp. 793-799.
COWEN, R. K., K. M. M. LWIZA, S. SPONAUGLE, C. B. PARIS, D. B. OLSON.
2000. "Connectivity of marine populations: open or close?" Science 287: pp. 857-859.
CORDÓN, O., HERRERA, F., LOZANO, M. 1996. A Three-stage method for
designing genetic systems by learning from examples”. In: Proceedings of the fourth
International Conference on Parallel Problem Solving from Nature, pp. 720-729,
Berlin, Germany, 22-26 September.
COSTA, P.A.S., FERNANDES, F. C., 1993. “Seasonal and spatial changes of
cephalopods caught in the Cabo Frio (Brasil) upwelling ecosystem”. Bulletin of Marine
Science, v.52, pp.751-759.
COSTA, P.A.S., HAIMOVICI, P., 1990, “A pesca de polvos e lulas no litoral do Rio de
Janeiro”. Ciência e Cultura, v.42, pp. 1124-1130.
CULOTTA, E. 1994. "Is marine biodiversity at risk?" Science 263: pp. 918-920.
DALE, V.H., BEYELER, S.C., 2001. "Challenges in the development and use of
ecological indicators". Ecological Iindicators, 1: pp. 3-10.
DAILY, G. C. ed. 1997. Nature’s services. Island Press, Washington, D.C.
DAVIS, J.R., NANNINGA, P.M., HOARE, J.R.L., PRESS, A.J., 1989. "Transferring
scientific knowledge to natural resources managers using artificial intelligence
concepts". Ecological Modelling 46, pp. 73-89.
DeMOTT, W.R. 1998. "Utilization of a cyanobacterium and phosphorous-deficient
greem alga as complementary resources by daphnids". Ecology, 79: pp. 2463-2481.
DIXIT, A.S., DIXIT, S.S., SMOL, J.P., 1992. "Algal microfossil provide high temporal
resolution of environmental trends". Water Air Soil Pollution 62: pp. 75-87.
141
DOUGHERTY, J., KOHAVI, R & SAHAMI, M. 1995. Supervised and unsupervised
discretization of continuos features. Proceedings of the 12th International Conference on
Machine Learning, pp. 94-202.
DUFFY, J.E. 2002. "Biodiversity loss, tropfic skew, and ecosystem functioning". Ecol.
Lett. 6: pp. 680-687.
DUNNE, J.A., WILLIAMS, R.J., MARTINEZ, N.D. 2002. "Food web structure and
network theory: the role of connectance and size". Proceedings of the National
Academy of Sciences USA 99: pp. 12917-12922.
DUNNE, J.A., WILLIAMS, R.J., MARTINEZ, N.D. 2004. "Network structure and
robustness of marine food web". Marine Ecology Progress Series 273: pp. 291-302.
DRUMM, D., PURVIS, M., ZHOU, Q., 1999. Spatial ecology and artificial neural
networks: modelling the habitat preference of the sea cucumber (Holothuria
leucospilota) on Rarotonga, Cook Islands. The 11th Annual Colloquium of the Spatial
Information Research Center, University of Otago, Dunelin, New Zealand.
E.C., European commission. 1999. Lessons from the European commission’s
Demonstration Programme on Integrated Coastal Zone Management. European
communities: Luxembourg. 93 pp.
E.C., European commission. 2000. On Integrated Coastal Zone Management: A
Strategy for Europe. European communities: Luxembourg. 27 pp.
EPPLEY, R.W.,1972, “Temperature and phytoplankton growth in the sea”: Fish. Bull.
v.,70, pp. 1063-1085.
ESPÍNOLA, R. P., EBECKEN, N. F. F. 2000. Otimização de regras fuzzy de
classificação por algoritmos genéticos, 22nd Iberian Latin American Congress on
Computational Methods in Engineering, Campinas, 7-9 November.
EVERITT, B. S. Cluster Analysis. Halsted Press, third edition, 1993.
EVSUKOFF, A G., BRANCO, A C. S., GENTEL, S., 1997, “A Knowledge Acquisition
Method for Fuzzy Expert System in diagnosis Problems.” Proceedings of Sixth IEEE
International Conference on Fuzzy Systems, Barcelona, Spain, 1-5 July.
142
FALKOWISK, P.O., 1984, “Physiological responses of phytoplankton to natural light
regimes”.
FAO. 1997. Review of the state of world fishery resources: FAO Fisheries Circular 920.
FAO, Rome, Italy
FAYAD, U. M., IRANI, K. B. 1993. Multi-interval discretization of continuous-valued
attributes for classification learning. IJCAI-93, 1022-1027.
FENAUX, M., M. F. STRATHMANN, R. R. STRATHMANN. 1994. "Five tests of
food-limited growth of larvae in coastal waters by rates of development and form of
echinoplutei". Limnology and Oceanography 39: pp. 84-98.
FIELD, J. G., K. R. CLARKE, R. M. WARWICH. 1982. "A practical strategy for
analyzing multispecies distribution patterns". Marine Ecological Progress Series 8: pp.
37-52.
FLÖDER, S., SOMMER, U. 1999. "Diversity in planktonic communities: an
experimental test of the intermediate disturbance hypothesis". Lomnol. Oceanogr. 44:
pp. 1114-1119.
FLOREK, K., LUKASZEWIEZ, J., PERKAL, J., STEINHAUS, H., ZUBRZCHI, S.
"Sur la liason et la division des points d’un ensemble fini". Colloquium Mathematicum,
2: pp. 282-285, 1951.
FOLSE, L.J., PACKARD, J.M., GRANT, W.E., 1989. "AI modelling of animal
movements in a heterogeneous habitat" Ecological Modelling 46, pp. 57-72.
FUKUNAGA, K., Introduction to statistical pattern recognition. Academic Press, New
York, 1972.
FUNK, M., APPEL, D., ROCK, Ch., HOCHSTRASSER, D., PELLEGRINI, Ch.,
MÜLLER, A. F. Knowledge acquisition in expert system assisted diagnosis: a machine
learning appoach. In Proc. AIME-87, pages 99-103. Spring Verlag, 1989.
FUSSMANN, G., HERBER, G., 2002. "Food web complexity and chaotic population
dynamics". Ecology Letters 5: pp. 394-401.
143
GALLEGOS, C.L., PLATT, T., HARRISON, W. B., IRWIN, B., 1983. “Photosynthetic
parameters of Arctic marine phytoplankton: vertical variations and time scale of
adaptation”. Limnol. Oceanogr., v.28, pp. 698-708.
GLOVER, H.E., 1980, “Assimilation numbers in cultures of marine phytoplankton”. J.
Plank. Res., v.2, pp.69-79.
GOLDMAN, C.R., MANSON, D.T., 1962, “Inorganic precipitation of carbon in
productivity experiments utilizing carbon 14”. Science, v.136, pp.1049-1050.
GUIMARÃES, M.A., COUTINHO, R. 1996. “Spatial and Temporal variation of
benthic marine algae at the Cabo Frio upwelling region, Rio de Janeiro, Brazil”Aquatic
Botany, v. 52, pp. 283-299.
GREEN, P. E., FRANK, R. E., ROBINSON, P. J. 1967, "Cluster analysis in test market
selection". Management Science, 13(8): pp. 387-400,. Series B.
GUAN, B.T., GERTNER, G.Z., PARYSOW, P., 1997. "A framework for uncertainty
success in assessment of mechanistic forest growth models: a neural network example".
Ecological Modelling 98, pp. 47-58.
GUÉGAN, J. F., LEK, S., OBERDORF, T., 1998. "Energy availability and habitat
heterogeneity to predict global riverine fish diversity". Nature 391, 382-384.
GUILLAUME, S. 2001, “Designing fuzzy inference systems from data: an
interpretability-oriented review”, IEEE Transactions on Fuzzy Systems,v.9, n.3, pp. 426-
443.
HAN, J., KAMBER, H. 2001, Data Mining – Concepts and Techniques – Chapters 6, 7
and 8.
HANS, J. 1986. Effects of temperature and salinity on larval development of Elminius
modestus (Crustacea, Cirripedia) from Helgoland (North Sea) and New Zealand.
Helgoländer Meeresunters 40:355-376.
HARDING, L. E. 1992. "Measures of marine environmental quality". Mar. Pollut.
Bull.25, pp. 23-27.
144
HARRIS, G. P., 1983, Mixed layer physic and phytoplankton population studies in
equilibrium and non-equilibrium ecology. In F.E. Round & D.J. Chapman (eds).
Progress in Phycological Research. 2. Biopress. England: pp. 1-46.
HARRISON, W.G., PLATT, T., 1980, “Variations in the assimilation number of costal
marine phytoplankton: effects of environmental covariates”. J. Plankton Res.,v.2, pp.
249-260.
HARRISON, W.G., PLATT, T., IRWIN, B., 1982, “Primary production and nutrient
assimilation by natural phytoplankton population of the eastern Canadian Artic”. Can. J.
Fish. Aquat. Sci., v. 39, pp. 335-345.
HAYKIN, S., 2001, Redes Neurais, princípios e prática, 2a edição, Rio de Janeiro,
Bookman.
HECTOR, A. et al., (34 authors). 1999. "Plant diversity and productivity experiments in
European grassland". Science 286: pp. 1123-1127.
HERDENDORF, C.E., 1992. "Lake Erie coastal wetlands: an overview" J Gt Lakes
Res. 18: pp. 533-551.
HERRERA, F., LOZANO, M., VERDEGAY, J. L. 1995a. Fuzzy Connectives Based
Crossover Operations to Model Genetic Algorithms Population Diversity, University of
Granada Technical Report DECSAI-95110, Spain.
HERRERA, F., LOZANO, M., VERDEGAY, J. L. 1995b. A Learning Process for
Fuzzy Control Rules using Genetic Algorithms, University of Granada Technical Report
DECSAI-95108, Spain.
HILLEBRAND, H., CARDINALE., B.J. 2004. " Consumer effects dicline with prey
diversity". Ecol. Lett. 7: pp. 192-201.
HILLEBRAND, H. 2003. "Opposing effects of grazing and nutrients on diversity".
Oikos, vol. 10, No. 3, pp. 592-600.
HILLEBRAND, H. 2003. Influence of natural environmental factors on benthic diaton
communities from the Windmill Islands, Antarctica. Phycologia MAPS.
145
HILLEBRAND, H., WORM, B., LOTZE, H. 2000. "Marine macrobenthic community
structure regulated by nitrogen loading and grazing pressure". Marine Ecology Progress
Series 204: pp. 27-38.
HIRATA, H., ULANOWICZ, R.E., 1985. "Information theoretical analysis of the
aggregation and hierarchical structure of ecological networks". Journal of theoretical
Biology 116: pp. 321-341.
HIXON, M. A., P. DEE BOERSMA, MALCOLM L. HUNTER Jr., FIORENZA
MICHELI, ELLIOTT A. NORSE, HUGH P. POSSINGHAM, PAUL V. R.
SNELGROVE. Ocean at Risk: Research Priorities in Marine Conservation Biology. In
M. E. Soulé and G. H. Orians. Eds. 2001 Conservation Biology: Research Priorities for
the Next Decade. pp. 125-154. Island Press; Washington, D.C.
HOBBIE, J. E., 1 ed. Estuarine Sciences – A Synthetic Approach to Research and
Practice. Washington, DC: Island Press 2000.
HODSON, F. R. Numerical typology and prehistoric archaeology. In F. R. Hodson, D.
G. Kendall, and P. A. Taütu, editors, Mathematics in the Archaeological and Historical
Sciences. University Press, Edinburgh, 1971.
HOLLAND,J. 1975, Adaptation in Natural and Artiticial Systens. University of
Michigam Press.
HOPKINS, C.C.E. 2005. The concept of Ecosystem Health & association with the
Ecosystem approach to Management and related initiatives. ICES
BSRP/HELCOM/ENEP regional Sea Workshop on Baltic Sea Ecosystem Health
Indicators. 30 March-1April 2005. Sopot, Poland.
HOUSTIS, C., NIKOLAOU, C., PATRIKALAKIS, N. “A Coastal Zone Management
System.” Second Meeting of the Monitoring committee for the Euro-Med Co-operation.
Capri, Italy, May 1996.
HOUHOULIS, P.F., MICHENER, W.K., 2000. “Detecting Wetland Change: A Rule-
Based Approach Using NWI and SPOT-XS Data.” Photogrammetric Engineering and
Remote Sensing, 66, 2, 205-211.
146
HSU, C. N., HUANG, H. J. & WONG, T. T. (2000). Why discretization works for
naïve Bayesian classifiers. Proceedings of the 17th International Conference on
Machine Learning, pp. 309-406.
HSU, C. N., HUANG, H. J. & WONG, T. T. 2003. "Implications of the Dirichlet
assumption for discretization of continuous variables in naïve Bayesian classifiers".
Machine Learning, 53 (3), pp. 235-263.
HUISMAN, J., WEISSINg, F.J. 1999. Biodiversity of plankton by species oscilations
and chaos. Nature 402: pp. 407-410.
HUSTON, M.H. 1994. Biological diversity: the coexistence of species on changing
landscapes. Cambridge University Press, Cambridge.
INTERLAND, S.J., KILHAM, S.S. 2001. "Limiting resources and the regulation of
diversity in phytoplankton communities". Ecology, 85 (5), pp. 1270-1282.
IRIGOIEN, X., HUISMAN, J., HARIS, R.P. 2004. "Global biodiversity patterns of
marine phytoplankton and zooplankton". Nature 429: pp. 863-867.
ISHIBUCHI, H., YAMAMOTO, T., & NAKASHIMA, T. 2001. Fuzzy data mining:
Effect of fuzzy discretization. Proceedings of the 2001 IEEE International Conference
on Data Mining, pp. 241-248.
JAECKLE, W. B. 1994. "Rates of energy consumption and acquisition by lecithotrophic
larvae of Bugula neritina (Bryozoa: Cheilostomata)". Marine Biology 119: pp. 517-523.
JACKSON, J. B. C., KIRB, M. X., BERGER, W. H., BJORNDAL, K. A.,
BOTSFORD, L. W., BOURQUE, B. J. 2001. "Historical overfishing and recent
collapse of coastal ecosystem". Science 293: pp. 629-638.
JAKEMAN, A. J., BECK, M. B., McALEER, M. J. Eds. Modelling Change in
Ecological Systems. Wiley, Chicherster, 1993, 584 p.
JAPKOWICZ, N. Class imbalance: Are we focusing on the right issue? In Proceedings
of the ICML’03 Workshop on Learning from Imbalanced Data Sets, 2003.
147
JARRETT, J. N., PECHENIK, J. A . 1997. "Temporal Variation in Cyprid Quality and
Juvenile Growth Capacity for an Intertidal Barnacle". Ecology, 78 (5). pp.1262-1265.
JAYALAKSHIMI, G, A., MUTHARASU, D., RAJARAM, S., PANDIYAN, S. G.,
KANNIAPPAN, P., 2000, “An Evolutionary Programming Approach to Evolve the
Architecture of Artificial Neural Networks”.
http://www.ise.nus.edu.sg/proceedings/apros2000/fullpapers/28-06.htm
JOHNS, D. M., 1981a. Physiological studies on Cancer irroratus larvae, I. Effects of
temperature and salinity on survival, developmental rate and size, Marine Ecological
Progress Series, 5, pp. 75.
JOHNS, D. M., 1981b. Physiological studies on Cancer irroratus larvae, II. Effects of
temperature and salinity on survival, physiological performance, Marine Ecological
Progress Series, 6, pp. 309.
JONES, J.L., GOWEN, R. L., TETT, P., 1984, “Water column structure and summer
phytoplankton distribution in the Sound of Jura, Scotland”. J. Exp. Mar. Ecol. v.78,
pp.269-289.
JOSHI, M., KULMAR, V., AGRAWAL, R. Evaluating boosting algorithms to classify
rare classes: Comparison and improvements. In Proceedings of the First IEEE
International Conference on Data Mining, pages 257-264, San Jose, CA, 2001.
KAREM, A. STEIGINGER, L. M. WALKER, 1984. Marine plankton life cycles
strategies. CRC Press, Inc, Boca Raton, Florida, p.93-120.
KARR, J.R., 1981. Assessment of biotic integrity using fish communities. Fisheries 6,
pp. 21-27.
KARR, J. R. “Ecological integrity. Protecting earth’s life support systems.” In
Ecosystem Health, Costanza, R., Norton, B. G., and Haskell, B. D., Eds. Island Press,
Washington, D.C., 1992, pp. 223-238.
KAY, J.J., GRAHAM, L.A., ULANOVICZ, R.E., 1989. A detailed guide to network
analysis. Pp. 51-61 in F. Wulff, J.G. Field, and K. H. Mann. Network Analysis in
Marine Ecology: Methods and Applications. Springer-Verlag, Berlin, 248pp.
148
KAY, J.J., 1993. On the nature of ecological integrity. In: Ecological integrity and the
management of ecosystem. Pp. 201-212. St. Lucie Press.220 p.
KELLY, J.R., HARWELL< M.A., 1990. Indicators of ecosystem recovery. Environ.
Manage. 14, pp. 527-545.
KERBER, R.1992. Chimerge: Discretization for numeric attributes. Proceedings of 10th
National Conference on Artificial Intelligence, pp. 123-128.
KOHAVI, R. 1995. “A Study Of Cross-Validation and Bootstrap for Accuracy
Estimation and Model Selection”. In: The 1995 International Joint Conference on
Artificial Intelligence, pp. 1137-1145, Quebec, Canada, 20-25 August.
KONDOH, M. 2001. Unifying the relationships of species richness to productivity and
disturbance. Proc. R. Soc. Lond. Ser. B 268, pp. 269-271.
KONDOH, M. 2003. Foraging adaptation and the relationship between food-web
complexity and stability. Science 299: pp. 1388-1391.
KUBAT, M., MATWIN, S. Addressing the curse of imbalanced training sets: One side
selection. In Proceedings of the Fourteenth International Conference on Machine
Learning, pages 179-186, Nashville, Tennessee, 1997. Morgan Kaufmann.
KUTKA, F.J., BACHAMAN, M.D., 1990. Acid sensitivity and water chemistry
correlates of amphibian breeding ponds in northern Wisconsin, USA. Hydrobiologia
208: 153-160.
LANCE, G. N., WILLIAMS, W. T. 1966 A general theory of classificatory sorting
strategies. 1. hierarchical systems. The computer Journal , 9: pp. 373-380.
LEGENDRE, L., DEMERS, S., 1984, “Towards dynamic biological oceanography and
limnology”. Can. J. Fish. Aquat. Sci., v. 41, pp.2-19.
LEIBOLD, M.A. 1996. A graphical model of Keystone predators in food webs: trophic
regulation of abundance, incidence, and diversity patterns in communities. American
Naturalist 134: pp. 922-949.
149
LEK, S. ,BELAUD, A., DIMOPOULOS, I., LAUGA, J., MOREAU, J., 1995. Improved
estimation, using neural network, of the food consumption of fish populations. Marine
and Freshwater Research 46, pp. 1229-1236.
LEK, S., DELACOSTE, M., BARAN, P., DIMOPULOS, I., LAUGA, J.,
AULAGNIER, S., 1996 a. Application of neural networks to modelling nonlinear
relationships in ecology. Ecological Modelling 90, pp. 39-52.
LEK, S., BELAUD, A, BARAN, P. DIMOPOULOS, DELACOSTE, M., 1996 b. Role
of some environmental variables in trout abundance models using neural networks.
Aquatic Living Resources 9, pp. 23-29.
LEVINE, S. PILOWSKI, I. BOULTON, D. M. 1969 The classification of depression by
numerical taxonomy. The British Journal of Psychiatry, 115: pp. 937-945.
LEVINE, E.R., KIMES, D.S., SIGILLITO, V.G., 1996. Classifying soil structure using
neural networks. Ecological Modelling 92, pp. 101-108.
LEVRAT, E., BOMBARDIER, V., LAMOTTE, M., BREMONT, J. Multi-level image
segmentation using fuzzy clustering and local membership variations detection. In IEEE
International Conference on Fuzzy Systems, pages 221-8. IEEE, New York, 1992..
LEWIS, N.R.; CULLEN, J.J., PLATT, T., 1984, “Relationship between vertical mixing
and photoadaptation of phytoplankton: similarity criteria”. Mar. Ecol. Prog. Ser., v. 10,
pp.1-6.
LIU, B., and HSU, W. “Post-analysis of learned rules.” AAAI-96, pp. 828-834.
LIU, B., HSU, W., CHEN, S., MA, Y. 1998. “Integrating Classification and Association
Rule Mining”, KDD-98, August, New York.
LIU, B., HSU, W., CHEN, S., MA, Y. 2000. “Analyzing the subjective interestingness
of association Rules” IEEE Intelligent Systems, University of Singapore.
LUBCHENCO, J. 1978. Plant species diversity in a marine intertidal community:
importance of herbivore food preferences and algal competitive abilities. American
Naturalist 112: pp. 467-494.
150
LÜNNING, K., 1990, Seaweeds their environment, biogeography and ecophysiology.
New York, Wiley-Interscience.
MACCAULL, W.A., PLATT, T., 1977, “Diel variation in the photosynthetic
parameters of costal marine phytoplankton”. Limnol. Oceanogr. V. 22, pp. 723-731.
MACKAY, A., 1981. The generalized inverse. Practical Computing, (Sept.): 108-110.
MACARTHUR, R.H. 1955. Fluctuations of animal populations and a measure of
community stability. Ecology 36: pp. 533-536.
MAESTRINI, S.Y., DROOP, M.R., BONIN, D.J., 1984, Test of algae as indicator of
sea water quality: Prospects, pp 133-188. In L.E. Shubert (ed.), Algae as ecological
indicators, Academic Press, London.
MAKI, J. S., RITTSCHOF, D., MITCHELL, R. 1992. Inhibition of Larval Barnacle
Attachment to Bacterial Film: An Investigation of Physical Properties. Microbial
Ecology, 23: pp. 97-106.
MALONE, T.C. 1971, “Diurnal rhythms in netplankton and nanoplankton assimilation
ratios”. Mar. Biol. V.10, pp. 285-289.
MALONE, T.C., 1977, “Light-Saturated photosynthesis by phytoplankton size fraction
in the New York Bight. USA. Mar. Biol., v. 42, pp. 281-294.
MALOOF, M. Learning when data sets are imbalanced and when costs are unequal and
unknown. In Proceedings of the ICML’03 Workshop on Learning from Imbalanced
Data Sets, 2003.
MANEL, S., DIAS, J.M., PUCKTON, S.T., ORMEROD, S.J., 1999 a. Alternative
methods for predicting species distribution: an illustration within Himalayan river birds.
Journal of Applied Ecology 36, pp. 734-747.
MANEL, S., DIAS, J.M., ORMEROD, S.J., 1999 b. Comparing discriminant analysis,
neural networks and logistic regression for predicting species distribution: a case study
with a Himalayan river bird. Ecological Modelling 120, pp. 337-347.
MAY, R.M., 1972. Will a large complex system be stable? Nature, 238: pp. 413-414.
151
MENGE, B. A, 1975. Brood or broadcast, the adaptive significance of different
reproductive strategies in the two intertidal seastars Leptasterias hexactis and Pisaster
ochraceus, Marine Biology, 31: pp. 87.
MARGALEF, R., 1978, “Lês types biologiques de phytoplancton consideres comme
dês alternatives de survie dans um milieu instable”, Ocoanol. Acta., v. 1, n. 4, pp. 493-
509.
MARGALEF, R. 1951. Diversidad de especies en las comunidades naturales. Publ. Inst.
Biol. Apl., Barcelona, 9: pp. 15-27.
MARGALEF, R.1958. Temporal succession and spatial heterogeneity in phytoplankton.
In: Perspectives in marine biology, pp. 323-349, Ed. By A. A. Buzzati-Traverso,
California, University Press.
MARTINEZ, N.D. 1991. Artifacts or attributes? Effects of resolution on the Little Rock
Lake food web. Ecol. Monogr 61: pp. 367-392.
MARTINEZ, N.D., HAWKINS, B.A., DAWAH, H., FEIFAREK, B.P. 1999. Effects of
sampling effort on characterization of food-web structure. Nature 410: pp. 1044-1055.
MASTERS, T., 1993. Practical Neural Network Recipes in C++. Academic Press,
Harcout Brace Jovanovich, Publishers. San Diego.
MASTRORILLO, S., LEK, S., DAUBA, E., 1997. Predicting the abundance of minnow
Phoxinus phoxinus (Cyprinidae) in the River Ariège (France) using neural networks.
Aquatic Living Resources 10, 169-176.
MAY, R.M. 1973. Stability and complexity in Model Ecosystems. Princeton University
Press, Princeton.
MAY, R.M. 1972. Will a large complex system be stable? Nature 238: pp. 413-414.
MILGRAM, S. 1967. “The Small World Problem.” Psycology Today, May 1967, pp.
60-67.
152
MONACO, M.E., ULANOWICZ, R.E., 1997. Comparative Ecosystem Trophic
structure of Three U.S. Mid-Atlantic estuaries. Marine Ecological Progress Series 161:
pp. 239-254.
MONTOYA, J.M., SOLÉ, R.V. 2002. Small world patterns in food webs. J. Theor Biol.
214: pp. 405-412.
MOORE, P. A., WEISSBURG, M. J., PARRISH, J. M., ZIMMER-FAUST, R. K.,
GERHARDT, G. A. 1994. Spatial distribution of odors in simulated benthic boundary
layers flows. Journal of Chemical Ecology, vol. 20, no. 2, pp. 225-279.
MOORE, A.B., MORRIS, K.P., BLACKWELL, G.K., “COAMES – Towards a Coastal
Management Expert System” In Proceedings Ith International Conference on
GeoComputation (University of Leeds, 1996), 2: 629-646.
MOORE, A.B., MORRIS, K.P., BLACKWELL, G.K., JONES, A.R., SIMS, P.C., 2001.
“Using Geomorphological Rules to Classify Photogrammetrically-derived Digital
Elevation Models.” International Journal of Remote Sensing 7: pp. 247-262.
MOREIRA DA SILVA, P. de C., 1968, “O fenômeno da ressurgência na costa
meridional brasileira”. Publicações Inst. Pesq. Mar., v. 24, pp. 1-38.
MOREIRA DA SILVA, P.C., 1971, Fertilization on the sea as a by-product of an
industrial utilization of deep water. In: Fertility of the sea. Costlow,J.D. (ed.). Gordon &
Breach Sci. Publ. New York, Paris, T I,II.
MOREIRA DA SILVA, P. de C., 1973, “A ressurgência de Cabo Frio”. Publicações
Inst. Pesq. Mar. v. 78, pp.1-56
MOYSE, J. 1963. A comparison of the value of various flagellates and diatoms as food
for barnacle larvae. Jounal du Conseil pour l’Exploration de la Mer 28: 175-187.
NAEEM, S., THOMPSON, L.J., LAWLOR, S.P., LAWTON, J.H., WOODFIN, R.M.
1994. Declining biodiversity can alter the performance of ecosystems. Nature 368: pp.
734-737.
NAKASHIMA, T., ARIYAMA, T., ISHIBUCHI, I. 2003, “Extracting Linguistic
Knowledge and Its Use as Decision Support in a Vital Futures Market”, In: Proceedings
153
of the IEEE International Conference on Fuzzy Systems, pp. 708-713, St. Louis, USA,
25-28 May.
NCR. (National Research Council). 2000. Ecological Indicators for the Nation. National
Academy Press. Washington, DC: 164 pp.
NCSTRL Documentation - http://www.ncstrl.org/Dienst/htdocs/document_menu.html.
National computer Science Technical Report Library, Cornell University.
NIELSEN, N. O. 1999. The meaning of health. Ecosystem Health 5, pp. 65-66.
NIIMI, A., TAZAKI, E. Object oriented approach to combined learning of decision tree
and ADF GP, 1999 International Joint Conference on Neural Networks, Washington
DC, USA, 1999.
NIKOLAOU, C., HOUSTIS, C., SAIRAMESH, J., PATRIKALAKIS, N., “Impact of
Scientific Advanced Networks for Transfer of Knowledge and Technology in the field
of Coastal Zones”, EuroMediterranean Workshop on Coastal Zone Management,
Alexandria, Egypt, November 10-14, 1996.
NIKOLAOU, C., MARAZAKIS, M., PAPADAKIS, D., YEORGIANNAKIS, Y.,
SAIRAMESH, J., “Towards a Common Infrastructure for Large-Scale Distributed
Applications.” First European Conference on Research and advanced Technology for
Digital Libraries, Pisa, Italy, September 1997. URL
http://www.ics.forth.gr/~maraz/euroDL97.ps.
O’CONNOR, R.J., WALLS, T.E., HUGUES, R.M. 2000. Using multiple taxonomic
groups to index the ecological condition of lakes. Environ. Monit. Assess. 61: 207-228.
ODUM, E. 1953. Fundamentals of Ecology. Saunders, Philadelphia.
ODUM, H.T., 1983. System Ecology. Wiley Interscience, New York, 510 p.
OLIVER, F., TREMBLAY, R., BOURGET, E., RITTSCHOF, D. 2000. Barnacle
settlement: field experiments on the influence of larval supply, tidal level, biofilm and
age on Balanus amphitrite cyprids. Marine Ecological Progress Series, Vol. 199: pp.
185-204.
154
ÖZESMI, S. L., ÖZESMI, U., 1999. An artificial neural network approach to spatial
habitat modelling with interspecific interaction. Ecological Modelling 116 (1), pp. 15-
31.
PACALA, S.W., CRAWLEY, M.J. 1992. Herbivores and plant diversity. American
Naturalist 140: pp. 243-260.
PAINE, R.T. 1966. Food web complexity and species diversity. American Naturalis,
1000: pp. 65-75.
PAIVA, A.M., 1993, Estudo das variações do nível médio do mar em Arraial do Cabo-
RJ. In.Technical Report IEAPM.18-25.
PARUELLO, J.M., TOMASEL, F., 1997. Prediction of functional characteristics of
ecosystems: a comparison of artificial neural networks and regression models.
Ecological Modelling 98, pp.173-186.
PAUL, J.F., 2003. Development and applying an index of environmental integrity for
the US Mid-Atlantic region. Envieron Manage. 67: 175-185.
PAULY, D., CHRISTENSEN, V., WALTERS, C., 2000. Ecopath, Ecosim, and
Ecospace as tools for evaluating ecosystem impact of fisheries. ICES Journal of Marine
Science, 57: pp. 697-706.
PEDEYCZ, W., GOMIDE, F. 1998. An Introduction to Fuzzy Sets: Analysis and
Design, 1ª ed. Massachussets, MIT Press.
PEREIRA, G. C. 2002, Previsão da Variabilidade dos Fatores Químicos e Biológicos
em Área de Ressurgência da Arraial do Cabo através de Redes Neurais. (Rio de Janeiro
– Brasil). Tese de Mestrado, Universidade Federal do Rio de Janeiro – COPPE, RJ –
Brasil
PEREIRA, G. C., COUTINHO, R., EBECKEN, N.F.F. 2002. Biological response
neural network prediction in coastal upwelling field. Oil and Hydrocarbon Spill III,
Modelling and Analysis Control Series: Water Studies. v.1, Wit Press, ISBN 1-85312-
922-4 Rhods, Greece , pp. 301-310, September 22-24.
155
PEREIRA, G.C., BONOMO, A., EBECKEN, N.F.F. 2004. Neural network based
model to flow cytometric data interpretation. The 2004 European Simulation and
Modelling Conference. 25-27 october, Eurosis publications pp 143-147. ISBN 90-
77381-14-7.
PERSHING, A.J., GREENE, C.H., JOSSI, L., O’BRIEN, L., BRODZIAK, J.K.T.,
BAILEY, B.A., 2004. “Interdecadal variability in the Gulf of Maine zooplankton
community with potential impacts on fish recruitment.” (submitted to ICES J. Mar.
Sci.).
PERSON, K. 1901. On lines and planes of closest fit to systems of points in space.
Philosophical Magazine, Sixth Series 2: pp. 559-572.
PIATESKI-SHAPIRO, G., MATHEUS, C. “The interestingness of deviations.”KDD-
94, 1994.
PIELOU, E.C. 1966. The measure of diversity in different types of biological
collections. J. Theor. Biol., 13: pp. 133-144.
PIMM, S.L., LAWTON, J.H., COHEN, J. 1991. Food web patterns and their
consequences. Nature 350: pp.669-674.
POFF, N.L., TOKAR, S., JOHNSON, P., 1996. Stream hydrological and ecological
responses to climate change assessed with an artificial neural network. Limnology and
Oceanography 41, pp. 857-863.
POLOVINA, J.J., 1984. Model of a coral reef ecosystem. I: the ECOPATH model and
its application to French Frigate Schoals. Coral Reefs, 3: pp. 1-11.
POURVAKHSHOURI, S.Z., MANSOR, S., 2003. Decision support system in oil spill
cases (literature review) Disaster Prevention and Management, Vol. 12, no. 3, pp. 217-
221.
PROVASALI, L., 1963, Organic regulation of phytoplankton fertility, In M. M. Hill
(ed.) The Sea, Vol. 2, Intersc. Publish., New York.
PROULX, M., MAZUMDER, A. 1998. Reversal of grazing impact on plant species
richness in nutrient-poor vs. nutrient-rich ecosystems. Ecology 79: pp. 2581-2592.
156
PUNJ, G., STEWART, D. W. 1983 Cluster analysis in marketing research: Review and
suggestions for applications. Journal of Marketing Research, 20: pp. 134-48.
PYLE D., 1999, Data Preparation for Data Mining, Morgan Kaufmann Publishers, Inc.
San Francisco, California.
QUINLAN, R. C4.5: program for machine learning. Morgan Kaufmann, 1992.
RAHEL, F.J., 2000. homogenization of fish faunas across the United States. Science
288: 854- 856.
RAPPORT, D. J. State of Canada’s Environment. Environment Canada, Ottawa, ON,
1986.
RAY, G. C., McCORMICK-RAY, J. 2004. Coastal-marine Conservation: Science and
Policy. Malden, MA: Blackwell Publishing.
RECKNAGEL, F., FRENCH, M., HARKONEN, P., YABUNAKA, K., 1997. Artificial
neural network approach for modelling and prediction of algal blooms. Ecological
Modelling 96, pp. 11-28.
REICH, Y., FENVES, S. The formation and use of abstract concepts in design. In D.
Fisher, M. Pazzani, and P. Langley, editors, Concept Formation: Knowledge and
Experience in Unsupervised Learning, pages 323-54. Morgan Kaufmann, San Mateo,
California, 1991.
REINHARDT, E., WRIGHT, A H., JACKSON, D.H., 1989. An advisory expert system
for designing fire prescriptions. Ecological Modelling 46, pp. 121-133.
RICHARD, A., WICHERN, DEAN and J. Applied Multivariate Statistical Analysis.
Prentice Hall, New Jersey, third edition, 1992.
RITCHIE, J.R., 1989. An expert system for a rangeland simulation model. Ecological
Modelling 46, pp. 91-105.
ROBINSON, S.K., THOMPSON III, F.R., DONOVAN, T.M., WHITEHEAD, D.R.,
FAABORG, J., 1995. Regional forest fragmentation and the nesting success of
migratory birds. Science 267: pp. 1987-1990.
157
RODRIGUEZ, E. G., 1991, “A ressurgência de Cabo Frio (RJ, Brasil): Fertilidade e
fatores nutricionais limitantes da biomassa fitoplanctônica”. Rev. Brasil. Biol., v.51, n.2,
pp. 471-486.
RODRIGUEZ, E. G., 1994, “Yearly variation in primary productivity of marine
phytoplankton from Cabo Frio (RJ, Brazil) region”. Hydrobiologia, n. 294, pp. 145-156.
RODRIGUEZ, E. G., TENEBAUM, D. R., 1995, “Variação diurna da capacidade
fotossintética do fitoplânctom de Cabo Frio (RJ, Brasil)” Acta Biológica Leopoldina, v.
17, n.1, pp. 35-52.
RODRIGUEZ, E. G., VALANTIN, J.L., ANDRÉ, D.L., JACOB, S.A., 1992,
“Upwelling and downwelling at Cabo Frio (Brazil): Comparison of biomass and
primary production responses”. Journal of Plankton Research., v. 14, n. 2, pp. 289-306.
ROSENZWEIG, M.L. 1971. Paradox of enrichment: destabilization of exploration
ecosystems in ecological time. Science, 171: pp. 385-387.
ROSENZWEIG, M.L., ABRAMSKY, Z. 1993. How are diversity and productivity
related? Pp. 51-65 In R. E. Ricklefs and D. Schluter, eds. Species diversity in ecological
communities: historical and geographical perspectives. University of Chicago Press,
Chicago.
ROTHSCHILD, B.J. 1988. Toward a Theory on Biological-Physical Interactions in the
World Ocean, Series C: Mathematical and Physical Sciences, vol. 239, 650 pp., Kluwer
academic Publishers, The Netherlands.
RUMELHART, D.E.; HILTON, G.E., WILLIANS, R.J., 1986. “Learning
representations by back-propagation error”. Nature, v. 323, pp. 533-536.
RUNGE, J.A., FRANKS, P.J.S., GENTLEMAN, W.C., MEGREY, B.A., ROSE, K.A.,
WERNER, F.E., ZAKARDJIAN, B., 2004. “Diagnosis and prediction of variability in
secondary production and fish recruitment processes: developments in physical-
biological modelling.” The Sea. Vol. 13: The Global Coastal Ocean: Multi-Scale
Interdisciplinary Processes. A. R. Robinson and K. Brinks, eds. Havard Univ. Press.
158
RYKIEL, E.J., 1989. Artificial intelligence and expert system in ecology and natural
resource management. Ecological Modelling 46, pp. 3-8.
RYTHER, J.H., GUILLARD, R.R.L., 1959, “Enrichment experiments as a means of
studying nutrients limiting to phytoplankton production”. Deep Sea Res., v. 6, pp. 65-
69.
SANTOS, D.P., 1996, Distribuição espacial e temporal de propágulos de macroalgas
marinhas e sua relação com o recrutamento no costão na região de Arraial do Cabo e
adjacências. Tese de D.Sc., Universidade de São Paulo, S.P., Brasil.
SATSMADJIS, J., 1982. Analysis of benthic fauna and measurement of pollution.
Revue Internationale Oceanographie Medicale 66-67, pp. 103-107.
SCARDI, M., 1996. Artificial Neural Networks as empirical models for estimating
phytoplankton production. Marine Ecological Progress Series 139, pp. 289-299.
SCIENCE 1999. special issue, Vol. 284, no. 5411,
(http://www.sciencemag.org/content/vol284/issue5411).
SHANNON, L.J., CURY, P.M., JARRE, A., 2000. Modelling effects of fishing in the
Southern Benguela ecosystem. ICES Journal of Marine Science, 57: pp. 720-722.
SHERMAN, K. 2000 Why regional coastal monitoring for assessment of ecosystem
health? Ecosystem Health 6, pp. 205-216.
SILBERSCHATS, A , TUZHILIN, A “What makes patterns interesting in knowledge
Discovery systems.” IEEE Trans. On KNOW. And Data Eng. 8 (6), 1996, pp.970-974.
SIMBERLOFF, D., 1997. Flagship, umbrellas, and Keystones: is single species
management passé in the landscape era? Biol. Conservation 83, pp. 247-257.
SKINNER, L.F., COUTINHO, R., 2002. Preliminary results on settlement of the
barnacles Tetraclita stalactifera and Chthamalus bisinuatus on a Brazilian tropical
rocky shore under upwelling conditions. Invertebrate Reproduction and Development,
41:1-3, pp. 151-156.
159
SMAYDA, T.J., 1970, “Growth potential Bioassay of water masses using diatoms
culture. Phosphorescent Bay (Puerto Rico) and Caribbean waters”. Helgoland. Wiss.
Meeresunters., v. 20, pp. 172-194.
SMAYDA, T.J., REYNOLDS, C.S., 2001. Community assembly in marine
Phytoplankton: Application of Recent Models to Harmful Dinoflagellate Blooms.
Journal of Plankton Research vol. 23, no. 5, pp. 447-461.
SMILEY, B., THOMAS, D., DUVALL, W., EADE, A. State of the Environmental
Reporting. Selecting Indicators of Marine Ecosystem Health: A Conceptual Framework
and an Operational Procedure. Environment Canada, Occasional report series no. 9,
Environment Canada, Ottawa, ON, 1998, 33 p.
SMITH, J.C.. PLATT, T., LI, W.K.W., HORNE, E. P. W., HARRISON, W. G.,
SUBBA, RAO, D.W., IRWIN, D. W., 1985, “Artic marine photoautotrophic
picoplankton. Mar. Ecol. Prog. Ser., v. 20, pp. 207-220.
SOLÉ, R.V., MONTOYA, J.M. 2001. Complexity and fragility in ecological networks.
Proc. R Soc. Lond. B 268: pp. 2039-2045.
SOLORZANO, L., STICKLAND, J.D.H, 1968, “Polyphosphate in sea waters”. Limnol.
Oceanogr., v. 13, pp. 515-518.
SOMMER, U. 1999. The impact of herbivore type and grazing pressure on benthic
microalgal diversity. Ecol. Lett. 2: pp. 65-69.
SOKAL, R. R., SNEATH, H. A. Principles of numerical taxonomy. W. H. Freeman,
San Francisco, 1963.
SORENSEN, T. 1948. A method of establishing groups of equal amplitude in plant
sociology based on similarity of species content and application to analyses of
vegetation on Danish commons. Biol. Skr, 5: pp. 1-34.
SPEARMAN, C. 1904. “general Intelligence”, objectively determined and measured.
American Journal of Phycology,15: pp. 201-293.
SRIKANT, R. and ARRAWAL, R. “Mining generalized associations rules.” VLDB-95,
1995.
160
STARFIELD, A M., FARM, B.P., TAYLOR, R.H., 1989. A rule-based ecological
model for the management of an estuarine lake. Ecological Modelling 46, pp. 107-119.
STEINER, C.F. 2001. Effects of prey heterogeneity and consumer identity on the
limitation of trophic-level biomass. Ecology 82: pp. 2495-2506.
STERNER, R.W., ELSER, J.J. 2002. Ecological stoichiometry: the biology of elements
from molecules to the biosphere. Princeton University Press.
STICHLAND, J.D.H., PARSONS, T. R., 1968, “A practical handbook of sea water”. J.
Fish. Res. Bd. Can. Bull., v. 167, pp. 311.
STONEBRAKER, M., CHEN, J., NATHAN, N., PAXTON, C., WU, J., “Tioga:
Providing Data Management Support for Scientific Visualization Applications.” In R.
Agrawal, S. Baker, D. Bell (Eds.), Palo Alto, California, Morgan Kaufmann Publishers
1993.
STROGATZ, S.H. 2001. Exploring complex networks. Nature 410: pp. 268-276.
TAKAHASHI, M.,BIEFANG, P. K., 1983, “Size structure of phytoplankton biomass
and photosynthesis in subtropical Hawaii”. Mar. Biol., v.76, pp. 203-211.
TAMBURRI, M. N., ZIMMER-FAUST, R. K., TAMPLIN, M. L. 1992. Natural
Sources and Properties of Chemical Inducers Mediating Settlement of Oyster Larvae: A
Re-examination. Bioll. Bull. 183: pp. 327-338.
TAN, S. S., SMEINS, F.E., 1996. Predicting grassland communities changes with an
artificial neural network model. Ecological Modelling 84, pp. 91-97.
TILMAN, D., REICH< P.B., KNOPS, J., WEDIN, D., MIELKE, T., LEHMAN, C.
2001. Diversity and productivity in a long-term grassland experiment. Science 294: pp.
843-845.
TUHILL, G. S. Knowledge engineering : concepts and practices for knowledge-based
systems. Tab Books Inc., 1989.
ULANOWICZ, R.E., 1986. Growth and development: ecosystem phenomenology.
Springer-Verlag, New York. 203 p.
161
VALANTIN, J.L., 1974, O plâncton na ressurgência de Cabo Frio (Brasil). II
Primeiras observações sobre a estrutura física, química e biológica das águas da
estação fixa (período 04/02 a 16/04/73). Inst. Pesq. Mar. Rio de Janeiro.
VALANTIN, J.L., MOREIRA, A.P., 1978, “A matéria orgânica de origem
zooplanctônica nas águas de ressurgência de Cabo Frio. (Brazil)”. Nac. Acad. Brás.
Ciênc., Rio de Janeiro, v. 50, n.1,pp.103-112.
VALANTIN, J.L., ANDRÉ, D.L., JACOB, S.A., 1987, “Hydrobiology in Cabo Frio
(Brazil) upwelling: two-dimensional structure and variability during a wind cycle”.
Continental Shelf Research. v. 7, n. 1, pp. 77-88.
VALANTIN, J.L., 1988, A dinâmica do plâncton na ressurgência de Cabo Frio-RJ.
Inst. Pesqui. Mar., Rio de Janeiro. Coletânea de trabalhos, In: F.P. Brandini (editor)
Memórias de III EBP Curitiba, 1989.
VALANTIN, J.L., COUTINHO, R., 1990, “Modelling maximum chlorophyll in the
Cabo Frio (Brazil) upwelling: a preliminary approach”. Ecol. Modelling., v. 52, pp.
103-113.
VALANTIN, J.L., MACEDO-SAIDAH, F.E., TENENBAUM, D.R., SILVA, N.M.L.,
1991. A diversidade específica para a análise das sucessões fitoplanctônicas, aplicação
ao ecossistema da ressurgência de Cabo Frio (RJ). Nerítica, Curitiba, n 6 (1-2), pp. 7-26.
editora UFPR.
VANDERMEULEN, H. The development of marine indicators for coastal zone
management. Ocean Coast. Manage. 39, 63-71, 1998.
VARIELLA, I., 1994, Marine Ecological Process, Spring Verlag.
VISA, S., RALESCU, A. Learning imbalanced and overlapping classes using fuzzy
sets. In Proceedings of the ICML’03 Workshop on Learning from Imbalanced Data
Sets, 2003.
VRML. Virtual Reality Modeling Language – http://hiwaay.net/~crispen/vrml/fag.html
162
WALTERS, C., 1996. Suggested improvements for Ecopath modeling. In Mass-Balance
Models of North-Eastern Pacific Ecosystem, pp. 82-86. Ed. D. Pauly and V.
Christensen. Fisheries Center Research Reports 4(1).
WARD, J. H. Hierarquical grouping to optimize an objective function. Journal of the
American Statistical Association, 58: 236-244, 1963.
WATTS, D., STROGATZ, S. 1998, “Collective dynamics of small-world networks.”
Nature 393: pp. 440-442.
WEISS, G. Mining with rarity: A unifying framework. SIGKD Explorations, 6(1): 7-19,
2004.
WEISS, S.M., KULIKOWSKI, C.A., 1984. A Practical Guide to Designing Expert
Systems. Rowman and Allenheld: Totawa NJ.
WEST, T. L., J. D. COSTLOW, 1987. Size regulation in the crustacean Balanus
eburneus (Cirripedia: Thoracica). Marine Biology 96: pp. 47-58.
WHITTIER, T. R., PAULSEN, S.G., LARSEN, D.P., PETERSON, S.A., HERLIHY,
A.T., KAUFMANN, P.R. 2002. Indicators of ecological stress and their extent in the
population of northeastern lakes: a regional assessment. BioScience 52: 2pp. 35-247.
WIECZOREK, S. K., TOOD, C. D., 1998. Biofilm cues and larval settlement.
Biofouling 12: 81-118.
WINEMILLER, K.O. 1990. Spatial and temporal variation in fish trophic networks.
Ecol. Monogr. 60: pp. 331-367.
WIKIPEDIA ENCYCLOPEDIA 2005. http://em.wikipedia.org/wiki/Complex_system
WILLIAMS, R.J., BERLOW, E.L., DUNNE, J.A., BARABÁSI, A.L., MARTINEZ,
N.D. 2001. Two degree of separation in complex food webs. Santa Fe Institute Working
Paper 01-07-036.
WILSON, E.O. 2003. What is nature whorth? In Allem J.L., ed. Annual editions:
Environment 03 / 04. Gilford, C.T: McGrow-Hill/Dushkin. Pp. 121-130.
163
WOLLENWEIDER, R. A., GIOVANARDI, F., MONTANARI, G., RINALDI, A.
1998. Characterization of trophic conditions of marine coastal waters with special
reference to the NW Adriatic Sea: proposal for a trophic scale, turbidity and generalized
water quality index. Environmetrics 9, pp. 329-357.
WOODRUFF, A.G. 1994. “GIPSY: Geo-referenced Information Processing System,”
Journal of the American society for Information Science, 45, pp. 645-655.
WOODRUFF, A.G., Automated Geographic Indexing of Text Documents (sequoia
2000 technical Report 94/41). Berkeley, Cal, University of California, EECS, 1994.
WORM, B.H., LOTZE, H., HILLEBRAND, H., SOMMER, U. 2002. Consumer versus
resource control of species diversity and ecosystem fuctioning. Nature 417: pp. 848-
851.
WU, X. 1999. Fuzzy interpretation of discretized intervals. IEEE Transactions on Fuzzy
Systems, 7 (6), pp. 753-759.
YANG, Y. & WEBB, G. I. 2002. Non-disjoint discretization for naïve Bayes classifiers.
Proceedings of the 19th International Conference on Machine Learning, pp. 666-673.
YANG, Y. & WEBB, G. I. 2004. Discretization for naïve-Bayes learning: Managing
discretization bias and variance.
YAO, X. 1993 A review of evolutionary artificial neural networks. International
Journal of Intelligent Systems. 8(4): pp. 539-577.
YODZIS, P., WINEMILLER, K.O., 1999. In search of operational trophospecies in a
tropical aquatic food web. Oikos 87: pp. 327-340.
YONESHIGUE, Y., 1985, Taxonomie et écologie des algues marines dans la région de
Cabo Frio (Rio de Janeiro, Brésil). Ph.D. dissertation, Université de Marseille, France.
ZADEH, L. A. 1973 Outline of a new approach to the analysis of complex systems and
decision processes. IEEE Transactions on Systems, and Cybernetics,3(1): pp. 28-44.
164
APÊNDICE
Questionário aplicado aos especialistas entrevistados:
1) Como funciona a ressurgência no universo dos dados disponíveis?
2) Quais as relações existentes entre clorofila e as larvas meroplanctônicas?
3) Pode existir alguma relação entre fatores físicos e as larvas (temperatura,
salinidade pH, etc.)? Explique dando exemplos se possível.
4) Pode existir alguma relação entre concentração de nutrientes e larvas? Explique.
5) Na sua opinião, como se dão as relações entre os diversos tipos de larvas?
Existe alguma predominância em relação a presença de algumas espécies em
conseqüência de diferentes condições ambientais, coexistência, competição, ou
alguma alternância de padrões em relação as massas d’águas, etc.
6) Gostaria de acrescentar algo que você acha ser relevante que não tenha sido
perguntado?
Segue-se com a entrevista do Dr. Ricardo Coutinho, pesquisador do IEAPM e
responsável pelo setor de bioincrustação.
R1) O Dr. Ricardo Coutinho acha que no local em que são coletados as amostras para se
obter os dados ocorre muito pouca ressurgência e que considerando-se que esta é
caracterizada por águas com temperaturas abaixo 18 C°, constitui fenômeno raro.
Segue dizendo que por ser um local de pouca profundidade (5 ou 6 metros) a coluna
d’água é homogênea e que quando se observa alguma estratificação se deve à
penetração de águas de ressurgência através do canal do “boqueirão”. Sendo assim, o
comum é ter águas de origem de ressurgência que sofreram algum aquecimento mas
apresentam claramente características em termos de salinidade e nutrientes de água de
ressurgência. Estes parâmetros são mais conservativos.
R2) As águas de ressurgência (ou as “águas esquentadas”) são normalmente
caracterizadas por níveis mais elevados de nutrientes, então, inicialmente não se verifica
uma alta produção de clorofila. Quando se analisa águas de superfície com 16 ou 17
165
graus, verifica-se baixos valores de clorofila, a produção somente ocorre depois que o
fitoplâncton “chega” a superfície e aí começa o crescimento que pode durar um dois ou
quatro dias dependendo da intensidade da ressurgência. O local estudado por ser
“parado”, pode apresentar alguns valores mais altos de clorofila mas, na verdade, veio
do lado de fora da ilha e penetrou ali com a massa d’água.
Entrevistador – Então, na sua opinião, a produção primária não ocorre no ponto de
coleta dos dados e sim originada noutro local?
Ricardo – Sim, ela é oriunda de outro local.
Entrevistador – E a relação entre as larvas meroplanctônicas e essa clorofila?
Ricardo – Normalmente essa relação depende da espécie. Algumas delas possuem um
ciclo de desenvolvimento no plâncton muito rápido, ascídias por exemplo, neste caso
não há uma relação direta pois já tem seu conteúdo alimentar dentro dela mesma e então
não precisa da clorofila, pode-se dizer que não é uma larva herbívora. Já as larvas de
cirripédios, demonstram intensa atividade de filtração durante seu longo período de
permanência no plâncton (dois meses), sendo assim, pode-se atribuir que maiores
concentrações de clorofila podem acelerar o seu desenvolvimento (seis estádios) até
chegar a fase de cipris. Normalmente, apenas as formas naupliares se alimentam no
plâncton, o cipris já passou por essas fases de metamorfose e não se alimenta mais no
plâncton.
Entrevistador – Já é uma pré-competência?
Ricardo – É uma pré-competência, então não tem tanta relação de alimentação quanto se
tem na fase de nauplios.
Entrevistador – As larvas coletadas no local estudado também viriam de outros locais
junto com essa produção primária que segundo o senhor é oriunda de outros locais?
Ricardo – Não, essas larvas vem dos costões rochosos, são larvas de organismos
bentônicos que são liberadas ali mesmo nas imediações. Em sistemas mais dinâmicos,
as larvas vem de várias fontes, em sistemas mais estáveis, enseadas como no caso em
questão, as larvas vem mais localizadas. No local estudado tem-se correntes muito
atuantes, então as larvas viriam pelos dois processos inclusive empurradas pelo vento já
que ocorrem junto a superfície, neste caso pode-se ter um acumulo de larvas que não é
decorrente da produção local e sim de outros locais.
Entrevistador – A concentração de larvas é então devido a fatores físicos?
166
Ricardo – Exatamente, fatores físicos e não biológicos.
Entrevistador – E quanto as interações? Existe alguma exclusão por tamanho em
relação ao alimento, já que o ponto de amostragem encontra-se em zona muito nerítica,
muito perto de uma praia, portanto com possível dominância de populações de
diatomáceas
Ricardo – Não.
Entrevistador – Melhor dizendo, pode-se ter uma dominância de algumas populações de
larvas devido a diferentes composições das populações fitoplanctônicas?
Ricardo – Não, não, as larvas não são seletivas neste nível.
Entrevistador – Bem, falando agora dos nutrientes químicos, o senhor acha que existem
relações entre os nutrientes e as larvas? Uma vez que as larvas estão inseridas num
contexto de massas d’água em que as condições do habitat apresentam diferentes
concentrações de diferentes nutrientes, teriam alguma preferência por determinadas
características ambientais ou não?
Ricardo – Bem, se você tivesse um sistema em que as massas d’águas fossem bem
separadas, bem distintas, poder-se-ia ter uma caracterização direta entre o fito e a
produção planctônica e as larvas no caso da ressurgência ... quando se tem muita
clorofila, uma maior produção de fitoplâncton, vai ter depois uma maior de larvas, o que
se tem mesmo de produção está na realidade relacionado com o zooplancton e não tão
diretamente com o merozooplancton, é importante distinguir. O meroplancton (larvas),
é liberado de acordo com outros fatores, pode estar influenciado principalmente pela
temperatura então, águas com altos níveis de clorofila derivadas de águas com altos
níveis de nutrientes podem aumentar processo de liberação de larvas e seu
desenvolvimento das larvas.
Entrevistador – Então a que fator o senhor atribui uma maior concentração de larvas?
Ricardo – à desova influenciada pela temperatura e alimentação.
Entrevistador – Durante quanto tempo pode ocorrer esta desova?
Ricardo – O organismo adulto pode ficar desovando durante uma semana, dependendo
da maré. Após a maré baixa, quando se tem a maré alta as larvas são liberadas por
causa de um tipo de ... não é bem um estresse, tem-se um tipo de modificação para que
isso ocorra.
167
Entrevistador – Na sua opinião, como se dão as relações entre os diversos tipos de
larvas, quero dizer, existe predominância de um tipo em relação a outros, são
competidoras, coexistem, compartilham ou fragmentam o nicho ecológico? O senhor já
detectou algum tipo de padrão de curto ou longo prazo?
Ricardo – É difícil dizer, porque existem níveis de saturação diferentes para cada
espécie então, uma espécie que tenha saturação de um determinado fator pode estar
limitada por isso e não limitada por outro como por exemplo, o tipo de alimento, então a
combinação destes vários fatores limitantes é que possibilita a coexistência. Uma larva
poderia comer tudo e não sobrar nada para outra, só que ela normalmente reduz o
alimento naquilo que é mais limitante para ela mesma e não para a outra.
Entrevistador – Então ela é seletiva!
Ricardo – É seletiva no sentido de reduzir o fator em que se ela reduzir muito ela
própria vai morrer, e não no que a outra vai comer, por isso ela não exerce uma
competição de exclusão mas sim de um equilíbrio estável dependendo da situação, com
a renovação das águas é o que acontece. Então a presença de uma larva, a não ser em
caso de exclusão competitiva, não necessariamente deveria estar associado a presença
de outra. A não ser que possuam exigências fisiológicas semelhantes de existência.
Entrevistador – Na sua opinião, no ponto de amostragem, pode ocorrer valores baixos
de oxigênio dissolvido devido a grande mortalidade de fitoplâncton?
Ricardo – Se for em grande escala, poderia afetar sim.
Segue-se agora com a entrevista da Dra. Vanda Maria Cordeiro Ribas pesquisadora do
IEAPM há trinta anos.
R1) Vanda - O afloramento das águas frias da ACAS se dá por causa principalmente do
vento nordeste que afasta da costa a Corrente do Brasil e da pequena faixa de
plataforma continental que aqui em Cabo Frio é muito próxima da linha costeira. Os
nutrientes então darão a possibilidade de maior florescimento algal, alimento
conseqüentemente a proliferação de animais numa seqüência primeira de herbívoros
principalmente os copépodos que são os mais abundantes aparecem em grandes
quantidades.
168
Entrevistador – Você fala de copépodos mas quanto aos decapodas meroplanctônicos?
Vanda – Neste caso refere-se as larvas de siris, carangueijos e camarões também,
especificamente é mais complicado, porque tem um grande número de espécies que
estão desovando durante o período, não é só no período de ressurgência, porque
depende da espécie que se esteja considerando. Por exemplo, se está-se focando uma
larva abundante como as de cirripédios, existem várias espécies desse grupo como
também diversas espécies de mitilideos, então, quando não se esta em nível específico
fica complicado para determinar a massa d’água com a abundância desses organismos.
Isso vem acompanhado de um número enorme desde foraminíferos,que são
protozoários, hidromeduzas, cnidários, várias larvas.
Entrevistador – Na sua opinião, você acha então que não se deve trabalhar com níveis
taxonômicos muito elevados, por exemplo, acima de família em um programa de
monitoramento ambiental?
Vanda – Acho que não, populações ó podem ser determinadas por espécies.
Entrevistador – Quais as relações existentes entre massas d’águas e clorofila ?
Vanda – Se a massa d’água tem mais nutrientes a clorofila vai ter de aumentar de modo
geral.
Entrevistador – A clorofila demora muito a responder a um aumento de nutrientes?
Vanda – Não, a coisa é quase imediata, mais ou menos uma hora, mas é muito variável
porque cada espécie tem seu próprio tempo de resposta.
Entrevistador – Então a clorofila é um conjunto de populações? Talves para se
monitorar as larvas a clorofila não seria uma boa estratégia porque as larvas são
seletivas o nível de alimento ?
Vanda – É, dentro dessas populações (de larvas) tem tamanhos diferentes de absorção
de partículas que estão no meio, quando se extrai a clorofila não se tem indicação a
quem pertence este pigmento e não se pode relacionar com os animais que ali estavam
presentes. Existem trabalhos que medem o tamanho da “boca” do copépodo para poder
dizer que tamanho de partícula ele pode ingerir.
Entrevistador – Então, refrindo-se as larvas meroplanctônicas você acha que podem
existir situações de exclusão alimentar devido a diferenças de tamanhos de alimento ?
169
Vanda – Acho que sim, se você se baseia pelo tamanho do orifício de absorção ou
“boca” o tamanho do alimento tem de variar.
Entrevistador – Essas larvas são seletivas pelo alimento ao nível de espécie e condições
nutricionais ?
Vanda – Sim eu acho.
Entrevistador –. Você quer dizer que elas pastam em algumas espécies e não em outras?
Vanda – Sim, elas podem selecionar e isto está relacionado ao tamanho, dependendo do
tamanho ela vai ingerir.
Entrevistador – A ocorrência das larvas meroplactônicas no ponto de amostragem é em
sua opinião oriundas de desovas de organismos adultos do próprio costão rochoso da
ilha ou vem de outros lugares ?
Vanda – Tem da ilha e tem da massa d’água que entra ali.
Entrevistador – As larvas são sensíveis as condições físicas e químicas da água, podem
ser seletivas as características do habitat ?
Vanda – Não tenho experiência quanto a esta questão especificamente então, não
saberia responder.
Entrevistador – E sobre possíveis relações entre as diversas populações de larvas, elas
competem entre si ?
Vanda – Não sei dizer se competem a ponto de impedir o desenvolvimento de outra de
grupos diferentes. Mas é claro que competem por alimento, vão competir, no
ecossistema existe isso, mas não sei se uma que seja maioria exerce uma exclusão
competitiva, acho que tudo tem um equilíbrio. A própria especificidade pelo alimento
propicia a coexistência.
Entrevistador – Você já notou se existem diferentes composições de populações de
larvas em diferentes massas d’águas ?
Vanda – É, pode ser, quando você tem uma região costeira, na região oceânica elas são
muito poucas, na ACAS tem menos, eu acho que a água fria nem tanto proporciona uma
desova tão grande. A maioria delas são de águas mais quentes. Eu acho que a ACAS
não tem muitas larvas.
Entrevistador – E quanto a salinidade e o oxigênio?
170
Vanda – Na Corrente do Brasil a salinidade é mais alta e tem mais matéria orgânica que
as larvas também se alimentam.
Larvas também comem matéria orgânica ?
Vanda – Ah!, tudo que estiver fragmentado elas filtram, então elas comem, pode não ser
o alimento preferido...
Entrevistador – Briozoário é sorte de pegar na amostragem ?
Vanda – É, o ciclo de vida é muito rápido, 15 min., o não aparecer não quer dizer que
não existe, é nós que não pegamos.
Segue-se com a entrevista com o Dr. Jean Louis Valatim atualmente professor
de biologia marinha da UJRJ e pesquisador aposentado IEAPM.
Entrevistador – Professor, como funciona a ressurgência de arraial do Cabo e quais suas
implicações biológicas ?
Jean – Lá em Cabo Frio o aspecto mais importante é o vento nordeste que é sazonal e
ocorre principalmente durante o verão, por causa da conformação da costa há uma
divergência da Corrente do Brasil. A conseqüência é a entrada de energia mineral
provocando uma produção primária e a cadeia alimentar.
Entrevistador – O senhor conseguiria me descrever em formas de regras quais nutrientes
estão relacionados com a clorofila ?
Jean – Ah! Sim, nitrato e fosfato, toda a produção primária é devido a entrada desses
dois nutrientes.
Entrevistador – Qual a relação entre as larvas meroplanctônicas e a clorofila ?
Jean – A clorofila é a expressão do fitoplancton e as larvas comem fitoplancton. Quanto
mais clorofila tiver mais fitoplancton ter e mais herbívoro também.
Entrevistador – Poderia me dizer alguma relação que possa existir entre as larvas e
fatores físicos ?
Jean – A salinidade influencia as larvas mas na ilha não tem rios por perto então a
influência não é marcante. Você me diz que o seu maior valor de Ph é de 10.4 o que eu
acho que é um dado errado, mas o Ph também exerce influências nas larvas.
171
Entrevistador – E quanto a concentração de oxigênio, esta variável apresenta um único
valor de 1,32, também seria um valor que está errado ou isso pode realmente acontecer
?
Jean – Pode sim, se tiver uma de grande produção. Você está trabalhando num lugar
que é na realidade um micro-habitat devido as características locais.
Entrevistador – O senhor poderia me dizer algo sobre o nitrito ? Minhas análises
demonstram sempre uma maior significância desta em relação ao nitrato e a amônia ?
Jean – O nitrito aparece normalmente muito baixo ou quando tem muita matéria
orgânica e é um produto da transformação da amônia para o nitrato pelas bactérias. A
via normal é de matéria orgânica para amônia seguido-se do nitrito e depois o nitrato
mas os picos de concentração não aparecem simultâneos existe uma defasagem.
Segue-se com a entrevista com a bióloga Jurema Trindade Quintanilha que
trabalha no IEAPM a 15 anos e uma das principais pesquisadoras que contam as
amostra.
Entrevistador – O que a senhora poderia me destacar como sendo importante no seu
trabalho de contagens das amostras e das larvas ?
Jurema – O que posso citar é que eu não consigo encontrar sazonalidade nos resultados
encontrados como alguns de meus colegas afirmam.
Entrevistador – Seu trabalho é fundamentalmente o de identificação e contagem das
larvas, então a senhora poderia me dizer se existe qual espécie é normalmente a mais
abundante ?
Jurema – Normalmente a mais abundante são as larvas de cirripédia, quando ela ocorre
junto com as outras é a mais abundante. Mas tem amostras que eu não acho essas
larvas.
Entrevistador – A que você atribui este fato ?
Jurema – A fatores físico-químicos da água ou a época do ano, o que está acontecendo
no meio ambiente entendeu! Tem períodos que ocorre muitos salpas ou ctenóforos e
quando isso ocorre a gente não consegue encontrar larvas nas amostras.
Entrevistador – Você acha que as salpas e os ctenóforos comem as larvas ?
172
Jurema – Podem comer – Fabiana, outra pesquisadora concorda pois são filtradores e
predadores e que a presença destes dois está ligada a temperaturas mais frias, Jurena
acena confirmando também.
Segue-se com a entrevista de Fabiana Figueiredo Silva pesquisadora do IEAPM
que trabalha na identificação e contagem de plâncton.
Entrevistador – Fabiana, como funciona a ressurgência no seu entender ?
Fabiana – ocorre devido a uma topografia especial da costa e do vento nordeste que faz
as águas da corrente do Brasil derivarem para alto mar e o afloramento da ACAS que
aumenta a concentração de nutrientes.
Entrevistador – Você poderia me dizer alguma relação existente entre as massas d’água,
nutrientes e a clorofila ?
Fabiana – O que eu percebo é que dependendo da massa d’água tem mais nutriente e
então a clorofila aumenta. O aumento da clorofila está ligado a águas com temperatura
mais fria. Na ressurgência tem mais clorofila mas nas águas da ACAS tem pouca
quantidade de larva.
Entrevistador – Essas larvas comem esta clorofila ?
Fabiana – Acho que algumas sim, outras não.
Entrevistador – Tem larvas que não comem por não serem herbívoras ?
Fabiana – Não, não comem por causa do tamanho , palatabilidade, seletividade.
Entrevistador – O que você pode ressaltar sobre fatores físicos e as larvas ?
Fabiana – certamente tem mais a ver com a temperatura.
Entrevistador – Existe alguma predominância de algum grupo ?
Fabiana – Eu acho, cirripédia, mitilídeo e decapoda.
Entrevistador – Você conhece relações mais específicas como competição ou exclusão
entre as larvas?
Fabiana – Quando tem mais cirripédia a larva do mitilídeo diminui né! mas não sei se é
uma regra, não sei se elas competem por espaço, por comida etc.
173
Entrevistador – Existe algum padrão sazonal ou de longo prazo que você poderia me
dizer ?
Fabiana – Não sei, mas depois que eu cheguei aqui teve o “el nono” teve “la nina”, qual
padrão ? Teve uma vez em que a ressurgência não aconteceu no período que ela deveria
acontecer e isso deve afetar a vida das larvas de alguma forma.
174
ANEXO
5
10
15
20
25
30
3594 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04
Temperatura oC
Figura 3.1a - Flutuação interanual da Temperatura.
21.0
21.5
22.0
22.5
23.0
23.5
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Temperatura oC
Figura 3.1b - Variação das médias interanuais da Temperatura
175
20
25
30
35
40
45
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04
Salinidade g/l
Figura 3.2a - Flutuação interanual da Salinidade.
34.034.234.434.634.835.035.235.435.635.836.036.2
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Salinidade g/l
Figura 3.2b - Variação das médias interanuais da Salinidade.
176
0
1
2
3
4
5
6
7
8
9
10
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04
Oxigênio ml/l
Figura 3.3a - Flutuação interanual dos valores de Oxigênio.
5.0
5.1
5.2
5.3
5.4
5.5
5.6
5.7
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Oxigênio ml/l
Figura 3.3b - Flutuação das médias interanuais de Oxigênio.
177
0
0,5
1
1,5
2
2,5
3
3,5
4
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04
Fosfato ug/l
Figura 3.4a - Flutuação interanual dos valores de Fosfato.
0,0
0,1
0,1
0,2
0,2
0,3
0,3
0,4
0,4
0,5
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Fosfato ug/l
Figura 3.4b - Variação das médias interanuais de Fosfato.
178
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04
Nitrito ug/l
Figura 3.5a – Flutuação interanual dos valores de Nitrito.
0,0
0,0
0,0
0,1
0,1
0,1
0,1
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Nitrito ug/l
Figura 3.5b – Variação das médias interanuais de Nitrito.
179
0
2
4
6
8
10
12
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04
Nitrato ug/l
Figura 3.6a – Flutuação interanual dos valores de Nitrato.
0,00,10,20,30,40,50,60,70,80,91,0
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Nitato ug/l
Figura 3.6b – Variação das médias interanuais de Nitrato.
180
0
1
2
3
4
5
6
7
94 95 95 96 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04
Amônia ug/l
Figura 3.7a – Flutuação dos valores interanuais de Amônia.
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
1,6
1,8
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Amônia ug/l
Figura 3.7b – Variação das médias interanuais de Amônia.
181
4
5
6
7
8
9
10
11
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04
Ph
Figura 3.8a – Flutuação interanual dos valores de Ph.
7,37,47,57,67,77,87,98,08,18,28,38,4
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Ph
Figura 3.8b – Variação das médias interanuais de Ph.
182
0
1
2
3
4
5
6
7
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04
Clorofila-a mg/l
Figura 3.9a – Flutuação interanual dos valores de Clorofila-a.
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Clorofila-a ml/l
Figura 3.9b – Variação das médias interanuais de Clorofila-a.
183
0
500
1000
1500
2000
2500
3000
3500
4000
94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04
Cirripedia org/m3
Figura 3.10a – Flutuação interanuais da ocorrência de sub-classe Cirripedia.
0,0
50,0
100,0
150,0
200,0
250,0
300,0
350,0
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Cirripedia org/m3
Figura 3.10b – Variação das ocorrências médias interanuais da sub-classe Cirripedia.
184
01000
20003000
40005000
60007000
80009000
10000
94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04
Mytilidae org/m3
Figura 3.11a- Flutuação interanuais da família Mytilidae.
0,0
50,0
100,0
150,0
200,0
250,0
300,0
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Mytilidae org/m3
Figura 3.11b - Variação das ocorrências médias interanuais da família Mytilidae.
185
0
100
200
300
400
500
600
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04
Decapoda org/m3
Figura 3.12a – Flutuação interanual da ordem Decapoda.
0,0
5,0
10,0
15,0
20,0
25,0
30,0
35,0
40,0
45,0
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Decapoda org/m3
Figura 3.12b – Variação das ocorrências médias interanuais da ordem Decapoda.
186
0
200
400
600
800
1000
1200
1400
1600
1800
94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04
Polychaeta org/m3
Figura 3.13a – Flutuação interanual da classe Polychaeta.
0,0
5,0
10,0
15,0
20,0
25,0
30,0
35,0
40,0
45,0
50,0
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Polychaeta org/m3
Figura 3.13b – Flutuação das ocorrências médias interanual da classe Polychaeta.
187
0
500
1000
1500
2000
2500
94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04
LD org/m3
Figura 3.14a – Flutuação interanual das Larvas em D.
0,0
20,0
40,0
60,0
80,0
100,0
120,0
140,0
160,0
180,0
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
LD org/m3
Figura 3.14b – Variação das ocorrências médias interanuais das Larvas em D.
188
0
200
400
600
800
1000
1200
94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04
Ostreidae org/m3
Figura 3.15a – Flutuação interanual dos valores da família Ostreidae.
0.0
10.0
20.0
30.0
40.0
50.0
60.0
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Ostreidae org/m3
Figura 3.15b – Variação das ocorrências médias interanuais da família Ostreidae.
189
0
1000
2000
3000
4000
5000
6000
94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04
Cipris org/m3
Figura 3.16a – Flutuação interanuais das larvas do tipo Cipris.
0,0
50,0
100,0
150,0
200,0
250,0
300,0
350,0
400,0
450,0
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Cipris org/m3
Figura 3.16b – Variação das ocorrências médias interanuais das larvas do tipo Cipris.
190
0
200
400
600
800
1000
1200
94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04
Ascidiaceae org/m3
Figura 3.17a – Flutuação interanual da família Ascidiaceae.
0
5
10
15
20
25
30
35
40
1 2 3 4 5 6 7 8 9 10 11 12
Ascidiaceae org/m3
Figura 3.17b – Variação das ocorrências médias interanuais da família Ascidiaceae.
191
0
20
40
60
80
100
120
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04
Bryozoa org/m3
Figura 3.18a – Flutuação interanual da classe Bryozoa.
0
1
2
3
4
5
6
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Bryozoa org/m3
Figura 3.18b – Variação das ocorrências médias interanuais da classe Bryozoa.
192
0
50
100
150
200
250
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04
Equinoide org/m3
Figura 3.19a – Flutuação interanual da classe Equinoide.
0
2
4
6
8
10
12
14
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Equinoide org/m3
Figura 3.19b – Variação das ocorrências médias interanuais da classe Equinoide.
193
0
50
100
150
200
250
300
94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04
Bivalvia org/m3
Figura 3.20a – Flutuação interanual da classe Bivalvia.
0
10
20
30
40
50
60
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Bivalvia org/m3
Figura 3.20b – Variação das ocorrências médias interanuais da classe Bivalvia.
194