Aplicação de Redes Neurais no Estudo da Variabilidade dos ... · se sabe sobre sua diversidade...

MINERAÇÃO DE DADOS PARA ANÁLISE E DIAGNÓSTICO AMBIENTAL

Gilberto Carvalho Pereira

TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS

PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA UNIVERSIDADE

FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS

NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE DOUTOR EM CIÊNCIAS

EM ENGENHARIA CIVIL.

Aprovada por:

_____________________________________________________

Prof. Nelson Francisco Favilla Ebecken, D.Sc.

_____________________________________________________

Prof. Ricardo Coutinho, Ph. D.

_____________________________________________________

Prof. Alexandre Evsukoff, D.Sc.

_____________________________________________________

Prof. Eliane Gonzales Rodriguez, D.Sc.

_____________________________________________________

Prof. Fernando Pellon de Miranda, Ph. D.

_____________________________________________________

Prof. Eduardo Raul Hruschka, D.Sc.

RIO DE JANEIRO, RJ – BRASIL

DEZEMBRO DE 2005

PEREIRA, GILBERTO CARVALHO

Mineração de Dados para Análise e

Diagnóstico Ambiental [Rio de Janeiro]

XIII, 194.p.29,7 cm (COPPE/UFRJ, D. Sc.,

Engenharia Civil, 2005)

Tese – Universidade Federal do Rio de

Janeiro, COPPE

1. Mineração de Dados

2. Sistemas Inteligentes

3. Diagnóstico Ambiental

I. COPPE/UFRJ II. Título (série)

“Devemos desejar e procurar o

último grau de perfeição, não para

nos tornar-mos superiores aos

outros, mas colocar-mo-nos sob os

pés de todos”.

À memória de meu pai

Agradecimentos

Ao Prof. Nelson Ebecken, pela orientação e oportunidade dada para desenvolver

este trabalho.

A todos os colegas e funcionários da COPPE, pela assistência e agradável

convivência.

Ao Dr. Ricardo Coutinho, por ter fornecido os dados inéditos para execução

deste trabalho e por valiosas discussões neste período.

Á Capes, pela bolsa de estudos concedida, e a UFRJ, pela boa formação

acadêmica.

Resumo da Tese apresentada à COPPE/UFRJ como parte dos requisitos necessários

para a obtenção do grau de Doutor em Ciências (D. Sc.)

MINERAÇÃO DE DADOS PARA ANÁLISE E DIAGNÓSTICO AMBIENTAL

Dezembro/2005

Orientadores: Nelson Francisco Favilla Ebecken

Ricardo Coutinho

Programa: Engenharia Civil

A zona costeira brasileira apresenta grande extensão e variedade de ambientes.

Nesta região, concentram-se mais de sessenta por cento da população e da atividade

econômica do país, o que causa enorme pressão nos recursos naturais. Contudo, pouco

se sabe sobre sua diversidade biológica e o funcionamento dos ecossistemas. Mudanças

ambientais são constantes, sendo importante distinguir entre variabilidade natural e

antrópica. Neste cenário, o objetivo deste trabalho é apresentar uma metodologia para o

desenvolvimento de um Sistema Inteligente de Gerenciamento Integrado do

Ecossistema Costeiro (SIGIEC), capaz de avaliar o nível de qualidade e saúde ambiental

através do conceito de Integridade Biológica. Foram usadas séries temporais de dez

anos de parâmetros físicos, químicos e biológicos para extrair conhecimento e gerar

modelos de regras de associação para classificar sete diferentes tipos de condições

ambientais, analisadas através da diversidade biológica, assim como um novo índice

trófico (PLIX). Redes neurais artificiais foram otimizadas por algoritmos genéticos para

fazer predições destes índices, apresentando um diagnóstico ambiental baseado na

análise dos mecanismos de controle da topologia, estabilidade e propriedades do

comportamento complexo de redes alimentares, além das possibilidades de extinções

em cascata.

Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the

requirements for the degree of Doctor of Science (D. Sc.)

DATA MINING FOR ENVIRONMENTAL ANALYSIS AND DIAGNOSTIC

December/2005

Advisors: Nelson Francisco Favilla Ebecken

Ricardo Coutinho

Department: Civil Engineering

The Brazilian coastal zone presents a large extension and a variety

environments. More than sixty percent of the population and economic activities in the

country take place in this region which is characterized by a huge pressure on

environmental resources. Nevertheless, little is known about biological diversity and

ecosystem dynamics. Environmental changes always occurs; however, it is important to

distinguish natural from anthropic variability. Under these scenarios, the aim of this

work is to present a methodology to develop an Intelligent System for Coastal

Ecosystem Integrated Management (SIGIEC), which is able to access the quality and

health levels of the environment through the biological integrity concept.Ten year time

series of physical, chemical and biological parameters were used to generate a

classification model based on association rules that recognizes seven different classes

based on biological diversity and a new trophic index (PLIX). Artificial neural networks

were evolved and optimized by genetic algorithms to forecast these indices, enabling

environmental diagnostic to be made taking into account control mechanisms of

topology, stability and complex behavioral properties of food web, as well as cascade

extinction possibilities.

ÍNDICE

FICHA CATALOGRÁFICA ii

DEDICATÓRIA iv

AGRADECIMENTOS v

RESUMO vi

ABSTRACT vii

ÍNDICE viii

GLOSSÁRIO x

CAPÍTULO I

INTRODUÇÃO 1

1.1 - Objetivos 2

1.2 – Relevância 3

1.3 – Estado da Arte 5

CAPÍTULO II

ESTRATÉGIA E DEFINIÇÃO DO PROBLEMA 12

2.1 – Caracterização de Área de Estudo 14

2.2 – O Ecossistema da Ressurgência 16

2.3 – A Atividade Planctônica 17

2.3.1 - O Fitoplâncton 19

2.3.2 - Ecologia das Larvas Merozooplanctônicas 21

CAPÍTULO III

ANÁLISE E DESCRIÇÃO DOS DADOS DISPONÍVEIS 27

CAPÍTULO IV

CLASSIFICAÇÃO DE DADOS E EXTRAÇÃO DE REGRAS 48

4.1 – Aquisição de Conhecimento 48

4.2 – Regras de Associação de Dados 49

4.3 – Análise de Regras Interessantes 55

4.4 – Regras de Classificação de Dados 65

4.5 - Regras “Fuzzy” e Classificação de Dados 73

4.6 – Redes Neurais 78

4.7 – Performance dos Classificadores 80

CAPÍTULO V

PREDIÇÃO DE GRANDEZAS E INDICADORES 83

5.1 – Estrutura Conceitual 84

5.2 - Interesses e Desafios 85

5.3 – Critérios para seleção de Indicadores 86

5.4 – Indicadores de Comunidade e Nível de Paisagem 90

5.5 – Natureza dos Índices Utilizados 91

5.6 - Índices e Gerenciamento de Ecossistemas 98

CAPÍTULO VI

SISTEMA INTELIGENTE E GERENCIAMENTO AMBIENTAL 101

6.1 – Arquitetura Geral do Sistema 102

6.2 – Tipos e Requerimentos dos Usuários 105

6.3 – Funcionalidade 106

CAPÍTULO VII

ANÁLISE DOS RESULTADOS E DIAGNÓSTICO AMBIENTAL 112

7.1 – Análise dos Resultados 112

7.2 – Diagnóstico Ambiental 116

7.2.1 – O Efeito da Presença de Consumidor na Diversidade de Presas 118

7.2.2 – O Efeito da Densidade de Prezas na Diversidade de Consumidores 120

7.3 – Sistemas Complexos, Propriedades Emergentes e Redes Alimentares 123

CAPÍTULO VII

CONCLUSÕES 129

REFERÊNCIAS BIBLIOGRÁFICAS 135

APÊNDICE – Entrevistas com especialistas 165

ANEXO – Séries históricas e histogramas das variáveis estudadas 175

GLOSSÁRIO

Algoritmo – um procedimento sistemático (etapa-por-etapa) para solucionar um

problema.

Ambiente – (1) termo geral usado para descrever produtos, hardware e softwares que

constituem um sistema computacional; (2) termo geral que define as condições de

existência na natureza.

Aprendizado supervisionado – estratégia de treinar modelos para adquirir

conhecimento ou habilidade de entender através de educação ou experiência dada por

um professor ou procedimento sistemático.

Arquitetura recorrente – modelo cuja estrutura apresenta conexões com

retroalimentação de um ou mais de seus elementos.

Área costeira – área ao longo do litoral de abrangência dos efeitos naturais resultantes

das interações terra-mar-ar, que leva em conta a paisagem físico-ambiental, a

integridade e os processos de unidades ecossistêmicas litorâneas, incluindo atividades

sócio-econômicas.

Atributo – na linguagem de Mineração de Dados, significa uma variável. Propriedade

“própria” de um objeto.

Back-propagation – algoritmo de treinamento de modelos de redes neurais.

Banco de dados – ambiente computacional para armazenamento, manuseio e descrição

de relações de dados, composto por diversas tabelas.

Base de dados – coleção de dados estocados.

Base de regras – sistema que usa um conjunto de regras para definir situações e ações

apropriadas.

Bentos – organismos que vivem no substrato, fixos ou não.

Biosfera – conjunto de todos os seres e ecossistemas.

Biota – termo geral que se refere a todos os organismos de determinado lugar.

“Bottom-up” – tipo de controle de cadeias tróficas em que as condições ambientais ou

as espécies da base da rede determinam a composição e estrutura dos níveis mais

elevados do sistema.

Clorofila – pigmento responsável pelo processo de fotossíntese.

Competência – fase em que uma larva reúne as condições fisiológicas necessárias para

sua fixação.

Conhecimento – uma coleção de relações declarativas e de procedimentos extraída de

dados ou da experiência de um especialista.

Conectividade – padrão de distribuição das ligações entre os elementos de um sistema

ou modelo que define sua topologia.

Data mining – metodologia para aquisição de conhecimentos extraídos de bancos de

dados.

Dendrogama – estrutura em forma de “árvore”.

Ecossistema – conjunto de elementos bióticos arranjados hierarquicamente

(Comunidade) interagindo com a componente abiótica (Ambiente).

Eficiência trófica – eficiência de transferência de energia entre os níveis tróficos de

uma rede alimentar.

Epibentônico – termo que separa os organismos em categorias de tamanho de acordo

com sua posição usual na região de interface entre a coluna d`água e o sedimento

(boudary layer). Inclui, macro, meso e microfauna.

Espécie trófica – organismos que tem os mesmos hábitos alimentares e servem como

presas para os mesmos predadores.

Eutrofização – processo de enriquecimento de uma substância mineral ou orgânica em

ambientes aquáticos.

Feedback – mecanismos de ação positiva ou negativa comuns ao funcionamento de

redes alimentares.

Feedforward – tipo de arquitetura de modelo sem ligações de retroalimentações.

Fitoplâncton – conjunto de organismos microscópicos e clorofilados responsáveis pela

maioria da produção primária em ecossistemas aquáticos.

Fuzzy – lógica que aborda o tratamento qualitativo do conhecimento e é utilizada para

representar incertezas através da designação de valores relativos.

Gametas – células reprodutivas tanto femininas como masculinas.

Hiperplano - em geometria é um subespaço linear, afim ou projeção de co-dimensão.

No espaço tridimensional, é um plano habitual, no bidimensional é uma reta e no

monodimensional, um ponto.

Inteligência Artificial – ramo das ciências da computação dedicado a estudar a maneira

pela qual os computadores podem ser usados para simular ou reproduzir funções

humanas.

Integridade biológica - habilidade do ecossistema de suportar e manter o balanço

integrado e adaptativo da organização estrutural, funcional e da diversidade da

comunidade.

Interface – em um sistema computacional, uma ligação que fornece comunicação entre

duas porções do processo.

Larva – organismo cujo desenvolvimento se encontra entre a eclosão do ovo e a

metamorfose para a fase de adulto.

Mapeamento – conjunto de associações entre elementos de uma base de dados.

Meroplâncton – conjunto de organismos que passam pelo menos uma fase de seu ciclo

de vida no plâncton.

Nécton – organismos que estão na coluna d’água e têm capacidade natatória para se

deslocar independentemente de correntes.

Nicho – lugar onde se pode encontrar determinado organismo ou sua posição na rede de

interações tróficas.

Objeto – entidade física ou conceitual que tem atributos e características definidas.

Ontogênico - todo o período de desenvolvimento de um organismo desde a

segmentação do zigoto até que ele próprio se complete como indivíduo adulto.

Pelágico – referente ao que está na coluna d’água.

Perceptron – um tipo de neurônio artificial.

Plâncton – conjunto de organismos que está na coluna d’água à deriva das correntes.

Recrutamento – processo de assentamento e fixação das larvas na colonização de um

substrato. Fase em que a larva deixa a vida planctônica para a bentônica.

Regra – uma declaração que consiste de duas partes, antecedente e conseqüente, que

define um particular objeto ou comportamento.

Rede alimentar – conjunto de interações tróficas que estruturam as comunidades

biológicas.

Rede neural – modelo conexionista com vários neurônios artificiais.

Ressurgência – movimento ascendente de água profunda.

Sistema especialista – um programa da área de inteligência artificial que consiste de

uma interface de usuário, um sistema de busca e uma base de conhecimento que

representa a solução de um problema específico.

Subsidência – período em que não ocorre o processo de ressurgência.

“Top-down” – tipo de controle de redes alimentares em que a presença de organismos

de níveis mais elevados determinam a composição e biomassa dos níveis inferiores. Ex.

“trophic cascade”.

Trófico – relativo ao alimento.

Zona intertidal – zona situada entre as marés baixa e alta.

Zooplâncton – conjunto de animais microscópicos da coluna d’água.

Capítulo I

Introdução

O ambiente costeiro brasileiro apresenta grande variedade de ecossistemas,

desde áreas alagadas e pantanosas a manguesais, zonas de corais, como o arquipélago

de Abrolhos, até extensos bancos de algas do tipo kelp, além de inúmeras praias de

diversos tipos de areia separadas por costões rochosos. Apesar da enorme extensão da

zona costeira, pouco se sabe sobre os três níveis da nossa diversidade biológica:

genético, espécie e ecossistema. No entanto, sabe-se que a biodiversidade marinha é

extremamente valiosa para o gênero humano, contribuindo com mais de 60% do valor

econômico da biosfera (COSTANZA et al. 1997). A vida marinha fornece cinco

serviços básicos para o homem (COSTANZA et al., 1999 e DAILY, 1997):

− Serviços do ecossistema, como a “bomba biológica”, que retira o dióxido de

carbono da atmosfera e transporta o carbono para o fundo do mar, como

também o papel de recifes de corais e pântanos costeiros moderando a erosão

costeira;

- Alimento, pois aproximadamente 20% da proteína consumida no planeta é

proveniente da pesca (FAO, 1997);

− Medicamentos, como produtos biológicamente ativos, inclusive agentes

antitumorais;

− Minerais e químicos, abióticos, como os combustíveis fósseis, manganês e sal

e biótipos, como colóides de algas e quitina de crustáceos, para indústria de

alimentos, médica e tecnológica;

- Recreacional e ecoturismo, especialmente a vida marinha da megafauna

(mamíferos) e corais que suportam a economia de alguns locais.

Apesar do seu imenso valor, os ecossistemas marinhos estão se deteriorando

rapidamente pela alteração física do habitat, super exploração, introdução de espécies

exóticas, mudanças do clima global, e poluição marinha (HISON, 2001). Os sistemas

mais avançados estão na zona costeira, especialmente estuários, mangues, recifes de

corais e comunidades associadas com o fundo da plataforma continental e o costão

rochoso (CARLTON et al. 1991,1993,1999 e CULOTTA 1994).

O modo reprodutivo mais comum de organismos multicelulares no mar (com

exceção de tubarões, mamíferos e outros poucos grupos) é a disseminação da desova de

gametas com dispersão em correntes marinhas durante o estádio larval. Muito pouco se

sabe a respeito do grau de conectividade entre estes organismos (COWEN et al. 2000),

que tem importantes ramificações para a conservação das espécies. Será difícil

conservar alguma coisa que seja desconhecida. A questão chave é: o que se quer

conservar e como isso funciona? Existe uma grande necessidade de monitoramento a

longo prazo dos ecossistemas marinhos em múltiplas escalas. Neste sentido, este estudo

dedicará esforços a analisar dados físicos, químicos e biológicos da água do mar da

reserva extrativista de Arraial do Cabo, compreendendo séries temporais de medidas

semanais realizadas ao longo dos últimos 10 anos na ilha de Cabo Frio (230S, 420W).

1.1) Objetivos

Comunidades ecológicas representam uma complexa rede de interações entre

muitas espécies. Estas interações apresentam um desafio, tanto para os ecólogos

teóricos como para empíricos que tentam predizer como as comunidades mudam em

resposta às perturbações ambientais.

A inspeção de dados ecológicos relativos ao bentos, plâncton ou necton,

normalmente resulta em um complexo conjunto de dados bióticos e ambientais a partir

do qual padrões e relações precisam ser extraídos no intuito de aumentar o

entendimento sobre o funcionamento dos nossos ecossistemas (FIELD et al. 1982).

Este estudo tem como objetivos principais os seguntes tópicos:

- Acessar os padrões de comportamento trófico do ecossistema, explicitando este

conhecimento através de uma base de regras geradas de modelos para a

classificação e previsão destes padrões no ambiente estudado;

- Investigar os padrões de variabilidade temporal do suprimento de larvas;

- Examinar as relações destes padrões a disponibilidade de alimento e a relação

deste alimento com os parâmetros físicos e químicos de qualidade de água.

Estes objetivos correspondem a três questões básicas que devem ser respondidas:

1. É possível separar causas exógenas (ambientais) de causas endógenas (bióticas)

com respeito à variação de densidades populacionais a partir de séries temporais

de dados ?

2. Padrões temporais de longa duração da dinâmica populacional podem ser gerados

por processos endógenos? Estes processos podem ser caracterizados em um

conjunto de dados reais?

3. É possível predizer como mudanças ambientais afetam a média de densidade

populacional ?

1.2) Relevância

Segundo OLIVER et al. (2000), no sistema de costões rochosos, a dinâmica das

populações de indivíduos adultos está relacionada com os processos de pré e pós

assentamento. A estrutura das comunidades bentônicas marinhas varia espacial e

temporalmente com respeito à componente dos invertebrados dominantes; então,

determinar como os fatores ambientais que influenciam a dinâmica das comunidades

marinhas é de suma importância para se preservar os recursos naturais e renováveis da

área costeira.

APOLINÁRIO (1999), demonstrou que a disponibilidade de larvas e o baixo

recrutamento causam a não manutenção de populações da zona intertidal em costões

rochosos.

De acordo com VALANTIN (1988), as relações fitoplâncton/zooplâncton, em

linhas gerais, apresentam uma correlação positiva direta entre as variações de

abundância do fitoplâncton e do zooplâncton, que representam um estado de equilíbrio

entre esses níveis tróficos nas águas oligotróficas. Em regiões de ressurgência,

deveríamos ter uma relação negativa, característica de um ecossistema em desequilíbrio.

Entretanto, em Arraial do Cabo, esta correlação é positiva, devido à ocorrência de

simultaneidade de máximos, indicando um sistema em estágio avançado de maturidade

e mais complexo do ponto de vista dinâmico. Durante a ressurgência, o “bloom” algal

induz a desova e o desenvolvimento larval dos herbívoros, as larvas são levadas para o

alto mar pelas correntes de deriva da ressurgência e submetidas a um processo de

migração ontogênica. Esta migração permite que as larvas retornem na ocasião do ciclo

de ressurgência seguinte. Assim, se o espaço de tempo entre dois eventos de

ressurgência for igual ao ciclo de vida do herbívoro, pode haver simultaneidade de picos

de abundância do fitoplâncton e do zooplâncton. Esta simultaneidade é de grande

importância, pois do ponto de vista trófico, pode contribuir para o aumento da

herbivoria que, por sua vez, controla o desenvolvimento algal.

Portanto, fica claro que entender os padrões de comportamento do ecossistema e

estabelecer as regras que descrevem as relações tróficas existentes entre seus diversos

componentes a longo prazo é de vital importância para o desenvolvimento sustentável e

gerenciamento da zona costeira. Além disto, o próprio fato de se construir séries

temporais de diversos organismos marinhos, que passam um período de seus ciclos de

vida no plâncton, os torna excelentes indicadores biológicos das possíveis perturbações

que possam ocorrer no ecossistema, sendo possível usá-los como modelos para

previsões de qualquer efeito ao nível bentônico.

Outros fatos que despertam a atenção nestes organismos vêm da própria

atividade bioincrustante. Este comportamento faz com que estruturas como plataformas

tenham sua massa aumentada, embarcações aumentem o consumo de combustível em

até 10% e tubulações marítimas sejam obstruídas reduzindo as trocas de calor (usina

nuclear de Angra dos Reis).

1.3) Estado da Arte

SKINNER & COUTINHO (2002) demonstraram em seus resultados

preliminares que o assentamento de duas espécies de cirripédios do costão rochoso de

Arraial do Cabo ocorre durante o período de outono/inverno, quando uma maior

densidade de larvas do tipo cipris foi observada em amostras planctônicas. Neste

período, são verificadas na água do mar as temperaturas mais elevadas, devido à pouca

ocorrência do fenômeno de ressurgência. Contrastando com a primavera e verão,

período de menores temperaturas, são observadas as maiores densidades de larvas do

tipo náuplio em relação às do tipo cipris. Esses resultados sugerem que a temperatura

pode acelerar a taxa de metamorfose larval ou que as tormentas de inverno podem

aumentar o transporte e o suprimento de larvas para a costa.

Em 1989, vários autores (DAVIS et al., FOLSE et al., REINHARDT et al.,

RITCHIE, RYKIEL, e STARFIELD) discutiram o uso de sistemas especialistas, um

ramo da inteligência artificial, que usa essa abordagem para processar conhecimento

obtido em ecologia e gerenciamento de recursos naturais. Tal procedimento inclui uma

base de conhecimento que contém regras do tipo “se-então” e um sistema de inferência,

que é um procedimento para processar regras. Normalmente, um sistema especialista é

criado através de entrevistas com especialistas, que fornecem o conhecimento para a

geração de regras. No entanto, em determinados casos, o conhecimento sobre o

funcionamento de um sistema complexo nem sempre poderá ser percebido pelos

próprios especialistas. Com os avanços tecnológicos, os sistemas de armazenamento de

dados e monitoração de fenômenos observados têm acumulado grandes massas de

dados que escondem conhecimento incapaz de ser extraído pelo ser humano. Este tema

é tratado pela disciplina “KDD–Knowledge Discovery in Databases”(descoberta de

conhecimento em banco de dados),, que é um processo (Figura 1.1) interativo que se

vale de algoritmos eficientes de mineração de dados, i.e. “Data Mining”.

Estabelecer os objetivos

Selecionar os D ados

A valiar osR esultados

O ferecer Soluções

ExtrairC onhecim ento

M odelar os D ados

T ransform ar os D ados

P ré-processaros D ados

Problem asProblem asA m bientais ?A m bientais ?

Figura 1.1 - Fases do Processo de Extração de Conhecimento .

Data Mining é uma atividade multidisciplinar que envolve diversas áreas (Figura

1.2), fornecendo as ferramentas para a descoberta de conhecimento em grandes massas

de dados. Data Mining não é uma tecnologia nova, mas um campo de pesquisa

multidisciplinar fortemente acoplada, envolvendo estatística, aprendizado de máquinas,

banco de dados, sistemas especialistas, técnicas de visualização de dados e computação

de alto desempenho.

Figura 1.2 – Mineração de Dados

O aparecimento das redes neurais data dos anos 40 e se deu no âmbito da

neurofisiologia. Este tipo de modelo foi usado com sucesso por vários campos de

pesquisa, mas sua aplicação em ecologia é bastante recente e se verifica apenas em

meados dos anos 90 em uma variada gama de objetivos e notáveis exemplos, conforme

descrito a seguir:

- Estimativas de taxas de consumo de alimento foram feitas por LEK et al.,

(1995);

- CHON et al.(1996) usaram uma rede neural de Kohonen, que é um algoritmo

de aprendizado não supervisionado, para agrupamento de microinvertebrados

bentônicos com o intuito de acessar a estrutura da comunidade;

- SCARDI (1996) demonstrouou que redes neurais podem estimar melhor a

produção do fitoplâncton do que modelos tradicionais de regressão linear;

- LEVINE et al. (1996) utilizaram uma rede do tipo “feed forward” treinada com

o algoritmo “back propagation” para classificar a estrutura de solos;

- BARAN et al. (1996), utilizaram redes neurais para a estimativa de biomassa e

densidade de trutas;

- POFF et al. (1996) criaram um modelo de rede neural que conseguiu boa

concordância entre a previsão do modelo e o fluxo observado de descarga da correnteza

de um rio, tendo como entradas dados da média diária de precipitação e medidas de

temperatura;

- BOUDJEMA e CHAU (1996) demonstraram a utilidade das redes neurais para

previsão de picos em séries temporais contendo pouco e muito ruído; seus dados

continham medidas de parasitas de madeira de árvores e abundância de sardinhas;

- TAN e SMEINS (1996) usaram uma rede neural para previsão das mudanças

das espécies dominantes em comunidades de pastagem, tendo como entradas do modelo

variáveis climáticas;

- BREY et al. (1996) uutilizaram variáveis bióticas e abióticas para estimar a

razão produção/biomassa de invertebrados bentônicos e demonstraram que as redes

neurais tiveram melhor performance que modelos de regressão múltipla;

- LEK et al. (1996) fizeram associações das características físicas do habitat de

desova de trutas em rios da França;

- MASTRORILLO et al. (1997) realizaram previsões da abundância de espécies

de ciprinídeos com redes neurais também em rios da França;

- GUAN et al. (1997), utilizaram uma rede neural para gerar e ranquear

parâmetros importantes na variância de modelos do mecanismo de crescimento de

florestas;

- RECKNAGEL et al. (1997) usaram níveis de concentração de nutrientes,

medidas de irradiação incidente, temperatura, profundidade e tempo de retenção da água

como variáveis de entrada de modelos de redes neurais para predizer com sucesso

“blooms” algais em quatro sistemas de água doce;

- PARUELLO e TOMASEL (1997), verificaram que as redes neurais

apresentaram melhor performance que modelos de regressão linear para previsão de um

índice de vegetação de diferenças normalizadas (NDVI) usando sensoriamento remoto;

- GUÉGAN et al. (1998) realizaram previsões da diversidade de peixes com

modelos neurais;

- SCHREER et al. (1998) compararam de técnicas estatísticas de agrupamentos

de dados e um algoritmo de treinamento não supervisionado de redes neurais para

estudar perfis de mergulho de animais marinhos;

- ÖZESMI e ÖZESMI (1999) usaram uma abordagem de redes neurais para

modelar características espaciais do habitat com interações interespecíficas;

- AOKI et al. (1999) fizeram previsões da resposta da biomassa zooplanctônica

às mudanças climáticas e oceânicas utilizando redes neurais;

- BARCIELA et al. (1999) compararam um modelo convencional de estrutura

dinâmica e uma rede neural para modelar a produção primária em uma baía costeira

afetada por ressurgência;

- MANEL et al. (1999 a, b), realizaram uma comparação de análise

discriminante, redes neurais e regressão logística para previsão da distribuição de

espécies.

PEREIRA e EBECKEN (2002) apresentaram com sucesso modelos de rede

neurais do tipo “perceptron múltiplas camadas” treinadas com o algoritmo “back

propagation” para fazer previsões futuras de curto, médio e longo período da clorofila-a

usada como estimativa da biomassa algal a partir de dados físico/químicos da água do

mar de Arraial do Cabo. A arquitetura do modelo foi otimizada por um algoritmo

genético. O fato curioso é de que o modelo de melhor performance apresentou

arquitetura recorrente.

Procedimentos de modelagem convencional freqüentemente assumem relações

lineares entre variáveis ecológicas, o que não é o caso. Redes Neurais artificiais

oferecem uma vantagem sobre os modelos tradicionais e fornecem uma plataforma útil

na qual modelos não lineares podem ser desenvolvidos. Uma das vantagens das redes

neurais é sua habilidade de aprender e descobrir padrões nos dados que não são

prontamente observados pelos pesquisadores ou métodos estatísticos (MASTERS,

1993). É esta habilidade em aprender a partir de exemplos novos e a capacidade de

generalização que proporcionaram o aumento de sua popularidade e o desenvolvimento

de diversas arquiteturas e algoritmos de aprendizado, como ilustrado na Figura 1.3.

Figura 1.3 - Modelos de Redes Neurais

Feed-forwardAprendizado

Híbrido

Clustering and Bayesian Learning

Prob NN

Clustering and Least Square

Learning RBF

Madaline

Back-propagation Multi-Layer

Single Layer Adaline

Perceptron

Feed-forward

Aprendizado Supervisionado

RecorrentART MAP ART

Boltzman

Recurrent BP Multi-Layer

LVQ Competitive

Aprendizado ConetividadeArquiteturaParadigma

Aprendizado não Supervisionado

Recorrente

Memória Associativa Hopfield

SOM Kohonen

Willshaw, Malsberg´s

ARTART1

Vector Quantization Competitive

Linker´s SO Feature Extraction Multi-Layer

Sanger´s Method

Oja´s Method Single Layer

Feed-forward

Entretanto, os modelos de redes neurais geram saídas apropriadas para qualquer

tipo de base de dados de entrada, mas o usuário normalmente não tem acesso direto para

entender porque e como um particular resultado foi obtido. Por este motivo, as redes

neurais são consideradas modelos “caixa preta”. Nos últimos anos, vários esforços têm

sido feitos para achar efetivos algoritmos de extração de regras que explicitem o

conhecimento adquirido pelas redes após seu treinamento. A real contribuição deste

trabalho será dada pelo acesso às mudanças de produtividade do meio marinho que

podem levar a uma alta heterogeneidade da qualidade do habitat, a qual reflete o nível

de saúde do ecossistema, além de detalhes dos processos ecológicos, para uma análise

mais precisa e diagnóstico das condições ambientais.

As técnicas de extração de regras para classificação e previsão de padrões

apresentam extensa literatura. A título de aplicação desta metodologia em modelagem

ecológica, vale ressaltar os trabalhos de DRUMM et al.,(1999) e BRADSHAW et

al.,(2000, 2002). Ambos utilizam redes neurais em sistemas de informações geográficas

para, através da extração de regras, identificarem características dos respectivos habitats

para determinarem a preferência de espécies na escolha de locais de reprodução ou

potencial de recolonização.

O segundo capítulo deste trabalho apresentará especificamente o problema que

será estudado. O capítulo três trata da descrição da estrutura e preparação dos dados

disponíveis. A metodologia de extração de regras para classificação de padrões será

apresentada no quarto capítulo, enquanto que o capítulo cinco se preocupará em

apresentar as previsões dos modelos de redes neurais em índices de qualidade

ambiental. O capítulo seis demonstra como um sistema inteligente baseado nos

conhecimentos obtidos pelos modelos pode ser aplicado ao gerenciamento costeiro. O

capítulo de número sete é reservado para uma análise dos resultados e elaboração de um

diagnóstico ambiental. No capítulo oito, encontram-se as conclusões finais e

considerações para os trabalhos futuros.

Capítulo II

Estratégia e definição do Problema

O acesso ao estado ecológico (diagnóstico ecológico), introduzindo níveis

admissíveis de influência antrópica (padronização ecológica), e a detecção das

conseqüências dos vários cenários de distúrbio na biota (predição ecológica) são a

principal tarefa de um sistema de controle ambiental.

No Brasil, a determinação dos padrões de qualidade do ambiente está baseada no

conceito de concentrações máximas admissíveis de poluentes pelas normas do Conselho

Nacional de Meio Ambiente (CONAMA). Estes valores (padrões) são determinados em

condições de laboratório, durante um curto período de tempo (dias) ou experimentos

crônicos (semanas), com populações de organismos isolados pertencentes a um pequeno

número de “espécies teste” selecionadas, usando um conjunto limitado de respostas

fisiológicas e comportamentais.

A avaliação do estado ecológico é, deste ponto de vista, injustificada, pois é

inconsistente a extrapolação de limites de tolerância de organismos em ecossistemas

multiespecíficos, onde dezenas ou centenas de complexos fatores de diferentes origens

operam simultaneamente em vários backgrounds de funcionamento.

Atualmente, muitas agências ambientais internacionais têm apoiado o uso de

critérios biológicos como indicador de condições ambientais, mais especificamente de

saúde ecológica ou ambiental. Medidas biológicas têm se tornado o foco do grau de

integridade biológica. A determinação de qualidade da água não deve ser apoiada

somente em parâmetros físicos ou químicos. Este fato pode resultar em uma sub-

estimativa do estado de degradação, visto que estes critérios não detectam degradação

proveniente de fontes estressoras não químicas ou seus efeitos cumulativos, nem tam-

pouco todas as substâncias químicas podem ser monitoradas. Esforços têm sido feitos

para incorporar uma quantidade de “informação biológica” para estimar a qualidade dos

corpos d’água e integrar estas informações nos programas de monitoramento (Water

Quality Standards/US-EPA, European Environmental Agency - EEA, Japan

Environmental Management Association of Industry - JEMAI).

O conceito de uma tolerância ecológica propondo níveis admissíveis de

influência para a parte biótica do ecossistema poderia ser uma alternativa mais realista.

De acordo com esta abordagem, para qualquer sistema ecológico é possível achar o

limite de variação dos fatores ecológicos e o comportamento de seu funcionamento,

distinguindo um dado ecossistema de outro adjacente, salvo suas estabilidades relativas.

O conceito de tolerância é bem conhecido em ecologia e aplicado ao nível de indivíduo

e população. Porém, a transferência desta idéia para o nível de comunidade e

ecossistema é ímpar, pois estes diferem acima de tudo dos indivíduos e populações pelo

princípio de auto organização. Qualquer mudança nas condições ambientais causa em

primeiro lugar alterações estruturais (flutuações do número de espécies, tamanho e

composição dos grupos tróficos, etc.) da comunidade quanto à constância relativa de

seus índices funcionais de eficiência, taxa de destruição e outros processos do

metabolismo ecológico. Em virtude da excessiva variabilidade das condições

ambientais, a transformação gradual de um dito estado “normal” de um ecossistema em

outro pode ser observada e não ser caracterizada como sua morte. Por essa razão, a

realização de extensas e regulares observações no monitoramento da comunidade a

longo prazo podem ser a única maneira de estabelecer os limites de funcionamento do

ecossistema em relação a qualquer fator ecológico ou poluente. Em outras palavras,

estamos lidando com “experimentos passivos,” os quais são realizados por muito tempo

pelo gênero humano em locais de sua residência, influência e atividade econômica, não

em organismos e substâncias químicas separadas, mas com um completo e complexo

conjunto de fatores que impactam a biota em condições concretas em relação às

características locais. Esta abordagem assume a existência de relações de “causa e

efeito” conectando níveis de influência na biota e a resposta da mesma. O objetivo é

revelar a fronteira entre o funcionamento normal e o patológico no espaço dos fatores

abióticos. Tal limiar é chamado de nível de tolerância ecológica à influência dos

distúrbios.

Deve-se entender aqui o conceito de Integridade Biológica como sendo a

habilidade do ecossistema de suportar e manter o balanço integrado e adaptativo da

organização estrutural, funcional e da diversidade da comunidade.

A ênfase da construção de um cenário para a contextualização deste trabalho

será uma breve e muito resumida descrição dos fatores que podem influenciar as

relações tróficas existentes entre os organismos aquáticos, seus ciclos de vida e o

ambiente, com o objetivo de mostrar ao leitor o grau de complexidade e de dificuldade

para se fazer um diagnóstico das condições ambientais.

2.1) Caracterização da Área de Estudo

A região de Arraial do Cabo (Figura 2) está localizada na costa leste do Estado

do Rio de Janeiro. Costões rochosos de formação gnaisse-granito datados do pré-

cambriano dominam a paisagem. Existem poucos rios nesta região; um deles situa-se a

norte do litoral da Ilha Rasa, onde encontramos uma pequena população de manguezal,

o outro encontra-se a sul de Jaconé e corre através do canal de Ponta Negra. A região

continental adjacente tem um complexo lagunar bem desenvolvido e apresenta

formação de dunas com vegetação característica de restinga (SANTOS, 1996). O clima

é considerado uma transição entre tropical quente e subtropical e é dito como seco, se

comparado à umidade geral da costa sudeste brasileira. As condições do tempo são

influenciadas pela alternância de dois anticiclones marítimos, tropical e polar

(BARBIERI, 1975). As marés são regulares semidiurnas, com amplitudes de 0.8 e 1.0

metros, mas frentes frias podem elevar o nível médio do mar (YONESHIGUE, 1985).

Duas principais épocas podem ser identificadas:

1) Primavera-verão, com anticiclone marítimo tropical com ventos prevalecendo E-NE;

2) Outono-inverno com frentes frias polares com ventos SW (VALANTIN et al., 1987).

A cidade de Arraial do Cabo é uma reserva extrativista criada em 1997 e uma das mais

belas paisagens da costa do Estado do Rio de Janeiro, apresentando grande atividade

turística e recreacional, com a presença freqüente de várias operadoras de mergulho,

iatismo e pesca, que juntas contribuem de maneira significativa para a economia local.

O crescimento urbano ocorre de maneira desordenada, gerando problemas de

saneamento público. Uma das fontes de recursos financeiros da cidade vem de uma

indústria de extração e processamento de calcário, que usa a água do mar como fonte de

resfriamento do processo. A existência de um pequeno porto, usado como terminal

salineiro atraiu a atenção de companhias petroleiras que começam a fazer de Arraial do

Cabo uma base operacional. Devido à proximidade com os campos de petróleo da bacia

de Campos, tem se tornado comum o fundeio de plataformas para pequenos reparos.

Nos costões rochosos onde, é comum se deparar com várias pessoas das camadas

sociais menos favorecidas, que têm como fonte de renda a retirada de mexilhões e

outros organismos que vivem na zona intertidal. Verifica-se ainda a presença de uma

pequena fazenda marinha em uma das enseadas. Por todos esses motivos, fica clara a

necessidade urgente da gestão de tantos conflitos de interesses e de diferentes pontos de

vista da área costeira.

Figura 2 – Caracterização e localização da área de estudo e ponto de coleta.

2.2) O Ecossistema da Ressurgência

As primeiras evidências da ocorrência da ressurgência aparecem com os

trabalhos de MOREIRA DA SILVA (1968, 1971 e 1973), além de VALANTIN,

(1974). Este fenômeno se manifesta mais freqüentemente entre os meses de outubro e

abril, aproximadamente primavera-verão, a sudoeste da Ilha de Cabo Frio, em Arraial

do Cabo. Sua zona de influência pode se estender por mais de cinqüenta quilômetros,

de acordo com sua intensidade (GUIMARÃES & COUTINHO, 1996). Até a latitude

22oS, o litoral brasileiro apresenta uma larga plataforma continental. No entanto, por

causa de uma mudança na orientação da linha costeira a topografia submarina desta

região mostra as isóbatas de 50-100 metros se aproximando da costa e na latitude 23oS

esta distância é de menos de 3 milhas (Ilha de Cabo Frio). Nesta mesma latitude, a

hidrologia própria da região é diretamente dependente das condições meteorológicas,

com o regime de ventos determinando a distribuição das massas d’água. Os ventos E-

NE dominantes de um anticiclone marítimo tropical, provocam, em razão da força de

Coriolis (transporte de Ekman), uma deriva da água superficial da Corrente do Brasil

(CB), que é uma extensão da Corrente Equatorial Sul, que corre em direção sul. A

divergência desta corrente da costa contribui para a origem de uma água costeira (AC)

derivada da mistura com a Corrente de Água Central do Atlântico Sul (ACAS), em

ascensão de 200-300 metros de profundidade. Este padrão se inverte quando da

passagem das frentes frias, que proporcionam ventos SW indicadores do fenômeno

inverso chamado “subsidência” (retorno para a costa das águas superficiais da Corrente

do Brasil). O perfil vertical da temperatura mostra a formação de uma termoclina na

zona de encontro das duas massas d’água (superficial e profunda) que flutua de acordo

com a intensidade e duração dos ventos (VALANTIN et al., 1987).

PAIVA (1993) encontrou uma forte correlação entre o nível médio do mar, o

regime de ventos e a temperatura da superfície do mar. Períodos em que o nível médio

do mar está baixo estão associados a baixas temperaturas superficiais e ventos

predominantes E-NE, sugerindo que o transporte de Ekman é um importante mecanismo

que afeta a ressurgência local.

Em resumo, podem ser identificados três principais fatores que aparentemente

influenciam a ressurgência:

1) a topografia;

2) a posição da Corrente do Brasil;

3) o regime de ventos, associado com o transporte de Ekman.

2.3) A atividade planctônica

A comunidade do plâncton marinho representa um grupo de diversos

organismos. Essa diversidade que faceia uma aparente estabilidade é enigmática e tem

sido estendida além de considerações morfológicas à variações fisiológicas. O plâncton

se desenvolve nas massas d’água e sua distribuição obedece aos movimentos das

mesmas dentro de três componentes que caracterizam o meio pelágico: as componentes

zonal, meridional e vertical. As duas primeiras definem a distribuição geográfica, ou

seja, correspondem respectivamente às variações do plâncton ao longo da costa e ao

longo do eixo costa-oceano. A componente vertical é relevante nas áreas onde existe

forte turbulência e correntes ascendentes, tais como a ressurgência e as áreas de

divergência. Uma quarta componente nesta estrutura é a componente temporal,

primordial no estudo da dinâmica do plâncton, e deve ser bem estabelecida em função

do tipo de organismo e do grau de variabilidade dos fatores abióticos a serem

modelados (VALANTIN, 1988). Esta variabilidade provoca diferentes condições

oceanográficas, afetando de maneira importante todo o ecossistema quanto à sua

composição populacional e produtividade da biota ali presente (RODRIGUEZ, 1992).

A ressurgência imprime um estresse ao ecossistema que resulta no seu

“rejuvenescimento”, com populações abundantes de baixa diversidade específica

(MARGALEF, 1978; THIROT, 1978).

Durante os meses da estação primavera-verão, a ascensão de água profunda da

ACAS (Águas Centrais do Atlântico Sul), melhor caracterizada por temperaturas

inferiores a 18 P

oPC, alta concentração de nutrientes (10 µM de nitrato) e salinidade

variando entre 35 e 36 S%o (GUIMARÃES & COUTINHO, 1996), é responsável pela

ocorrência e desenvolvimento esporádico de formas planctônicas de origem subtropical,

temperada e até batipelágica, enquanto que nos meses da estação outono-inverno,

referentes ao período de subsidência, encontra-se o plâncton tropical de águas costeiras

de superfície com temperaturas acima de 21P

oPC, salinidade entre 35 e 36 S%o e baixo

teor de nutrientes (nitrato e fosfato abaixo de 1 µM). Este fenômeno constitui para o

sistema planctônico um fator geral de variação:

- pela alternância dos movimentos ascendentes e descendentes;

- pela amplitude da componente horizontal;

- pela variação de sua intensidade que caracteriza os ciclos temporais de

curtos e longos períodos.

Na variação sazonal, as maiores biomassas são registradas durante o verão, com

populações microplanctônicas de ordem de 500 a 2 milhões de células por litro. Os

ciclos curtos estão ligados à sucessão das fases de ressurgência e subsidência. Durante

esse período, o fitoplâncton é dominado por diversas populações de grande diversidade

de grupos e espécies (VALANTIN, 1988).

A ressurgência é potencialmente importante para a produtividade da biota local

(MOREIRA, 1971; COUTINHO et al.,1989, COSTA e HAIMOVICI, 1990; COSTA e

FERNANDES, 1993). Os níveis de radiação luminosa em regiões tropicais não são

exatamente limitantes para o crescimento algal quando comparados à luz nas altas

latitudes (LÜNNING, 1990). Quando a luz se torna favorável ao crescimento algal, os

nutrientes são consumidos e constituem então os principais fatores limitantes das

populações fitoplanctônicas. VALIELLA (1994) citou que, além da disponibilidade de

luz e nutrientes, outro fator potencial que limita o desenvolvimento das algas é o

herbivorismo pelo zooplâncton (grazing).

Os resultados obtidos por VALANTIN e COUTINHO (1990), a partir da

simulação de um máximo de clorofila durante um evento de ressurgência, reforçam a

hipótese de uma atuação preponderante dos fatores físicos (advecção lateral) e do

herbivorismo como limitantes do crescimento da biomassa primária nesta região.

2.3.1) O Fitoplâncton

A atividade fotossintética do fitoplâncton, além de variações sazonais

(HARRISON e PLATT, 1980; FALKOWSKY, 1984), é influenciada pela estratificação

da coluna d’água (GALLEGOS et al., 1983), tamanho das células (MALONE, 1977,

1980; HARRIS, 1983; TAKAHASHI e BIEFANG, 1983), temperatura (EPPLEY,

1972; HARRISON et al., 1982; SMITH et al., 1985) e turbulência (LEWIS et al., 1984).

É portanto, fundamental considerar a variação dos parâmetros ambientais na análise da

variação da atividade fitoplanctônica, que é de grande importância ecológica, uma vez

que compromete as medidas de produção diária.

RODRIGUEZ e TENEMBAUM (1995) observaram a variação diurna da

capacidade fotossintética (PmB) do fitoplâncton para duas estações de coleta com

diferentes graus de influência da ressurgência em Arraial do Cabo. Os valores de PmB

(mg C. mg Clor. a-1.h-1) variam de 0,05 a 23,8 para todos os resultados obtidos e a

amplitude máxima ao longo de um dia foi de 0,09 a 4,18. PmB apresentou uma relação

exponencial com a temperatura e com o nitrogênio. A fração nanoplanctônica

representou até 99% do fitoplâncton. A variação da capacidade fotossintética

apresentou na maior parte dos experimentos valores máximos no período entre as 10h e

14h. Os valores mínimos ocorreram em uma população constituída por 88% de

microplâncton e 12% de nanoplâncton. Segundo MAC CAULL e PLATT (1977), as

variações da fotossíntese em populações naturais resultam de uma oscilação intrínseca

do fitoplâncton e de flutuações dos fatores ambientais.

Os resultados de MALONE (1971) mostram que, quando as concentrações de

nitrogênio são limitantes, o nanoplâncton tende a apresentar o máximo de fotossíntese

de manhã e à tarde, quando as águas são ricas devido à sua baixa capacidade de estocar

nutrientes. Já o microplâncton, devido à sua maior capacidade de estocagem, apresenta

o máximo a tarde independentemente do regime de nutrientes. Segundo GLOVER

(1980), a relação entre nutriente limitante e a capacidade fotossintética é variável e

altamente dependente da espécie.

RODRIGUEZ (1994) examinou curvas de saturação de luz do fitoplâncton de

quatro estações da região de Cabo Frio e relatou as trocas das condições ambientais,

com base em 263 experimentos feitos semanalmente durante dois anos. Concluiu que

nenhuma diferença na produtividade específica entre as estações foi detectada. A

análise de correlação e regressão atribuiu a maioria das variações de PmB à temperatura,

à salinidade, nutrientes e à razão feoficina / clorofila-a. Não identificou um significante

padrão sazonal devido à enorme variabilidade temporal de PmB , mas esta apresenta

alguma tendência. Essa forte variabilidade pode ser explicada pela grande sensibilidade

deste ecossistema a trocas repentinas na velocidade e direção dos ventos e à alternância

das variáveis hidrológicas e biológicas. A força de estratificação pode também

influenciar a produtividade, já que isto age sobre a luz e o regime de nutrientes (JONES

et al., 1984; LEGENDRE e DEMERS, 1984).

GONZALEZ-RODRIGUEZ, et al.(1992) realizaram uma análise baseada em

diferentes fases de ressurgência e subsidência. Estabeleceram um modelo de análise de

componentes principais e regressão dos aspectos biológicos de Arraial do Cabo. Para

condições idênticas de ressurgência, ocorre uma resposta biológica de igual intervalo,

permitindo o estabelecimento de um padrão regional. Esses padrões são representados

pelos valores de clorofila variando entre 0,5 e 0,6 mg/m-3, e produção primária variando

entre 2 e 14 mg C m-3 h-1. Durante o inverno, na ausência de ressurgência, as águas

apresentam uma temperatura, nutrientes, biomassa primária e produção nos mesmos

níveis daquelas achadas nas fazes de pós-ressurgência. Mesmo na ausência de água

profunda, o enriquecimento orgânico parece ser importante, quando comparado as águas

oligotróficas da corrente do Brasil. A abundância de matéria orgânica nas águas de

inverno, principalmente a maioria oriunda do sedimento ressuspendido do fundo da

plataforma continental, constitui a principal fonte de energia mantendo altos níveis da

rede alimentar, especialmente a abundância do zooplâncton (110 mg/m-3/dia, média

anual, VALANTIN e MOREIRA, 1978), controlando o crescimento das populações do

fitoplâncton.

Num estudo sobre a fertilidade e os fatores nutricionais limitantes da biomassa

fitoplanctônica de Cabo Frio, RODRIGUEZ (1991), comenta que a fertilidade das águas

varia com as espécies consideradas e o período do ano. As águas mais ricas em

nutrientes minerais (N e P) não são sempre as mais férteis. No entanto, são as águas de

ressurgência que, globalmente, são as mais férteis. O nitrogênio e o fósforo são os dois

elementos principais que limitam a biomassa algal; as substâncias complexantes são o

terceiro fator limitante. Deduz-se que as algas podem absorver diretamente formas

químicas orgânicas dos elementos nutritivos e, desta forma, outros elementos podem se

tornar limitantes antes dos citados.

O conhecimento do teor mineral da água não é suficiente para se conhecer a

biomassa máxima potencial que ela pode suportar, pois outros elementos não dosados

podem igualmente ser absorvidos e ter papel importante na capacidade de produção

algal (MAESTRINI et al., 1984) influenciando assim, o número de espécies capazes de

se desenvolver sobre as condições presentes. Esta propriedade é conhecida como

“condicionamento biológico” (PROVASALI, 1963; JOHNSTON, 1964) e foi colocada

em evidência por BARBER e RYTHER (1969) e BARBER et al. (1971). BANSEN

(1977), mostra que as células no momento da densidade máxima são pobres em

clorofila-a, mesmo levando-se em consideração as numerosas variações de ordem

fisiológica.

RYTHER e GUILLARD (1959), GOLDMAN e MANSON (1962), CHARPY et

al., (1982) assinalaram que a presença de ferro associado com substâncias complexantes

pode acelerar a assimilação do carbono, conduzindo a uma sub-estimativa do papel do

nitrogênio e do fósforo. Além disso, o elemento limitante não é sempre aquele que está

presente nas águas nas concentrações mais fracas conhecidas (SMAYDA, 1970), pois as

análises levam freqüentemente em conta apenas a parte mineral, enquanto as algas

podem utilizar compostos orgânicos (RAYWCARD, 1965; SOLORZANO e

STRICKLAND, 1968 e ANITA et al., 1975). De outra forma, o efeito crítico de um

elemento depende mais das condições físico-químicas que controlam sua

disponibilidade do que sua concentração total (PROVASALI, 1963). Este processo é

importante para os metais, principalmente o ferro, como mostram HUNTSMAN e

SUNDA (1980). No entanto, um valor elevado de fertilidade a um dado momento não

corresponde forçosamente a um aporte de elementos biogênicos novos, pois formas

químicas regeneradas participam da produção da biomassa. Os elementos que limitam a

biomassa de Arraial do Cabo são o nitrogênio, o fósforo e, em menor grau, o ferro e o

molibdênio (RODRIGUEZ, 1991).

2.3.2) Introdução à Ecologia das Larvas Merozooplanctônicas

Este trabalho se propõe a analisar o comportamento da fração meroplanctônica

da fauna epibentônica de Arraial do Cabo, para tentar fornecer um diagnóstico do estado

ecológico e ambiental.

A existência de um estágio de larvas planctônicas no ciclo de vida de

invertebrados marinhos é uma opção e adaptação evolutiva. Em geral, parece que o

ambiente pelágico oferece oportunidades tróficas e dispersivas não disponíveis para

organismos bênticos. O sucesso em um estágio do ciclo de vida requer sucesso na

transição de todos os outros estágios. Um organismo como função do tempo pode ser

uma bem adaptada larva herbívora planctônica e igualmente especializado carnívoro

bentônico da zona intertidal. A gametogênese, desova e fertilização pelos estágios

bênticos são importantes determinantes do sucesso inicial nas formas planctônicas. Da

mesma maneira, o comportamento da larva pelágica determina o habitat dos adultos

bentônicos. É esta propriedade de integração do ciclo de vida que estabelece a própria

perspectiva de análise da componente meroplanctônica da comunidade zooplanctônica

marinha. A maioria dos taxons de invertebrados bênticos possui alguma espécie com

larvas pelágicas.

A descrição da ecologia da fração larval da comunidade planctônica se dará aqui

em três tópicos, como segue:

1) causas de mortalidade durante o período planctônico;

2) energia do desenvolvimento larval e,

3) dispersão.

Uma larva pode ser definida como o estágio de desenvolvimento entre a saída da

membrana dos ovos e a metamorfose para a fase adulta. Tipicamente, tais estágios

possuem estruturas larvais que existem e funcionam somente neste período do ciclo de

vida. Fica claro que a diversidade e variedade de formas apresentadas pelas várias

classes de invertebrados não pode ser adequadamente captada por uma simples e

concisa definição. A intenção aqui é indicar a fase do ciclo de vida que é planctônica.

Além disto, os termos pelágico e planctônico serão usados de forma intercambiável com

referência às larvas destes organismos. O período pelágico começa com a desova ou

eclosão. A desova de gametas livres por ambos os sexos resulta em zigotos pelágicos,

embriões e larvas. A duração do período pelágico pode variar de apenas alguns poucos

minutos, como é o caso de algumas ascídias, até anos, como no caso de lagostas. Em

geral, a fase pelágica é pequena se comparada com a fase bentônica dos indivíduos

juvenis e adultos. É observado que, entre a fase de fecundação e a fase de recrutamento,

existe uma taxa de mortalidade muito elevada. Por este motivo, é conhecido que

inúmeras fêmeas podem desovar até quarenta milhões de gametas por ano. MENGE

(1975) estimou que a taxa de mortalidade larval pode chegar em alguns casos a 99%. A

predação, fatores físicos ambientais, a escala de dispersão inapropriada e a inanição têm

sido sugeridos como as principais causas desta elevada taxa de mortalidade. A

influência dos fatores físicos ambientais (temperatura e salinidade) pode não ser a causa

letal direta, porém o estresse sub-letal pode retardar ou acelerar as taxas de

desenvolvimento e o período de permanência no plâncton (JOHNS I , II). HANS (1986)

demonstrou que nauplios de cirripédios apresentaram pouca atividade a baixa

salinidade. Por causa dessa inatividade, as larvas na natureza provavelmente

submergem para camadas com maior salinidade. Comportamento similar foi observado

em decapodas (ANGER, 1985). HANS (1986) atribuiu as diferenças de tamanho de

larvas à temperatura, porque foram achadas as menores larvas em regiões mais frias.

Estes resultados contrastam com os de BARNES (1965), que achou maiores tamanhos

em áreas geográficas mais quentes. Decerto, adaptações não genéticas podem

influenciar na aclimatação, no tamanho e no tempo de desenvolvimento naupliar.

O tempo de permanência no plâncton durante a vida pelágica está relacionado

com a escala de varredura no processo de dispersão da espécie e com o amadurecimento

da larva para encontrar os sítios de assentamento e a escolha do habitat apropriado. A

escala de dispersão está associada à ecologia da fase bentônica. Existe ainda diferentes

graus de respostas de diferentes espécies aos fatores que perturbam as taxas de

desenvolvimento larval. Temperatura, salinidade e estresse nutricional podem aumentar

ou diminuir o número e duração dos estágios larvais. Como conseqüência, é difícil

fazer previsões sobre os efeitos sub-letais do estresse ambiental na taxa de

desenvolvimento e potencial de dispersão.

A predação tem sido considerada a mais importante causa da perda de larvas.

Por exemplo, peixes planctívoros e ctenóforos são conhecidos como predadores de

muitas formas de larvas e embriões. É muito difícil estabelecer o efeito quantitativo de

tal predação na natureza, mas a evidência de que este é um importante processo vem da

ocorrência de estruturas de defesa como o desenvolvimento do espinho do rostro, setas e

setulas, bem como defesas químicas e sensibilidade à luz logo depois da eclosão, que

pode levar a larva a regiões isentas de predadores na coluna d’água. A suposição de que

a predação é a mais importante fonte de mortalidade levou a uma série de modelos da

história da vida marinha (CHRISTENSEN e FENCHEL, 1979, CASWELL, 1981,

dentre outros). A característica comum a esses modelos é a adoção de uma taxa de

mortalidade constante e significante, além da minimização do tempo de exposição à

predação.

Considerações energéticas sobre organismos vivendo com quantidades fixas de

combustível (energia) não são triviais. Qualquer fator que mude a taxa de

desenvolvimento, a taxa metabólica, ou o tempo requerido para encontrar o substrato

apropriado para o assentamento pode produzir energicamente uma equivalência à

inanição.

Estudos de laboratório demonstraram a susceptibilidade à inanição. Estes dados

são uma fonte de mortalidade para todas as larvas, exceto aquelas que encontram ricos

patches do plâncton (ANGER, 1981). A composição bioquímica do fitoplâncton mostra

uma maior quantidade de proteínas, carboidratos e alguns lipídios. A maioria das larvas

pode presumivelmente sintetizar todos os ácidos graxos a partir de carboidratos. O

estudo de WEST e COSTLOW (1987) revelou que a limitação da quantidade de

alimento fornecido a larvas com baixo estoque de energia pode resultar em reduzido

sucesso metamórfico. A extensão da vida larval reduz as reservas energéticas da larva

no estágio cipris (non-feedind larvae) e resulta em reduzido crescimento juvenil

(JAECKLE, 1994). A variação temporal do conteúdo orgânico em cipris pode refletir

diferenças na qualidade (FENAUX et al., 1994) e quantidade (MOYSE, 1963) do

alimento disponível nos estágios de nauplio. JARRETT e PECHENIK (1997) mostrou

que a variação temporal da qualidade da larva cipris e a capacidade de crescimento de

juvenis pode também ser por causa da qualidade dos ovos produzidos pelos adultos.

A escala de dispersão depende do movimento das massas d’água, do

comportamento larval e da duração dos estágios pelágicos. A longevidade larval e os

movimentos da água estabelecem o potencial de dispersão, enquanto o comportamento

da larva freqüentemente determina o atual grau de difusão e separação. Ambos

contribuem para a distribuição geográfica das espécies bentônicas sedentárias e sésseis,

enquanto as correntes e os fluxos de maré resultam em padrões cíclicos de translocação

e fornecimento de larvas para o processo de recrutamento e assentamento das

populações.

O desenvolvimento da fase larval planctônica é dividido em dois períodos, um

chamado de pré-competente, outro de competente. A duração do período pré-

competente depende das taxas de crescimento e desenvolvimento, as quais são

modificadas por fatores tais como variação genética, temperatura e disponibilidade de

alimento. A competência larval depende do período pré-competente e é um estado

fisiológico que estabelece a capacidade de assentamento. O comportamento de

assentamento é um fenômeno ecológico complexo. Nesta fase do ciclo de vida se

encontra o término da fase larval e envolve uma mudança morfológica e fisiológica

radical durante a transição para as formas adultas bentônicas. O assentamento de uma

larva é um processo de comportamento reversível associado com o contato e exploração

do substrato antes da metamorfose, que, diferentemente, é um fenômeno de

desenvolvimento irreversível mediado por várias transformações do indivíduo entre

formas de vida distintas, que inclui a permanente fixação através da liberação de

“cimento”. No processo de assentamento, ocorre uma resposta da larva à substâncias

indutoras (TAMBURRI et al., 1992). Estes compostos podem ser liberados na água por

indivíduos adultos da mesma espécie (conespecíficos) ou por microorganismos do

biofilme bacteriano. Na realidade, as larvas podem reconhecer locais favoráveis ou não

para o assentamento e metamorfose e exibem variada resposta à presença, ausência e

idade do biofilme (MAKI et al., 1992 e WIECZOREK e TODD, 1998).

MOORE et al., (1994) demonstrou que o processo de assentamento é governado

por forças físicas. As larvas são influenciadas pela interação entre o fluido em

movimento e a superfície do sólido estacionário. Esta interface é chamada boundary

layer, geralmente dividida em três regiões, cada qual caracterizada pela combinação de

forças particulares. A região imediatamente acima da superfície sólida é chamada bed

layer e consiste de duas sub-camadas. Na primeira, ocorre a difusão molecular e pode

ter apenas poucos micrômetros de espessura e se caracteriza pela ausência de fluxo. A

sub-camada mais externa (sub-camada viscosa) é caracterizada por um fluxo laminar

(quasilaminar flow), mas é dominada pela força de viscosidade do fluido, tendendo a

diminuir a turbulência. A segunda região, ainda mais externa, é chamada de buffer zone

ou log layer. Nela a força inercial e a viscosidade são importantes na manutenção do

fluxo. Seu nome é dado pelo fato de que a velocidade do fluxo nesta camada é uma

função da distância logarítmica sobre o sólido. A terceira e mais externa é chamada de

camada exterior (outer layer) ou camada de déficit logarítmico (log-deficit layer), onde

o fluxo é praticamente independente da força friccional e o fluido em movimento, se

caracteriza pela presença de grande turbulência.

Capítulo III

Análise e Descrição dos Dados Disponíveis

Neste estudo, foram reunidas séries temporais de pouco mais de dez anos,

compreendendo o período de novembro de 1994 até outubro de 2004, fornecidos pelo

Instituto de Estudos Almirante Paulo Moreira (IEAPM), instituição de pesquisa da

Marinha do Brasil. A base de dados é constituída por um conjunto de variáveis

abióticas e bióticas. As primeiras, físicas e químicas, demonstram a variabilidade das

características hidrológicas do ambiente marinho em termos de mudanças dos padrões

de qualidade de água, em função da alternância dos períodos de eutrofização e de

períodos de subsidência devido ao fenômeno da ressurgência. As variáveis biológicas

são compostas por medidas de concentração de clorofila-a (mg/l) como estimativa da

biomassa algal, que é diretamente influenciada, qualitativa e quantitativamente, pelo

aporte de nutrientes. Esta por sua vez, serve de alimento para as larvas zooplanctônicas

dos organismos epibentônicos, que são as variáveis que compõe o segundo nível trófico

deste estudo. Podem ainda ser incluídos nesta categoria todas as bactérias autotróficas

fotossintetizantes que residem na coluna d’água e os organismos mixotróficos que, em

algum momento, dependendo das condições ambientais, contribuem para a atividade

fotosintética.

As variáveis referentes às larvas zooplanctônicas compreendem a abundância de

ocorrência desses organismos e estão expressas em número de organismos por metro

cúbico de água. Este grupo de variáveis é composto de diversos níveis taxonômicos, o

que permitirá conhecer também qual a granulometria necessária e mais adequada para

futuros programas de gerenciamento ambiental. A variável da sub-classe Cirripédia

(cracas) se refere aos estágios de desenvolvimento larval do tipo nauplii, enquanto a

variável cypris se refere ao último estágio de desenvolvimento deste mesmo grupo. São

agrupados na classe Bivalvia todas as larvas deste grupo taxonômico com exceção das

famílias Mytilidae (mexilhões) e Ostreidae (ostras), que constituem elas próprias outras

duas variáveis da base de dados e de grande interesse econômico. Na variável Larva em

Desenvolvimento (LD), estão incluídos organismos com estágio de desenvolvimento

muito inicial, não permitindo então uma identificação precisa. A base de dados contém

ainda variáveis do filo Bryozoa, classe Polychaeta e Echinoidea (ouriço do mar), ordem

Decapoda (sirís) e família Ascidiaceae.

Foram retiradas da base de dados, já na fase inicial dos estudos, a variável das

larvas pertencentes à classe Ophiuroidea, por serem extremamente raras, as variáveis

das larvas da família Teredinidae, gênero Isognomon, e o grupo das larvas de tipo

Trocófora, por apresentarem mais de dois terços de suas contagens com valor zero e,

portanto, inferirem tendências.

Vale aqui ressaltar que a referida base de dados faz parte de um projeto de

monitoramento ambiental da Ilha de Cabo Frio mantido pelo IEAPM e não foi

produzida com o intuito de ser usada em um estudo de mineração de dados.

Estes dados consistem de amostragens semanais de água a aproximadamente 30

metros da linha de praia da Ilha de Cabo Frio (Figura 2). As coletas foram realizadas na

superfície da área de estudo e os parâmetros hidrológicos foram determinados como

segue: para a temperatura, foi utilizado um batitermógrafo e um termômetro de

inversão; para a salinidade, foi usado o salinômetro de indução Beckman modelo RS-

7C; para os nutrientes nitrato, nitrito, amônia e fosfato, além dos valores de oxigênio,

usou-se os métodos descritos em STICHKLAND e PARSONS (1968). A clorofila foi

determinada através do método espectrofotométrico de RICHARD e TOMPSON (1952)

e da equação de SCOR-UNESCO (1966). As amostras zooplanctônicas foram coletadas

através de arrasto horizontal em superfície, com rede tipo cilindro-cônica, com 100 µm

de abertura de malha, em torno do ponto de estudo, e fixadas com formol a 4% e

posteriormente contadas “in totum” sob lupa em cuba de Dollfus. O volume filtrado foi

estimado através de fluxômetro tipo TKS. Os resultados foram extrapolados para

organismo/mP

Para ilustrar a compreensão e visualização das relações entre as variáveis

envolvidas no funcionamento e controle do sistema em estudo, elaborou-se um

diagrama conceitual como ilustrado na Figura 3.1.

Figura 3.1 – Diagrama Conceitual

A radiação solar disponível é a principal fonte de energia para a

fotossíntese fitoplanctônica e o crescimento destas populações é função da quantidade

de radiação incidente e das propriedades ópticas da coluna d’água. A turbidez afeta a

penetração da luz e está envolvida na regulação da quantidade de luz no ambiente. Da

mesma forma, a estabilidade da coluna d’água é uma função da turbulência induzida

pelo fluxo de correntes e pelo vento. Os dados não incluem fatores como as interações

de competição interespecíficas, vento e fluxo de correntes.

As massas d’água são primeiramente caracterizadas pela temperatura e

salinidade próprias (Tabela 3.1) e transportam os nutrientes, que são uma segunda forma

de entrada de energia para a fotossíntese com posterior produção de oxigênio. Fatores

físicos, como a sedimentação e advecção; como também os biológicos, como a

mortalidade, predação, etc. são importantes e ocorrem simultaneamente no sistema.

Tabela 3.1 – Características T/S das massas d’águas de Arraial do Cabo

MASSAS D’ ÁGUA T °C S % ACAS T<18 S<36 ACAS/ÁGUA COSTEIRA 18<T<20 35,4<S<36 ÁGUA COSTEIRA T>20 S<35,4 ACAS/ÁGUA TROPICAL 18<T<20 S>36 ÁGUA COSTEIRA/ÁGUA TROPICAL T>20 35,4<S<36 ÁGUA TROPICAL T>20 S>36

Devido à grande transparência das águas no ponto de estudo, não se teve a

preocupação de incluir informações sobre a incidência de radiação luminosa, pois este

fator não constitui, neste caso, fator limitante para o desenvolvimento dos organismos

clorofilados.

Para se conhecer o comportamento e a distribuição dos dados, uma estatística

básica, contendo valores mínimos, máximos, média e desvio padrão, é apresentada na

Tabela 3.2.

Tabela 3.2 – Unidades, valores mínimos, máximos, média e desvio padrão das variáveis

Variáveis Unidade Mínimo Máximo Média Desv. Pad.Temperatura P

oPC 15.88 29.4 22.59 1.88

Salinidade g/l 32 39.14 35.48 0.62 Oxigênio ml/l 1.97 8.79 5.30 0.50

Fosfato (POB4 B) µg/l 0 3.69 0.27 0.21 Nitrito (NOB2B) µg/l 0 0.7 0.07 0.09 Nitrato (NOB3 B) µg/l 0 10.19 0.62 0.94 Amônia (NHB4 B) µg/l 0.07 6.61 1.25 0.80

pH - 6.81 10.44 8.07 0.38 Clorofila-a mg/l 0 6.36 0.95 0.84 Cirripedia Org/mP

3P 0 3641 155.12 308.71

Mytilidae Org/mP

3P 0 9309 99.01 424.93

Polychaeta Org/mP

3P 0 1683 18.06 82.54

Decapoda Org/mP

3P 0 478 17.71 42.67

LD Org/mP

3P 0 2229 72.19 195.95

Ostreidae Org/mP

3P 0 1132 28.64 82.38

Cypris Org/mP

3P 0 5537 49.41 450.45

Ascidiaceae Org/mP

3P 0 1115 17.08 73.32

Bryozoa Org/mP

3P 0 101 2.45 8.58

Echinoidea Org/mP

3P 0 201 3.34 13.95

Bivalvia Org/mP

3P 0 277 9.92 28.80

Pela inspeção da Tabela 3.2, verifica-se que as variáveis ambientais

(físico e químicas) apresentam pequenos valores de desvio padrão, apesar de os

nutrientes mostrarem valores mínimos indicando a ausência destes no ambiente

(concentrações provavelmente abaixo dos limites de detecção dos equipamentos

utilizados) e valores máximos dentro de intervalos já sugeridos na literatura por outros

autores. Porém, também pode ser observado valores mínimos indicando a ausência das

larvas zooplanctônicas, mas valores de desvio padrão muito elevados. Esta situação

será utilizada neste trabalho como critério para a detecção e definição de outliers para

estas variáveis. Portanto, os valores que excederem três vezes seu desvio padrão serão

automaticamente substituídos pela maior das médias entre as variáveis. Espera-se com

esta medida minimizar o efeito numérico destes valores sobre o funcionamento dos

algoritmos que serão utilizados preservando ainda o comportamento do sistema. Estes

valores poder ser resultantes de atividade de desova, caracterizando estados especiais e

“raros” nos dados, ou serem resultado dos arrastos de rede terem ocasionalmente

acontecido em zonas de maior concentração destes organismos no patch planctônico,

determinando assim algum nível de ruído inerente a esta base de dados. Através da

observação dos gráficos de flutuações interanuais (vide anexo), pode-se verificar que

esta estratégia foi utilizada, na realidade, em muito poucos casos, evitando a exclusão

destes da base de dados. Outra preocupação importante na fase de assistência à base de

dados foi preencher os valores faltantes (PYLE,1999). A variável salinidade

apresentava o intervalo de 27/04/04 a 05/10/04 com este problema; a solução usada foi a

aplicação da técnica de KNN (50 vizinhos mais próximos) descrita por FUKUNAGA

(1972). Na variável oxigênio, foram encontrados três valores errados apresentando

sinais negativos. Uma consulta ao pessoal do IEAPM sanou o problema prontamente.

A variável nitrito apresentou apenas dois valores faltantes; neste caso, o procedimento

adotado foi o de uma média móvel dos últimos quatro valores. O procedimento

seguinte foi o de normalizar os dados segundo a fórmula abaixo descrita, para

minimizar o efeito das altas concentrações e abundâncias, estabilizando a variância,

padronizando-os com média zero e tendo a unidade como desvio padrão para a

execução de análise multivariada efetuada:

MINMAXMINatualValornormValor

−−

As flutuações das variáveis ao longo do período de estudo e as variações médias

interanuais são apresentadas no Anexo.

A flutuação da temperatura na Figura 3.1a no Anexo demonstra a forma de uma

senoide e, a partir do ano de 1998, seus valores máximos têm um aumento gradual,

evidenciando alguma tendência, mas este comportamento não se verifica no ano de

2004. Porém, quando se observa a Figura 3.1b do mesmo anexo, pode-se observar que

os valores das médias interanuais têm um comportamento em forma de U. Isto pode ser

explicado pelo fato do ano de 1995 ter sido um ano de ocorrência do fenômeno “El

Ninho”, mas pode também ser especulado como um comportamento referente a padrões

de longo período.

A flutuação de salinidade é apresentada na Figura 3.2a do anexo, onde se pode

notar que, no período de agosto/setembro de1995, são verificados seus menores valores,

enquanto que, em abril de 1997 e maio de 2004, acontece situação inversa. Os menores

valores médios interanuais da salinidade são verificados nos anos de 1995 e 1998, talvez

pela maior permanência de água costeira, de acordo com os valores apresentados pela

Tabela 3.1 (S<35.4).

A flutuação do oxigênio pode se verificada na Figura 3.3a, onde se constata uma

enorme variabilidade. Seu valor máximo se dá no ano de 1999, a segunda maior média

anual, de acordo com a Figura 3.3b. Seu comportamento, com valores médios em torno

de 5 ml/l, demonstra um ambiente sadio. Apesar do oxigênio ser um produto da

fotossíntese, este não necessariamente acompanha o mesmo padrão da clorofila, devido

ao consumo pelos processos de respiração, oxidação geoquímica e de matéria orgânica,

além da grande maioria ser exportada para a atmosfera. Por este fato, as menores

concentrações são verificadas nos anos de 1998 e 2000 e podem estar ligadas a

processos de regulação interna do sistema. De outra maneira, redução mais acentuada

de valores médios anuais ocorre em 1996, com valores pontuais acima de 5 ml/l.

Verifica-se na Figura 3.4a a incidência de fosfato nas águas. O maior valor é

encontrado em setembro de 2002. Porém seus valores médios interanuais mostrados na

Figura 3.4b indicam adequada disponibilidade deste nutriente para o crescimento da

biomassa algal, de acordo com RODRIGUEZ (1991), salvo possíveis limitações pela

razão nitrogênio/fósforo como demonstrada em PEREIRA 2002.

Das três formas de nitrogênio inorgânico medidas durante o período estudado,

foi o nitrato que apresentou o maior valor, 10,19µg l P

-1P. A amônia mostra um valor de

6.61 µg lP

-1P, enquanto o nitrito tem a menor participação, com 0,70 µg l P

-1 Pde acordo com

as Figuras 3, números 5a, 6a e 7a respectivamente. Porém, pode ser observado que as

maiores médias interanuais do nitrato ocorrem a partir de 1999 (Figura 3.6b), enquanto

que as maiores médias interanuais da amônia se dão nos anos anteriores a 1999 (Figura

3.7b). O nitrito apresenta comportamento variado, segundo a Figura 3.5a.

A observação da flutuação da variável pH, na Figura 3.8a, revela um valor

máximo de 10.44 em setembro de 2001, algo totalmente atípico para este local, se

comparado com a variação média na Figura 3.8b.

A flutuação das concentrações de clorofila-a ao longo do período de tempo

estudado são apresentada na Figura 3.9a. Existe uma significante variação no tempo e

uma relativa magnitude de incidência de “blooms” algais, que geralmente acontecem

nos meses de primavera-verão, demonstrando um padrão sazonal dos ciclos de curto

período. Verifica-se ainda que os maiores valores de clorofila-a ocorrem nos anos de

1996 a 1999. Os outros anos apresentam picos de menor magnitude. Porém, a inspeção

da Figura 3.9b revela que a variação média de clorofila-a está de acordo com valores já

propostos na literatura para esta região. A explicação para tal comportamento pode

estar ligada aos ciclos de médio período.

Pode ser facilmente visualizada na Figura 3.10a a presença de um valor extremo

(outlier) e variação real no ano de 2002 para a variável Cirripedia, este valor será um

dos valores tratados como outlier. Na análise dos gráficos das variações das médias

interanuais (Figura 3.10b), deve-se também ter cuidado nos anos de 1994, pois, apenas

se referem aos dois últimos meses deste ano.

De forma semelhante, a Figura 3.11a apresenta uma única ocorrência com valor

extremo, entre os anos de 2000 e 2001, de larvas da família Mytilidae. Pode-se dizer,

por este motivo, que, na Figura 3.11b, a média referente ao ano 2000 deve ter sido

puxada para cima pela presença deste valor e que a menor ocorrência média de

mexilhões se deu no ano de 1997.

Quanto aos organismos da ordem Decapoda (Figura 3.12a), estes apresentam

uma flutuação mais comportada, com as maiores variações médias, ocorrendo a partir

do ano de 1999.

Também na variável dos organismos Polychaetas, encontramos outliers (ano de

2002 na Figura 3.13a); seu efeito na média anual da Figura 3.13b.

As larvas em D apresentam grande variação na Figura 3.14a, porém observa-se

que, na Figura 3.14b, com exceção do ano de 1994, as maiores médias anuais ocorrem

nos anos de 2000 e 2001, semelhante às larvas da família Mytilidae (Figura 3.11b) e

Ostreidae, como pode ser verificado na Figura 3.15b.

Para as larvas da sub-classe Cirripedia em estágio de desenvolvimento avançado

e em fase de assentamento, larvas cypris na Figura 3.16a, podemos também detectar a

presença de outliers no ano de 2003 e sua média anual alterada na Figura 3.16b. No ano

de 1997, parece não haver ocorrência deste tipo larval.

Na análise das larvas pertencentes à família Ascidiaceae , Figuras 3.17a e 3.17b,

também ocorrem valores altos.

A maior ocorrência média de organismos do grupo dos briozoários se dá no ano

de 2003, como pode ser verificado nas Figuras 3.18a e 3.18b. Situação semelhante se

ocorre com os organismos da variável Equinoide (Figuras 3.19a e 3.19b).

A variável da classe Bivalvia apresenta, na Figura 3.20a, uma grande

variabilidade, estando mais presente no período compreendido entre 1994 e início de

1997, além de 1998. Ocorre a maior média no ano de 1996, segundo a Figura 3.20b.

De uma forma geral, pode-se dizer que o ano de 1997 foi um ano de ocorrência de

baixas temperaturas médias e salinidade alta, acompanhadas de baixa ocorrência larval.

A matriz apresentada na Tabela 3.3, demonstra as correlações lineares existentes entre

as variáveis ambientais, a concentração de clorofila e as densidades larvais.

Tabela 3.3 – Correlação das variáveis

Matriz de Correlações Variáveis Temp Sal O2 PO4 NO2 NO3 NH4 PH Clorofila Cirripedia Mytilidae Decapoda Polychaeta LD Osteidae Cipris Ascidiaceae Bryozoa Equinoide Bivalvia

Temp 1.00 -0.18 -0.29 -0.24 -0.30 -0.20 0.02 0.05 -0.29 0.08 0.01 0.02 0.04 0.08 0.00 -0.03 0.10 0.04 0.04 0.14 Sal -0.18 1.00 0.07 -0.07 0.01 0.06 -0.02 0.04 -0.01 0.00 -0.08 0.03 0.00 -0.01 -0.04 0.00 0.07 -0.07 0.01 -0.33O2 -0.29 0.07 1.00 0.00 0.01 0.03 -0.06 -0.08 0.21 -0.02 0.05 -0.01 -0.01 -0.09 0.01 -0.01 0.06 0.00 -0.04 -0.01

PO4 -0.24 -0.07 0.00 1.00 0.28 0.19 0.03 0.05 0.06 -0.03 -0.02 -0.05 0.01 0.05 -0.02 -0.01 -0.04 0.23 0.08 -0.02NO2 -0.30 0.01 0.01 0.28 1.00 0.35 0.05 0.00 0.05 0.02 -0.01 -0.04 0.00 -0.02 0.00 -0.02 -0.07 -0.03 0.04 -0.09NO3 -0.20 0.06 0.03 0.19 0.35 1.00 -0.02 -0.03 -0.03 0.06 -0.02 -0.04 0.00 0.03 0.01 -0.01 -0.03 0.04 -0.01 -0.09NH4 0.02 -0.02 -0.06 0.03 0.05 -0.02 1.00 0.01 0.01 -0.05 -0.05 -0.04 -0.05 -0.03 0.04 0.03 0.06 -0.03 -0.02 0.02 PH 0.05 0.04 -0.08 0.05 0.00 -0.03 0.01 1.00 0.00 -0.08 0.01 -0.11 -0.08 0.14 0.04 -0.17 0.00 -0.05 -0.02 0.11

Clorofila-a -0.29 -0.01 0.21 0.06 0.05 -0.03 0.01 0.00 1.00 -0.04 -0.02 -0.06 0.01 -0.06 -0.01 -0.01 0.05 -0.01 0.00 0.02 Cirripedia 0.08 0.00 -0.02 -0.03 0.02 0.06 -0.05 -0.08 -0.04 1.00 0.11 0.20 0.57 0.27 0.14 0.07 0.11 -0.03 0.04 -0.01Mytilidae 0.01 -0.08 0.05 -0.02 -0.01 -0.02 -0.05 0.01 -0.02 0.11 1.00 0.21 0.09 0.25 0.67 0.00 0.00 0.48 0.03 0.04Decapoda 0.02 0.03 -0.01 -0.05 -0.04 -0.04 -0.04 -0.11 -0.06 0.20 0.21 1.00 0.19 0.20 0.24 0.50 0.29 0.30 0.20 -0.08Polychaeta 0.04 0.00 -0.01 0.01 0.00 0.00 -0.05 -0.08 0.01 0.57 0.09 0.19 1.00 0.20 0.16 0.00 0.18 0.04 0.07 0.00

LD 0.08 -0.01 -0.09 0.05 -0.02 0.03 -0.03 0.14 -0.06 0.27 0.25 0.20 0.20 1.00 0.33 -0.03 0.27 0.12 0.05 0.17 Ostreidae 0.00 -0.04 0.01 -0.02 0.00 0.01 0.04 0.04 -0.01 0.14 0.67 0.24 0.16 0.33 1.00 0.00 0.14 0.30 0.03 0.02

Cypris -0.03 0.00 -0.01 -0.01 -0.02 -0.01 0.03 -0.17 -0.01 0.07 0.00 0.50 0.00 -0.03 0.00 1.00 -0.02 -0.01 -0.02 -0.03Ascidiaceae 0.10 0.07 0.06 -0.04 -0.07 -0.03 0.06 0.00 0.05 0.11 0.00 0.29 0.18 0.27 0.14 -0.02 1.00 0.08 0.07 -0.04

Bryozoa 0.04 -0.07 0.00 0.23 -0.03 0.04 -0.03 -0.05 -0.01 -0.03 0.48 0.30 0.04 0.12 0.30 -0.01 0.08 1.00 0.16 0.13 Equinoidea 0.04 0.01 -0.04 0.08 0.04 -0.01 -0.02 -0.02 0.00 0.04 0.03 0.20 0.07 0.05 0.03 -0.02 0.07 0.16 1.00 0.06

Bivalvia 0.14 -0.33 -0.01 -0.02 -0.09 -0.09 0.02 0.11 0.02 -0.01 0.04 -0.08 0.00 0.17 0.02 -0.03 -0.04 0.13 0.06 1.00

Primeiramente, pode ser constatado que a temperatura apresenta uma correlação

negativa com os valores de salinidade, oxigênio, com os nutrientes e clorofila

(respectivamente r = - 0.18; r = -0.29; r = - 0.24; r = - 0.30; r = - 0.20; r = - 0.29). Este

fato pode ser explicado devido ao próprio fenômeno da ressurgência onde as águas

profundas, mais frias e ricas em nutrientes, aflorem sendo assim inversamente

proporcionais. Pode ser verificada também a significativa correlação positiva entre

clorofila e oxigênio (r = 0.21) pois o oxigênio é um produto da atividade fotossintética.

Dentre os nutrientes, o nitrato parece ser preferencialmente a principal forma

nitrogenada por apresentar correlação negativa com a clorofila (r = - 0.003). Pode-se

verificar ainda a completa ausência de correlação entre a clorofila, pH e Equinoide.

Quando se observa as relações entre a temperatura e as variáveis larvais pode-se

observar que somente a família Ascidiaceae e a classe Bivalvia apresenta alguma

correlação (r= 0.10 e r = 0.14 respectivamente). Já com a salinidade, somente a classe

Bivalvia apresenta alguma correlação, ainda que negativa (r = - 0.33). A família

Mytilidae demonstra a maior correlação positiva com a família Ostreidae (r = 0.67)

seguida do filo Bryozoa (r = 0.48). A sub classe Cirripedia apresenta uma forte

correlação com a variável Polychaeta (r = 0.57) enquanto que a ordem Decapoda

apresenta forte correlação com as larvas do tipo Cypris (r = 0.50). As larvas em D se

mostram correlacionadas com a família Ostreidae (r = 0.33) e, a família Ascidiaceae

também se correlaciona, em menor grau, com a ordem Decapoda (r = 0.29).

No intuito de reduzir a dimensionalidade dos dados e acessar sua estrutura, em

primeiro lugar, aplicaremos a método de análise de “comunidades” (cumunality),

introduzida por THURSTONE (1947). Esta técnica procura a parte da variância

explicada apenas pelos fatores comuns, excluindo, assim, a parte da variância ligada aos

fatores específicos, próprios e exclusivos de cada variável. A Tabela 3.4 demonstra o

resultado deste estudo como segue.

Tabela 3.4 – Estudo de cumunalidade

Variáveis Fator 1 Fator 2 R2 Temperatura 0.002958 0.571368 0.313240

Salinidade 0.002685 0.065353 0.167630 Oxigênio 0.000019 0.131208 0.139543 Fosfato 0.008022 0.264896 0.241564 Nitrito 0.000024 0.397138 0.228264 Nitrato 0.002430 0.287916 0.166661 Amônia 0.002528 0.002796 0.041070

pH 0.002843 0.014504 0.097596 Clorofila-a 0.001443 0.116339 0.130027 Cirripedia 0.216652 0.221610 0.383922 Mytilidae 0.462575 0.462862 0.567870 Decapoda 0.380456 0.380919 0.501787 Polychaeta 0.224656 0.226973 0.360251

LD 0.310766 0.329603 0.283530 Ostreidae 0.493834 0.493962 0.500564

Cipris 0.035854 0.037059 0.352950 Ascidiaceae 0.133321 0.143935 0.225388

Bryozoa 0.305460 0.312273 0.415182 Equinoidea 0.049999 0.050363 0.086347

Bivalvia 0.004976 0.106181 0.212759

Como pode ser observado as variáveis Amônia e pH, apesar de serem

quase que unanimemente consideradas como importantes descritores das condições de

qualidade ambiental, não contribuem de maneira significativa para a variância fatores 1

e 2 (R2 = 0.041070 e 0.097596 respectivamente). O mesmo ocorre com relação com a

variável da classe Equinoide cujo valor R2 é de 0.086347. Assim sendo, este teste

também passa a ser usado como critério de exclusão de variáveis no problema em

estudo.

Afim de visualizar à estrutura dos dados restantes, e como estes encontram-se

ordenados, passamos a demonstrar os resultados da técnica estatística de Análise de

Componentes Principais (APC), que também pode ser usada para a redução da

dimensão dos dados. A primeira aplicação desta técnica em estudos ecológicos é

relatada por GOODALL (1954) e provavelmente continua sendo o método de

ordenação mais usado. A ACP estabelece, com base em uma matriz de semelhança

(correlações, variâncias-covariâncias ou até de similaridades), um conjunto de eixos

(componentes ou fatores) ortogonais. Estes eixos representam a totalidade da variância

dos dados, cada um contribuindo com uma determinada fração. Cada componente

corresponde a um autovetor dessa matriz. Assim, com base em uma matriz com m

variáveis, serão calculados m autovetores (= eixos fatoriais) de comprimento λ1, λ2,......

λm decrescente em razão da sua contribuição à variância total de dados. Esses

comprimentos correspondem aos m autovalores (= raízes latentes) da matriz. O

resultado disso é um sistema reduzido de coordenadas, proporcionando informações

sobre as semelhanças ecológicas das amostras como pode ser visto na Tabela 3.5

abaixo.

Tabela 3.5 – Matriz reduzida apresentando as sete componentes principais.

Variáveis Fator 1 Fator 2 Fator 3 Fator 4 Fator 5 Fator 6 Fator 7 Temperatura -0.01526 0.438974 0.042074 -0.03489 -0.61646 0.222757 0.147892Salilinidade -0.0413 0.010708 -0.03088 -0.03397 0.074022 -0.77989 0.121073

Oxigênio 0.05243 0.058959 -0.00121 -0.01063 0.717425 -0.07693 -0.0089 PO4 0.033359 -0.69605 -0.12586 0.029123 0.068003 0.20494 0.135587NO2 -0.02423 -0.74020 0.067472 -0.02516 0.056542 -0.06867 -0.11146NO3 0.010184 -0.67343 0.070083 -0.04332 -0.06991 -0.1587 -0.02735

Clorofila-a -0.05441 0.000942 -0.00419 -0.02502 0.745648 0.124475 0.063845Cirripedia 0.044237 -0.02226 0.877982 0.087916 -0.05515 0.003237 0.048265Mytillidae 0.910663 0.052887 0.0785 0.017311 0.021604 0.013369 -0.06695Decapoda 0.25986 0.044231 0.137367 0.792501 -0.03531 -0.08866 0.287693Polychaeta 0.056358 -0.00506 0.824314 0.040364 0.038222 0.024274 0.14484

LD 0.306453 -0.07542 0.299894 -0.05914 -0.14375 0.120434 0.555725Osteidae 0.822054 0.037852 0.180147 -0.00789 0.01522 -0.05596 0.086852Cypris -0.06507 0.010937 0.025042 0.893926 0.003344 0.013917 -0.13204

Ascidiaceae -0.01127 0.091166 0.063857 0.085879 0.072653 -0.11072 0.874755Bryozoa 0.650738 -0.14575 -0.20175 0.17108 -0.02188 0.196483 0.186756Bivalvia 0.037816 0.098235 0.003916 -0.08131 0.0245 0.779906 0.076564

Var. Expl. 2.110354 1.733892 1.671236 1.490104 1.502387 1.436741 1.322542Prp.Total 0.124138 0.101994 0.098308 0.087653 0.088376 0.084514 0.077797

A análise da Tabela 3.5 revela como primeira componente principal, estão

agrupadas as variáveis Mytilidae e Osteidae, as variáveis de maior interesse econômico.

Em seguida aparece a variável nitrito (NOB2 B) como a segunda componente principal.

Cirripedia e Polychaeta são agrupados como terceiro fator enquanto a ordem Decapoda

está agrupada com as larvas do tipo Cypris no quarto fator. O quinto fator é composto

pelo agrupamento da clorofila e do oxigênio. Bivalvia e salinidade fazem parte do

sexto fator e no sétimo fator encontra-se a família Ascidiaceae. Esta estrutura de

agrupamento está de acordo com os resultados obtidos na Tabela 3.3 de correlações.

Tabela 3.6 – Autovalores, % da variância total e % acumulada.

Valor Autovalor % variância total Autovalor acumulado % acumulada1 2.628875 15.46397 2.62887 15.46397 2 1.949888 11.46993 4.57876 26.93390 3 1.645749 9.68088 6.22451 36.61478 4 1.440500 8.47353 7.66501 45.08831 5 1.327102 7.80648 8.99211 52.89479 6 1.236225 7.27191 10.22834 60.16671 7 1.038916 6.11127 11.26726 66.27798

Como pode ser observado, na Tabela 3.6, mostrada acima, o trabalho de limpeza

dos dados resultou em um sistema em que os sete autovalores representam 66 % da

variância total dos dados. A distribuição espacial dos agrupamentos nos planos fatoriais

1, 2 e 3 são apresentados a seguir nas Figuras 3.21 e 3.22.

NO2NO3

CirripedioMytillidae

DecapodaPolychaetaLD

OstreaCipris

Ascidia

Bryozoa

Bivalvia

-0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0

Fator 1

Figura 3.21 – Análise de Componentes Principais, fatores 1 e 2, varimax mormalizado.

A Figura 3.21 apresenta a projeção do plano fatorial formado pelos eixos

fatoriais 1 e 2. Conforme a Tabela 3.6, pode-se observar que o eixo fatorial 1

corresponde somente a 15,46% da variância total dos dados enquanto o segundo eixo,

participa com 11,46% dessa variância. Portanto este plano fatorial representa apenas

26,93% da variância total acumulada. Esta projeção, permite uma visualização global

das condições tróficas existentes. Segundo a Tabela 3.5, o eixo 1 representa fatores

biológicos quando agrupa a família Mytilidae e Ostreidae por terem fortes e positivas

coordenadas (fatores de carga) enquanto que a temperatura, salinidade, nitrito, clorofila,

cypris e a família ascidiaceae apresentam-se negativas para este eixo. O eixo 2,

representa uma componente ambiental química desde que a variável nitrito apresenta

uma forte coordenada negativa que é acompanhada de perto pelos nutrientes nitrato e

fosfato. Ainda com relação à este eixo pode-se notar uma fraca e positiva contribuição

da variável temperatura.

Cirripedio

Mytillidae

DecapodaPolychaeta

Ostrea

Cipris

Ascidia

Bryozoa

Bivalvia

-1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8

Fator 2

Figura 3.22 – Análise de Componentes Principais, fatores 1 e 3, varimax normalizado.

O fator 3, novamente se apresenta como uma componente biológica

tendo como fortes coordenadas positivas as variáveis cirripedia e polychaeta, enquanto a

salinidade, oxigênio, fosfato e clorofila são negativas para este eixo.

Como comentário da análise de componentes principais pode-se dizer que:

1) A representatividade das variáveis individuais estudadas e eixos fatoriais que se

fizeram evidentes para a variância total dos dados não permite redução do espaço de

busca para a soluções do problema;

2) O eixo fatorial 1 é um eixo de representação biológica e as variáveis de coordenadas

negativas em relação ao mesmo podem ser consideradas superposições de pontos

(variáveis)

3) O eixo fatorial 2 é um eixo de representação dos fatores ambientais ligados às

características químicas e mais fracamente físicas do habitat marinho.

A não ser que o meio ambiente físico seja fortemente descontínuo e que as

amostragens efetuadas pelo programa de gerenciamento tenham sido realizadas de cada

lado de um forte gradiente, qualquer analista terá dificuldades em definir nitidamente

grupos de amostras ou espécies, em virtude do conceito de continuum que caracteriza os

ecossistemas. Para tentar descrever, de maneira mais clara e sintética possível, a

estrutura de um conjunto de dados que representam o funcionamento de um ecossistema

determinando a composição e a extensão das suas unidades funcionais, passa-se agora a

demonstrar a técnica de Análise de Agrupamentos ou “Cluster Analysis”. Esta técnica

pode identificar regiões mais densas ou esparsas na base de dados, por conseguinte,

descobrir padrões de distribuição global e correlações interessantes entre as variáveis.

“Clustering”, ou agrupamento segundo COLE (1998), é um procedimento exploratório

que procura estruturas “naturais” em um conjunto de dados e envolve a separação dos

próprios dados (casos) ou objetos em grupos. Agrupar dados é útil na redução dos

dados, esquemas de classificação e sugerindo ou sustentando hipóteses sobre sua

estrutura. Técnicas de agrupamento tem sido usadas em uma grande variedade de

disciplinas. Na psiquiatria, LEVINE e BOLTON (1969) usaram “clustering” para

desenvolver uma classificação de tipos de depressão. Na pesquisa de mercado, GREEM

(1967) usou algoritmos de agrupamento na identificação de conjuntos homogêneos de

testes de mercados. Na arqueologia, HODSON (1971) aplicou “clustering” ao

problema de classificação “British Hand-Axes”. No reconhecimento de padrões,

LEVRAT et all. (1992) usou “fuzzy-clustering” para segmentar uma imagem. Na

engenharia, RECH e FENVES (1991) usaram um algoritmo para criar uma hierarquia

de especificações e desenhos associados para pontes e, na medicina, FUNK et al. (1987)

usou técnicas de agrupamento de dados como um método de aquisição de conhecimento

para sistemas especialistas no auxílio a diagnósticos.

No problema de agrupamento, o conjunto de n objetos X = {XB1 B, XB2 B,.....,XBn B} é

separado em grupos de objetos similares. Cada XBi B ∈ ℜP

pP é um vetor atributo consistindo

de p medidas reais que descrevem o objeto. Os objetos são agrupados em grupos não

superpostos C = {CB1 B, CB2 B,.....,CBkB} (C é um grupo), onde k é o número de grupos CB1 B ∪ CB2 B

∪.........∪ CBkB = X, CBi B ≠ φ e CBi B ∩ CBj B = φ para i ≠j. Os objetos (casos) separados em cada

grupo devem ser mais similares entre si do que entre os objetos de qualquer outro grupo,

de maneira que o valor de k pode ser desconhecido. Caso contrário, se k é conhecido,

trata-se de um problema de k grupos (clusters). A separação dos dados ocorre através de

cálculos de similaridades sem que nenhuma suposição sobre a possível estrutura

existente seja feita. A similaridade entre objetos (dados) é uma medida que compara

quão próximos (ou parecidos) são os objetos em questão. Portanto, uma pequena

distância entre objetos deverá indicar uma alta similaridade. Sendo assim, pode-se usar

as medidas de similaridade também de forma inversa, como medida de dissimilaridade

(diferença). De acordo com EVERITT (1993) e RICHARD (1992) várias medidas de

distância podem ser empregadas no problema de agrupamento de dados. As medidas

mais comumente usadas são a distância euclidiana,

d (XBi B, XBj B) = )()'( XjXiXjXi −− = [ ( )∑=

xjlxil1

1/2P , (2)

esta medida de distância é perfeitamente métrica, é uma linha reta entre dois pontos.

Uma medida alternativa é a distância de Manhattan (“city-block”) que soma as

diferenças entre todos os atributos,

d (XBi B, XBj B) = ∑=

xjlxil1

Esta medida é problemática se as variáveis são correlacionadas. Na literatura, diversas

outras medidas são utilizadas, como medidas de PEARSON (1901), SPEARMAN

(1904), SORENSEN (1948) e BRAY-CURTIS (1957).

Existe um grande número de algoritmos de agrupamento na literatura e a escolha

depende do tipo dos dados disponíveis, da aplicação e do objetivo que se quer alcançar.

Em geral, os métodos podem ser classificados em métodos hierárquicos, métodos de

partição, métodos baseados em densidade, baseados em “grid” ou baseados em

modelos. Neste estudo apenas serão usados um método hierárquico e outro de partição

de acordo com a abordagem na matriz de dados. De qualquer forma, ambos resultam

em uma estrutura em forma de árvore chamada Dendrogama.

Os métodos hierárquicos podem também por sua vez serem classificados de

acordo com o tipo de seu funcionamento. Os do tipo aglomerativo, também chamados

“bottom-up” começam com cada objeto formando um grupo separado. Esses objetos

(grupos) são então sucessivamente agrupados de acordo com suas similaridades até

permanecer apenas um único grupo ou qualquer critério de parada ser satisfeito. Já os

métodos hierárquicos denominados de divisivos também chamados de “top-down”

funcionam de maneira oposta, começam com todos os objetos em um mesmo grupo e

baseados em suas dissimilaridades dividem os dados sucessivamente em sub grupos até

cada objeto ser ele próprio um grupo ou um critério de parada ser alcançado. Para

ambos os métodos o número de grupos (k) tem de ser indicado, entretanto, a diferença

entre os níveis de hierarquia pode ser uma indicação do correto número de grupos. Os

métodos do tipo aglomerativo são mais populares e devido sua característica funcional é

usado para agrupar as variáveis neste estudo.

Existem quatro importantes algoritmos nesta categoria, comentados a seguir.

O método de ligações simples (single-linkage) também chamado de “nearest

neighbour” ou “método do visinho mais próximo” (FLOREK, 1951), a distância entre

dois grupos é a distância entre os objetos mais próximos destes grupos.

Método de ligações completas (complete-linkage) também chamado “furthest

neighbour” ou “método do vizinho mais distante” (SORENSEN, 1948) junta os grupos

com a distância mínima entre seus objetos mais distantes.

Método pela associação média (average-linkage) também chamado “group-

linkage” (SOKAL,1963) calcula a média aritmética da similaridade (ou da distância)

entre o objeto que se quer incluir num grupo e cada objeto desse grupo. O objeto é

atribuído ao grupo com o qual ele tem a maior similaridade média (ou menor distância

média) com todos os objetos. Uma variação desse método é chamado de “centroid

clustering” (LANCE, 1966) agrupando de acordo com a distâncias entre os centróides.

Diferentemente dos métodos acima, o método de variância mínima (WARD,

1963) otimiza um objetivo estatístico, a soma das distâncias quadradas entre objetos e o

centro de seu cluster. Um grupo será reunido a outro se essa reunião proporcionar o

menor aumento da variância intragrupo. A variância é calculada para todas as

alternativas de aglomeração, escolhendo a que proporciona a menor variância. Este

método é altamente eficiente na formação de grupos. Por essas características foi o

método escolhido para agrupar as variáveis deste trabalho como pode ser visto no

dendograma da Figura 3.23.

Método WardCoeficiente de Spearman

idia LD

gaçã

Método WardCoeficiente de Spearman

idia LD

gaçã

I IIFigura 3.23 – Dendrogama das variáveis, método Ward, coeficiente de Spearman.

Pode-se interpretar à partir da Figura 3.23 dois grandes grupos que

representam a macroestrutura do ecossistema, ligadas as componentes abiótica (grupo I)

e biótica (grupo II). Este fato pode ser explicado devido ao fato dos grupos

apresentarem dados com características muito diferentes. Os primeiros são dados

provenientes de medidas laboratoriais (dosagens químicas), enquanto que no grupo II

estes dados partem da visualização e contagem do número de indivíduos nas amostras

sob lupa. Observa-se que a ordenação dos eixos fatoriais apresentados na Tabela 3.5 e

Figura 3.22 são evidentes, a primeira componente principal , grupo 1 (Myitilidae,

Ostreidae e Bryozoa) e a terceira componente principal, grupo 3 (Cirripedia e

Polychaeta) além dos grupo 4 (Decapoda e Cypris) e grupo 7 (Ascidiaceae e LD) estão

todos na componente biótica sugerindo uma possível estrutura da comunidade. Existe

uma grande subjetividade na decisão de destacar e interpretar os grupos que poderiam,

aparentemente, constituir uma realidade ecológica. Do outro lado, componente abiótica

(grupo I), encontram-se a segunda componente principal composta pelos nutrientes no

grupo 2 (NOB2 B, NOB3 B NHB4 B e POB4 B) seguida do grupo 5 (clorofila, oxigênio e salinidade). A

salinidade encontra-se agrupada com a clorofila de acordo com os valores da Tabela 3.3

de autocorrelações, pois esta variável se apresenta bastante significante (r = -0.01, p

<0.05). O fato da variável temperatura estar no grupo das componentes biológicas se

deve ao fato das larvas terem uma maior sensibilidade a esta variável física, ou ser

apenas um efeito numérico devido ao funcionamento do algoritmo utilizado.

Dando prosseguimento aos métodos de agrupamento, passa-se agora a

aplicação dos métodos de partição. Estes métodos também são chamados de métodos

de otimização. Dado uma base de dados de n objetos, o método constrói k clusters de

dados, cada partição representa um grupo e k ≤ n. Ou seja, o método classifica os dados

em k grupos, que juntos satisfazem o seguinte critério: todo grupo tem que conter no

mínimo um objeto, e cada objeto tem de pertencer a exatamente um grupo. A segunda

premissa pode ser relaxada no caso de métodos de fuzzy-clustering. O número de

grupos é também especificado a priori ou é determinado como parte do método de

agrupamento. A partição inicial pode ser randômica à partir de pontos chamados de

sementes (“seed”). Os objetos são então alocados a um grupo de acordo com uma

função objetivo até um critério de parada ser alcançado. Para chegar a uma otimização

global efetua-se uma exaustiva busca cedendo e redirecionando os objetos de acordo

com suas similaridades e os pontos semente. Os vários métodos diferem em relação a

partição inicial, função objetivo, critérios de concessão, redirecionamento e parada. Os

métodos mais populares são o algoritmo K-means, onde cada grupo é representado pelo

valor médio em cada grupo, e o algoritmo k-medoids, onde cada cluster é representado

pelo objeto mais próximo do centro do cluster. Apesar da sensibilidade à partição

inicial, a técnica K-means, tem segundo PUNJ & STEWART (1983) um desempenho

melhor que os métodos hierárquicos devido ao fato de serem menos afetados por

“outliers”, a escolha da medida de distância e a presença de variáveis irrelevantes, sendo

por este motivo a técnica escolhida para acessar a estrutura dos dados estudados, como

(objetos ou linhas) apresentado no dendrogama da Figura 3.24.

Objects

406 146 151 46 467 470 159 439 77 28 347 504 395 86 113 8 273 172 377 228 71

Objetos

Figura 3.24 – Dendrogama dos objetos, método k-means, distância euclidiana.

Pela observação da Figura 3.24, pode-se determinar que ao nível

aleatório de dissimilaridade 2, pode ocorrer sete grupos. Quando se implementa a

Tabela 3.1 que classifica as massas d’água segundo os valores de temperatura e

salinidade em forma de regra (executado em Excel e não demonstrado) encontra-se um

intervalo não contemplado. O número de agrupamentos encontrado neste dendrogama

coincidentemente é o mesmo da referida implementação, além deste fato, pode ser

verificado na Figura 3.25 que o número máximo possível de autovalores determinado

pelo critério de Kaiser também é sete. Este critério de Kaiser será usado então para

definir o número correto de grupos no caso estudado.

A Figura 3.25 mostra a contribuição percentual de cada autovalor dentro dos 66,27 % da

variância apresentada pela Tabela 3.6.

Número de Autovalores0.0

15,46%

26.93%

36.61%

45.08%52.89%

60.16%

66.27%

15,46%

26.93%

36.61%

45.08%52.89%

60.16%

66.27%

26.93%

36.61%

45.08%52.89%

60.16%

66.27%

Figura 3.25 - Número de clusters segundo critério de Kaiser

Capítulo IV

Classificação de Dados e Extração de Regras

4.1) Aquisição de Conhecimento

Segundo TUHILL (1990), conhecimento é a informação refinada que os

especialistas usam para resolver problemas. O conhecimento humano está relacionado

com a linguagem e uma inteligência que adquire, processa, armazena, acessa e

comunica esse conhecimento. Existem muitas técnicas de aquisição de conhecimento

dentre as quais podemos citar: entrevistas, protocolos, programação neurolingüística e,

análise e aquisição de conhecimento automática (machine learning).

Fazer entrevistas com um especialista é a técnica mais comum de aquisição de

conhecimento sobre um dado domínio e será aqui utilizada. Porém, apresenta duas

falhas básicas. A primeira é a falta de direção, isto é, um especialista faz o que faz, sob

quais circunstâncias. A outra é saber qual o momento mais apropriado. Na segunda, a

não ser que se prepare uma estrutura bem definida sobre o objetivo a ser alcançado, o

encontro pode resultar em fracasso levando a grande perda de tempo. Entretanto,

entrevistas contribuem para a formação de uma base de conhecimento de duas maneiras.

Primeiramente, chamam a atenção para aspectos de conhecimento pouco profundo.

Este conhecimento superficial permite ao entrevistador adquirir mais familiaridade com

o assunto discutido e gerar uma forma de maior interação com o especialista. Em

segundo, entrevistas com especialistas podem preencher lacunas resultantes de aspectos

mais profundos do domínio em questão. Esse conhecimento declarativo é usado para

fornecer relações e classificar objetos. A equipe de especialistas foi constituída pelos

doutores Ricardo Coutinho, Jean Valantin e Dra. Vanda Maria Monteiro Ribas e as

biólogas Jurema Quintanilha e Fabiana Figueiredo, todos pesquisadores do Instituto de

Estudos Almirante Paulo Moreira reconhecidos conhecedores do ambiente focado neste

trabalho e o conhecimento adquirido neste processo foi estruturado no apêndice.

Uma das estratégias mais usadas para representar o conhecimento é através de

uma base de regras. Desta maneira, o capítulo a seguir é dedicado fundamentalmente à

dois objetivos principais: o primeiro, aplica um algoritmo para a geração de regras de

associação entre os atributos (variáveis) da base de dados estudada a fim de extrair

conhecimento não explicitado por ferramentas de análise convencional, seguido da

geração de regras de classificação baseadas nas associações “interessantes” encontradas

para desenvolver um sistema baseado em conhecimento.

4.2) Regras de Associação de Dados

As regras de associação são acima de tudo uma classe de importantes

regularidades encontradas em um conjunto de dados e buscam por relações interessantes

entre os itens (atributos). A descoberta dessas relações de associações pode ajudar em

processos de tomada de decisão ou na classificação de padrões. Uma variável Booleana

representa a presença ou ausência de um item. Cada registro pode ser representado por

um vetor Booleano de valores atribuídos para essas variáveis, (LIU et al., 2000). Os

vetores booleanos podem ser usados para identificar padrões que refletem os itens que

são freqüentemente associados. Esses padrões podem ser representados na forma de

regras de associação. Uma regra é uma implicação lógica: É composta de uma parte

contendo uma premissa chamada de antecedente que descreve as condições da regra e

outra parte chamada de conseqüente que realiza a conclusão da informação. A parte

antecedente é formada por argumentos reunidos por operadores lógicos (se, e, ou, etc.),

gerando uma expressão de conclusão lógica representada por então. Se essa expressão

for verdadeira, isto é, se as condições da regra forem satisfeitas, então a parte

conseqüente determinará a ação a ser executada. Por exemplo, a informação de que um

determinado conjunto de indicadores e descritores ambientais (X) seja apresentado,

implique em um índice de qualidade da condição de saúde ambiental (Y), ou numa

determinada composição estrutural de populações é representado na regra de associação

abaixo:

Regra n:

“X” -> “Y” (4.1)

(S% C% s s’)

Onde os índices da regra acima são:

S% - é o valor suporte da regra [P (X U Y)].

C% - é a confiança da regra [P (Y|X)].

s - é o valor suporte da regra expresso em número de vezes que ocorre X ou Y.

s´ – é o número de vezes em que os dois itens X e Y ocorrem simultaneamente.

Medidas de relacionamento entre as partes antecedente e conseqüente das regras

tais como o grau de certeza, o grau de interesse e acurácia (YAO & ZONG, 1999), e a

qualidade interpretativa de uma base de regras podem ser avaliadas pela quantidade de

condições e conclusões presentes na estrutura de representação. Neste caso, quanto

mais elementos uma regra possuir, mais difícil será seu entendimento. Por exemplo,

uma regra que em sua parte antecedente possua apenas duas ou três condições é mais

fácil de entender que outra com dezenas de condições.

Fatores também importantes são: a quantidade de regras na base de

conhecimento e a presença de qualificadores lingüísticos para descrevê-los. Uma regra

que utilize esses elementos lingüísticos é nitidamente mais compreensível que outra que

apresenta comparações numéricas, já que a maioria do conhecimento humano se

encontra armazenado de forma lingüística (GUILLAUME, 2001, NAKASHIMA et al.,

2003).

O suporte e confiança das regras são medidas que refletem respectivamente a

utilidade e o grau de certeza das regras descobertas. Isto quer dizer, que um suporte de

por exemplo, 20 % para uma regra de associação, significa que se 20 % de todos

registros que um determinado conjunto de indicadores e descritores ambientais (X)

tenha sido atingido, também tendem a deflagrar uma implicação em um determinado

índice de qualidade da condição de saúde ambiental (Y), ou numa determinada

composição estrutural de populações em estudo. Uma confiança de 90% significa que

90% dos registros de deflagração dos (Y), ocorreram dado que um determinado (X)

também tenha sido atingido. Tipicamente regras de associação são consideradas

interessantes quando satisfazem um limiar mínimo de ambos, suporte e confiança. Tais

limiares podem ser estabelecidos por usuários do sistema ou especialistas no domínio

(HRUSCHA, 2003).

Entretanto, a base de dados estudada e anteriormente descrita neste trabalho é

formada por um conjunto de séries temporais de atributos quantitativos (variáveis de

valores contínuos) enquanto que, a tarefa de minerar associações ou regularidades é na

maioria das vezes, segundo BAY (2000), executada por algoritmos que foram

projetados para operar em intervalos. De acordo com este mesmo autor, estes intervalos

pertencem na realidade a atributos discretos podendo também ser chamados de

categóricos onde, apresentam um número fixo de valores. O problema central para

minerar as possíveis associações nos dados está em, como se deve manipular variáveis

de valores contínuos. A abordagem mais comum segundo AGRAWAL (1993) e AN

(1999), é discretizar os dados.

De acordo com YANG & WEBB 2004, discretização é o processo de

transformar dados quantitativos em dados qualitativos e é uma área de pesquisa no

próprio processo de mineração de dados. Diversos métodos de discretização tem sido

propostos na literatura, os principais são:

• Métodos supervisionados e não supervisionados (DOUGHERTY et al.,

1995);

• Métodos paramétricos e não paramétricos;

• Hierárquicos e não hierárquicos (KERBER, 1992);

• Uni ou multivariados (BAY, 2000);

• “Disjoint vs. Non-disjoint” (YANG & WEBB, 2002);

• Global vs. Local (DOUGHERTY et al., 1995);

• “Eaguer” (“zeloso”) vs. “Lazy” (“relaxado”) (HSU et al., 2000,2003);

• Ordinal vs. Nominal;

• “Fuzzy vs. Non-Fuzzy” (WU, 1999; ISHIBUCHI et al.,2001).

Todos estes métodos apresentam suas vantagens ou desvantagens e nenhum

deles pode ser considerado como um método universal. O critério de escolha de qual

método será mais adequado depende do contexto de aprendizagem, em particular, do

algoritmo de aprendizagem, a natureza dos dados, e do objetivo da aprendizagem.

Diferentes contextos de aprendizagem tem diferentes características, o que requer

diferentes estratégias de discretização.

Na maioria dos métodos de discretização, é criada uma função de mapeamento

para os valores quantitativos dos atributos originais (variáveis contínuas) transportando-

os para um espaço de intervalos discretos (variável qualitativa). Primeiramente, a

discretização divide os valores dos atributos quantitativos em um número determinado e

finito de intervalos. A função de mapeamento associa todos os valores quantitativos em

um intervalo para um único valor qualitativo. Um determinado valor do atributo

quantitativo será eleito como “cut point”, ponto que será usado pela função de

mapeamento como fronteira entre dois intervalos no espaço discreto. O critério que

estabelece estes pontos de corte ou fronteiras podem variar de acordo com cada método.

Neste trabalho a abordagem para estabelecer os pontos de corte para a

determinação dos intervalos de discretização de cada variável foi o uso do próprio

conhecimento dos especialistas entrevistados. Mediante a apresentação das

distribuições das estatísticas de cada variável (Tabela 3.2), foram perguntados a partir

de que valores se pode considerar a presença ou ausência de determinado organismo, ou

se no caso de presença, consideram pouca, média ou muita ocorrência. Normalmente

existe alguma divergência pela própria natureza relativa do conceito de pouco, médio ou

muito, porém o consenso dos especialistas, pode ser obtido. Assim, foram estabelecidos

cinco intervalos para cada atributo. Para os dados de temperatura e salinidade os

especialistas se basearam na Tabela 3.1 que define as massas d’água de acordo com

estes dois critérios. Para os dados químicos e biológicos se basearam na Tabela 3.2.

Portanto, os cinco intervalos para os atributos físicos e químicos se referem a: Baixo

(1), baixo/médio (2), média (3), médio-alta (4) e alta (5) concentração de ,por exemplo,

oxigênio ou nutrientes enquanto que, para os dados biológicos estes intervalos se

referem a ausência, valores iguais a zero (1), poucos (2), média ocorrência (3),

freqüentes (4) e abundantes (5). Os valores estabelecidos como pontos de corte das

variáveis podem ser encontrados na Tabela 4.1.

Tabela 4.1 – Intervalos e pontos de corte das variáveis discretizadas

Variáveis Intervalo 1 Intervalo 2 Intervalo 3 Intervalo 4 Intervalo 5

Baixo Baixo/médio Médio Médio/alto Alto Temperatura P

oPC ≤ 18.1 De 18.2 à20 De 20.1 à25 De 25.1 à27 ≥ 27

Salinidade ‰ ≤ 34 De 34.1 à 35.4 De 35.5 à 36 De 36.1 à 37 ≥ 37 Oxigênio mg/l ≤ 3 De 3.1 à 4.5 De 4.6 à 5.5 De 5.6 à 6.5 ≥ 6.5 Fosfato µg/l ≤ 0.1 De 0.11 à 0.35 De 0.36 à 0.5 De 0.51 à 1 ≥ 1.1 Nitrito µg/l ≤ 0.1 De 0.11 à 0.3 De 0.31 à 0.4 De 0.41 à 0.5 ≥ 0.51 Nitrato µg/l ≤ 0.3 De 0.31 à 0.7 De 0.71 à 1 De 1.1 à 2 ≥ 2.1

Clorofila-a mg/l ≤ 0.6 De 0.61 à 1 De 1.1 à 2 De 2.1 à 3 ≥ 3.1

Org/mP

3P Ausente Pouco Médio Freqüente Abundante

Cirripedia = 0 De 1 à 150 De 151 à 500 De 500 à 800 ≥ 801 Mytilidae = 0 De 1 à 50 De 51 à 200 De 201 à 600 ≥ 601

Polychaeta = 0 De 1 à 20 De 21 à 40 De 41 à 80 ≥ 81 Decapoda = 0 De 1 à 10 De 11 à 30 De 31 à 70 ≥ 71

LD = 0 De 1 à 40 De 41 à 150 De 151 à 300 ≥ 301 Osteidae = 0 De 1 à 25 De 26 à 50 De 51 à 100 ≥ 101 Cypris = 0 De 1 à 50 De 51 à 100 De 101 à 250 ≥ 251

Ascidiaceae = 0 De 1 à 5 De 6 à 10 De 11 à 20 ≥ 21 Bryozoa = 0 De 1 à 2 De 3 à 4 De 4 à 5 ≥ 6 Bivalvia = 0 De 1 à 6 De 7 à 8 De 9 à 10 ≥ 11

De acordo com este critério e segundo os pontos de corte estabelecidos, cada

variável foi tratada de forma independente e não levou em consideração qualquer

possível relação com as demais. Esta abordagem de discretização foi uma forma de

trazer o conhecimento especialista existente para o espaço de busca, e ao mesmo tempo

uma estratégia de se colocar em evidência de forma ranqueada a ocorrência estatística

dos intervalos da nova matriz (discretizada), como demonstrada pela Tabela 4.2. Os

nomes dos atributos foram abreviados de acordo com Temperatura, TEMP; Salinidade,

SAL; Oxigênio, OX; Fosfato, PO; Nitrito, NTI; Nitrato, NTO; Clorofila-a, CLO;

Cirripédia, CIR; Mytilidae, MIT; Decapoda, DEC; Polychaeta, POL; Larva D, LD;

Ostreidae, OST; Cipris, CIP; Ascidiaceae, ASC; Bryozoa, BRY; Bivalvia, BIV;

acompanhados de seus respectivos intervalos 1, 2, 3, 4 e 5 e seguidos da percentagem de

ocorrência na matriz.

Tabela 4.2 – Estatística de ocorrência dos intervalos na matriz discretizada

TEMP3 82.8 NTI1 78.9 OX3 73.8 BIV1 71 PO2 69.5BRY1 66.9 CIR2 66.5 POL2 64.8 CIP2 54.4 LD2 54OST2 52.1 MIT2 51.7 SAL3 48.7 DEC2 44.2 ASC1 42.9CIP1 40.9 NTO1 38.6 SAL2 35.8 CLO1 35.2 NTO2 34.6MIT3 33.1 CLO2 30.3 CLO3 28.2 LD3 24.3 DEC3 24.1OST1 23.5 ASC2 21.3 CIR3 19.6 BIV5 18.4 NTI2 17.6PO3 17.6 PO1 17.6 POL1 17.4 OX4 16.8 DEC1 16.6

ASC5 14.7 SAL4 12.3 ASC4 11.7 LD1 11.5 OST3 11.4DEC4 11.4 NTO3 10.0 POL3 9.6 BRY2 9.6 ASC3 9.4BRY3 9.2 TEMP4 9.0 BRY4 8.0 MIT4 8.0 BIV2 7.8OST5 7.0 OX5 6.7 TEMP2 6.3 CIR1 6.3 BRY5 6.3MIT1 6.1 LD4 6.1 OST4 6.1 POL5 5.5 PO4 4.7CIR5 4.1 LD5 4.1 DEC5 3.7 CLO4 3.7 CIR4 3.5CIP3 2.7 POL4 2.7 SAL1 2.5 CLO5 2.5 OX2 2.3BIV4 1.6 NTI3 1.6 TEMP 1 1.4 NTI5 1.4 BIV3 1.2MIT5 1.2 CIP4 1.0 CIP5 1.0 PO5 0.6 SAL5 0.6OX1 0.4 SAL5 0.3 TEMP5 0.3 NTO4 0.09 NTO5 0.09

Segundo NIIMI & TAZAKI (2000), várias técnicas para descobrir regras de

associação foram descritas na literatura, porém o algoritmo Apriori desenvolvido por

AGRAWAL e SRIKANT (1994), é o mais comumente utilizado como ferramenta de

mineração, pois explora as propriedades de um nível discreto. Este algoritmo é uma

técnica criada para gerar regras sobre itens freqüentes em grandes bases de dados e usa

os parâmetros de suporte e confiança já descritos anteriormente. Dependendo de qual o

nível de suporte e confiança estabelecidos, o espaço de busca pode ser reduzido, ou o

número de regra de associação candidatas pode ser aumentando. Estes índices

determinarão entre outras palavras, o número de regras geradas e o grau de certeza em

que a regra pode ocorrer. Assim, de acordo com a estatística de ocorrência dos

intervalos gerados pelo processo de discretização, minerar itens com baixa ocorrência,

como por exemplo, a presença de águas de frias oriundas da ressurgência na superfície

constitui um evento raro e precisará de ser usado um suporte muito baixo, e para tal

deve-se usar um índice de confiança elevado.

Na linguagem da comunidade de mineração de dados, um item pode ser um

atributo que compõe a base de dados e um conjunto de itens é normalmente tratado

como um “itemset”. Um “frequent itemset” é um “itemset” que o suporte é maior que o

especificado por um usuário é denotado por Lk onde k é o tamanho do “itemset”. Um

“cadidate itemset” é um “frequent itenset,” representado por Ck, onde k é o tamanho do

“itemset”. O algoritmo Apriori usa a propriedade downward closure (encerramento

descendente) para podar ramos desnecessários para posterior consideração e opera como

segue:

1 K = 1;

2 Acha frequent itemset, Lk à partir de Ck, o conjunto de todos itemsets;

3 Forma Ck+1 à partir de Lk;

4 k = k+1;

5 Repete as etapas 2 à 4 até Ck estar vazio;

A etapa 2 é chamada de geradora de “frequent itemset”. A etapa 3 é chamada como a

geradora de “candidate itemset”.

A k-ésima iteração (para > 1) forma freqüente (k+1) “itemset” candidatos

baseados nos freqüentes k-itemsets, e varre a base de dados uma vez para encontrar o

conjunto completo de freqüentes (k+1)-itemsets, Lk+l. As variações envolvendo redução

de amostras e transações podem ser usadas para fazer o procedimento mais eficiente.

Outras variações incluem: particionar (dividir) os dados (minerando cada partição e

então combinando os resultados), e amostrar os dados (minerando em um subconjunto

dos dados). Essas variações podem reduzir o número de iterações requeridas para um

pequeno número, tal como dois ou um, como sugerido por Agrawal, (1994). Porém, os

algoritmos de mineração de regras de associação tendem a produzir um grande número

de regras, a maioria delas apresentando redundâncias, ou sem grande interesse tornando,

muito difícil a inspeção manual do que é realmente interessante.

4.3) Análise de Regras Interessantes

Para resolver tal problema, LIU et al., (2000) desenvolveram uma

aproximação para ajudar a reduzir o grande número de regras geradas e selecionar

apenas as regras interessantes (em particular, regras inesperadas). Através de uma

análise de interessabilidade, alavanca-se o conhecimento do domínio existente e então

classificam-se as regras descobertas de acordo com alguns critérios tais como:

conformidade e imprevisibilidade. Pesquisas em mineração de dados

(SILBERSCHATZ, 1996) têm mostrado que se pode medir o grau de interesse de regras

através de medidas objetivas e subjetivas. Medidas objetivas analisam a estrutura da

regra, sua performance preditiva, e a significância estatística (BAYARDO &

AGRAWAL, 1999). Tais medidas incluem os índices de suporte e confiança. No

entanto, medidas objetivas não são suficientes para determinar o grau de interesse de

uma regra, sendo então necessário, o uso de medidas subjetivas. As duas principais

medidas subjetivas são:

• Inesperabilidade ou imprevisibilidade (LIU,1996): as regras são interessantes

se elas são desconhecidas ou contradizem o conhecimento existente (ou expectativas do

usuário);

• Acionabilidade (PIATESKY-SHAPIRO,1994): as regras são interessantes se

podem ser usadas de forma a obter alguma vantagem ou benefício.

As regras interessantes podem ser classificadas dentro de três categorias:

• Regras que são inesperadas e acionáveis,

• Regras inesperadas, e não acionáveis e,

• Regras acionáveis, mas esperadas.

O foco deste trabalho está no inesperado, porque a acionabilidade é parcialmente

manuseada através da imprevisibilidade, já que as regras acionáveis são ou esperadas ou

inesperadas. Regras esperadas são também chamadas de “conforming rules” porque

elas estão de acordo com o conhecimento ou expectativas existentes. Este modelo de

regra é mais geral que o modelo original proposto por AGRAWAL et al. (1994).

Define-se como regra de associação generalizada em mineração (SRIKANT,

1995):

Seja I = {iBl B, . . ., i BwB} um conjunto de itens, e G um grafo acíclico direcionado nos itens.

Uma extremidade em G representa um “é”, uma relação. Então, G é um conjunto de

taxonomias. Um exemplo de taxonomia é apresentado na Figura 4.1

Figura 4.1 – Exemplo de possível taxonomia nos dados.

Seja T um conjunto de relações (transações), onde cada relação t reúne um

conjunto de itens tal que t⊆ I. Uma regra de associação generalizada é uma implicação

da forma X→Y, onde X⊂ I, Y⊂ I, e X∩Y = Ø. A regra X→Y será válida no conjunto

de relações T com confiança c, se c% de relações em T que suporta X também suporta

Y. A regra tem suporte s em T se s% das relações em T contiverem X∪Y. Por

exemplo:

Ostreidae → Mytilidae [suporte 10%, confiança 60%],

Significa que em 10% das ocorrências, tanto ostras e mexilhões aparecem juntos, e que

60% das ostras sempre ocorrerão com mexilhões.

A análise de interessabilidade proposto por LIU (2000), é uma técnica interativa.

Em cada iteração, deve-se especificar os conhecimentos existentes sobre o domínio.

Então, o sistema usa este conhecimento para analisar as regras descobertas de acordo

com algum critério de interessabilidade, e através de tal análise identifica aquelas regras

potencialmente interessantes. Basicamente o algoritmo funciona como segue:

Repetir até que o usuário decida parar:

CLASSEBIVALVIA

FAMÍLIAMYTILIDAE

FAMÍLIAOSTREIDAE

CLASSEBIVALVIA

FAMÍLIAMYTILIDAE

FAMÍLIAOSTREIDAE

1 - o usuário especifica ou modifica algum conhecimento previamente existente;

2 – o sistema analisa as regras descobertas de acordo com a conformidade do

conhecimento prévio e imprevisibilidade e identifica as potencialmente interessantes;

3 - o usuário inspeciona e analisa os resultados através de um sistema de

visualização, salva as regras interessantes, e remove aquelas indesejáveis.

A linguagem permite especificar três tipos de conhecimento representando

diferentes graus de precisão:

• impressões gerais (IG),

• conceitos razoavelmente precisos (CRP) e,

• conhecimento preciso (CP).

Os dois primeiros tipos de conhecimento demonstram sentimentos vagos do

especialista, enquanto o último, o conhecimento preciso. Esta divisão é importante

porque o conhecimento humano tem granularidades. É crucial permitir a especificação

de diferentes tipos de conhecimento. Isto não somente determina como se pode fazer

uso do conhecimento, mas também como fazer uso de todo conhecimento possível. A

linguagem de especificação também faz uso da idéia da clássica hierarquia (ou

taxonomia), que é a mesma usada em regras de associação generalizadas (SRIKANT,

1995). O objetivo é mostrar os aspectos essenciais das regras de maneira que possam

oferecer vantagem às capacidades visuais humanas de identificação daquelas

verdadeiramente interessantes com rapidez e facilidade.

Os aspectos essenciais são:

• Tipos de regras potencialmente interessantes: diferentes tipos de regras

interessantes devem ser separadas porque dão ao usuário diferentes tipos de

conhecimento.

• Graus de Interessabilidade: as regras devem ser agrupadas de acordo com seus

graus de Interessabilidade. Isto permite ao usuário focalizar primeiramente as regras

maximamente inesperadas e decidir se olha às regras de menor grau de interesse.

• Itens interessantes: mostrar os itens interessantes numa regra é mais

importante que toda a regra. Por exemplo, quando se olha para regras com partes

conseqüentes inesperadas, é natural que a primeira coisa que se deseja saber é qual o

item mais inesperado na parte conseqüente. Maiores detalhes podem ser obtidos em

LIU (2000).

Considere U um conjunto de especificações representando o espaço de

conhecimento, e A um conjunto de regras descobertas. A técnica proposta une e

ranqueia as regras em A em um número de maneiras para achar diferentes tipos de

regras interessantes, “conforming rules”, regras com partes conseqüentes inesperadas,

regras com condições inesperadas e regras com ambos os lados interessantes.

Regras em conformidade: uma regra descoberta em ABi B∈A está em

conformidade com o espaço do conhecimento UBi B∈U do especialista se ambas as partes

de ABi B se unem adequadamente com UBi B∈U. Utiliza-se “confmBij B” para indicar o grau de

conformidade. Ranquear as regras que estão em conformidade mostra a consistência do

conhecimento existente.

Regras com partes conseqüentes inesperadas: uma regra ABi B∈A tem uma

conseqüência inesperada com respeito a UBj∈ BU se a parte condicional ABi B se une com UBj

Bmas não à parte conseqüente. Usa-se “unexpConsqBijB” para indicar o grau de

imprevisibilidade da parte conseqüente. Ranquear regras com partes conseqüentes

inesperadas mostra aquelas regras descobertas que são contrárias ao conhecimento

existente. São freqüentemente interessantes.

Regras com partes condicionais interessantes: uma regra ABi∈ BA tem parte

condicional inesperada com respeito a UBj∈ BU se a parte conseqüente de ABi B se emparelha

bem com U Bj B,B Bmas não à parte condicional. Emprega-se “unexpCondBijB” para indicar o

grau de condições inesperadas. Ranquear as regras pela parte condicional mostra que

existem outras condições que podem levar a parte conseqüente do conhecimento. Está-

se explorando território desconhecido, outras associações que estão relacionados com o

conhecimento existente.

Regras de ambas as partes inesperadas: uma regra ABi B∈A é inesperada com

ambas as partes com respeito a UBj B∈U se ambas as partes da regra ABi B não se une com

aquelas de UBj B. Utiliza-se “bsUnexp BijB” para indicar o grau de imprevisibilidade por

ambas as partes. Ranquear regras por ambas as partes mostra que existem outras regras

em que ambas partes nunca foram mencionadas pelo conhecimento especificado.

Se os valores de “confmBijB”, “unexpConsqBijB”, “unexpCondBijB” e “bsUnexpBijB” for

entre 0 e 1, 1 representará uma completa união, completa conformidade ou

imprevisibilidade e, 0 representará nenhuma união.

Considerando LBijB e RBijB graus de condições e conseqüências da união da regra ABi

Bcontra UBj B respectivamente, estes valores são computados de acordo:

ijijij RLconfm ∗= (4.1)

⎩⎨⎧

>−−≤−

ijijijij

ijijij RLRL

RLqunexpconse (4.2)

⎩⎨⎧

>−−<−

ijijijij

ijijij LRLR

LRunexpcond (4.3)

( )ijijijij unexpcond,qunexpconse,confmmax1bsUnexp −= (4.4)

Este procedimento foi utilizado para extrair as regras interessantes da base de

dados estudada.

Segue-se a apresentação de alguns conjuntos de regras identificadas e

selecionadas como interessantes de acordo com a variação de índices de suporte e

confiança. Esta variação é necessária para se acessar a base de dados em diferentes

níveis e tentar minerar regras que possam cobrir o espaço de busca e descrever a

ocorrência de fenômenos raros (ocorrência de classes pequenas). O objetivo aqui é o de

tentar estabelecer uma descrição das diferentes massas d’águas estabelecidas pela

Tabela 3.1 através de regras de associação. Por exemplo:

Se TEMP3 e POL2 e SAL4 então BIV1 [8.2%, 100%, 42, 42, 8.12%]; (2)

Se NTI1 e NTO1 SAL4 então TEMP3 [8.2%, 100%, 42, 42, 8.12%]; (3)

Se TEMP3 e PO2 e POL2 então DEC1 [7.3%, 100%, 40, 32, 7.3%]; (4)

Se TEMP3 e OST2 e SAL4 então NTI1 [5.8%, 100%, 30, 30, 5.8%]; (5)

SE CIR2 e CIP1 e SAL4 então TEMP3 [5.8%, 100%, 30, 30, 5.8%]; (6)

Se CLO1 e PO3 e SAL4 então TEMP3 [5.8%, 100%, 30, 30, 5.8%]; (7)

Se SAL4 e CLO1 ePOL1 então TEMP3 e OX3 [5.8%, 100%, 30, 30, 5.8%]; (8)

Se TEMP3 e ASC5 e CLO1 então BRY1 [5.8%, 100%, 30, 30, 5.8%]; (9)

Se LD2 e DEC2 POL2 então TEMP3 [5.8%, 100%, 30, 30, 5.8%]; (10)

A presença dos intervalos TEMP3 e SAL4 na parte condicional da primeira

regra apresentada demonstra que esta situação corresponde aos intervalos de

discretização e a Tabela 3.1 das massas d’água à águas da Corrente do Brasil. Este

conjunto de regras demonstra uma condição da estrutura trófica pois, pode-se perceber

que são águas oligotróficas que se caracterizam pela presença de poucos nutrientes

nitrogenados de acordo com a regra número três. Porém, ainda com relação ao nutriente

fosfato, a regra quatro apresenta um intervalo de PO2 enquanto que a regra de número

sete mostra a possibilidade deste nutriente atingir valores médios (PO3), no entanto, a

mesma regra apresenta um intervalo de clorofila baixo (CLO1), demonstrando que a

produção primária pode estar limitada pelo desbalanceamento da razão N/P. Quanto a

componente das larvas merozooplanctônicas, o que se pode observar é a ausência de

larvas de Bivalvia (BIV1, regra 1), e Briozoários (BRY1, regra 1). De acordo com as

regras de número 1, 4, 8 e 10, fica claro que os poliquetas (POL1 e POL2) podem estar

ausentes ou se presentes, com baixa densidade larval. Caso semelhante, são os nauplios

de cirripédios que na regra número 3 estão ausentes mas, na regra 6, apresenta baixa

densidade populacional, enquanto as larvas do tipo cipris estão ausentes. O fato mais

interessante é demonstrado pela regra 9, onde pode-se perceber a grande abundância das

larvas das ascídias (ASC5). Neste conjunto de regras fica demonstrado um exemplo do

caráter oligotrófico da Corrente do Brasil e uma possível composição do arranjo

populacional.

Um fato curioso é saber o que e quando acontece em uma situação de

concentração de oxigênio baixa. Esta situação ocorre muito poucas vezes na base de

dados, e o que se deveria esperar é uma baixa concentração de larvas, já que são acima

de tudo animais e sensíveis a este fator ambiental. A seguinte base de regras mostra

esta situação:

Se TEMP3 e SAL2 e OST4 então LD5 [0.19%, 100%, 1, 1 0.19%] (11)

Se ASC1 e LD5 e OST4 então OX1 [0.19%, 100%, 1, 1 0.19%] (12)

Se BIV5 eOX1 então OST4 e LD5 [0.19%, 100%, 1, 1 0.19%] (13)

Se OST4 e LD5 e OX1 então BRY1 [0.19%, 100%, 1, 1 0.19%] (14)

Se LD5 e OST4 então POL3 e SAL2 [0.19%, 100%, 1, 1 0.19%] (15)

Se OST4 e LD5 e MIT3 então NTI1 e PO2 [0.19%, 100%, 1, 1 0.19%] (16)

Se BIV5 e CLO2 e OX1 então DEC2 [0.19%, 100%, 1, 1 0.19%] (17)

Se OST4 e LD5 e OX1 então NTO1 [0.19%, 100%, 1, 1 0.19%] (18)

A presença dos intervalos TEMP3 e SAL2 na regra 11 caracteriza a massa

d’água costeira. Segundo as regras 16 e 18 percebe-se que se trata de águas também

pobres em nutrientes, devido a existência dos intervalos NTI1 e NTO1 o que demonstra

baixos níveis de nitrogênio, enquanto que a presença de PO2 mostra uma concentração

pouco mais elevada do grupo fosfato. Este fato explica a pequena ocorrência de

clorofila (intervalo CLO2, regra 17). Porém a estrutura populacional muda

radicalmente em relação ao conjunto de regras anterior. Pode-se observar agora a

presença freqüente de larvas de ostras (OST4) e a abundância de larvas do tipo LD

(LD5) e Bivalvia (BIV5). Fica fácil de observar que estas três categorias estão

associadas a níveis baixos de oxigênio (regras 12, 13 14 e 18). Ainda pode ser

verificado a presença de poucos decapodas (DEC2, regra 17) e uma média ocorrência

larvas de mexilhões (MIT3, regra 16) e poliquetas (POL3), enquanto que os briozoários

permanecem ausentes (BRY1, regra 14), tanto quanto as ascídias (ASC1, regra 12).

Não foram detectadas regras que descrevem o comportamento das outras populações

nesta situação. Mas a inspeção das regras que seguem:

Se SAL2 e CIR2 e POL4 então TEMP4 [0.19%, 100%, 1, 1 0.19%] (19)

Se PO1 e TEMP4 então ASC2 [0.19%, 100%, 1, 1 0.19%] (20)

Se OX3 e TEMP5 então ASC4 [0.19%, 100%, 1, 1 0.19%] (21)

Se OX3 e TEMP5 então CIR4 e DEC5 [0.19%, 100%, 1, 1 0.19%] (22)

Se SAL2 e CIP1 e MIT4 entãoTEMP5 [0.19%, 100%, 1, 1 0.19%] (23)

Se CLO1 e CIP1 então CIR4 e OST5 [0.19%, 100%, 1, 1 0.19%] (24)

demonstra que neste tipo de massa d’água (água costeira) a pequena presença de

nauplios de cirripédios (CIR2) com o aumento da temperatura para o intervalo TEMP4

(regra 19) e o aparecimento de ascídias (ASC2, regra 20). Desta forma, temperaturas

muito elevadas, intervalo TEMP5, e de níveis médios de oxigênio verifica-se a

freqüente ocorrência de cirripédios (CIR4, regra 22) e a abundância de decápodes. Este

conjunto de regras demonstra dentre outras coisas que são a temperatura e o oxigênio os

fatores ambientais determinantes para a estruturação populacional na massa d´água

costeira.

De acordo com o conhecimento do fenômeno da ressurgência procurou-se por

regras que continham em alguma de suas partes o intervalo TEMP1 (pelo processo de

discretização inclui temperaturas menores que 18 graus). Neste contexto foram

descobertas apenas cinco regras como segue:

Se CIP2 e OST1 e OX5 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (25)

Se NTI2 e POL3 e OX4 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (26)

Se NTI2 e POL3 e NTO4 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (27)

Se CIP1 e NTI2 e POL3 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (28)

Se ASC1 e NTI2 e POL3 então TEMP1 [0.12%, 100%, 1, 1 0.12%] (29)

Neste conjunto pode-se concluir que trata-se de uma massa d’água com

características de poucas larvas devido a ocorrência de OST1 e CIP2na regra 25 e ASC1

na regra 29. Porém pode ser observado a presença de níveis médios de poliquetas

(POL3) pelas regras 26, 27 e 29. A regra 27 também apresenta um elevado nível de

nitrato (NTO4) enquanto são observados pequena concentração de nitrito (NTI2) nas

regras 26 e 27. Ainda fica evidente a ocorrência de elevados teores de oxigênio,

intervalos OX5 e OX4 das regras 25 e 26 respectivamente.

Normalmente, ao longo do ano, o mais comum é encontrar a presença de uma

massa d’água costeira “estacionária” junto ao continente e a presença de águas da

Corrente do Brasil fluindo em direção sul, que se misturam. Esta mistura dá origem

outra água com característica diferentes. Neste exemplo foram usados um valor suporte

de 30% e um valor de confiança de 80%. As regras originadas deste experimento foram

ranqueadas por ambas as partes como segue:

Se TEMP3 e PO2 e BRY1 então NTI1 [10.7%, 96.8%, 55, 53, 10.3%] (30)

Se BRY1 e CLO2 e SAL3 então TEMP3 [12.3%, 96.8%, 63, 61, 11.93%] (31)

Se PO2 e NTO1 e SAL3 então NTI1 [12.5%, 98.4%, 64, 63, 12.32%] (32)

Se PO2 e LD2 e OST2 e MIT2 então NTI1 [15.3%, 96.4%, 64, 63, 12.3%] (33)

Se TEMP3 então SAL3 [78.8%, 85.1%, 403, 336, 65.7%] (34)

Se TEMP3 então OX3 [73.8%, 83.1%, 377, 316, 61.8%] (35)

Esta situação mostra novamente um ambiente de poucos nutrientes e pobre

diversidade biológica. Os intervalos TEMP3, SAL3 e OX3 são os mais freqüentes no

ambiente dado aos altos valores de suporte das regras.

No entanto, durante o processo de emergência das Águas Profundas do Atlântico

Sul (ACAS), esta massa d’água pode ter contato direto com a água costeira ou com a

água tropical produzindo assim outros ambientes de misturas de características

diferentes como se demonstra à seguir:

Se TEMP2 e MTI4 então SAL4 [0.19%, 100%, 2, 2, 0.19%] (36)

Se NTO2 e MTI4 então SAL4 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (37)

Se PO3 e MTI4 então SAL4 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (38)

Se CLO3 e MTI4 então SAL4 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (39)

Se NTO2 e NTI4 e PO3 então SAL4 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (40)

Se CLO3 e ASC5 e MIT5 então SAL4 e DEC 4 [0.19%, 100%, 2, 2, 0.19%] (41)

Se OX3 e OST2 e LD2 então CIP2 e TEMP2 [0.19%, 100%, 2, 2, 0.19%] (42)

Se POL2 e CIR2 e MIT3 então SAL4 [0.19%, 100%, 2, 2, 0.19%] (43)

Estas águas se caracterizam por serem uma mistura das águas da ACAS e da

água tropical da Corrente do Brasil. É evidente a presença de grande concentração do

nutriente, nitrito, intervalos de MTI4, MTI5 sugerindo uma intensa atividade bacteriana

devido a este nutriente ser uma forma de transição do metabolismo entre a amônia e o

nitrato. Este último se encontra ainda em um intervalo de baixa concentração. O fosfato

se encontra em níveis médios juntamente com a clorofila. São encontrados nestas águas

baixas densidade de poliquetas, cirripédios, ostras e larvas em D. Verifica-se ainda uma

ocorrência abundante de mexilhões, ascídias e decápodes.

Noutra situação verifica-se:

Se BRY1 e NTO1 e TEMP2 então CLO5 [0.78%, 100%, 5, 4, 0.78%] (44)

Se SAL3 e TEMP2 e CLO5 então MIT1 [0.78%, 100%, 5, 4, 0.78%] (45)

Se PO2 e NTI1 e TEMP2 então SAL3 OX5 [0.78%, 100%, 5, 4, 0.78%] (46)

Se OST2 e NTI1 e BIV3 então LD2 e DEC1 [0.78%, 100%, 5, 4, 0.78%] (47)

Se BIV3 e CIR2 e CIP1 então POL2 e CLO5 [0.78%, 100%, 5, 4, 0.78%] (48)

A presença de intervalos TEMP2 e SAL3 neste conjunto de regras caracteriza

um situação de mistura das águas da ACAS e a água costeira. Percebe-se que são águas

de alta produção primária devido ao intervalo CLO5, no entanto verifica-se a baixa

concentração de nutrientes pois os mesmos devem já ter sido depletados pelo sistema

clorofiliano. Observa-se também a baixa ocorrência de larvas que provavelmente ainda

não tiveram tempo suficiente para se verificar um pulso de produção secundária.

4.4) Regras de Classificação de Dados

No momento em que as tecnologias oriundas da área de “machine learning”

passaram a ser empregadas em conjuntos de dados do mundo real, verificou-se a

emergência de um novo problema (CHAWLA, 2004), isto é, o desbalanceamento dos

dados ou de classes.

Este problema tem sido o responsável pela degradação da performance de

classificadores (TAEHO 2004). Na tarefa de minerar dados e gerar um classificador

que possa operar no gerenciamento ambiental costeiro, este problema deverá ser

enfrentado e solucionado. Portanto, o objetivo aqui é construir um classificador capaz

de cobrir o espaço de busca contemplando todas as possibilidades ou casos raros, como

a ocorrência da ressurgência e os diversos ambientes provocados pelo transiente

resultante do processo de mistura das diversas massas d’águas. É importante determinar

o que é exatamente considerado raro e o efeito que este problema pode causar nos

modelos de classificação.

Segundo WEISS (2004), muitas das pesquisas da área de mineração de dados

estão relacionadas com classes raras e casos ou exemplos raros. O problema de casos

raros está relacionado com a distribuição dos dados, enquanto que o problema de classes

raras ocorre quando existem mais exemplos em uma classe do que em outra, neste caso,

os classificadores tendem a ser subjugados pela maior classe e ignorar a menor. Porém,

vale notar que, dentro das classes mais comuns (maiores) pode também haver casos

raros de acordo com a distribuição interna das classes. Ambos os tipos de raridade têm

sido referidos como responsáveis pelo problema de desbalanceamento dos dados. Isto

torna difícil a tarefa de mineração e indução de classificadores devido a :

• Escolha da métrica adequada para avaliação dos classificadores;

• Carência de dados;

• Fragmentação dos dados;

• Estabelecer o nível indutivo apropriado para gerar o classificador (bias);

• Ruído;

Alguns autores comentam a interação de classes desbalanceadas com outros

problemas tais como pequenas disjunções, “small disjunct” encontrado em

JAPKOWICZ (2003), e a sobreposição de classes em VISA (2003). O

desbalanceamento de classes está relacionado com a sobreposição, devido ao fato das

classificações erradas ocorrerem freqüentemente perto da “fronteira” ou do limite da

sobreposição, enquanto que, “small disjuncts” são aquelas disjunções dos

classificadores que cobrem poucos exemplos de treinamento. O problema é que

pequenas disjunções geralmente causam uma taxa de erro maior. A natureza da

propensão ao erro é um resultado direto da raridade WEISS (2004).

Uma série de abordagens ao nível dos dados e de algoritmos tem sido propostas

na literatura para solucionar este problema. Estas soluções incluem muitas formas

diferentes de re-amostragem tais como, sub-amostrar (under-sample) os exemplos da

classe majoritária (KUBAT et al., 1997), sobre-amostrar (over-sample) os exemplos da

classe minoritária (MALOOF, 1998), sobre-amostrar a classe majoritária e sub-amostrar

a classe minoritária (CHAWLA, 2002), atribuir pesos a exemplos da classe minoritária

(CARDIE et al., 2003), evoluir algoritmos de “boosting” para classificar classes raras

(JOSHI et al., 2001), combinar dados sintéticos com algoritmos de “boosting” para

melhorar a predição da classe minoritária (CHAWLA, 2003).

Para a determinação das classes a abordagem deste trabalho consistiu na aplicação do

algoritmo de agrupamento de dados K-means descrito anteriormente e seus resultados,

colocados na matriz de intervalos discretos. A Tabela 4.3, mostra o número de classes,

a freqüência ou número de registros em cada classe, a porcentagem que cada classe

representa em relação a base de dados e o número de regras obtidas pelo classificador

gerado.

Tabela 4.3 – Número de classes, freqüência, probabilidade e regras geradas.

Classe Freqüência Probabilidade Nº Regras1 203 39.70% 742 21 4.20% 53 183 35.80% 634 14 2.70% 35 43 8.40% 146 15 2.90% 47 32 6.30% 12

Segundo QUILAN (1992), o objetivo de minerar regras de classificação é

descobrir um pequeno conjunto de regras capaz de atuar como classificador preciso. Na

mineração de regras de associação, não existe alvo predeterminado mas, para regras de

classificação isto se faz necessário pois o alvo é a classe que se deseja prever. A

particularidade do conjunto de regras de classificação é, portanto, possuir o atributo

classe posicionado na parte conseqüente da regra. LIU (1998), propõe a integração do

sistema que busca todas as regras de associação com outro para descobrir regras de

classificação em uma estrutura que chamou de classificação associativa, que busca por

um sub conjunto de regras de associação especial chamado de regras de associação de

classe (CARs). Este autor adaptou o algoritmo Apriori de AGRAWAL & SRIKANT

(1994), para minerar o sub conjunto “CARs” que satisfaça um pré-determinado nível de

suporte e confiança mínimas. Esta adaptação se fez necessária por dois motivos: o

primeiro é evitar a explosão combinatorial do algoritmo e em segundo, foi adotar a

estratégia de discretização de atributos contínuos desenvolvida por FAYYAD e IRANI

(1993). Portanto, seu sistema funciona em três etapas:

• Discretiza atributos contínuos;

• Gera todas as regras de associação de classes (CARs);

• Constrói um classificador baseado em CARs.

Esta metodologia de classificação assume que a base de dados é uma tabela

relacional, que consiste de N casos descritos por l distintos atributos. Estes N casos são

classificados dentro de q classes conhecidas. Durante a classificação, todos os atributos

são tratados uniformemente. Para um atributo categórico, todos os possíveis valores são

mapeados para um conjunto de números inteiros positivos e consecutivos. Para um

atributo contínuo, seus valores são discretizados dentro de intervalos, e os intervalos

também são mapeados em um conjunto de números inteiros positivos consecutivos.

Com esses mapeamentos, pode-se tratar um caso (objeto ou registro) como um conjunto

de pares (atributo, valor inteiro) e uma classe alvo. Cada par (atributo, valor inteiro) é

chamado de item.

Seja D o conjunto de dados, I o conjunto de todos os itens em D, e Y o conjunto

de classes alvo. Pode-se dizer que um caso d ∈ D contém X ⊆ I, um subconjunto de

itens, se YX ⊆ . Uma regra de associação de classe (CAR) é uma implicação da forma

X → y, onde DX ⊆ , e y є Y. Uma regra X → y é válida em (ou está contida em) D

com confiança c se c% dos casos em D que contém X são marcados com a classe y. A

regra X → y tem suporte s em D se s % dos casos em D que contém X são rotulados

com a classe y.

Vale ressaltar novamente que o primeira etapa de discretização usada neste

trabalho foi a mesma do processo de extração de regras de associação.

Para produzir o melhor classificador de todo o conjunto de regras é efetuada uma

avaliação sobre os possíveis subconjuntos de CARs gerados durante a fase de

treinamento e a seleção da seqüência de regras que fornece menor erro.

O conceito básico empregado na operação de geração de CARSs é achar todos

os “ruleitems” (regra dos items atributos) que tem suporte mínimo (“minsup”) acima do

especificado. Um ruleitem tem a forma de:

< condset, y >

onde “condset” (condições) é um conjunto de items, y є Y, é uma classe alvo.

“Ruleitems” que satisfaçam “minsup” são chamados “frequent ruleitems” (regras

freqüentes). Para todos “ruleitems” que tem o mesmo “condset”, o “ruleitem” com a

mais alta confiança é escolhido como uma “possible rule”, possível regra (PR) que

representa este conjunto de “ruleitems”. Se existir mais do que um ruleitem com o

mesmo nível de confiança, é randomicamente selecionado um ruleitem. Se a confiança

é maior do que “minconf”, diz-se que a regra tem acurácia. O conjunto de regras de

associação de classe (CARs) então consiste de todas as regras possíveis (PRs) que são

tanto freqüentes e precisas.

O algoritmo gera todos os items freqüentes fazendo múltiplos passos sobre os

dados. No primeiro passo, estabelece o suporte individual de cada item e determina se

este é freqüente. Em cada passo subseqüente, escolhe um conjunto de items “semente”

(“seeds”) eleito como freqüentes no passo anterior. Essa semente é usada para gerar

novos “ruleitems” possivelmente freqüentes, chamados de “candidate ruleitems”

(regras de itens candidatas) O atual suporte desses candidatos são calculados durante o

passo sobre os dados. No final do passo, determina quais candidatos são realmente

freqüentes. A partir deste conjunto de regras freqüentes, produzam-se as regras CARs.

Para se selecionar qual conjunto de CARs será o melhor classificador, torna-se

necessário definir uma ordem nas regras geradas.

Dado duas regras, rBi B e rBj B, r Bi B f rBj B (também chamado r Bi B que precede rBj B ou r Bi B tem

uma maior precedência que r Bj B) se:

1. a confiança de rBi B é maior do que a de r Bj B ou,

2. suas confianças são as mesmas, mas o suporte de r Bi B é maior que a de rBj B, ou

3. ambos confiança e suporte de r e r Bj B são os mesmos, mas r Bi B é gerado antes que rBj B.

Considere R ser o conjunto de regras geradas (CARs), e D os dados de

treinamento. A idéia básica do algoritmo é escolher um conjunto de regras de alta

precedência em R para cobrir D. O algoritmo do classificador é construído em três

etapas:

1 - Classifica o conjunto de regras R geradas de acordo com a relação “f ”. Isto

assegura a escolha das regras de maior precedência;

2 - Seleciona regras para o classificador a partir de R seguindo a seqüência

classificada. Para cada regra r, o algoritmo varre D para encontrar aqueles casos

“cobertos” por r (que satisfazem as condições de r). Se a regra r classifica corretamente

o caso d, a regra é marcada e considerada uma regra potencial para o classificador. d.id

é o único número de identificação de d. Se r pode classificar corretamente no mínimo

um caso (se r está marcado), será uma regra potencial para o classificador. Os casos

cobertos por estas regras são então retirados de D. Uma classe “default” é também

selecionada (a classe majoritária nos dados restantes), que significa que se se parar a

seleção, mais regras para o classificador C esta classe será a classe “default” de C.

Computa-se então o número total de erros feitos pelo corrente C e a classe “default”.

Isto é a soma do números de erros que foi feito por todas as regras selecionadas em C e

o número de erros feitos pela classe “default”nos dados de treinamentos. Quando não

existir nenhum caso à ser treinado ou regra , o processo de seleção é terminado.

3 - São descartadas todas as regras em C que não melhoram a acurácia do classificador.

A primeira regra contendo o número mínimo de erros registrados em D é a regra que

limita a poda (“cutoff rule”). Todas as regras depois desta regra podem ser descartadas

porque elas irão produzir mais erros. As regras não descartadas e a classe da última

regra selecionada em C formam o classificador. As regras não descartadas e a classe

“default” da última regra em C formam o classificador. Esta técnica de classificação é

muito eficiente, maiores detalhes podem ser encontrados em LIU (1998).

A Tabela 4.4 apresenta a matriz de confusão ou matriz de erro usada para avaliar

o resultado de um experimento de classificação. Os componentes da diagonal principal

da matriz fornece o número de registros ou casos classificados corretamente.

Tabela 4.4 – Matriz de Confusão do Classificador

A acurácia deste modelo foi estimada em 87.63% sendo a taxa média de erro estimada

em 12.37%.

Na seção anterior tentou-se apresentar regras de associação e relacioná-las com

as classes de intervalos de temperatura e salinidade para estabelecer uma comparação.

No caso de regras de classificação, esta comparação não pode ser feita pois, as classes

foram estabelecidas pelo algoritmo K-means. Vale a pena lembrar que esta

classificação leva em conta o espaço multidimensional dos dados e não apenas duas

variáveis. A seguir apresentam-se alguns exemplos das regras de classificação mais

interessantes:

Se OX3 e PO2 e POL2 TEMP4 então CLASSE 1 [3.13%, 100%] (49)

Se TEMP3 e BRY1 e PO1 CLO1 então CLASSE 1 [1.76%, 100%] (50)

Se BRY1 e POL4 então CLASSE 1 [1.76%, 100%] (51)

(1) (2) (3) (4) (5) (6) (7) Classificadocomo:

172 0 19 0 1 0 1 (1): 15 8 5 0 2 0 0 (2): 219 2 156 0 1 0 0 (3): 31 0 1 12 0 0 0 (4): 42 0 1 0 33 0 0 (5): 50 0 0 0 0 15 0 (6): 61 0 0 0 0 0 29 (7): 7

Se NTI1 e BIV1 e CIP2 e SAL2 então CLASSE 1 [8.06%, 92%] (52)

Se DEC3 e BRY5 e POL4 então CLASSE 2 [0.57%, 100%] (53)

Se CLO2 e POL5 e CIP4 então CLASSE 2 [0.47%, 100%] (54)

Se ASC2 e SAL5 então CLASSE 2 [0.26%, 100%] (55)

Se LD2 e TEMP1 então CLASSE 2 [0.26%, 100%] (56)

Se LD2 e MIT2 e CIP1 e CLO3 então CLASSE 3 [6.26%, 85%] (57)

Se BIV1 e CIR2 e POL2 e ASC1 então CLASSE 3 [12.52%, 81%] (58)

Se NTO2 e NTI3 então CLASSE 4 [1.37%, 100%] (59)

Se BIV5 e NTI1 e MIT4 e então CLASSE 5 [12.52%, 81%] (60)

Se OX4 e PO5 então CLASSE 5 [12.52%, 81%] (62)

Se BRY1 e CLO5 e então CLASSE 6 [2.52%, 100%] (63)

Se TEMP2 e CLO5 e OST5 então CLASSE 6 [1.52%, 100%] (64)

Se TEMP3 e CIR5 e DEC3 então CLASSE 7 [0.96%, 100%] (65)

Se DEC4 e CIP5 e OST5 então CLASSE 7 [0.96%, 100%] (66)

A análise das regras de classificação demonstra que dentre este pequeno número

de regras selecionadas o classificador apresenta como CLASSE 1 intervalos de

temperaturas 3 e 4 e salinidade 2 indicado pelo conhecimento dos especialistas e Tabela

3.1 se tratar de uma massa d’água costeira e os demais intervalos tanto químicos e

biológicos correspondendo a características oligotróficas. A CLASSE 2 apresenta na

regra número 55 o intervalo de salinidade 5 característica de águas tropicais, enquanto

que a regra de número 56 apresenta a temperatura com intervalo 1 sugerindo a transição

devido ao encontro de duas massas d’água, Acas e tropical com elevadas densidades

larvais. A CLASSE 3 apresenta apenas regras com variáveis biológicas não sendo

possível, neste momento, estabelecer correlação direta com parâmetros físico-químicos

das massas d’águas, porém se trata de ambiente com médios teores de clorofila e baixa

incidência larval. A CLASSE 4 pode ser considerada como caso inverso, demonstrando

níveis médios do nutriente nitrito e baixo-médio de nitrato. A CLASSE 5 representa um

ambiente muito oxigenado e com altas concentrações de fosfato; a ocorrência de

abundantes larvas de bivalvias pode explicar a grande freqüência de larvas de

mexilhões, intervalo MIT4. A ocorrência do intervalo de número dois indica que a

CLASSE 6 pode corresponder a águas resultantes de mistura da ACAS com a água

costeira ou com águas tropicais; de qualquer forma demonstra-se um ambiente com alta

concentração de clorofila, abundância de larvas de ostras e ausência de briozoários. Já a

CLASSE 7, é encontrado o intervalo TEMP3 característico de águas costeiras ou

tropicais e um ambiente marcado pela dominância de larvas dos cirripédios (CIR5 e

CIP5) e ostras com média para alta ocorrência dos decápodes.

4.5) Regras “Fuzzy” e classificação de dados

As pesquisas por novos classificadores têm encontrado motivação não só na

melhoria da performance de precisão de classificação mas também na aquisição e

representação de novos conhecimentos associados à classificação.

Segundo ZADEH (1973), o cérebro humano processa e interpreta informações

incompletas e imprecisas fornecidas pelos órgãos sensoriais. A medida que a

complexidade de um sistema aumenta, a habilidade humana de fazer “declarações”

precisas e significantes sobre seu comportamento diminui até um determinado nível

além do qual a precisão se torna quase uma característica inacessível. Por causa desta

crença Zadeh introduziu o conceito de variável lingüística.

De acordo com este autor, uma variável lingüística é caracterizada por um

conjunto (x, T(x), X, G, M) no qual x é o nome da variável; T(x) é o “term set”,ou o

conjunto de valores lingüísticos; X é o universo de discussão; G é uma regra sintática

que gera os termos em T(x); e M è uma regra semântica que se associa com cada valor

lingüístico A significando M(A), onde M(A) indica um conjunto “fuzzy” em X. Por

exemplo:

Se a concentração de oxigênio é interpretada como uma variável lingüística,

então seu conjunto de valores lingüísticos T(OX) poderia ser:

T(OX) = {baixo, médio-baixo, médio, médio-alto, alto}

onde o termo T(OX) é caracterizado pelo conjunto “fuzzy” do universo X = [0, 10]. A

regra sintática se refere à maneira pela qual os valores lingüísticos são gerados no

conjunto de valores T(OX) enquanto que as regras semânticas definem a função de

pertinência de cada valor lingüístico no conjunto de valores. A Figura 4.2 ilustra uma

típica função de pertinência do tipo triangular.

0 2,5 5,0 7,5 10,0

Baixo Médio-baixo Médio Médio-alto Alto

Concentração de Oxigênio

tinên

0 2,5 5,0 7,5 10,0

Baixo Médio-baixo Médio Médio-alto Alto

Concentração de Oxigênio

tinên

Figura 4.2 – Função de pertinência típica

A teoria de conjuntos fuzzy fornece um cálculo sistemático para lidar com

tais informações lingüísticas e desempenha computação numérica usando alvos

lingüísticos estipulados por funções de pertinência. Além disso, a obtenção e seleção de

conhecimento estruturado na forma de regras “fuzzy” (if-then), se-então, forma a

componente chave de um sistema de inferência “fuzzy”que pode modelar

eficientemente a perícia humana de um domínio específico.

A transformação de informações numéricas, precisas, da base de dados em

informações lingüísticas, imprecisas, ocorre com sucesso por meio das técnicas de

conjuntos “fuzzy” (PEDRYCZ & GOMIDE, 1998), originando o sistema de regras.

Esta abordagem se faz interessante pois as informações contidas na base de dados pode

ter um certo grau de imprecisão devido ao ruído inerente de qualquer processo de

medição.

O processo de geração de regras, pode utilizar o esquema de decomposição

proposto por KOSKO (1992) e regras do tipo TKS de ordem zero como indicado em

EVSUKOFF et. al. (1997). A Tabela 4.5 ilustra a estrutura de regras “fuzzy” do tipo

TSK para uma base de dados com dois atributos.

Tabela 4.5 – Regras fuzzy TSK

Takagi-Sugeno-Kang (TSK): Se x1 é Ai e x2 é Aj, então yi = f(x1, x2)

TSK de ordem zero: Se x1 é Ai e x2 é Aj, então yi = cij

TSK de ordem zero decomposta: Se x1 é Ai, então yi = ci

Se x2 é Aj, então yi = cj

Modelo Exemplo

Takagi-Sugeno-Kang (TSK): Se x1 é Ai e x2 é Aj, então yi = f(x1, x2)

TSK de ordem zero: Se x1 é Ai e x2 é Aj, então yi = cij

TSK de ordem zero decomposta: Se x1 é Ai, então yi = ci

Se x2 é Aj, então yi = cj

Modelo Exemplo

Neste estudo, o espaço dos dados normalizados foi também dividido em

cinco intervalos, mas não seguindo o conhecimento dos especialistas. Desta vez, os

pontos de corte dos atributos foram distribuídos de forma eqüitativa, intervalos variando

de 0 à 0,25; 0,26 à 0,5; 0,51 à 0,75 e 0,76 à 1,00 como o exemplo da Figura 4.2 acima.

Estes intervalos foram usados para definir funções de pertinência triangulares,

trapezoidais ou multi-sigmoidais associados aos valores lingüísticos baixo, baixo-médio,

médio, médio-alto e alto.

As regras são geradas de tal modo que suas respostas informam além da classe, um

valor de inclusão no conjunto “fuzzy”estabelecido em YUAN e SHAWN (1995).

Por outro lado, muitos algoritmos genéticos têm sido aplicados aos conceitos da

teoria “fuzzy” com a intenção de otimizar o desempenho de sistemas baseados em

regras deste tipo na tarefa de ajustar funções de pertinência, estrutura das regras e

tamanho da base de regras (CORDÓN et al., 1996, HERRERA et al., 1995). Seguindo

esta linha, neste trabalho foi usada a abordagem apresentada por ESPÍNOLA &

EBECKEN (2000), com o objetivo de extrair um pequeno subconjunto da base de

regras que utilize a menor quantidade de atributos e que tenha a maior acurácia possível.

O melhor modelo apresentou um subconjunto com apenas onze regras mostradas a

seguir.

Se Temperatura é média baixa então CLASSE 1 [sup. 0.11%, int. 31.78%] (67)

Se Temperatura é média baixa então CLASSE 3 [sup. 0.13%, int. 28.04%] (68)

Se Temperatura é baixa então CLASSE 4 [sup. 0.003%, int. 1.28.%] (69)

Se Temperatura é médio alto então CLASSE 6 [sup. 0.0002%, int. 2.58%] (70)

Se Nitrito é médio alto então CLASSE 4 [sup. 0.0002%, int. 2.58%] (71)

Se Nitrito é alto então CLASSE 4 [sup. 0.0041%, int. 1.83%] (72)

Se Ostras é médio alto então CLASSE 7 [sup. 0.0041%, int. 1.83%] (73)

Se Ascídias é alto então CLASSE 2 [sup. 0.0119%, int. 5.21%] (74)

Se Bivalvia é médio pequeno então CLASSE 5 [sup. 0.0034%, int. 1.75%] (75)

Se Bivalvia é médio alto então CLASSE 5 [sup. 0.0281%, int. 11.70%] (76)

Se Bivalvia é alto então CLASSE 5 [sup. 0.0304%, int. 11.70%] (77)

Quando se analisa estas regras fica evidente que o algoritmo genético realmente

é uma ferramenta eficiente no que diz respeito a extração de um pequeno subconjunto

do total de regras geradas. Esta abordagem promoveu também uma drástica seleção de

atributos mostrando quais os realmente mais relevantes na decisão de resolver o

problema de classificação.

A variável Temperatura parece ser o fator ambiental mais importante devido ao

fato de seus intervalos (suas funções de pertinência) ser responsáveis pela separação de

quatro classes, 1, 3, 4 e 6 respectivamente. A variável Nitrito foi a responsável pela

separação da classe 4 enquanto que o atributo Ostra separou a classe 7. A variável

Ascídia separa a classe 2 e Bivalvia separará a classe de número 5. É importante notar

que do ponto de vista de monitoramento biológico a variável Bivalvia constitui uma

Classe, categoria taxonômica bastante elevada e apresentou sensibilidade para um

atributo potencial em termos de indicador ecológico. O mesmo pode ser dito para a

família Ascidiaceae que apesar de numericamente inferior pode ser considerada como

um “item-espécie chave”. A seleção da variável nitrito como separador sugere que a

classe 4 podem ser águas de grande atividade de metabolismo microbiano já que é uma

forma nitrogenada intermediária na interconversão da amônia e nitrato operando

fortemente na ciclagem interna de nutrientes do sistema.

A Tabela 4.6 mostra a matriz de confusão deste modelo de classificação

“fuzzy”gerado pelo algoritmo genético.

Tabela 4.6 - Matriz de confusão do modelo “fuzzy”

A acurácia deste modelo de regras é de 85.33% e sua taxa média de erro

estimada em 14.67%. Deve-se considerar que o algoritmo genético faz uma

amostragem aleatória e que nesta amostragem não necessariamente estarão presentes

representantes de todas as classes. Sendo assim, a matriz acima apresenta valor zero no

que se refere aos acertos da classe de número 6 e ao mesmo tempo apresenta uma

unidade caracterizando erro de omissão da classe seis em detrimento da classe três.

Este fato demonstra que se deve ter cautela quando da avaliação da performance de

classificadores mesmo quando se usa uma estratégia de validação cruzada como foi o

caso tanto da avaliação do modelo “crisp” e “fuzzy”. O modelo de regras “fuzzy”

19 0 2 0 0 0 0 (1): 10 2 0 0 0 0 0 (2): 21 2 17 0 0 0 0 (3): 30 0 0 2 0 0 0 (4): 40 0 0 0 4 0 0 (5): 50 0 1 0 0 0 0 (6): 62 0 0 0 0 0 2 (7): 7

contempla esta classe através da regra de número 70, porém seu suporte é extremamente

baixo (0.0002).

4.6) Redes Neurais

O processo de aprendizagem do homem se dá no cérebro que é um sistema de

processamento de informações altamente complexo, fazendo cálculos não lineares

distribuídos pelos neurônios. Estima-se em dez bilhões o número de neurônios do

córtex cerebral com aproximadamente sessenta trilhões de conexões sinápticas,

tornando-o uma estrutura altamente eficiente no que se refere à tarefa de percepção de

sinais, controle motor e reconhecimento de padrões. O funcionamento desta estrutura é

ainda mais complexo quando se leva em consideração a propriedade de plasticidade

devido à capacidade de geração de novas conexões ou modificação das já existentes.

Neste sentido, esta seção tem como objetivo testar a tecnologia de redes neurais

artificiais (HAYKIN, 1994), que tem a capacidade intrínseca de aprender padrões à

partir do treinamento de dados de entrada adaptando-se ao ambiente através do

algoritmo de aprendizagem, ser modelos não paramétricos capazes de formar fronteiras

de decisão altamente não lineares no mapa de entrada e saída do espaço de

características e fluxo de informação distribuída na matriz de pesos, o que permite

pequena perda de eficiência no caso de dano em algum de seus componentes. Existem

diversos tipos de redes empregadas na tarefa de classificar padrões dentre as quis pode-

se citar, classificadores probabilísticos (PNN), classificadores de hiperplano (MLP),

classificadores de Kernel (RBF), classificadores de exemplos (KNN), todos com

diferentes estruturas e filosofia. Para cada problema existe um classificador ideal, a

questão é identificar este classificador. Uma boa performance de classificação requer a

seleção de atributos efetivos e escolha da arquitetura correta que faça bom uso dessas

características. Na tarefa de classificação de padrões o objetivo é atribuir padrões de

entrada para uma classe, dentre um número finito M de classes. Padrões de entrada

podem ser vistos como pontos em um espaço multidimensional definido pelas medidas

das características (atributos) de entrada. O objetivo do classificador é a partição deste

espaço multidimensional em regiões de decisão que indiquem a qual classe pertence

uma determinada entrada. Devido a este grande número de possibilidades, será usado a

metodologia de algoritmos genéticos para a otimização do processo de geração do

classificador.

Algoritmos genéticos têm sido usados em combinação com redes neurais de

diversas maneiras. Eles podem selecionar atributos como em BRILL (1992) ou evoluir

o vetor de pesos de uma arquitetura fixa de rede segundo YAO (1993). Neste

experimento, as duas abordagens são utilizadas de maneira combinada como

apresentado por PEREIRA & EBECKEN (2005). Foi deixado que o algoritmo

dividisse aleatoriamente a base de dados em três partes: um para conjunto de

treinamento consistindo de 85% dos dados, outro para teste com 10% dos dados e os 5%

restantes deixados para a validação do modelo. Devido ao pequeno número de registros

e a grande dependência deste tipo de modelo por dados de treinamento teve-se a

preocupação de adotar novamente o procedimento de validação cruzada. Os três

melhores resultados desta evolução apresentou redes do tipo MLP (Perceptron Multi

Camadas) cuja arquiteturas e respectivos erros (RMS) em cada fase de desenvolvimento

é apresentado na Tabela 4.7. Pode ainda ser observado que todos os três modelos

apresentaram duas camadas “escondidas” demonstrando que se tratar de padrão muito

complexo. O primeiro modelo mostra uma redução significativa do número de

variáveis de entrada selecionadas, este modelo tem a menor arquitetura demonstrando

grande otimização, porém é também o que apresenta o maior erro. O modelo mostrado

na segunda linha da Tabela 4.7 pode ser eleito como “o melhor” devido ao fato de

apresentar arquitetura bastante otimizada, se comparado com o terceiro modelo, que

consegue os menores erros mas tem de usar todo o espaço de busca, tendo então maior

custo computacional.

Tabela 4.7 – Arquiteturas MLPs e erros de treinamento, teste e validação

T ipo de A rquitetura T reinam ento T este V alidaçãoM L P- 2/4 /7 /1M L P- 5/9 /7 /1M L P- 19/17/7 /1

0.10250.05550.0192

0.11410.00370.0221

0.10660.00700.0553

T ipo de A rquitetura T reinam ento T este V alidaçãoM L P- 2/4 /7 /1M L P- 5/9 /7 /1M L P- 19/17/7 /1

0.10250.05550.0192

0.11410.00370.0221

0.10660.00700.0553

Vale notar que todos os modelos apresentam sete nós na segunda camada

computacional. O algoritmo de treinamento utilizado foi o retropropagação de erro

proposto por RUMELHART (1986), em que a transformação do espaço de entrada é

feita sobre os nós formados por uma soma ponderada das entradas que passam através

da não linearidade de uma função sigmoidal ou tangente hiperbólica. Os nós das

camadas “escondidas”, formam hiperplanos que atuam como funções discriminantes das

fronteiras de decisão no processo de separação.

4.7) Performance dos Classificadores

Para avaliar a performance de todos os modelos propostos, adotou-se a estratégia

de validação cruzada em 10 vezes. Muitas pesquisas na construção de classificadores

tem focado o erro mínimo de classificação mas, em aplicações do mundo real,

diferentes tipos de erros podem ter custos diferentes. O custo das predições incorretas

muitas vezes é mais importante do que o número de predições incorretas A estimativa

da acurácia de um classificador é importante para avaliar o quão preciso determinado

classificador é e como se comportará na presença de dados desconhecidos (HAN, 2001).

Este autor cita que outras técnicas para melhorar a acurácia de um classificador, são

conhecidos por “Bagging” (bootsrap aggregation) e o “boosting”. Estas técnicas

combinam uma série de classificadores treinados, C1, C2, ..., CT com o objetivo de criar

um classificador composto melhorado, C*. Supondo que certo diagnóstico ambiental

seja dado por um modelo ou um especialista, alguém ao invés de consultar um único

especialista ou modelo, pode consultar ou perguntar para vários. A idéia é de que se um

certo diagnóstico ocorre mais do que outros, então esse poderá ser o melhor. Este é o

princípio bagging enquanto que se atribuir pesos ou importâncias aos “valores” de cada

diagnóstico, baseado na acurácia dos diagnósticos prévios o diagnóstico final será então,

uma combinação dos diagnósticos ponderados. Esta é a essência de um boosting.

Dado um conjunto S de s amostras, pode-se utilizar “bagging” quando: Para

uma iteração t (t= 1, 2, ..., T), um determinado conjunto de treinamento St é amostrado.

Uma vez que na amostragem alguns registros que rotulam uma classe podem não estar

incluídos em St, outros podem ocorrer várias vezes. Um classificador Ct será treinado

para cada conjunto de treinamento St. Para classificar uma amostra não conhecida, X,

cada classificador Ct indica uma classe de predição, e atribui um voto. O classificador

bagged, C*, conta os votos e assim a classe com o maior número de votos é

determinada para X. Bagging pode ser aplicado à predição de valores contínuos

utilizando o valor médio da predição de cada classificador.

Em Boosting, são fixados pesos para cada amostra de treinamento. Um série de

classificadores é treinado. Depois que um classificador Ct é treinado, os pesos são

atualizados para permitir o classificador subseqüente, C t+1, “corrigir” os erros de

classificação feitos por Ct. O classificador boosted, C*, combina os votos de cada

classificador individual, onde o peso de cada voto do é uma função acurácia. O

algoritmo boosting pode ser estendido para a predição de valores contínuos.

A Figura 4.8 apresenta o histograma da performance da acurácia dos diversos

classificadores por classe expresso em porcentagem. Pode-se observar que para todas

as classes a rede neural apresentou o melhor índice de acertos. Já quando se analisa o

comportamento do modelo de regras crisp” nas classes de número 1, 2, 3 e 5 percebe-se

baixa performance em relação ao modelo de regras “fuzzy” e uma equivalência quanto a

classe de número 3. Porém, o modelo de regras “fuzzy” simplesmente ignora a classe 6

enquanto mostra performance semelhante ao modelo de rede neural na classe número 7.

1 2 3 4 5 6 7Classes

crisp fuzzy nn

Figura 4.8 – Acurácia dos classificadores “Crisp”, “Fuzzy” e Neural por classe

Este capítulo dedicou esforços para analisar o desempenho dos modelos de

classificação aplicados aos padrões existentes no transiente originado pelas diferentes

massas d’águas. Restaria analisar o conhecimento escondido no modelo de redes

neurais artificiais. Apesar de existirem metodologias consagradas para a extração de

regras de redes neurais, a complexidade do modelo escolhido não recomenda esforços

nesta atividade, pois demandaria extensos estudos para resultar em conhecimento

explícito e interessante.

Capítulo V

Predição de Grandezas e Indicadores

Mudanças ambientais são constantes nos ecossistemas de todo o planeta e os

ecossistemas marinhos não são exceção á regra. O importante é distinguir entre

mudanças naturais e importantes mudanças provocadas pelo homem (JACKSON,

2001). Estas mudanças devem ser monitoradas e comparadas com aproximações das

condições originais. A escolha apropriada de indicadores, o projeto do sistema de

monitoramento e o processo de modelagem é crítico para o sucesso (JAKEMAN et al.

1993). A questão é como melhor identificar, monitorar, antecipar, reportar, interpretar e

responder à rede de mudanças no ecossistema, (ZELANY, 2001). Este capítulo tem por

objetivo analisar os problemas referentes à identificação, adoção e aplicação de

indicadores biológicos e ecológicos para o acesso e predição da saúde do ecossistema e

qualidade do ambiente costeiro. De acordo com RAY and McCORMIC (2004), mais da

metade da população mundial reside na faixa de linha costeira. Este desenvolvimento

resultou em acelerada pressão ambiental. Os sintomas nos ecossistemas incluem desde

deterioração da qualidade da água através da entrada de nutrientes, sedimentos e

substâncias tóxicas alterando as condições hidrológicas à perdas de habitat e

biodiversidade, interdição de praias, sobrepesca e declínio global das condições de vida

(HOBBIE, 2000; NRC, 2000; BOESCH et al., 2001). É evidente que a saúde do

ecossistema e a saúde humana estão intrincadamente ligadas (STEGEMAN and

SOLOW 2002). Por exemplo, “blooms” de algas tóxicas podem causar muitas doenças

ao homem, desde desordem neurotóxica aguda à perturbações crônicas no fígado.

Pessoas podem ser contaminadas numa atividade recreativa através do contato com

agentes bacterianos, viroses, protistas ou pela ingestão de frutos do mar contaminados e

até pela simples inalação de toxinas presentes no “spray” marinho.

5.1) Estrutura Conceitual

Várias abordagens de estruturas conceituais têm sido propostas para acessar a

saúde do ecossistema e a qualidade ambiental no últimos anos. RAPPORT (1986), por

exemplo, descreve uma estrutura baseada na relação estresse/resposta que foi adotada

pelo “Marine Environmental Quality (MEQ) Working Group of Canadá”. Esta

abordagem está baseada em quatro componentes.

1) Características e usos,

2) Fatores de Estresse,

3) Respostas do Ecossistema (usando indicadores),

4) Saúde ou condição ambiental.

HARDING (1992), apresenta um modelo de Qualidade do Ambiente Marinho (QAM =

MEQ) incluindo fontes estressoras (contaminantes químicos), características de

exposição, medidas de efeitos e indicadores de qualidade. Este foi um avanço

importante ligando fontes estressoras à efeito para ações de gerenciamento através de

análise de risco. Mais recentemente, SMILEY et al. (1998), aplica uma estrutura de

MEQ modificada na área do Estreito da Geórgia (EUA) enquanto CANG & WELLS

(2001), implementam na “Bay of Fund” uma abordagem baseada em

“objetive/guidelines”. As fontes estressoras e efeitos monitorados são da concentração

de bifenil-policlorados (PCBs), mercúrio e toxinas algais. O objetivo é fazer medidas

de variáveis do ecossistema e compará-las com valores de condições originais.

Ao mesmo tempo, verifica-se o uso do termo “Saúde do Ecossistema Marinho”

ou MEH (Marine Ecosystem Health) por VANDERMEULEN (1999), SHERMAN

(2000) dentre vários outros. Este termo deu origem a programas com abordagens

patológicas e epidemiológicas principalmente no “Gulf of Maine”. Por outro lado, Karr

e HOLLING (1992), NIELSEN (1999) e CAMPBELL (2000) usam a expressão

integridade ecológica. Com o uso de tantos termos usados na área, e não

necessariamente referindo-se a mesma coisa, tornou-se evidente a necessidade de

promover “workshops” para definição de conceitos. Atualmente, o termo MEQ se

refere à mudanças históricas nas condições ambientais e MEH, refere-se á presente

condição e direção das mudanças enquanto que Integridade Ecológica ou do

ecossistema (IE), é a dimensão da saúde que reflete a capacidade de manter a

organização, incorporando a idéia de resiliência e homeostase. Segundo a Agência de

proteção ambiental dos Estados Unidos (EPA) o desenvolvimento de indicadores para

medir a saúde do ambiente marinho e costeiro envolve as seguintes etapas:

1) definir o escopo do problema,

2) analisar a base de conhecimento,

3) selecionar indicadores,

4) conduzir pesquisa e monitoramento dos indicadores.

5.2) Interesses e Desafios

Devido à intensa demanda por recursos financeiros o acesso às condições

da região costeira, tem largamente adotado o uso de indicadores (WHITTIER et al.,

2002). Entretanto, SIMBERLOFF (1997), apresenta três dificuldades principais na

adoção de indicadores como ferramentas de gerenciamento de recursos:

1) Programas de monitoramento dependem freqüentemente de um pequeno número de

indicadores, conseqüentemente, falham em considerar a complexidade do sistema

ecológico;

2) A escolha de indicadores ecológicos é freqüentemente confundida nos programas de

gerenciamento que tem vagos ou obscuros objetivos de longo prazo;

3) Programas de monitoramento e gerenciamento normalmente não têm rigor científico,

portanto, falham no uso de um protocolo definido para identificar indicadores

ecológicos.

Por tudo isto, existe atualmente grande necessidade para o desenvolvimento de

indicadores capazes de detectar e diagnosticar sinais das condições ambientais sobre

escalas espaço-temporais ao nível celular, organismo, habitat, ecossistema e regional,

podendo-se citar como principais desafios:

1) Perturbação x Resposta - a maioria dos atuais indicadores das condições costeiras não

estão “ligados” com as fontes específicas de perturbação. Conseqüentemente, não está

claro que causas refletem mudanças no indicador ou que soluções de gerenciamento

devem ser implementadas. A maioria dos estudos que lidam com aspectos da

comunidade estão relacionados com a diversidade de espécies. Uma variedade de

índices de diversidade tem sido propostos.

2) Múltiplos Impactantes – desde os de origem antrópica como também perturbações

naturais.

3) Espaço e Tempo – fontes perturbadoras operam sobre escalas espaciais (de metros à

paisagens inteiras) e de tempo (segundos à décadas). Os indicadores atuais nem sempre

explicitam como eles relacionam condições com estas fontes perturbadoras nestas

diferentes escalas.

4) Condições de Referência – a interpretação de condições ou mudanças de um

indicador está baseada na comparação com uma condição de referência ou

“benchmark”. Freqüentemente as condições de referência não são definidas, ficando

então o julgamento da mudança do indicador limitada e sujeita a interpretações e

debates.

5.3) Critérios para Seleção de Indicadores

Indicadores ao nível de explotação de recursos ou espécies alvo são centrais em

qualquer programa de gerenciamento. A partir de uma perspectiva ecológica, especial

interesse tem as “espécies chave”. Estas, podem ser definidas como espécies de alta

conectividade de interações, sendo assim, suas abundâncias relativas tem um grande

impacto nos ecossistemas. A questão é quem são elas e quais são as funções

desempenhadas? A seleção de indicadores é crucial para o sucesso global de qualquer

programa de monitoramento. Em geral, indicadores ecológicos precisam capturar a

complexidade do ecossistema (KELLY & HARWELL, 1990) e ainda permanecer

simples o suficiente para ser fácil e rotineiramente monitorado (CAIRNS et al., 1993).

A fim de definir indicadores ecológicos DALE (2001), sugere um conjunto “ideal” de

critérios como segue:

• Ser de fácil mensuração;

• Ser sensível ao agente perturbador do sistema;

• Responder de maneira previsível às perturbações;

• Antecipador, mudanças no indicador devem ser medidas antes que ocorram

substanciais mudanças na integridade do sistema;

• Predizer mudanças que possam ser evitadas por ações de gerenciamento;

• Ser integrativo: todo o conjunto de indicadores fornece medidas da cobertura

dos principais gradientes do sistema;

• Ter uma resposta conhecida aos distúrbios naturais, perturbações

antropogênicas e mudanças temporais;

• Ter baixa variabilidade de resposta.

A clorofila-a tem sido usada por muitos anos como um indicador da biomassa do

fitoplâncton. A Figura 5.1 (PEREIRA,2002), apresenta a predição de modelos de redes

neurais artificiais do tipo Multi Layer Perceptron (MLP) quanto ao comportamento

desta variável no local estudado.

Entretanto, desde que virtualmente todo fitoplâncton contém este pigmento, este

sozinho não pode ser usado para determinar a composição da comunidade. Avanços

têm sido feitos para integrar conhecimento a partir de uma variedade de níveis tróficos

tão bem quanto escalas espaço temporais.

Indicadores ecológicos aplicados em diferentes contextos, para diferentes

ecossistemas, e para diferentes problemas podem ser classificados em oito níveis, desde

os mais reducionista aos mais holísticos:

Clorofila-aMod 4-sMod 5-sMod 6-s

Figura 5.1 – Predição de clorofila-a por três modelos de redes neurais.

Nível 1 – referem-se à presença ou ausência de espécies específicas. A aplicação mais

conhecida deste tipo de indicador é o índice saprobiano, que classifica córregos em

quatro classes de acordo com seus níveis de poluição orgânica. As espécies que foram

aplicadas para acessar as classes de poluição foram divididas em quatro grupos:

Organismos característicos de águas não poluídas, espécies dominantes em águas

poluídas, indicadores de poluição e espécies indiferentes à poluição. Experimentos com

redes neurais têm sido feitos em rios europeus para achar a relação entre qualidade de

água e a presença ou ausência de peixes, já que este grupo é tido como forte indicador

das condições ambientais.

Nível 2 – Este nível de indicadores usa a razão entre classes de organismos. Um

exemplo característico é o índice de algas Nyggard.

Nível 3 – Este nível é baseado em concentrações de compostos químicos. Os exemplos

são o acesso do nível de eutrofização na base da concentração total de fósforo

(assumindo que este elemento é o fator limitante para a eutrofização).

Nível 4 – Neste nível se aplica concentrações de níveis tróficos inteiros, por exemplo a

concentração de fitoplâncton (como clorofila-a ou como biomassa por m3) é usado

como indicador para a eutrofização. Uma alta concentração de peixes tem também sido

aplicada como indicador de boa qualidade de água ou pássaros como indicadores para

um saudável ecossistema florestal.

Nível 5 – Este nível usa taxas de processos com indicadores. Por exemplo,

determinações de produção primária são usadas como indicadores de eutrofização ou

um alto crescimento anual de uma determinada árvore em uma floresta é usado como

indicador de saúde do ecossistema ou ambiental. Altas taxas de respiração podem ser

usadas como indicadores da tendência dos ecossistemas aquáticos para a depleção de

oxigênio.

Nível 6 – Usam-se indicadores compostos ou combinados. Por exemplo,

respiração/biomassa, respiração/produção, produção/biomassa ou a razão dos

produtores primários e consumidores. ODUM (1983), usa essas combinações de

indicadores para acessar se um ecossistema está nos estágios primordiais de

desenvolvimento ou no clímax.

Nível 7 – este nível compreende indicadores considerados holísticos tais como

resistência, resiliência, capacidade de tamponamento, biodiversidade, todas as formas

de diversidade, tamanho e conectividade da rede ecológica e “turnover rate” de carbono,

nitrogênio e energia.

Nível 8 – compreendem indicadores de variáveis termodinâmicas, também chamados

indicadores super-holíticos, já que tentam capturar a imagem total do ecossistema sem

inclusão de detalhes. Tais indicadores são a exergia, energia, destruição exergética,

produção de entropia, força, massa, e sistema de tempo de retenção de energia.

Indicadores econômicos de custo benefício (que incluem todos benefícios ecológicos, e

não somente os benefícios econômicos da sociedade) também pertencem a este nível.

Novos potenciais indicadores: um que ligue a produtividade e hidrologia e outro a

comunidade e padrões de paisagem. Esses dois tipos de indicadores serão essenciais

para melhor medir e entender a complexidade, resposta e condição dos sistemas

costeiros.

5.4) Indicadores de Comunidade e Nível de Paisagem

Uma tarefa particularmente duvidosa no desenvolvimento de indicadores tem sido a

escala e a resposta da população agregada ao nível local para refletir as condições da

comunidade biológica para táxons específicos ou fornecer acesso a padrões de larga

escala como IBI (KARR, 1981) (índice of biological integrity), perfil de espécies

biológicas (Simon et al., 2001), multi-taxa índices (O’CONNOR et al., 2000), ou

índices de integridade ambiental (PAUL, 2003). Estas abordagens possuem enorme

potencial como indicadores para acessar as condições ambientais e sobre grande

paisagem ou áreas regionais tão bem quanto para detecção de mudanças temporais.

Entretanto, existe a necessidade de consideráveis desenvolvimentos entre estes três tipos

de indicadores tais como:

1) fornecer ligação com específicos e múltiplas fontes de perturbação,

2) exploração de técnicas analíticas para integrar e sintetizar o complexo sinal

biológico,

3) comunicar os resultados dessas respostas multivariadas e,

4) fornecer escalas espaço temporais explicitas no qual os indicadores podem ser

agregados para escalas de ações de gerenciamento (WARDROP et al., 2003).

A estrutura e função de comunidades vegetais e animais têm sido extremamente

medidas para descrever as condições de sistemas terrestres e aquáticos. A força dessas

abordagens mais integradoras é a maior probabilidade de identificar respostas biológicas

sensíveis a uma grande variedade de perturbações que existem em qualquer ambiente e

a possibilidade de amostrar grande variedade de táxons; cada qual com uma única

história de vida capaz de ser “rompida” pelo agente perturbador. Por exemplo, o

fitoplâncton é particularmente sensível aos nutrientes (DIXT et al., 1992). Comunidade

de invertebrados bentônicos são sensíveis à contaminação nos sedimentos (BAILEY et

al., 1995). Comunidades de peixes integram informação do desenvolvimento humano

(BRAZNER, 1997) e espécies exóticas (RAHEL, 2000). Áreas alagadas são

diretamente afetadas por modificações hidrológicas tais como diques e construção de

rodovias (HERDENDORF, 1992). Anfíbios são sensíveis a qualidade da água

(KUTKA and BACHAMAN, 1990). Pássaros são afetados por mudanças no habitat e

fragmentação em escala de paisagem (ROBINSON et al., 1995). No entanto, muitos

destes táxons tem disponíveis refinados métodos de amostragem.

O desenvolvimento destes indicadores evoluiu substancialmente nas últimas

décadas. Atualmente, medidas das condições ambientais estão mais sofisticadas e

incluem três dimensões: espaço, tempo e organização biológica (COTTINGHAM,

2003). Porém, apesar de representar impressionante avanço científico e tecnológico,

ainda há limitações para seu uso distribuído e integrado.

5.5) Natureza dos Índices Utilizados

O plâncton é freqüentemente submetido a variações de abundância e

composição. ARHONDITSIS (2003), apresenta inúmeros exemplos de índices para a

análise da estrutura de comunidades submetidas a diferentes níveis de eutrofização em

ecossistemas costeiros. Neste trabalho, os dados relativos as contagens das larvas

merozooplanctônicas servirão de exemplo neste capítulo. Um parâmetro

freqüentemente utilizado no estudo da ecologia do plâncton é a diversidade específica,

cujas variações informam sobre a estrutura e a dinâmica do sistema. VALENTIN et al.

(1991), apresenta um estudo comparativo de diversos índices de diversidade específica

na região de Cabo Frio. O autor demonstra uma análise de sucessão de populações

fitoplanctônicas e constata que o índice de Margalef (usado como referencial de

comparação) e o índice de Shannon são naquele caso muito próximos e correlacionados

(r = 0.959) e que, este último apresenta-se sempre com valores pouco superiores.

Ambas medidas são baseadas na teoria da informação, entretanto o índice de

MARGALEF (1951), se destina a medir a riqueza de espécies em uma definida amostra

e é apresentado como segue:

D = (S – 1) / log2 N (5.1)

onde S é o número de espécies e N é o número total de indivíduos. O autor não

estabeleceu um valor de referência.

MARGALEF (1958), estabeleceu uma teoria sobre a evolução de um

ecossistema. Segundo este autor, um ecossistema evolui para uma complexidade maior

à medida que aumenta seu grau de maturidade, o qual será avaliado através do estado de

sua estrutura, ou seja, através da análise quantitativa e qualitativa das populações. No

início do desenvolvimento, o sistema planctônico apresenta uma estrutura simples e sua

composição específica é caracterizada pela presença de um reduzido número de

espécies, com elevadas taxas de multiplicação e predominância acentuada de uma ou

duas espécies apenas, chamadas de “oportunistas”. É o primeiro estágio da sucessão de

Margalef. A medida que o plâncton se desenvolve, outras espécies aparecem juntando-

se às primeiras. A introdução progressiva dessas espécies no sistema equilibra a

repartição dos indivíduos entre as espécies provocando um aumento do índice de

diversidade específica. Até que não exista uma dominância nítida, o índice

permanecerá superior a fase de “plateau” onde o sistema é caracterizado por uma

estrutura estável e equilibrada atingindo seu máximo de maturidade e um elevado grau

de complexidade. De acordo com VALENTIN et al. (1991), este padrão geral de

sucessão de populações planctônicas só pode ser observado na íntegra dentro de uma

mesma massa d’água. Esta exigência não é preenchida pelos métodos clássicos de

observação no mar (coletas periódicas discretas em uma ou várias estações), pois

raramente permitem acompanhar o ciclo evolutivo completo das populações, mas

apenas uma seqüência de estágios unicamente interpretáveis num contexto geográfico

mais amplo. Para PIELOU (1966), a diversidade, com suas duas componentes, o

número de espécies e a regularidade de repartição dos indivíduos entre as espécies, são

aspectos estruturais da comunidade, enquanto que a estabilidade está relacionada com o

funcionamento da comunidade. O trabalho de VALANTIN et al. (1991), demonstra que

os valores da diversidade do fitoplâncton mantém-se acima de 2 bits.cel-1, e que os

valores do índice entre 1 e 2 bits.cel-1 estão relacionados com a dominância dos gêneros

Leptocylindrus e Rhizosolenia em períodos de ressurgência. O autor cita ainda que o

índice médio anual é alto, situando-se entre 3 e 4 bits.cel-1 e que as sucessões das

populações fitoplanctônicas seguem em linhas gerais o modelo proposto por Margalef e

que, raramente o índice atingiu valores inferiores a 1 bits.cel-1 (0.85), devido neste caso

a um “bloom” de Concinodiscus, uma diatomácea de grande porte (200 µm). Pelo

demonstrado, o índice de Margalef será utilizado neste trabalho na análise da

diversidade da populações meroplanctônicas (segundo nível trófico) como apresentado

na Figura 5.2 que segue:

Cloro fila-a

Índic e de Margalef

Figura 5.2 – Variação temporal do Índice de Margalef e clorofila-a.

A análise da variação temporal do índice de Margalef apresentado na Figura 5.2 acima

demonstra, quando aplicados às larvas merozooplanctônicas, valores compatíveis com

os apresentados por VALANTIN et al. (1991) para as populações fitoplanctônicas. O

índice varia normalmente entre 1 e 2 bits.cel-1, mas apresenta uma variação média

interanual em torno de 1.5 bits.cel-1, valor muito abaixo dos encontrados para as

populações vegetais. Pode-se também verificar a ocorrência de alguns poucos valores

acima de 2 bits.cel-1. Nestes casos, uma dominância alternada foi encontrada nas larvas

merozooplanctônicas devido a presença do tipo cipris e cirripédia no dia 30/05/96,

família mytilidae como por exemplo o dia 22/10/97 e larvas de decapodas no dia

26/11/97. O menor valor do índice (0.94), foi verificado no dia 1/11/00 com a

predominância de mitilídeos seguido do valor 1.03 em 8/12/03 com a predominância de

larvas do tipo cipris. Vale notar que, nos dias 15/12/99, 20/10/00 e 14/00/02 não foram

encontradas larvas nestas amostras.

Por outro lado, a partir de um ponto de vista mais holístico, alguns estudos

propuseram índices capazes de no mínimo tentar integrar informação da totalidade do

ambiente. A primeira abordagem se deve a SATMASJADIS (1982) que relaciona o

tamanho de partículas do sedimento e a diversidade de organismos bentônicos fazendo

inferência a níveis de poluição. Seguindo nesta linha, WOLLENWEIDER et al. (1998),

desenvolveu o índice trófico (TRIX) integrando a clorofila-a, saturação de oxigênio,

nitrogênio total e fósforo para caracterizar o estado trófico de águas costeiras. Como

pode ser observado, o índice Trix caracteriza-se por fazer a ligação entre a parte físico-

química do sistema e o primeiro nível trófico (clorofila). Por tratar-se de um índice que

pode ser testado na natureza dos dados atualmente disponíveis, este será, também

utilizado neste trabalho por entender-se que no processo de decisão do gerenciamento

costeiro, não basta apenas saber a diversidade biológica de uma determinada amostra de

água mas, em que condições tróficas esta diversidade se apresenta. Desta maneira, é

apresentada a seguir a formulação do índice Trix:

TRIX = k/n * Σ (M Bi B – LBi B) / (UBi B – LBi B) (5.2)

onde k = 10 (escalando e resultado entre zero e dez), n = 4 é o número de variáveis a

serem integradas, M Bi B é o valor medido da variável i, UBi B é o limite superior da variável i,

e LBi B é o limite inferior de i. Os valores resultantes do índice Trix são dependentes dos

valores máximos e mínimos das variáveis integradas e expressão a condição trófica do

ambiente. Progressivamente, índices mais complexos como por exemplo o Índice de

Integridade Biótica (IBI), “Chesapeake Bay index” (B-BI), ou “Estuarine Biological

Index” (BHI) não podem ser usados no atual momento dos dados deste trabalho. A

Figura 5.3 apresenta a variação temporal dos valores de clorofila e o índice Trix quando

aplicados aos dados da ponto estudado.

Pode-se observar na Figura 5.3, que o índice Trix é correlacionado com

os valores de clorofila-a devido aos “picos” de ambas as variáveis serem coincidentes.

Porém, a base de dados deste trabalho contém diversas variáveis de contagens de larvas,

estas constituem neste caso outro nível trófico que também deve ser integrado.

ClorofilaTrix

Figura 5.3 – Variação temporal de clorofila-a e índice Trix.

A estratégia de abordagem para este fato foi a de manter a mesma formulação do

índice Trix mas ao invés de usar as variáveis fosfato e nitrogênio, foi utilizado a razão

nitrogênio/fósforo e o somatório de todas as variáveis de contagens de larvas. Desta

maneira, foi gerado um outro índice que foi chamado de PLIX constituído pelas

variáveis: oxigênio, razão N/P, clorofila e larvas totais. A Tabela 5.1 mostra as

correlações entre os índices utilizados, suas variáveis constituintes e agrupamentos de

massas d’águas.

Tabela 5.1 – Correlações dos índices.

Variáveis Oxigênio Fósforo Nitrogênio N/P Clorofila Larva Total Prod./Cons. Margalef TRIX PLIX K-means Classe TSOxigênio 1 0 0.03 0.02 0.21 -0.03 -0.01 0.03 0.4 0.11 0.18 -0.03Fósforo 0 1 0.28

0.580.97

0.3 -0.250.5 -0.11

-0.16 0.06 0.05 0.01 0.03 0.44 0.04 0.08 -0.09Nitrogênio 0.03 0.28 1 -0.06 -0.07 -0.01 0.02 0.55 -0.02 0.15 -0.16

N/P 0.02 -0.16 -0.06 1 0.02 0.01 -0.02 -0.01 -0.1 0.14 -0.09 0Clorofila 0.21 0.06 0.05 0.02 1 -0.05 0.01 0.04 0.15 0.31 -0.22

Larva Total -0.03 0.05 -0.07 0.01 -0.05 1 -0.06 -0.12 -0.06 0.45 -0.07Prod./Cons. -0.01 0.01 -0.01 -0.02 0.01 -0.06 1 0.81 0 -0.06 0.01 0.04

Margalef 0.03 0.03 0.02 -0.01 0.04 -0.12 0.81 1 0.05 -0.01 0.01 0.07TRIX 0.4 0.44 0.55 -0.1 0.58 -0.06 0 0.05 1 0.07PLIX 0.11 0.04 -0.02 0.14 0.15 0.97 -0.06 -0.01 0.07 1

K-means 0.18 0.08 0.15 -0.09 0.31 0.45 0.01 0.01 0.3 0.5 1 -0.12Clase TS -0.03 -0.09 -0.16 0 -0.22 -0.07 0.04 0.07 -0.25 -0.11 -0.12 1

Conforme pode-se observar, a Tabela 5.1 apresenta uma coluna chamada de

balanço “produtores/consumidores (Prod./Cons.). Verifica-se que esta coluna é a única

que apresenta relação (r = 0.81) com o índice de Margalef além do fato de ambas

mostrarem-se fracamente correlacionadas com os outros índices (Trix e Plix) e

agrupamentos de massas d’águas pelos métodos K-means e diagramas T/S. Pode-se

também verificar que o índice Trix apresenta grande correlação (r = 0.58) com a

variável clorofila, correlação positiva de r = 0.30 com o agrupamento k means e relação

inversa (r = -0.25) com o agrupamento do diagrama T/S. Quando se observa as

correlações do índice Plix, observa-se que este é muito correlacionado com o somatório

das larvas, e que quando comparado com o agrupamento K-means apresenta maior

correlação que o índice Trix (r = 0.50) e menor correlação negativa se comparado com o

agrupamento das classes de águas do diagrama T/S (r = -0.11). Este fato em si, pode ser

considerado como ganho real na representação do estado ambiental corrente e poder de

previsibilidade.

Duas situações devem ser avaliadas por qualquer gerente ambiental em seu

processo de decisão. Na primeira, pode-se imaginar por exemplo, que no decorrer do

dia, o suposto gerente tenha que fazer uma descarga de um efluente industrial. Neste

momento, o gerente deverá avaliar como estão as condições ambientais e decidir se é ou

não, o melhor momento para a execução de tal operação tentando, mitigar os possíveis

efeitos de impactos ambientais. Esta situação caracteriza-se como um problema de

classificação na qual o gerente deverá utilizar modelos que operam com índices que

possam acessar as condições ambientais. Desta forma, a Tabela 5.2 apresenta os erros

de modelos de redes neurais artificiais desenvolvidas para classificação dos índices

utilizados neste trabalho.

Tabela 5.2 – Comparação do erro (RMS) de redes neurais na classificação de índices.

Índices Treinamento Teste Validação Correlação R2

TRIX 0.6272 0.3457 0.5362 0.6818

PLIX 0.0027 0.0027 0.0030 0.9999

MARGALEF 0.8369 0.1905 0.2651 0.9355

Como pode ser observado, redes neurais são excelentes modelos para a classificação do

estado trófico através do índice Plix (R2 = 0.9999) e ainda apresentam performance

muito boa para a classificação do índice de diversidade biológica específica de Margalef

(R2 = 0.9355). O índice Trix apresentou a menor capacidade para classificação (R2 =

0.6818), este comportamento pode ser devido ao fato que no experimento

computacional, os modelos apenas consideram as variáveis biológicas de clorofila e

contagens de larvas como variáveis de entrada, ou seja, o objetivo é classificar o estado

ambiental à partir de dados biológicos.

Noutra abordagem, testou-se a capacidade destes modelos de fazerem predições

de quais seriam as condições futuras de diversidade biológica e sua condição trófica se o

gerente ambiental anteriormente citado tivesse decidido que era o melhor momento para

efetuar a operação de descarga do efluente. Deve-se chamar a atenção que o tratamento

dos índices pelos modelos neste caso são o de séries temporais, diferentemente do

experimento anterior que foram tratados como uma classe ligada a uma amostra

ambiental. A Tabela 5.3 mostra a comparação dos erros (RMS) de treinamento, teste e

validação dos modelos neurais utilizados para predição futura dos índices e grau de

correlação da função real e modelada.

Tabela 5.3 - Comparação do erro (RMS) de redes neurais na predição futura de índices.

Índices Treinamento Teste Validação Correlação R2

TRIX 0.7114 0.3445 0.6001 0.3275

PLIX 1.1711 0.8348 0.8167 0.7407

MARGALEF 0.8889 0.4177 0.7295 0.6239

Pode-se novamente observar que o índice Plix (R2 = 0.7407), tem uma capacidade e

previsibilidade muito maior se comparado com o índice Trix (R2 = 0.3275) enquanto

que o modelo neural apresenta boa capacidade para prever como estará o nível de

diversidade biológica. A Figura 5.4 mostra a variação temporal dos valores médios

mensais da predição do modelo de rede neural artificial e os valores do índice Plix.

Pode-se verificar que apesar de não conseguir “ajustamento perfeito” entre a curva real

e a projetada, o modelo foi capaz de acompanhar as tendências do estado trófico geral.

RedePLIX

Figura 5.4 – Predição do modelo neural e índice Plix.

5.6 - Índices e Gerenciamento de Ecossistemas

O gerenciamento da zona costeira é um processo que integra fatores biológicos,

sociais e econômicos em uma estratégia compreensiva com o objetivo de proteger e

aumentar a sustentabilidade, diversidade e produtividade dos recursos naturais. São

descritos a seguir oito elementos que podem ser empregados no gerenciamento de

ecossistemas:

1. Sustentabilidade: não está focado primeiramente em discurso mas, pelo

contrário, considera a sustentabilidade como pré-condição;

2. Metas: estabelece objetivos mensuráveis que especificam processos e resultados

futuros necessários para a sustentabilidade;

3. Usa modelos ecológicos compreensíveis: o gerenciamento de ecossistemas

conta com pesquisas que consideram todos os níveis de organização ecológica;

4. Complexidade e conectividade: o gerenciamento de ecossistemas reconhece a

diversidade biológica e reforça a complexidade estrutural do ecossistema contra

distúrbios e fornece os recursos genéticos necessários para o ajuste (adaptação)

de mudanças de longa duração;

5. O caráter dinâmico do ecossistema: reconhece que tanto mudanças e evolução

são inerentes na sustentabilidade de ecossistemas tentando evitar o

“congelamento” de um estado particular de configuração;

6. Contexto e Escala: processos do ecossistema operam sobre um longo gradiente

espaço-temporal, e seu comportamento em qualquer localização é grandemente

afetado pelos sistemas adjacentes. Então, não existe uma única escala

apropriada ou organização temporal (“timeframe”) para gerenciar;

7. O homem como componente do ecossistema: valoriza-se o papel ativo do

homem em conseguir objetivos e metas de gerenciamento sustentável;

8. Adaptabilidade e Responsabilidade: admite que o corrente conhecimento e

paradigmas de funções do ecossistema são provisórios, incompletos, e sujeitos a

mudanças. Abordagens de gerenciamento tem de ser vistas como hipóteses a

serem testadas pro pesquisas e programas de gerenciamento.

Desta maneira, e de acordo com a teoria ecológica, o gerenciamento baseado no

conceito de ecossistema é dependente de pesquisa científica que determina as interações

e processos necessários que sustentam a composição, estrutura e função no ambiente. O

entendimento destes fatores fornecerá a base científica necessária para informar as

decisões de gerenciamento. Esta abordagem pode ser vista como um processo

sistemático, baseado no bom julgamento de sensibilidade ecológica e contando com os

seguintes princípios básicos:

• Parcerias (participação da sociedade): trabalhar junto com os cidadãos

comuns, empresários, governantes locais e organizações para achar

soluções em conjunto;

• Usar o melhor conhecimento científico disponível (social, econômico e

ecológico) como fundamento para a tomada de decisão, entende o inter-

relacionamento dos recursos naturais, e foca na sustentabilidade do

sistema ecológico como um todo;

• Estabelece objetivos de longa duração das condições desejadas mantendo

a capacidade costeira de sustentar os benefícios públicos e oportunidades

futuras de prosperidade econômica, permanente subsistência e saúde

ecológica.

Capítulo VI

Sistema Inteligente e Gerenciamento Ambiental

Como anteriormente citado, a zona costeira representa o centro da

atividade econômica com mais de 60% da população mundial residindo nesta região.

Apesar da frágil saúde ecológica desta área, novas atividades estão sempre sob

desenvolvimento contínuo. O crescimento demográfico e sócio-econômico estimula

investimentos em infraestrutura, transportes, indústrias, etc. Ainda que pretendendo

melhorar o padrão de qualidade de vida, essas mudanças induzem o aumento da pressão

no ambiente natural. Por causa disto, o gerenciamento da zona costeira é um plano de

ação necessário para se conseguir o objetivo fundamental de preservação. O preciso

entendimento das interações dos mecanismos dos processos físicos e biológicos

representa um significante melhoramento na capacidade de gerenciamento ambiental e

permitirá o desenvolvimento de uma nova geração de ferramentas preditivas cujas

aplicações são muito diversas, por exemplo, dragagens em operações portuárias,

atividade petrolífera, pesqueira, projetos de conservação e restauração ou recreacional e

turismo. Segundo RUNGE et al. (2004), o conhecimento das dinâmicas e interações,

determinando a abundância das populações planctônicas, tornou possível a predição da

variação e mudanças no ecossistema pelágico. Pode-se agora vislumbrar a aplicação

destes modelos, por exemplo, em questões de gerenciamento baseado no conceito de

ecossistemas (PERSHING et al., 2004), ou no papel do oceano costeiro na ciclagem do

carbono. Os dois autores descrevem o desenvolvimento de sistemas acoplados de

modelos físicos e biológicos ligados ao processo de recrutamento em sistemas costeiros.

Este capítulo se destina a apresentar uma visão geral sobre um sistema inteligente a fim

de ser usado como sistema de suporte de decisão para o gerenciamento integrado da

qualidade do ecossistema costeiro. A metodologia é baseada numa abordagem de

análise de sistemas ecológicos e na integridade da estrutura hierárquica da comunidade.

Sistemas inteligentes são sistemas computacionais que avisam ou ajudam

a resolver problemas do mundo real usando modelos que alcançam a mesma conclusão

que o raciocínio de um especialista se faceado com problema semelhante (WEISS and

KULIKOWSKI, 1984). Atualmente, segundo HOUHOULIS and MICHENER (2000),

pode-se observar o desenvolvimento desses sistemas como resposta à sua escassez nesta

área e a emergência de forte nicho potencial nas ciências do mar (MOORE et al., 2001).

O Projeto MONCOZE, por exemplo, encontra-se em desenvolvimento na Noruega, o

sistema COAMES, é desenvolvido no âmbito do projeto ICZM (Integrated Coastal

Zone Management) da Comunidade Européia (EC, 1999, 2000), o sistema THETIS por

uma empresa italiana, o F-ECTS (Feed-backs of Estuarine Circulation and Transport of

Sediments on phytobentos), será um sistema para o gerenciamento de zonas estuarinas

desenvolvido por um consórcio entre Portugal, Alemanha, Itália Dinamarca e Inglaterra.

O sistema de modelos voltados para o estudo do impacto e gerenciamento de atividades

de pesca, ECOPATH, pelo Chesapeake Research Consortium nos Estados Unidos, um

grupo de universidades americanas lideradas pelo centro de excelência da universidade

de New Hampshire desenvolvem o sistema GoMOOS – Gulf of Maine Ocean

Observing System como parte integrante do U.S. Integrated Observing System.

6.1 - Arquitetura geral do Sistema

A filosofia do projeto do Sistema Inteligente de Gerenciamento Integrado do

Ecossistema Costeiro (SIGIEC) proposto neste trabalho, é a de seguir a tendência

(MOORE et al., 1996, 2001; HOUSTIS, 1997 dentre outros) de um sistema hierárquico

orientado a objeto constituído basicamente de uma interface de usuário, um banco de

dados, uma base de conhecimento, um módulo que contém funções e modelos, e um motor de inferência e integração cuja configuração pode ser observada na Figura 6.1.

A partir de um ponto de vista mais conservativo, o objetivo do sistema é permitir

que a explotação de vários recursos (espécies) do ecossistema com sua biodiversidade e

integridade estrutural, permita sua manutenção e disponibilidade futura através de

técnicas de manejo mais abrangentes e sustentável.

B a se d e C o n h e c im e n to

F u n ç õ e s e M o d e lo s

I n te r fa c ed o u su á r io

U su á r io sc o m u n s

B a n c o d eD a d o s

M o to r d eIn te g r a ç ã o

G e r e n teA m b ie n ta l

C ie n tis ta s

S e n so re sS e n so re s G e o g rá f ic oG e o g rá f ic o S ó c ioS ó c ioE c o n ô m ic oE c o n ô m ic o

D o c u m e n to sD o c u m e n to s

Figura 6.1 – Principais componentes da arquitetura geral do sistema.

POWRVAKHSHOURI & MANSOR (2003), comparou vários modelos de

suporte de decisão e classifica as obrigações do operador do sistema como sendo a de,

primeiramente, definir a presente condição do ambiente seguido da identificação de

conflitos ou problemas e a sugestão de soluções alternativas. Porém, de acordo com

CAMPBELL (2005), a abordagem de um sistema de observação para monitoramento do

ecossistema propõe cinco questões. Como são as mudanças no ecossistema? Quais os

fatores forçantes destas mudanças? Como o ecossistema responde às forçantes naturais

e humanas? É possível predizer mudanças futuras? Quais as conseqüências para os

vários usuários do ecossistema em questão?

O sistema SIGIEC pode ser visto como uma biblioteca digital de coleções de

informações multimídia, modelos científicos de simulação, técnicas de interpretação de

dados e métodos de visualização. Um esquema simplificado da hierarquia do banco de

dados é apresentada na Figura 6.2 a seguir.

Segundo COLWEL (2004), a nova fronteira e desafio na exploração científica é,

integrar e minerar grandes conjuntos de dados acumulados por diversos pesquisadores,

nomeadamente, ecólogos, biólogos da área de conservação, toxicólogos, cientistas da

área de saúde pública, climatólogos e engenheiros de sistemas, para produzir novos

entendimentos e princípios fundamentais não conhecidos anteriormente por causa das

limitações de sistemas desacoplados.

Banco de dadosBanco de dados

SócioSócio--EconômicoEconômicoGeográficoGeográfico QuímicoQuímicoBiológicoBiológico FísicoFísico

MapasMapas

SIGSIG

ImagensImagens

Linha costeiraLinha costeira

TransportesTransportes FloraFlora PoluentesPoluentes

FaunaFauna MetaisMetais HidrodinâmicaHidrodinâmica

GeofísicaGeofísica

RecreativoRecreativo

HistóricoHistórico

PopulacionalPopulacional

PaisagísticoPaisagístico

BiotiposBiotipos

SensibilidadeSensibilidade

NutrientesNutrientes HidrografiaHidrografia

TemperaturaTemperatura

SalinidadeSalinidade

CorrentesCorrentes

ConservaçãoConservaçãoSaúde AmbientalSaúde Ambiental

DBODBO Planos/relatóriosPlanos/relatórios

BacteriológicoBacteriológico

Figura 6.2 – Estrutura simplificada de informações multimídia do banco de dados.

Sendo assim, numa classe de dados geográficos, podem ser armazenados por exemplo,

mapas de diversas áreas, imagens de satélites, perfis da linha costeira e um sistema de

informações geográficas para servir de interface com o usuário que quiser acessar dados

espaciais e georeferenciados. Uma classe de informações sócio-econômicas pode

conter informações sobre a malha de transportes referentes aos mapas existentes,

localização de locais para recreação (praias por exemplo), informações de sítios

arqueológicos, dados populacionais e até informações paisagísticas. Na classe de dados

biológicos pode-se encontrar séries temporais de dados florísticos, faunísticos ou

microbiológicos além de sub-classes de dados de saúde ambiental ou planos de

conservação. Na classe de atributos químicos, encontram-se dados de poluentes, metais

pesados ou nutrientes. Noutra classe, dados físicos podem conter informações

geofísicas, oceanográficas, hidrológicas ou hidrodinâmicas. Uma classe de dados

textuais pode conter também documentos sobre a legislação vigente da região

contemplada e arquivos com critérios de qualidade ambiental.

O módulo de funções e modelos, é destinado ao gerenciamento de dados

na tarefa de receber e identificar dados de diferentes fontes, pré processá-los e distribuí-

los nas diversas áreas temáticas (classes) do banco de dados e específicas sub-categorias

de armazenamento. Ficam também armazenados neste módulo diversos modelos que

acessam bases de dados específicas para solucionar um determinado problema.

No módulo da base de conhecimento estão armazenadas conjuntos de

regras de associação e regras de classificação com seus respectivos índices de suporte e

confiança para utilização dos métodos visualização e diagnóstico ambiental.

O módulo de interface do usuário é dividido em duas partes. A primeira,

uma caixa de diálogo, permite que os diferentes usuários acessem a resposta do sistema

através de “queries” escritas. A segunda (“display”), é uma caixa de resposta e

informação diagnóstica (saídas do sistema).

Finalmente, o motor de inferência e integração é o coração do sistema,

assimilando as “queries” do usuário, dados e conhecimento associado para fornecer

significativas respostas.

6.2 – Tipos e Requerimentos dos Usuários

As necessidades dos usuários são introduzidas pelo exame de um cenário

de uso do sistema. Três principais grupos de usuários são considerados nesta

abordagem.

Suponha uma extensiva base de dados de propriedades físicas, químicas e

biológicas de uma determinada região costeira. Esta base de dados inclui propriedades

como batimetria, correntes, ondas, espectro de ventos, salinidade, temperatura, e

concentrações químicas e biológicas. Uma “query” típica da base de dados poderia ser,

“Ache a região do espaço em um dado local e intervalo de tempo, em que a

concentração de uma certa espécie de microorganismo ou química pode exceder a certo

valor”. Cientistas podem estar interessados em questões desta forma a fim de ser

capazes de melhor entender os processos físicos e químicos em uma região costeira.

Autoridades civis locais, podem estar interessadas em permissões para pesca ou

declarações sobre risco à saúde identificando locais impróprios ao turismo, natação etc.

Mais geralmente, a interrogação da base de dados está na forma de uma “query” do tipo

“ache um subconjunto de um dado conjunto contendo pontos com uma propriedade

específica”. Relevantes dados podem envolver medidas tais como imagens de satélites

e medidas “in situ” a partir de bóias ou sondas. Os processos envolvidos podem incluir,

por exemplo, difusão de químicos ou poluentes, convecção de microorganismos etc.

Conseqüentemente a base de dados pode também ser composta de dados de resultados

de simulação. Um usuário final (público em geral ou um formador de opinião)

necessita localizar o exato dado que satisfaz seus interesses ou, resgatar dados de um

desejado nível de qualidade. Por exemplo, pode-se querer acessar o “ranking” de

classificação das praias de sua cidade. Então, pode-se perguntar por que sua cidade não

apresenta praias seguras. Como resultado, pode ter uma definição do que é considerado

uma praia segura, no apropriado nível de detalhe, e os dados que a definição é

dependente. Por exemplo, segurança pode ser definida como um conjunto de critérios

tais como a altura de ondas ou o nível de concentração de determinada substância ou

microorganismo.

6.3 – Funcionalidade

De acordo com NIKOLAO (1996, 1997), um sistema de informações

distribuídas pode conectar vários usuários via internet. Os principais blocos

componentes do sistema são:

• Acesso a vários tipos de bases de dados baseados em WWW, por

exemplo, documentos HTML (relatórios, publicações, imagens, arquivos

de dados numéricos de sensores, etc.).

• Acessar ferramentas como simuladores, visualização de dados

(STONEBRAKER, 1993), sistemas de informações geográficas (SIG) e

de interpretação de dados. Ferramentas gráficas são necessárias em

aplicações de SIG, e linguagem de modelagem em realidade virtual

(VRML) é incorporada como visualização (CLEMATIS, 1996).

• Banco de dados podem ser largamente usados para guardar informações

da zona costeira e seu acesso pode ser feito através da internet. Podem

ser usados os já existentes “off the shelf” DBMSs tais como Sybase,

Oracle ou Arq/Info.

• Integração de serviços existentes por indexação/buscador com SIG tais

como mapas e imagens de áreas ou regiões selecionados pelo usuário

(HOUSTIS, 1996) através de um servidor de biblioteca digital tal como a

documentação NCSTRL’s DIENST 4.0 server

(http://www.ncstrl.org/Dient/htdocs/document_menu.html.).

• Uma interface para fontes de informação tais como dados de sensores e

imagens requisitados pelo usuário via “web-browse” (Netscape

Navigator, Microsoft Explorer, Sum Hotjava).

• Segurança e acesso restrito – mecanismos de controle e restrição de

acesso as bases de dados de acordo com o tipo de usuário.

O usuário submete uma simples ou complexa “query” via “web browser” para o

servidor que acessa o sistema selecionando os diversos serviços disponíveis tais como

dados, indexação e busca para localizar objetos, que se adequam as “queries”

submetidas. Por exemplo, pode-se requerer uma imagem de satélite (WOODRUFF,

1994) e ser capaz de fazer aproximações (“zoom”) de determinadas áreas selecionadas

pelo usuário. A interface inclui uma extensão para suportar a funcionalidade com o SIG

além de ser capaz de indexar documentos HTML distribuídos em vários arquivos de

maneira interativa do banco de dados como por exemplo séries temporais de dados das

componentes físicas químicas e biológicas do ambiente para caracterização das

condições do habitat. Ao mesmo tempo, algoritmos de regras de classificação operam

sobre estes dados para informar a que classe ou estado do considerado ambiente (água)

pertence, de acordo com consulta a documentos e critérios oficiais também

armazenados no banco de dados. Concomitantemente, algoritmos de regras de

associação acessam os dados biológicos e produzem informações sobre as interações

existentes entre os diversos organismos disponibilizando esta informação de forma

visual como a estrutura da comunidade e topologia da rede trófica. Podem ser

apresentados nesta interface os índices de diversidade biológica (Margalef) e condição

do estado trófico (Plix). Esta rede pode ser investigada em maiores detalhes se

disponibilizada em VRML. As abundâncias ou biomassas relativas de cada elemento

(organismo) da rede, pode ser representado através de um código de intensidades de

cores ou intervalos “fuzzy” como limiar de ativação para uso da estrutura como possível

simulador, toda esta janela, na realidade, informa ao usuário as condições do ambiente

como um todo. O acoplamento com modelos relativos aos padrões de circulação local e

o processamento de dados que caracterizem as condições hidrológicas confere a

topologia e estrutura da comunidade o caráter dinâmico. Quando o usuário seleciona

uma região do mapa ou imagem através do “browser”, as coordenadas da região são

usadas para indexar a informação apropriada sobre a região e pode efetuar algumas

operações “on line” com dados de sensores “in situ” transmitidos por telemetria em

“tempo real”.

Diversos modelos tróficos do ecossistema aquático são baseados no acoplamento

de equações diferenciais (MAY, 1972, POLOVINA, 1984; WALTERS, 1996;

SHANNON, 2000), entretanto, todos possuem uma série de parâmetros a ser

estabelecidos e a resolução do sistema de equações foi apresentado por MACKAY

(1981). Porém, estes parâmetros são estabelecidos pelo usuário e a conjugação dos

mesmos não necessariamente corresponde a realidade das relações entre a biomassa de

um grupo e a vulnerabilidade da espécie presa para com a predadora nem suas

respectivas eficiências de transferência. No entanto, uma vez que soluções algébricas

foram disponibilizadas, uma rede de fluxo pode ser construída a partir da biomasa dos

organismos (CHRISTENSEN and PAULY, 1993).

A Figura 6.3 a, b e c apresentam os arranjos estruturais da comunidade

merozooplanctônica encontrada pela aplicação do algoritmo “A priori” de regras de

associação nos dados disponíveis para execução deste trabalho.

Classe = XX = Água CosteiraClasse = XX = Água CosteiraTemp Temp 4 e 5 / Sal 2 / 4 e 5 / Sal 2 / Ox Ox 33

Classe = XX = Água TropicalClasse = XX = Água TropicalTemp Temp 3 / Sal 3 / 3 / Sal 3 / Ox Ox 33

CLO 1CLO 1

MIT 4MIT 4

CIP1CIP1

DEC 5DEC 5

POL 4POL 4

CIR 4CIR 4

ASC4ASC4

OST 5OST 5

NTI 1 / NTO 2 / PO 1NTI 1 / NTO 2 / PO 1 NTI 1 / NTO 1 / PO 2NTI 1 / NTO 1 / PO 2

CLO 2CLO 2

MIT 2MIT 2

LD 2LD 2

CIR 3CIR 3

POL 2POL 2

BRY 1BRY 1

DEC 3DEC 3

OST 2OST 2

Classe = XX =ACAS Classe = XX =ACAS Temp Temp 1 / Sal 3 / 1 / Sal 3 / Ox Ox 4 e 54 e 5

CLO 1CLO 1

CIR 2CIR 2

MIT 1MIT 1

CIP 2CIP 2

ASC 1ASC 1

POL 3 POL 3 \\

OST 1OST 1

NTI 2 / NTO 4 / PO 2NTI 2 / NTO 4 / PO 2cc

Classe = XX = Água CosteiraClasse = XX = Água CosteiraTemp Temp 4 e 5 / Sal 2 / 4 e 5 / Sal 2 / Ox Ox 33

Classe = XX = Água TropicalClasse = XX = Água TropicalTemp Temp 3 / Sal 3 / 3 / Sal 3 / Ox Ox 33

CLO 1CLO 1

MIT 4MIT 4

CIP1CIP1

DEC 5DEC 5

POL 4POL 4

CIR 4CIR 4

ASC4ASC4

OST 5OST 5

NTI 1 / NTO 2 / PO 1NTI 1 / NTO 2 / PO 1 NTI 1 / NTO 1 / PO 2NTI 1 / NTO 1 / PO 2

CLO 2CLO 2

MIT 2MIT 2

LD 2LD 2

CIR 3CIR 3

POL 2POL 2

BRY 1BRY 1

DEC 3DEC 3

OST 2OST 2

Classe = XX =ACAS Classe = XX =ACAS Temp Temp 1 / Sal 3 / 1 / Sal 3 / Ox Ox 4 e 54 e 5

CLO 1CLO 1

CIR 2CIR 2

MIT 1MIT 1

CIP 2CIP 2

ASC 1ASC 1

POL 3 POL 3 \\

OST 1OST 1

NTI 2 / NTO 4 / PO 2NTI 2 / NTO 4 / PO 2cc

Figura 6.3 – Estrutura populacional em três diferentes condições ambientais: a, água

costeira; b, água tropical da corrente do Brasil; c, água de ressurgência.

Estas estruturas populacionais podem ser consideradas como modelos de redes

neurais artificiais onde algoritmos genéticos podem ser usados para otimizar a matriz

dos pesos sinápticos. Os valores dos pesos otimizados representam a força das

interações ecológicas entre as espécies envolvidas; interações representadas por linhas

tracejadas indicam a não presença de uma das referidas populações. A adoção desta

metodologia e técnica de visualização permite o usuário estudar aspectos sobre a

importância e contribuição efetiva de determinado organismo ou grupo de organismos

para a comunidade como um todo. A análise da matriz de pesos otimizados pode

permitir também a estimativa mais precisa da eficiência trófica entre as camadas da

rede. Baixos valores de eficiência trófica podem indicar que um ecossistema está

vulnerável a invasões por espécies exóticas ou que alguma forma de predação,

mortalidade ou doença não foi considerada. A possibilidade de usar estas

representações gráficas implementadas como modelos de simulação permite também

inferir conhecimentos sobre a relação entre complexidade e estabilidade estrutural do

comportamento dos ecossistemas e evita o grande problema de super parametrização

comuns aos modelos convencionais. A análise da saída do modelo permitirá determinar

se o arranjo arquitetônico apresentará comportamento caótico, “saddle points”, situação

em que um distúrbio causa um estado estacionário mais simplificado da comunidade

menos diversa, ou sustentabilidade estrutural capaz de reação ao longo do tempo.

A rede alimentar representa o fluxo de energia biológica entre as diversas

populações no ecossistema. Nas últimas décadas, o conceito de rede com bifurcações,

“loops”, e fluxos multidirecionais de materiais tem recolocado o simples paradigma de

uma cadeia alimentar linear. Na base da rede, o fitoplâncton transforma a energia solar

em biomassa. O fitoplâncton serve de pasto para o zooplâncton herbívoro além de

exudar moléculas orgânicas que são consumidas pelas bactérias. As bactérias são

absorvidas pelo microzooplâncton. O microzooplâncton e o zooplâncton herbívoro são

predados pelo zooplâncton maior e assim sucessivamente. Forças físicas modulam a

eficiência de transferência energética de um componente para outro (ROTSHILD,

1988). Estudos de campo e laboratório tem evidenciado estas rotas e adicionando

valiosa informação com respeito a especificação de taxas destas transformações em

muitos ecossistemas marinhos (HARRIS, 1995).

Nos últimos quinze anos, ecologistas de ecossistemas tem desenvolvido

uma abordagem e um conjunto de métodos computacionais denominados “análise de

redes ecológicas” (ULANOWICZ, 1986; KAY et al., 1996). MONACO and

ULANOWICZ (1997) empregaram esta abordagem para a comparação de estrutura

trófica e a produtividade total do sistema de três estuários nos Estados Unidos

(Narragansett Bay, Delaware Bay e Chesapeake Bay). Na pesquisa de redes

alimentares, YODZIS and WINEMILLER (1999), propuseram recentemente uma nova

definição e operacionalização do conceito de “espécie trófica” que é um conjunto de

espécies na rede que tem fontes alimentares similares e também predadores similares.

Sua definição pode ser considerada idêntica a noção de “equivalência estrutural “ na

análise de redes sociais concebida por BURT and TALMUD (1993). A estrutura de

grafo da Figura 6.4 a seguir ilustra este conceito.

Figura 6.4 – Estrutura de grafo representativa do conceito de “equivalência estrutural”.

{2,3}{2,3}11

Nas estruturas da Figura 6.4, as setas estão sempre direcionadas dos nós que

representam as espécies predadoras para as espécies presas. Na Figura 6.4 a, observa-se

que tanto a espécie do nó de número dois e três apresentam o mesmo predador, nó um, e

concorrem pelo mesma presa no caso do nó de número seis. Desta maneira podem ser

agrupadas em um mesmo elemento da rede, pois desempenham o mesmo papel

funcional. Por outro lado, os nós cinco e seis também sofrem a predação das mesmas

espécies, nós dois e quatro, porém não disputam as mesmas presas ou recursos, nós sete

e oito respectivamente. Neste caso não desempenham o mesmo papel e não podem ser

agrupadas, Figura 6.4 b.

Nos modelos de HIRATA and ULANOWICZ (1985) e ULANOWICZ

(1986), a informação em uma rede é definida como a quantidade de incertezas

solucionadas pelo conhecimento da estrutura da rede. Os autores usam um algoritmo de

distância heurística muito parecido com um algoritmo de “clustering” hierárquico para

aglomerar espécies em um número arbitrário de classes desejadas. Noutra abordagem,

coloração regular, BATAGALJ (1992), apresenta uma abordagem alternativa usando

procedimentos de otimização combinatorial para classificar nós diretamente em grupos

e utiliza uma medida de penalidade para minimizar o erro. Deve-se ressaltar que essas

agregações ou agrupamentos de espécies troficamente análogas, também chamadas de

espécies isotróficas, são úteis pois reduzem a complexidade, mas devem ser

consideradas com cautela para apresentarem significado e critérios biológicos para

evitar que ocorram-se em erros por efeitos puramente numéricos.

Capítulo VII

Análise dos Resultados e Diagnóstico Ambiental

Será apresentado neste capítulo, uma análise das diversas abordagens do

processo de assistência e estruturação da base de dados e dos resultados dos modelos de

regras de associação e de classificação além dos modelos de redes neurais utilizados

para a predição das condições ambientais do caso estudado e uma abordagem para um

diagnóstico ambiental baseado na estrutura de redes biológicas.

7.1 – Análise dos Resultados

A matriz de correlações das variáveis (Tabela 3.3), apresenta valores

negativos entre os nutrientes fosfato, amônia, nitrito e nitrato com a variável

temperatura. Isto sugere que a origem destes nutrientes deve-se ao processo de

ressurgência. Este fato é reforçado pela ocorrência de correlação também negativa entre

a variável clorofila e a temperatura, sendo o nitrato o nutriente preferencial devido a

apresentar correlação negativa com a clorofila. Ao mesmo tempo, pode ser observado

que a variável amônia tem uma correlação negativa com a variável nitrito que por sua

vez tem a maior correlação (positiva) com a variável nitrato. Portanto, este conjunto de

fatos sugerem que o processo de ressurgência desempenha importante papel no

metabolismo ambiental da região pois, retorna uma importante quantidade de minerais

reciclados pelo sistema microbiano. Devido a região não possuir influência de rios,

possivelmente a matéria orgânica disponível para a remineralização seja oriunda da

própria “chuva biológica”, que em sendo degradada, torna-se parte de um processo de

“feedback positivo” para a manutenção do sistema. Por outro lado, não são observadas

correlações entre as diversas variáveis larvais com a clorofila. Este fato (ausência de

correlação), foi também descrito a nível global por IRIGOIEN et al., (2004). No caso

em estudo, uma possível explicação é que o ponto de coleta, é muito próximo da linha

de praia. Seria esperado que a população algal fosse dominada por espécies de grandes

diatomáceas ou discutível organismos formadores de filamentos coloniais. Desta forma,

a capacidade das larvas absorverem partículas algais estaria limitada pelo tamanho,

levando-as a usar outras fontes de energia alimentar.

Observa-se que a Tabela 3.2, apresenta para a variável pH um valor máximo de

10.19, e pode ser considerado um erro que foi corrigido pelo estudo de análise de

“comunidade” (Tabela 3.4), que identificou a contribuição individual de cada variável

estudada, permitindo assim uma redução da dimensionalidade da base de dados.

Noutra abordagem, a análise de componentes principais demonstrou o

ordenamento dos componentes fatoriais (autovetores). Este procedimento mostra na

Tabela 3.5 que o principal fator (1) é composto por duas variáveis larvais (Mytillidae e

Ostreidae) e o segundo fator apresenta a variável nitrito como sendo a variável química

mais relevante, confirmando o apresentado na matriz de correlações da Tabela 3.3. O

posicionamento das variáveis apresentadas nas projeções dos planos fatoriais 1 e 2 e, 2 e

3 nas Figuras 3.21 e 3.22 respectivamente foram confirmadas pela análise de

agrupamentos através do método Ward, como pode ser visto na Figura 3.23. A

utilização da técnica de agrupamento K-means demonstrou através da inspeção da

Figura 3.24 ao nível dois de dissimilaridade aleatória, a ocorrência de sete “clusters,”

que foi confirmada pelo critério de Kaiser apresentado na Figura 3.25 e Tabela 3.5. A

aplicação das diversas técnicas demonstrou que a base de dados tem uma estrutura de

sete grupos tanto quando acessada pelas variáveis descritoras do sistema (colunas)

quanto pelo número de casos observados (linhas) e que representam 66.27% da

variância total dos dados, valor bastante significativo levando-se em consideração a

natureza ecológica do problema.

Uma vez que se conheceu a estrutura dos dados, o passo seguinte foi extrair

conhecimento mais refinado e escondido. Como uma base de regras é a maneira mais

comum de se representar conhecimento, a estratégia adotada foi a aplicação do

algoritmo Apriori para gerar regras de associação de padrões regulares normalmente

não explicitados. Porém, como a maioria dos algoritmos de minerar associações não

operam em espaço contínuo, as variáveis da base de dados foram discretizadas em

intervalos segundo o conhecimento de especialistas, apresentados na Tabela 4.1. Para

evitar o problema de explosão combinatorial e redundância de regras, foi efetuado uma

análise de interessabilidade (LIU et al., 2000) que permitiu acessar o espaço discreto

dos dados em diversos níveis através da manipulação dos parâmetros de suporte e

confiança. As regras resultantes deste procedimento (regras 2 à 48) são apresentadas no

capítulo 4 e demonstraram uma partição das populações merozooplanctônicas em

relação das diferentes condições do ambiente. Na realidade, o procedimento de regras

de associação além de tudo, serve como estratégia ou método de visualização ou

inicialização da estrutura trófica demonstrando não apenas uma possível topologia da

complexa rede de interações, mas também as quantidades relativas de cada elemento.

Um exemplo é demonstrado na Figura 6.3 a, b e c, onde pode ser observado que na água

costeira, são encontradas altas densidades de alguns grupos de larvas, no entanto,

noutras classes de água as quantidades relativas dos mesmos grupos apresentam-se

diferentes. Desta maneira, estes organismos podem ser usados como indicadores

biológicos para a classificação das diversas massas d’águas. Para efetuar tal

classificação, foi aplicado a abordagem de regras de associação de classes (CARs), uma

modificação do algoritmo Apriori desenvolvida por LIU (1998). Estas regras de

classificação (regras 49 à 66) são apresentadas também no capítulo 4 e a performance

deste tipo de modelo de classificação é apresentado na matriz de confusão da Tabela

4.4. Pode-se observar que este modelo de regras contemplou todas as classes do

problema e obteve uma acurácia de 87.63%.

Noutra abordagem de desenvolver classificadores, tentou-se como alternativa a

metodologia de geração de regras “fuzzy” (regras 67 à 77). Este técnica demonstrou

grande poder de seleção de atributos porém, apesar de conseguir uma acurácia de

85.33% como demonstrado na matriz de confusão da Tabela 4.6, este modelo não

contemplou a classe de número seis, provavelmente, devido ao fato do algoritmo

genético não ter amostrado aleatoriamente elementos raros da base de dados. Outro

agravante observado foi que as regras 67 e 68 apresentam ambas o atributo temperatura

média baixa como separador das classes 1 e 3. Por outro lado, a metodologia de

algoritmos genéticos foi utilizada para evoluir e otimizar arquiteturas de modelos de

redes neurais artificiais. O resultados deste experimento são apresentado na Tabela 4.7,

enquanto que uma comparação da performance dos três tipos de modelos de

classificação pode ser contemplada na Tabela 4.8. Fica claro que o modelo de redes

neurais é o mais preciso.

Deve-se ressaltar no entanto, que na atividade de gerenciamento, não basta

apenas determinar qual a classe de um dado estado ambiental. Normalmente, a

caracterização é feita com a utilização de índices, e uma tarefa muito importante é a de

fazer predições das condições futuras. Neste intuito, os modelos de redes neurais não só

foram utilizados para classificar o estado ambiental, mas também para fazer predições

dos mesmos.

O índice de diversidade biológica de Margalef (equação 5.1) foi utilizado para

determinar o grau de complexidade de um determinado nível trófico e caracterizar a

estrutura da comunidade. Como a base de dados é composta de larvas que normalmente

são herbívoras, a Figura 5.2 mostra a variação temporal deste índice plotado contra a

variação da clorofila. O valor médio deste índice (1.5 bits.cel-1) aplicado para as larvas

merozooplanctônicas confirma a teoria que a diversidade biológica diminui quanto mais

elevado o nível trófico, quando comparado com o mesmo índice aplicado para as

populações fitoplanctônicas (2 bits.cel-1), encontrado por VALENTIN (1991). Para

fazer a ligação entre a “produtividade” e as condições hidrológicas foi calculado o

índice Trix (equação 5.2) introduzido por WOLLENWEIDER et al. (1998), cuja

variação temporal é mostrada na Figura 5.3 juntamente com a clorofila. Observa-se que

os picos das duas variáveis são coincidentes e portanto sugerindo boa correlação.

Porém, pela necessidade de integrar todas as variáveis da base de dados, ligando

“produtividade, hidrologia e as diversas populações, o índice Trix foi modificado em

sua composição de variáveis formadoras, dando origem a um novo índice em potencial,

que passou a ser chamado de Plix. A Tabela 5.1, apresenta uma matriz de correlações

entre os índices utililazados, variáveis componentes e estratégias de agrupamento de

classes de água. Observa-se que realmente o índice Trix possui elevada correlação com

a clorofila (r = 0.58), confirmando o apresentado na Figura 5.3, enquanto que o índice

de Margalef é mais correlacionado com a razão produção/consumo (r = 0.81) mas, o

índice Plix apresentou altíssimo grau de correlação (r = 0.97) com a totalidade das

populações de larvas. Desta maneira, se o objetivo é classificar o ambiente aquático

através de critérios mais holísticos e biológicos levando-se em consideração uma

abordagem multidimensional (k-means) e não apoiada apenas em diagramas de

temperatura e salinidade, a Tabela 5.1 demonstra que o índice Plix apresenta mais

segurança e confiabilidade pois não só diminuiu o grau de correlação negativa com as

Classes TS, mas aumentou sensivelmente sua linearidade com as classes geradas pelo

algoritmo k-means em relação com o índice Trix. Este fato é sem dúvida, uma real e

significativa contribuição deste trabalho e confere maior capacidade de melhorar a

performance de modelos neurais no que tange a problemas de classificação como

demonstra a Tabela 5.2 ou problemas de predição das tendências das condições tróficas

futuras, como na Tabela 5.3 e Figura 5.4.

Pode-se então disponibilizar os valores de tais índices juntamente com a

visualização da estrutura da rede de interações populacionais mostrada na Figura 6.3

como informação adicional da interface do usuário do sistema proposto no capítulo 6.

Esta estrutura de rede torna-se a partir deste ponto um simulador para diagnóstico das

condições de saúde ambiental voltado para o conceito de integridade biológica que na

realidade é a própria expressão da estrutura hierárquica da comunidade.

Como pode ser observado na Figura 6.3, trata-se de uma estrutura onde os dados

disponíveis para este trabalho contemplam apenas uma única fonte de recurso (clorofila

= presas) para diversas populações de consumidores (larvas). Este tipo de estrutura foi

anteriormente implementada e testada computacionalmente por FUSSMAN &

HERBER (2002) que não encontraram pontos de equilíbrio para permitir a

sustentabilidade e coexistência de tal situação devido a extinção da fonte de recurso e

exclusão competitiva de consumidores. Por este motivo, neste trabalho não serão

investidos esforços para a execução de tal tarefa. Porém, passa-se a fazer considerações

sobre propriedades de redes alimentares e efeitos sobre seu comportamento para um

diagnóstico ambiental.

7.2 – Diagnóstico Ambiental

A teoria ecológica diz que o aumento da riqueza de espécies e/ou o

aumento das interações interespecíficas desestabiliza as populações, sugerindo que uma

rede alimentar complexa é mais frágil, PIMM (1991). Analiticamente, MAY (1972,

1973), analisou a estabilidade local de matrizes de comunidades randomicamente

agrupadas e demonstrou matematicamente que a estabilidade da rede decresce com a

complexidade. Essas predições contradizem a intuição que redes alimentares

complexas, que na realidade persistem na natureza, devem ser estáveis. O mecanismo

de manutenção de uma rede alimentar complexa na natureza tem sido o foco central em

ecologia de comunidades. Esta área de investigação tem-se preocupado em responder

questões relevantes tais como:

• O ecossistema marinho apresenta múltiplos estados de estabilidade ?

• A remoção de predadores do topo da rede resulta em mudanças fundamentais no

plâncton (top down control “trophic cascades”) ?

• Os ecossistemas marinhos são caracterizados por controle “bottom up” de

maneira que a retirada de um predador não promove distúrbios no

funcionamento e estrutura da comunidade ?

• A pesada exploração de espécies forrageiras, por exemplo anchovas e sardinhas,

nichos intermediários na cadeia alimentar, causam mudanças no funcionamento

do ecossistema de ressurgência ?

• Qual o grau de controle exercido pelas espécies dominantes (wasp-waist control)

A chave para responder estas questões está no entendimento dos diferentes

mecanismos responsáveis pelas propriedades e padrões emergentes das redes

alimentares. A alteração e distúrbio de um ou vários componentes do ecossistema pode

ter um forte efeito em níveis tróficos mais ou menos elevados dependendo se as redes

alimentares são controladas pela disponibilidade de recursos ou pelas espécies

consumidoras e predadoras. Recentemente, a maioria dos debates sobre a relação entre

diversidade e estabilidade (NAEEM et al. 1994, HECTOR et al. 1999, TILMAN et al.

2001), esteve focado na riqueza de espécies de plantas e produtividade primária.

Entender a estrutura e a dinâmica de redes ecológicas é crucial para entender a

persistência e estabilidade dos ecossistemas. Determinar a interação entre estrutura de

rede, sua dinâmica, e vários aspectos da estabilidade tais como persistência, robustez, e

resiliência de redes do mundo real é um dos maiores desafios de uma área

interdisciplinar das ciências naturais em expansão (STROGATZ, 2001).

7.2.1 - O Efeito da Presença de Consumidores na Diversidade de Presas

O efeito da presença de consumidores na coexistência de espécies

competidoras se dá por meio de dois mecanismos opostos que mediam o efeito do

consumo (PAINE, 1966; GUREVITCH et al., 2000; CHASE et al., 2002).

Primeiramente, os consumidores reduzem a biomassa das presas pelo aumento da taxa

de mortalidade e, potencialmente governam a nível local a extinção das espécies de

presas, reduzindo então a diversidade das mesmas. No segundo mecanismo,

consumidores também previnem a exclusão competitiva de espécies de presas mantendo

desta forma a diversidade local. Essas forças contrastantes resultam em “grandes”

efeitos divergentes (positivos e negativos) dos consumidores na diversidade das presas

(CHASE et al., 2002). Efeitos positivos da presença do consumidor foram achados na

interação planta-herbívoro em habitat pelágico (PROULX et al., 1996) e no habitat

bentônico de lagos (HILLEBRAND et al., 2003). É então da maior importância

descobrir as circunstâncias sob as quais ocorre a coexistência mediada por

consumidores (CHASE et al., 2002). Esses fatores dizem respeito a própria interação

presa-predador (fatores intrínsecos), ou a características abióticas ou bióticas do habitat

(fatores extrínsecos).

Fatores Intrínsecos:

É esperado que os consumidores promovam a diversidade de presas quando seus

impactos é maior no competidor dominante. A seleção ativa de consumidores pode

estar focada para a mais abundante presa e agir como um fator de estabilização

mantendo a diversidade de presas (CHESSON, 2000). A mesma conseqüência,

manutenção da diversidade de presas, também prevalece quando os consumidores são

especialistas e os consumidores de presas abundantes são mais comuns, considerando

que, espécies raras de presas sofrem baixa perda per capta para os consumidores

(PACALA and CRAWLEY, 1992). Consumidores podem também prevenir a exclusão

de presas alimentando-se principalmente sobre a espécie competidora dominante e

limitando seu crescimento (CHASE et al., 2002), um efeito conhecido como “Keystone

predation” (PAINE, 1966; LUBCHENCO, 1978; LEIBOLD, 1996). “Keystone

predation” não requer a seleção ativa dos consumidores, mas pode ocorrer quando a

dominância correlaciona-se à alta susceptibilidade para o consumo por causa da forma

de crescimento ou composição química (HILLEBRAND et al., 2000; CHASE et al.,

2002).

A probabilidade de coexistência mediada por consumidores é, além

disso, afetada por fatores intrínsecos tais como a razão de tamanho consumidor/presa,

que determina o efeito do consumidor na estrutura espacial do conjunto de presas

(STEINMAN, 1996; HILLEBRAND, 2003). Além disso, a presença de consumidores

pode enfraquecer as interações competitivas entre as espécies de presas pelo efeito

indireto na manutenção de recursos (ABRAMS, 2001), a regeneração de nutrientes

(ATTAYDE and VANKOOTEN, 2001; WERNER and PEACOR, 2003). Esses efeitos

indiretos promovem a diversidade de presas se eles reduzem o impacto da

competitividade da espécie da presa dominante. A diversidade de presas também

aumenta com a presença de consumidores se o efeito de consumidores é distribuído

heterogeneamente no espaço e no tempo (PACALA and CRAWLEY, 1992). Presas

podem persistir pela repetida dispersão em uma meta comunidade.

Fatores Extrínsecos:

A densidade de consumidores e a produtividade de presas são dois fatores

bióticos que mediam o efeito do consumidor na densidade de presas. A densidade de

consumidores e suas taxas de alimentação regulam o quão fortemente os consumidores

afetam a mortalidade de presas. Em analogia à hipótese de distúrbio intermediários

(CONNELL, 1978; FLODER and SOMMER, 1999), a mais alta densidade de presas foi

observada em densidades intermediárias de consumidores (SOMMER, 1999) e também

observada neste trabalho (Figura 5.2). Consumidores raros e ineficientes não previnem

exclusão competitiva de suas presas, ao passo que consumidores abundantes e eficientes

podem aumentar a mortalidade a níveis que inibem a existência local de presas.

Segundo, a produtividade afeta a taxa de exclusão competitiva, que determina se os

consumidores promovem a coexistência de presas (HUSTON, 1994). Os efeitos

positivos dos consumidores na diversidade de presas são mais plausíveis quando a

exclusão competitiva é rápida (em alta produtividade). A produtividade aumenta a taxa

de crescimento das espécies competidoras e intensifica a dominância competitiva.

Consumidores e distúrbios desempenham papéis similares na manutenção da

diversidade em que a resposta depende de se seus efeitos caem na espécie dominante ou

nas espécies subordinadas, e a taxa na qual se processa a ocorrência do limite da

diversidade (exclusão competitiva). Os papéis da produtividade e dos distúrbios tem

sido incorporados nos modelos de não-equilíbrio (HUSTON, 1994) e equilíbrio

(KONDOH, 2001).

Estes modelos oferecem predições da dinâmica presa-predador. Essa predições

foram testadas em revisões quantitativas em estudos de sistemas terrestres, marinhos e

dulcícolas. A predominância de efeitos positivos de consumidores na diversidade de

presas foi encontrada em ambientes de alta produtividade que sofre com altas taxas de

exclusão, no entanto, efeitos negativos ocorreram em sistemas de baixa produtividade

onde os consumidores reduzem a diversidade de presas aumentando sua mortalidade

numa situação que poucas espécies de presas podem existir. Corroborando com as

predições de modelos, nos experimentos de WORM et al (2002), os consumidores

promoveram a diversidade de presas em alta disponibilidade de nutrientes e diminuiu no

caso contrário. O termo de interação entre consumo e disponibilidade de nutrientes foi

maior (mais forte) do que o principal efeito de cada um dos fatores, sugerindo que o

“feedback” entre consumidores e recursos é da maior importância para a regulação da

diversidade de presas.

7.2.2 - O Efeito da Densidade de Presas na Diversidade de Consumidores

Outra questão na discussão das relações entre produtividade e

diversidade é a de como a densidade de recursos afeta a diversidade de consumidores.

O aumento da produtividade resulta em maiores tamanhos de populações e menor risco

de extinção (ROSENZWEIG and ABRAMSKY, 1993; ABRAMS, 1995).

Adicionalmente, a diversidade aumenta com a produtividade se a maior produtividade

promover densidades mais altas de espécies de presas raras, permitindo a existência de

consumidores mais especializados, ou se a produtividade resultar em maior dependência

intraespecífica da densidade (ABRAMS, 1995). ROSENZWEIG and ABRAMSKY

(1993), revisaram nove hipóteses para o decréscimo da diversidade em ambiente de alta

produtividade e propuseram que a exclusão de espécies de consumidores aumentou por

causa da reduzida heterogeneidade espacial e temporal no suprimento de presas em

maiores densidades. Mais recentemente, WILSON et al. (2003), mostraram que o

enriquecimento (de culturas) pode diminuir a regularidade e a riqueza de espécies se a

variância interespecífica na capacidade de suporte média aumentar com a produtividade.

Neste caso, poucas espécies dominam a comunidade em alta produtividade e a relação

entre diversidade e produtividade depende de como os efeitos dos fatores abióticos

(nutrientes) estão distribuídos entre as espécies. CHASE and LEIBOLD (2002),

acharam que diferentes relações operam em diferentes escalas em tanques, com uma

relação unimodal entre a produtividade e a riqueza local do sistema, e uma relação

monotônica positiva com a riqueza regional. Esse padrão indica que o efeito da

produtividade na coexistência das espécies é dependente da escala; aumentando o

suprimento de nutrientes enriquece a diversidade local em sistemas oligotróficos e

decresce sob condições eutróficas, enquanto a maior produtividade sempre promove a

diversidade regional.

A teoria prediz que a alta diversidade de presas corresponde a maior

variância em comestibilidade desse modo, maior probabilidade de incluir espécies não

comestíveis (DUFFY, 2002). Alternativamente, os consumidores podem obter

benefícios nutricionais a partir de uma comunidade mais diversa (hipótese da dieta

balanceada, DeMOTT, 1998) e portanto, ser mais abundantes em áreas com mais

variados recursos. Qualquer aumento na diversidade de presas intensifica a resistência

do consumo (e reduz a eficiência do consumidor), ou aumentando a diversidade de

presas aumenta a abundância de consumidores (e intensifica os efeitos do consumidor).

STEINER (2001), encontrou fraco controle de consumidores sobre a

biomassa algal pelo zooplâncton em ambiente com diversidade algal mais alta, o que

atribuiu à presença de fitoplâncton não comestível em alta diversidade que foi capaz de

compensar para a redução da taxa de vulnerabilidade. Em uma meta-análise

quantitativa o efeito da herbivoria decresceu significativamente com o aumento da

diversidade algal (HILLEBRAND and CARDINALE 2004). Essa relação do efeito do

consumidor na diversidade de presas permanece consistente mesmo depois de

cuidadoso cálculo de complexas e diversas variáveis tais como o tipo de habitat,

desenho experimental, ou biomassa de consumidores e presas. Em contraste, uma meta

análise de experimentos de cascata trófica através do ecossistema mostrou que a

diversidade de produtores não explicam a variabilidade na força de interação do

controle “top-down” (BORER, 2002). Desta maneira, a alta diversidade de presas pode

amortecer o controle “top-down” sobre a biomassa da comunidade no sistema,

entretanto esses efeitos podem ser obscurecidos por fontes de variabilidade entre os

sistemas.

Prediz-se normalmente que a diversidade de presas aumenta a

diversidade de consumidores através de maiores oportunidade de diferenciação e

especialização do nicho. Esta predição aplica-se para recursos não sustentáveis

(nutrientes, luz) e recursos sustentáveis tais como presas biológicas para consumidores

heterotróficos. Entretanto, os mecanismos podem diferir para esses dois tipos de presas.

Recursos não renováveis:

A clássica teoria de competição diz que o número de espécies coexistindo

em equilíbrio não pode exceder o número de recursos limitantes em ambientes

homogêneos (TILMAN, 1982), esta predição tem sido constatada por experimentos

controlados. Conseqüentemente, INTERLANDI and KILHAM (2001) acharam que a

diversidade do fitoplâncton em lagos foi maior quando mais recursos (luz e nutrientes)

estavam abaixo dos níveis limitantes. O equilíbrio dinâmico então sugere uma ligação

linear entre diversidade de recursos e diversidade de consumidores. Análises de

modelos em estado de não equilíbrio mostram que a dinâmica não linear permite a

coexistência de espécies em poucos recursos (ARMSTRONG and McGEHEE, 1980).

Usando modelos com três recursos limitantes e um grande número de espécies

competidoras, a dinâmica em estado de não equilíbrio com oscilações e flutuações

caóticas reduziu a exclusão competitiva e manteve alta diversidade (HUISMAN and

WEISSING, 1999).

Recursos renováveis:

Pela ingestão de partículas orgânicas, consumidores heterotróficos

adquirem recursos adicionais, que são (parcialmente) sustentáveis mas diferem em

qualidade. Enquanto que espécies produtoras variam tremendamente no conteúdo de

nutrientes, consumidores vertebrados e invertebrados são menos variáveis em suas

composições bioquímicas. Conseqüentemente, o crescimento e sobrevivência de

consumidores é determinada pela combinação ou inadequação entre a demanda de

nutrientes do consumidor e a composição de nutrientes da presa (STERNER and

ELSER, 2002). Além disso, a diversidade aumentada de presas pode aumentar a

sobrevivência, o crescimento e a reprodução de consumidores por causa de uma dieta

mais balanceada (DeMOTT, 1998). Finalmente, a alta diversidade de presas

substituíveis permite que mais consumidores coexistam, dado que consumidores

apresentam especialização para um tipo de presa e a proporção de tais especialistas

permanece constante ou aumenta com a diversidade de presas. Além disso, também a

diversidade do fitoplâncton e zooplâncton marinho não se correlacionam em escala

global (IRIGOIEN et al., 2004). No entanto alta diversidade de presas promove a

coexistência pelo maior fornecimento de oportunidades de diferenciação do nicho.

A crise global de biodiversidade tem gerado um intenso e controverso

debate sobre o funcionamento do ecossistema, motivada pela corrente alta de perda de

espécies, por motivos antrópicos, é importante perguntar se a diversidade de uma rede

alimentar afeta a probabilidade de perdas secundárias pela deleção de uma ou várias

espécies e se estas perdas comprometem a estabilidade dos sistemas ecológicos. Então

a questão geral é determinar se redes com maior diversidade são mais persistentes e

resistentes contra diferentes tipos de perturbações e extinções. Este fato fez surgir a

necessidade de estudos para a análise da estrutura e topologia das redes alimentares.

Novos métodos de estudo vieram da própria teoria de redes e mais recentemente da área

de sistemas complexos tornando-se importantes ferramentas de análise.

7.3 - Sistemas Complexos, Propriedades Emergentes e Redes Alimentares

Segundo a enciclopédia Wikipedia (2005), um sistema complexo é um

sistema cujas propriedades não são totalmente explicadas pelo entendimento de suas

partes componentes. Estes sistemas consistem de um grande número de partes,

entidades ou agentes entrelaçados interagindo mutuamente. O termo “sistemas

complexos” é também freqüentemente usado como termo geral dirigido a abordagem de

pesquisa que inclui idéias e técnicas desde a teoria do caos, vida artificial e, computação

evolutiva. De acordo com uma edição especial da revista Science (1999), várias

definições podem ser usadas para sistemas complexos dentre as quais destacam-se.

"Um sistema complexo é altamente estruturado. É um sistema cuja evolução é

muito sensível às condições iniciais ou a pequenas perturbações, o número de

componentes interdependentes e interatuantes é grande e, existem níveis pelo qual o

sistema pode evoluir e “desdobrar-se” através do tempo”.

Sistemas complexos são tidos como sendo sistemas abertos cujas fronteiras são

difíceis de determinar apresentando propriedades tais como emergência, relações não-

lineares entre as partes interatuantes e entrelaçadas formando complexas redes que

contém alças de retroalimentação de maneira que a descrição independente das partes

estruturais interdependentes não descrevem o comportamento adaptativo do todo. A

história de um sistema complexo é muito importante e não pode ser ignorada pois,

mesmo pequenas mudanças nas “circunstâncias” podem levar a grandes desvios no

futuro. Isto tem sido referido como o “Butterfly effect” (efeito borboleta). Um aspecto

dos sistemas complexos é que seus componentes são também considerados como

sistemas adaptativos complexos, de maneira que a biosfera é composta por complexos

ecossistemas, que tem diversas estruturas de comunidade (rede alimentar) formadas por

diferentes populações nas quais atua o processo de evolução que determina a adaptação

dos organismos através do processo de seleção natural. No caso de populações

humanas, que vivem em sociedade, estabelecem-se economias formadas de

organizações, compostas por pessoas, que são sistemas de órgãos controlados por seus

sistemas nervosos e endócrino, que respondem à redes de genes etc., todos em cada

nível de hierarquia, são sistemas complexos. Portanto, a área de sistemas complexos

estende-se por um variado campo de ação desde redes de interações sociais, redes

ecológicas, redes de interações metabólicas, interações protéicas, genéticas,

epidemiológicas, fluxos financeiros, redes de computadores, internet etc.

De acordo com STROGATZ (2001), toda década ou mais, surge uma grandiosa

teoria trazendo aspirações similares. Nos anos 60, foi a cibernética, nos anos 70, veio a

teoria da catástrofe, os anos 80, foi marcado pela teoria do caos e nos anos 90, a teoria

da complexidade.

A estrutura e o funcionamento de uma rede complexa forma o “esqueleto” dos

sistemas complexos. Estas redes são especiais pois trabalham no limite do caos (the

edge of caos) onde o grau de conectividade não é regular nem aleatório. A maioria das

redes complexas do mundo real são “small-world networks” ou “scale-free networks”

na margem entre a ordem e a aleatoriedade. Estas redes podem ser descritas

matematicamente ou através da teoria de grafos. Ambas as classes de redes apresentam

características comuns. Grafos “small-world” emergem através de reconexões

aleatórias de “grids” regulares (adição de aleatoriedade à ordem), enquanto que

estruturas “scale-free” (livres de escala) manifestam-se em redes se um certo grau de

ordem é adicionado a aleatoriedade: em vez de se considerar um crescimento

puramente randômico da rede, considera-se um crescimento randômico com conexões

preferenciais.

Uma rede é chamada de “small-world” por analogia ao fenômeno “small-world”.

Essas redes foram descritas por WATTS and STROGATZ (1998), e parecem ser

“small” (pequenas) por causa de um curto caminho médio, entre dois elementos

escolhidos aleatoriamente, (small average and characteristic path length) como grafos

randômicos e apresentam alto grau de agrupamento (clustering) como malhas regulares.

O fenômeno “small-world”, também conhecido como “small-world effect”, descrito

pelo psicólogo MILGRAM em 1967, é a hipótese de todos no mundo podem ser

alcançados através de uma curta cadeia de conhecidos (amigos). O conceito ascendeu a

frase “seis graus de separação” (six degree of separation). A propriedade “small-world”

pode estar associada com a conectividade global e o caminho mais curto (shortest path

length), surge em redes regulares através da adição de atalhos aleatórios (random

shortcuts). Depois da descrição destas redes, BARABÁSI (1999), achou um modelo

para explicar a emergência do fenômeno “small-world”, a propriedade “scale-free”, que

pode estar associada com a conectividade local da rede estas, surgem em redes

randômicas através de agrupamento (clustering).

Uma rede é chamada “scale-free” se não tem uma escala exata ou fixa. Uma

rede com uma única escala (single scale) é similar a um “grid” onde, todo nó tem o

mesmo grau ou mesmo número de conexões. Em uma rede “scale-free”, alguns nós tem

um grande número de conexões se comparados aos demais. Tipicamente, o grau de

conectividade pode ser descrito por uma lei de força (power law) e normalmente

apresentam robustez contra falhas acidentais e são normalmente vulneráveis ao ataque

contra “hubs” ou supernós (nós com grande conectividade) que influenciam fortemente

a maneira de funcionamento dessas arquiteturas. Estes nós situam-se em locais

“especiais” da rede pois atraem muitas ligações e isto tem sido chamado do fenômeno

“the winer take all” ou o ganhador leva tudo. Estas redes também exibem o fenômeno

“small-world”, em que dois nós médios são separados por um número muito pequeno de

conexões e geralmente também tem alto grau de agrupamento. O mundo real é repleto

de redes “scale-free”, por exemplo redes de computador, padrões sexuais em humanos,

que afetam a dispersão de doenças sexualmente transmissíveis, redes de interações

protéicas etc. Segundo o modelo de BARABÁSI (1999), para se produzir uma rede

“scale-free” artificial processando-se propriedades “small-world”, duas regras tem de

ser seguidas:

• Crescimento : a rede é semeada com pequeno número de nós iniciais. Em cada

etapa, um novo nó é adicionado. Este nó é conectado a m nós já existentes.

• Conexão Preferencial: a probabilidade de um novo nó adicionado se conectar a

um nó n já existente depende do grau de conectividade de n (número de

conexões de n com os outros nós).

Parece que modelos de redes “scale-free” podem ser o fundamento de uma lei

natural que governa a formação de redes “smal-world” naturais.

As primeiras análises de propriedades topológicas de redes alimentares emergiu

a partir das pesquisas ecológicas sobre a relação entre diversidade e estabilidade

(MacARTHUR, 1955; MAY, 1973) e tipicamente usou baixa resolução (poucas

espécies). Uma dramática melhoria nos dados (WINEMILLER, 1990; MARTINEZ,

1991), levou a bem sucedidas descrições e modelagem das propriedades gerais de

cadeias alimentares entre ecossistemas (MARTINEZ, 1999) incluindo como as

propriedades das redes alimentares variam com a riqueza de espécies, a resolução, e

esforço de amostragem. Todos estes achados revitalizaram o estudo ecológico das redes

alimentares e pesquisadores têm explicitamente examinado as propriedades “small-

world” para redes alimentares. MONTOYA & SOLÉ (2001), examinaram quatro redes

alimentares e apresentaram “short path length” e maior grau de “clustering” do que

redes randômicas e uma sobreposição de sete redes alimentares com “short path length”

que são pouco, mas significantemente mais longas que “path length” de redes

randômicas mostradas por WILLIAMS, et al. (2001), que demonstrou que esta

propriedade decresce com o aumento da riqueza de espécies. Em 2002, MONTOYA &

SOLÉ, analisaram outros três sistemas (Ythan estuary web, Silwood web e Little Rock

lake web) com diferentes níveis de resolução taxonômica, mas todas envolvendo alto

grau de “clustering” e “short path length” (com dois graus de separação) entre as

espécies, e comentam que estas características sugerem que as comunidades podem ser

auto organizadas de uma maneira não aleatória podendo ter importantes conseqüências

em sua resistência à perturbações tais como a remoção de uma espécie. DUNNE

(2002), explorou o papel da conectividade e o tamanho de redes através da comparação

de dezesseis redes alimentares variando entre 25 e 172 espécies e cita que, redes

alimentares geralmente têm muito maior complexidade, medida como conectividade (a

fração de todos possíveis ligações realizadas numa rede) e muito menor tamanho que

outras redes estudadas. A autora verificou que o “characteristic path length” de redes

alimentares eram curtos e pouco maiores do que outras redes randômicas estudadas

anteriormente (WILLIAMS et al. 2001), e que apesar do grau de distribuição de redes

alimentares não apresentarem uma forma funcional universal, as distribuições são

sistematicamente relacionadas com a conectividade e o tamanho da rede. Redes

alimentares com relativa alta conectividade tipicamente apresentaram uma distribuição

uniforme, redes com média conectividade tendem a ter uma distribuição exponencial

enquanto que, redes com baixa conectividade, mostram uma distribuição “power-law”

ou parcial. Entretanto, graus uniformes de distribuição não tinham sido reportados

anteriormente em qualquer tipo de rede do mundo real. A falha em se observar

topologias “scale-free” na maioria das redes alimentares parece estar relacionada ao

relativo pequeno tamanho (número de níveis tróficos) e a alta conectividade.

Em outra abordagem, integrando a complexidade estrutural e a dinâmica de

redes alimentares, FUSSMANN (2002) mostra que oscilações caóticas, equilíbrio

estável e regular e oscilações estáveis no limite do caos, são os principais estados

dinâmicos gerados por modelos de comunidade multi específicas. Este autor, testando

diversas arquiteturas, achou que a dinâmica caótica aumenta com o número de níveis

tróficos de uma rede alimentar, mas decresce com o grau de complexidade e que a

existência de múltiplos pontos de atração (nós com maior grau de conectividade) podem

levar a diferentes estados dinâmicos do sistema, dependendo das condições iniciais. O

autor testou a força de interação entre os elementos das redes e verificou que a produção

primária disponível para consumo aumenta com o número de produtores. Um aumento

na produção primária é normalmente considerado como tendo um efeito

desestabilizador na dinâmica da comunidade (ROSENZWEIN, 1971), mas demonstrou

que interações do tipo onivoria, principalmente em diferentes níveis tróficos, têm o

efeito um estabilizador. De acordo com BORER (2002), a direção e a força de

interação entre duas espécies depende do tipo de interação em questão.

O surgimento de análises de redes alimentares baseados em consumidores com

comportamento com dieta flexível e adaptativa (KONDOH, 2003), sustentam a chave

para a manutenção de redes complexas. Na ausência de forrajamento adaptativo, a

arquitetura da rede é fixa e é menos provável a persistência da população em uma rede

mais complexa. A presença de consumidores capazes de rápida adaptação, torna

possível a flexibilidade da arquitetura e sua mudança ao longo do tempo. Esta

flexibilidade resulta em uma relação positiva entre a complexidade da rede e a

persistência das populações. O efeito estabilizador da complexidade implica que uma

rede complexa e adaptativa seja auto-sustentável. Esta auto sustentabilidade, entretanto,

não necessariamente significa que uma redes mais complexa será mais sustentável para

perda de espécies. Em uma rede complexa e adaptativa, uma vez que as espécies são

perdidas, isto abaixa a persistência da população, desta maneira aumentando a

possibilidade de extinções posteriores. Este “feedback” positivo abaixa a riqueza de

espécies e a persistência das populações ao mesmo tempo, resultando em extinções em

cascata. Isto sugere que redes complexas e adaptativas podem ser mais frágeis quando

estão sob forte pressão, abaixando a riqueza das espécies.

Numa análise da estrutura e robustez de redes alimentares marinhas DUNNE,

(2004), apresenta resultados preliminares sugerindo que ecossistemas com variável

diversidade e complexidade dividem características fundamentais. Por causa da “short

average path lengh” os efeitos de perturbações podem ser largamente transmitidos ao

longo das redes.

Capítulo VIII

Conclusões

Este trabalho apresentou inicialmente a grande variedade, valor e tipos de

ecossistemas costeiros, o desconhecimento atual acerca da diversidade biológica, uma

breve descrição dos serviços básicos que a vida marinha fornece para o homem, a rápida

deterioração dos diversos habitats e a enorme necessidade de se desenvolver programas

de monitoramento e gerenciamento ambiental para se tentar alcançar um

desenvolvimento sustentável. Este último deve ser entendido como sendo a harmonia

entre a manutenção e crescimento da atividade econômica capaz de promover o

desenvolvimento social com a preservação e conservação ambiental. A questão chave

foi, é e continua sendo: O que conservar e como isso funciona? Como resposta para a

primeira parte da pergunta, fica claro que é o próprio ambiente no seu sentido maior –

Ecossistema – em que se espera ter demonstrado as fortes tendências e tentativas à nível

mundial na adoção e extensão deste conceito para os programas de gerenciamento

ambiental. Porém, a segunda parte da pergunta, procurou-se demonstrar ao leitor que o

funcionamento dos ecossistemas são extremamente complexos devido ao grande

número de componentes e interações operando em diversas escalas de tempo e espaço, e

a necessidade de desenvolver índices mais abrangentes que reflitam as condições reais

do ambiente como um todo.

Com o objetivo de conhecer e acessar os padrões de comportamento

trófico pela variação temporal do suprimento de diferentes tipos de larvas, clorofila e

parâmetros físicos e químicos da água, os métodos de extração de conhecimento através

de regras, permitiram demonstrar a existência de uma partição na comunidade

meroplanctônica, tornando possível classificar a corrente classe de estado ambiental e

fazer predições futuras.

Três questões básicas foram levantadas.

A primeira é, seria possível separar fontes exógenas (ambientais) de fontes

endógenas (bióticas) de variação de densidades populacionais à partir de séries

temporais de dados? A resposta para esta questão é não, pois o modelo de regras de

classificação através de associações (LIU, 1998), demonstrou que ambos os dados são

contemplados tanto nas partes antecedentes como conseqüentes dos conjuntos de regras.

Este tipo de modelo demonstrou os níveis ou sob que condições físico e químicas, os

diversos tipos de larvas formam uma dada composição populacional, em outras

palavras, ficou demonstrado as fronteiras que separam determinado estado ambiental de

outro, e que em certos casos, a estrutura da rede alimentar pode estar sob forte

influência de um controle do tipo “bottom-up” já que determinados conjuntos

populacionais estão relacionadas a níveis específicos de clorofila e esta, por sua vez,

responde a certa conjuntura de nutrientes.

A segunda questão foi se padrões temporais de longa duração da

dinâmica populacional poderiam ser gerados por processos endógenos, e estes processos

poderiam ser caracterizados em conjuntos de dados reais. Apesar da resposta desta

questão ser sim, não se teve a possibilidade com a atual base de dados de demonstrar tal

fato. Porém , como demonstrado por FUSSMANN & HERBER (2002), interações do

tipo onivoria que ocorre no controle “top-down,” principalmente em níveis tróficos

diferentes, promovem efeito estabilizador das redes alimentares, aliado a ocorrência de

consumidores com forrageamento adaptativo (KONDOH, 2003), mantém a persistência

e sustentabilidade da rede no longo prazo. A base de dados atual, só apresenta a

clorofila como única fonte de recursos para as larvas, excluindo assim, a possibilidade

de evidenciar suas preferências alimentares nem tão pouco, contém dados sobre os

possíveis predadores das larvas.

A terceira e última questão diz respeito com a possibilidade de predizer

como mudanças ambientais afetam a média de densidades populacionais. A resposta

também é sim, pois uma vez que foi possível determinar os intervalos de ocorrência das

diferentes densidades populacionais específicas e composições relacionadas aos

intervalos físicos e químicos, as regras por si nos demonstram este fato. Outra

abordagem para acessar tal condição poderia ser a aplicação da metodologia de extração

de regras de modelos de redes neurais.

O principal foco desses conceitos (bottom-up, top-down, trophic cascade

etc.) tem sido explicar a distribuição e controle da biomassa em diferentes níveis

tróficos, enquanto que o controle da diversidade recebeu menos atenção. A presença de

predadores altera a diversidade de consumidores intermediários e conseqüentemente a

diversidade de presas basais. Simultaneamente, a densidade de presas basais afetará a

diversidade de predadores via mudanças no nível de consumidores intermediários.

Sobre OLIVER (2000), que cita que a estrutura e dinâmica das

comunidades bentônicas nos costões rochosos varia espacial e temporalmente com

respeito aos invertebrados dominantes e processos de pré e pós assentamento, e que

segundo APOLINÁRIO (1999), a disponibilidade de larvas e o baixo recrutamento

causam a não manutenção das populações da zona intertidal, os dados disponíveis

apresentaram uma dominância numérica para as populações de larvas de cirripédios e

mytilidae com densidades médias interanuais bastante flutuantes.

VALANTIN (1988), citou que as relações fitoplâncton/zooplâncton, em

linhas gerais, apresentam uma correlação positiva direta entre esses dois níveis tróficos

em águas oligotróficas e que, em regiões de ressurgência, por causa do estado de

desequilíbrio dever-se-ia encontrar uma correlação negativa, mas que, na ressurgência

de Arraial do Cabo, devido ao que chamou de simultaneidade de máximos, esta

correlação seria positiva. De acordo com o apresentado na Tabela 3.3 de correlações, as

larvas de Cirripédia, Mytilidae, Decapoda, Larva em D, Ostreidae, Cipris e Bryozoa,

apresentam todas correlações negativas com a clorofila enquanto que as larvas de

Polychaeta, Ascidiaceae, Equinoide e Bivalvia apresentam-se com sinal positivo porém,

não correlacionadas como o encontrado por IRIGOIEN (2004).

SKINNER & COUTINHO (2002), demonstraram um maior

assentamento de duas espécies de cirripédios no período outono/inverno quando

observaram uma maior densidade de larvas do tipo cipris e a maior ocorrência de larvas

do tipo náuplio no período de primavera/verão e sugerem que a variação temporal da

temperatura seria o fator ambiental responsável por tal fato. Na realidade, a maior

densidade de larvas do tipo cipris foi observada no período estudado pelos dois autores

mas, não se pode dizer que o encontrado constitui um padrão de comportamento do

ecossistema da ressurgência de Arraial do Cabo uma vez que não se verifica o mesmo

nos anos antecedentes e subseqüentes.

Pode-se dizer que a fase de preparação de dados é crucial para o processo

de modelagem e extração de conhecimento e que a metodologia de análise estatística

multivariada constitui ferramenta indispensável no que se refere a depuração e

conhecimento da estrutura da base de dados enquanto que, a metodologia de algoritmos

para geração de regras demonstrou grande capacidade de gerar modelos de regras

capazes de classificar e predições das condições ambientais e potencial como

ferramenta de inicialização de redes alimentares.

Como o ecossistema é composto por diversos componentes e impactado

por diversas fontes perturbadoras, o melhor indicador ecológico é o próprio conjunto de

elementos da rede alimentar. Para acessar as diferentes condições e estados ambientais

foi desenvolvido o índice PLIX que demonstra as condições tróficas globais da rede

alimentar enquanto que o índice de diversidade de Margalef pode ser usado para acessar

o grau de perda global de diversidade do sistema ou aplicado a cada nível da rede

trófica. Juntos estes índices podem ser usados para interpretar a resposta do sistema

biológico às perturbações ambientais. Neste sentido, o sistema proposto pode ser usado

como simulador e comparar os efeitos de possíveis modificações das condições

ambientais na rede de interações tróficas e seus efeitos na perda de biodiversidade e

estabilidade do ecossistema com condições de referência. Observou-se que o índice de

diversidade de Margalef (Tabela 5.1), aplicado às larvas meroplanctônicas foi altamente

variável ao longo do tempo e que esta diversidade apresenta baixa correlação positiva

com os fatores físicos e químicos e a clorofila mas, fortemente correlacionada com a

razão de produção/consumo. Este fato sugere uma situação de competição por recursos

por parte dos organismos. Constatou-se ainda que o mais alto valor de diversidade

larval ocorreu juntamente com alta densidade de clorofila. Este fato demonstra que o

aumento de densidade algal se deu provavelmente pelas espécies normalmente menos

abundantes ou raras, permitindo assim a coexistência de uma mais diversa composição

de larvas como o verificado anteriormente por ABRAMS (1995), estando também de

acordo com a hipótese de uma dieta mais diversificada e balanceada de DeMOTT

(1998). Porém, os valores mais baixos de diversidade larval estão freqüentemente

associados a baixos valores de clorofila demonstrando que as larvas exercem fraca

pressão de herbivoria sobre a biomassa algal como relatado por STEINER (2001) e

HILLEBRAND (2004).

A arquitetura do Sistema de Gerenciamento Integrado do Ecossistema

Costeiro proposto neste trabalho, usada como ferramenta de apoio e suporte de decisão,

definindo as condições ambientais e identificando conflitos ou problemas, satisfaz os

requerimentos propostos por POWRVAKHSHOURI (2003), COLWEL (2004) e

CAMPBELL (2005).

A pequena revisão sobre a biodiversidade e a ecologia de redes alimentares

mostrou um íntimo acoplamento e vários níveis de organização. A maioria das

pesquisas foram feitas na “clássica rede alimentar” compreendendo o fitoplâncton,

zooplâncton, planctívoros e predadores no meio pelágico e em alguns casos

comparações com sistemas terrestres. Entretanto, muito da diversidade nos sistemas

aquáticos ocorre em cadeias alimentares microbianas. A falta de informação neste nível

é extraordinária, principalmente entre a ligação do microscópico com o macroscópico.

A inclusão de conexões com cadeias alimentares baseadas em detrito em estudo de

biodiversidade mudará certamente a percepção de padrões entre diversidade e interações

tróficas.

O sucesso do gerenciamento de ecossistemas futuro dependerá de pesquisa direta

nos mecanismos básicos que governam a dinâmica das interações do ecossistema. O

controle “bottom-up e top-down” alteram o funcionamento do ecossistema entretanto,

um ecossistema não é governado inteiramente por um ou outro tipo de controle mas, por

uma súbita mudança de combinações destes que pode depender do seu estado,

diversidade e integridade. Nenhuma teoria geral pode ser atribuída ao funcionamento

do ecossistema, exceto à luz da teoria da evolução. Afim de entender a relação entre

diversidade e relações tróficas tem-se que estender a estrutura temporal para incluir

processos evolutivos. A importância da competição na especiação e micro-evolução.

Os trabalhos futuros incluirão o emprego da tecnologia de citometria de fluxo

focada a laser para a geração de dados das partículas em suspensão e organismos da

água para acessar a estrutura de cadeias alimentares microbianas e a importância das

relações de interações infecciosas e parasitárias. O reconhecimento e classificação das

assinaturas ópticas desta partículas e organismos será feito com o auxílio de modelos de

redes neurais artificiais como apresentado por PEREIRA et al. (2003). Os dados

gerados serão armazenados em ambiente de banco de dados que será acessado por

algoritmos geradores de regras de associação para a indução de uma estrutura de rede

como o exposto neste trabalho. Esta rede deverá ser implementada por algoritmos

evolutivos que permitam um aprendizado por reforço em tempo “quase real”.

Investigar se supostas mudanças na diversidade estão relacionadas com

propriedades emergentes da rede alimentar tais como o número global de ligações da

rede, número de ligações por espécie e a relação complexidade e estabilidade.

Redes alimentares “sempre” foram consideradas como tendo um curto tamanho,

“Small networks but not small worlds,” como se comportarão quando acoplar o macro e

o micro ? “Big world and big networks” ? Permanece obscuro se a conectividade está

relacionada com o tamanho da rede ou diminui com a diversidade.

Explorar a importância da direcionalidade de ligações, força de ligações e tipos

de interações além da importância da perda de diversidade e os fatores que mantém o

funcionamento de estruturas auto adaptativas será uma etapa valiosa no entendimento e

aplicação da teoria da complexidade em comunidades ecológicas.

Referências Bibliográficas

ABRAMS, P.A. 1995. "Monotonic or unimodal diversity-productivity gradients: what

does competition theory predicts?" Ecology 76: pp. 2019-2027.

ABRAMS, P.A. 2001. "Modeling the adaptive dynamics of traits involved in inter-and-

intra-specific competition: An assessment of three methods". Ecology Letters 4: pp.166-

AGRAWAL, R., IMIELINSKI, T., & SWAMI, A. (1993). "Mining Associations

between sets of items in massive databases." Proceedings of the 1993 ACM-SIGMOD

International Conference on Management of Data, pp.207-216.

AGRAWAL, R., and SRIKANT, R. Fast algorithm for mining association rules. VLDB-

94, 1994.

AN, A. & CERCONE, N. (1999). "Discretization of continuos attributes for learning

classification rules". Proceedings of the 3rd Pacific-Asia Conference on Methodologies

for Knowledge Discovery and Data Mining, 509-514.

ANGER, K., DAWIRS, R. R., 1981. Influence of starvation on the larval development

of Hyas araneus (Decapoda: Majidae), Helgol. Wiss. Meeresunter., 34, 287.

ANGER, K., 1985. Influence of salinity on larval development of the spider crab, Hyas

araneus, reared in the laboratory. – In: Marine biology of polar regions and effects of

stress on marine organisms. Ed. By J. S. Gray & M. E. Christiansen. Wiley, Chichester,

pp. 463-473.

ANITA, N. J., BERLAND, B.R., BONIN, D.J. and MAESTRINI, S.Y., 1975,

“Comparative evaluation of certain organic and inorganic sources of nitrogen for

phototrophic growth of marine algae”. J. Mar. Biol. Ass. U.K., v.55, pp. 519-539.

AOKY, T., KOMATSU, T., HWANG, K., 1999. "Prediction of response of

zooplankton biomass to climatic and oceanic changes". Ecological Modelling 120, pp.

261-270

APOLINÁRIO, M., 1999. "The role of pre-recruitment processes in the maintenance of

a barnacle (Chtamalus challengeri Hoek) patch on an intertidal pebble shore in Japan".

Rer. Brasil. Bio., 59 (2): 225-237.

ARHONDITSIS, G., KARYDIS, M., TSIRTSIS, G., 2003. "Analysis of Phytoplankton

Community Structure Using Similarity Indices: A New Methodology for Discriminating

among Eutrophication Levels in coastal Marine Ecosystems". Environmental

Management, vol. 31, No. 5, pp. 619-632.

ARMSTRONG, R.A., McGREHEE, R. 1980. "Competitive exclusion". American

Naturalist 115: pp.151-170.

ATTAYDE, J.L., HANSON, A. "A relative importance of fish predation and excretion

effects on planktonic communities". Limnol. Oceanogr. 46: pp. 1001-1012.

BAILEY, R.C., DAY, K.E., NORRIS, R.H., REYNOLDSON, T.B., 1995.

"Macroinvertebrate community structure and sediment bioassay results from nearshore

areas of North American Great Lakes." J Gt Lakes Res. 21: pp. 45-52.

BANSEN, K., 1977 “Determining the carbon-chlorophyll ratio of natural

phytoplankton.” Mar. Biol., 41, pp. 199-212.

BARAN, P., LEK, S., DELACOSTE, M., BELAUD, A, 1996. "Stochastic models that

predict trout population density or biomass on a mesohabitat scale." Hydrobiologia 337,

pp. 1-9.

BARABASI, A.L. 1999. “Emergence of scaling in random networks.” Science 286: pp.

509-512.

BARBIERI, E.B., 1975. “Ritmo climático e extração de sal em Cabo Frio”. Revista

Brasileira de Geografia, v. 37, pp.23-109.

BARCIELA, R.M., GARCIA, E., FERNANDEZ, E., 1999. "Modelling primary

production in a coastal embayment affected by upwelling using dynamic ecosystem

models and artificial neural networks". Ecological Modelling 120, pp. 199-211.

BARNES, H. & BARNES, M., 1965. "Egg size, nauplius size and their variation with

local, geographical, and specific factors in some common cirripedes." J. Anim. Ecol. 34,

p. 391-402.

BATAGALJ, V., DOREIAN, P., FERLIGOJ, A, 1992. "An optimization approach to

regular equivalence." Social networks 14: pp. 121-135.

BAY, S. D. (2000). "Multivariate discretization of continuos variables for set mining".

Proceedings of the 6th ACM SIGKDD International Conference on Knowledge

Discovery and Data Mining, 315-319.

BAYARDO, R., and AGRAWAL, R. “Mining the most interesting rules.”KDD-99,

BOESCH, D. F., BURRESON, E., DENNISION, W., HOUDE, E., KEMP, M.,

KENNEDY, V. 2001. Factors in the decline of coastal ecosystems. Science 293: pp.

629-638.

BORER, E.T., AMDERSON, C., BLANCHETTE, C., BROITMAN, B., COOPER, S.,

HALPEN, B. 2002. "Topological approaches to food web analyses: a few modifications

may improve our insights". Oikos 99: pp. 397-401.

BRADSHAW,C.J.A, PURVIS, M., RAYCOV, R., ZHOU, Q., DAVIS, L.S., 2000.

Predicting patters in spatial ecology using neural networks: modelling colonization by

New Zealand fur seal. In: Denzer, R., Swayne, D.A, Purvis, M., Schimak, G. (Eds.),

Environmental Software Systems. Environmental Information and Decision Support,

167. Kluwer Academic Publishers, Dordrecht, Netherlands, pp. 57-65.

BRADSHAW,C.J.A, DAVIS, L.S., PURVIS, M., ZHOU, Q., BENWELL, G.L., 2002.

"Using artificial neural network to model the suitability of coastline for breeding by

New Zealand fur seals (Arccephalus forsteri)". Ecological Modeling 148, pp. 111-131.

BRETT, M., GOLDMAN, C.R. 1997. "Consumer versus resources control in

Freshwater pelagic food web". Science, 275 issue 5298, pp.384-386.

BRAY, R. J. & CURTIS, J. T. 1957. "An ordination on the upland forests communities

of southern Winsconsin". Ecological Monography, 27: pp. 325-349.

BRAZNER, J.C., 1997. "Regional, habitat and human development influences on

coastal wetlands and beach fish assemblages in Green Bay, Lake Michigan". J Gt Lakes

Res. 23: pp. 36-51.

BREY, T., JARRE-TEICHMANN, A., BORLICH, O. , 1996. "Artificial neural network

versus multiple linear regression: predicting P/B ratios from empirical data". Marine

Ecological Progress Series 140, pp. 251-256.

BOUDJEMA, G., CHAU, N.P., 1996. "Revealing dynamics of ecological systems from

natural recordings". Ecological Modelling 91, pp.15-23.

BRILL, F., Z., BROWN, D. E., MARTIN, W. N. 1992 "Fast genetic selection of

features for neural network classifiers". IEEE Transactions on Neural Networks,3(2):

pp. 324-328.

BURT, R.S., TALMUD, I., 1993. "Market niche". Social Networks 15: pp. 133-149.

CAIRNS, J., McCORMICK, P.V., NIDERLEHNER, B.R., 1993. "A proposed

framework for developing indicators of ecosystem health". Hydrobiologia 236, pp. 1-

CHESSON, P. 2000. "A need for niches?" Trends in Ecology and Evolution 9: pp. 26-

CAMPBELL, J.W., 2005. The University of New Hampshire Center of Excellence for

Coastal Ocean Observation and Analysis. Semi-Annual Technical Report:

NA16OC2740. Ocean Process Analysis Laboratory, Durham, New Hampshire, USA.

CARLTON, J. T., G. J. VERMEIJ, D. R. LINDBERG, D. A, CARLTON, E. DUDLEY.

1991. "The first historical extinction of a marine invertebrate in an ocean basin: the

demise of the eelgrass limpet Lottia alvens". Biological Bulletin 180: pp. 72-80.

CARLTON, J. T. 1993. "Neoextintions of marine invertebrates". American Zoologist

33: pp. 499-509.

CARLTON, J. T. 1999a. The scale and ecological consequences of biological invasions

in the world’s oceans. Pages 195-212 In º T. Sandlund, P. J. Schei, A Viken, eds.

Invasive species and biodiversity management. Kluwer Academic Publishers,

Dordrecht, Netherlands.

CARLTON, J. T., J. B. GELLER, M. L. REAKA-KUDLA, E. A. NORSE. 1999b.

"Historical extinctions in the sea". Annual Review of Ecology and Systematics 30: pp.

515-538.

CASWELL, H., 1981. "The evolution of mixed life histories in marine invertebrate and

elsewhere", Am. Nat., pp. 117, 529.

CLEMANTIS, A., FALCIDIENO, B., SPAGNUOLO, M. 1996 "Parallel processing on

heterogeneous networks for GIS Applications", Int. Journal of Geographical

Information Systems, special issue on Parallel Processing in GIS, vol. 10, No. 6.

CHANG, C. P., WELLS, P. G. A marine environment quality (MEQ) framework and

the Bay of Fundy. Opportunities and Challenges for Protecting, Restoring and

Enhancing coastal Habitats in the Bay of Fundy: Proceedings of the 4th Bay of Fundy

Science Workshop, Saint John, NB, 2000, Chopin, T., and Wells, P. G., Eds.

Environment Canada – Atlantic Region, Occasional report No. 17, Sackvill, NB, 2001,

127 p.

CHARPY.R., CHARPY, L.J., MAESTRINI, S.Y., 1982, “Fertilité des eaux côtieres

Nord-patagoniques: facteurs limitant la prodution du phytoplankton et potentialities

d’explotation myticole”. Oceanol. Acta, v.5, n.2, pp.179-188.

CHASE, J.M., LEIBOLD, M.A. 2002. "Spatial scale dictates productivity-biodiversity

relationship". Nature 416: pp. 427-230.

CHAWLA, N. V., JAPKOWICZ, N., KOLCZ, A. "Special issue on learning from

imbalanced data sets". SIGKDD Explorations, 6 (1): 1-6, 2004.

CHAWLA, N. V. "C4.5 and imbalanced datasets: Investigating the effect of sampling

method, probabilistic estimate, and decision tree structure." In Proceedings of the

ICML’03 Workshop on Class Imbalances, 2003.

CHAWLA, N. V., HALL, L. O., BOWYER, K. W., KEGELMEYER, W. P. SMOTE:

2002 "Synthetic Minority Oversampling technique". Journal of Artificial Intelligence

Research, 16:pp. 321-357.

CHON, T.S., PARK, Y.S., MOON, K.H., CHA, E.Y., 1996. "Patternizing communities

by using an artificial neural network". Ecological Modelling 90, pp. 69-78.

CHRITENSEN, F. B., FENCHEL, T. M., 1979. "Evolution of marine invertebrate

reproductive patterns", Theor. Popul. Biol. 16: pp. 267

CHRISTENSEN, V., PAULY, D., (ed.) 1993a. "Trophic models of aquatic ecosystem".

ICLAM Conference Proceedings, No. 26. 390p.

CHRISTENSEN, V., PAULY, D., 1993b. "Flow characteristics of aquatic ecosystems"

In Trophic Models of Aquatic Ecosystems, pp. 339-355. Ed. By Christensen, and D.

Pauly. ICLAM Conference Proceedings, No. 26.

COLE, M. R., 1998, Clustering with Genetic Algorithms (Western – Australia). Ph.D.

dissertation, University of Western Australia, Australia.

COLWELL, R.R., 2004. Biocomplexity and a New Public Health Domain. EcoHealth

Journal Consortium, 10.1007/s10393-004-0067-9,

http://www.springerlink.com/media/contrib…/fulltext.htm

CONNEL, J.H. 1978. "Diversity in tropical raim forests and coral reefs". Science 199:

pp. 1302-1310.

COSTANZA, R. R., D’ARGE, R. D., GROOT, S., FARBER, M., GRASSO, B.,

HAMNON, K., LIMBURG, S., NAEEM, R. V., O’NEILL, J., PARUELO, R. G.,

RASKIN, P., SUTTON, M. Van Den BELT. 1997. "The value of the world’s ecosystem

services and natural capital". Nature 387: 253-260.

COSTANZA, R., ANDRADE P., ANTUNES, M., Van Den BELT., D., BOCSCH, D.,

BOCRSMA, F., CATARINO, S., HANNA, L., LIMBURG, B., LOW, M., MOLITOR,

J. G., PEREIRA, S., RAYNER, R., SANTOS, J., WILSON M., YOUNG, 1999.

"Ecological economics and sustainable governance of the oceans". Ecological

Economics 31: pp. 171-187

COSTANZA, R. 1999. "The ecological, economic, and social importance of the

oceans". Ecological Economics 31: pp. 199-213.

COTTINGHAM, K.L., 2002. "Tackling biocomplexity: the role of people, tools, and

scale". Bioscience 52: pp. 793-799.

COWEN, R. K., K. M. M. LWIZA, S. SPONAUGLE, C. B. PARIS, D. B. OLSON.

2000. "Connectivity of marine populations: open or close?" Science 287: pp. 857-859.

CORDÓN, O., HERRERA, F., LOZANO, M. 1996. A Three-stage method for

designing genetic systems by learning from examples”. In: Proceedings of the fourth

International Conference on Parallel Problem Solving from Nature, pp. 720-729,

Berlin, Germany, 22-26 September.

COSTA, P.A.S., FERNANDES, F. C., 1993. “Seasonal and spatial changes of

cephalopods caught in the Cabo Frio (Brasil) upwelling ecosystem”. Bulletin of Marine

Science, v.52, pp.751-759.

COSTA, P.A.S., HAIMOVICI, P., 1990, “A pesca de polvos e lulas no litoral do Rio de

Janeiro”. Ciência e Cultura, v.42, pp. 1124-1130.

CULOTTA, E. 1994. "Is marine biodiversity at risk?" Science 263: pp. 918-920.

DALE, V.H., BEYELER, S.C., 2001. "Challenges in the development and use of

ecological indicators". Ecological Iindicators, 1: pp. 3-10.

DAILY, G. C. ed. 1997. Nature’s services. Island Press, Washington, D.C.

DAVIS, J.R., NANNINGA, P.M., HOARE, J.R.L., PRESS, A.J., 1989. "Transferring

scientific knowledge to natural resources managers using artificial intelligence

concepts". Ecological Modelling 46, pp. 73-89.

DeMOTT, W.R. 1998. "Utilization of a cyanobacterium and phosphorous-deficient

greem alga as complementary resources by daphnids". Ecology, 79: pp. 2463-2481.

DIXIT, A.S., DIXIT, S.S., SMOL, J.P., 1992. "Algal microfossil provide high temporal

resolution of environmental trends". Water Air Soil Pollution 62: pp. 75-87.

DOUGHERTY, J., KOHAVI, R & SAHAMI, M. 1995. Supervised and unsupervised

discretization of continuos features. Proceedings of the 12th International Conference on

Machine Learning, pp. 94-202.

DUFFY, J.E. 2002. "Biodiversity loss, tropfic skew, and ecosystem functioning". Ecol.

Lett. 6: pp. 680-687.

DUNNE, J.A., WILLIAMS, R.J., MARTINEZ, N.D. 2002. "Food web structure and

network theory: the role of connectance and size". Proceedings of the National

Academy of Sciences USA 99: pp. 12917-12922.

DUNNE, J.A., WILLIAMS, R.J., MARTINEZ, N.D. 2004. "Network structure and

robustness of marine food web". Marine Ecology Progress Series 273: pp. 291-302.

DRUMM, D., PURVIS, M., ZHOU, Q., 1999. Spatial ecology and artificial neural

networks: modelling the habitat preference of the sea cucumber (Holothuria

leucospilota) on Rarotonga, Cook Islands. The 11th Annual Colloquium of the Spatial

Information Research Center, University of Otago, Dunelin, New Zealand.

E.C., European commission. 1999. Lessons from the European commission’s

Demonstration Programme on Integrated Coastal Zone Management. European

communities: Luxembourg. 93 pp.

E.C., European commission. 2000. On Integrated Coastal Zone Management: A

Strategy for Europe. European communities: Luxembourg. 27 pp.

EPPLEY, R.W.,1972, “Temperature and phytoplankton growth in the sea”: Fish. Bull.

v.,70, pp. 1063-1085.

ESPÍNOLA, R. P., EBECKEN, N. F. F. 2000. Otimização de regras fuzzy de

classificação por algoritmos genéticos, 22nd Iberian Latin American Congress on

Computational Methods in Engineering, Campinas, 7-9 November.

EVERITT, B. S. Cluster Analysis. Halsted Press, third edition, 1993.

EVSUKOFF, A G., BRANCO, A C. S., GENTEL, S., 1997, “A Knowledge Acquisition

Method for Fuzzy Expert System in diagnosis Problems.” Proceedings of Sixth IEEE

International Conference on Fuzzy Systems, Barcelona, Spain, 1-5 July.

FALKOWISK, P.O., 1984, “Physiological responses of phytoplankton to natural light

regimes”.

FAO. 1997. Review of the state of world fishery resources: FAO Fisheries Circular 920.

FAO, Rome, Italy

FAYAD, U. M., IRANI, K. B. 1993. Multi-interval discretization of continuous-valued

attributes for classification learning. IJCAI-93, 1022-1027.

FENAUX, M., M. F. STRATHMANN, R. R. STRATHMANN. 1994. "Five tests of

food-limited growth of larvae in coastal waters by rates of development and form of

echinoplutei". Limnology and Oceanography 39: pp. 84-98.

FIELD, J. G., K. R. CLARKE, R. M. WARWICH. 1982. "A practical strategy for

analyzing multispecies distribution patterns". Marine Ecological Progress Series 8: pp.

37-52.

FLÖDER, S., SOMMER, U. 1999. "Diversity in planktonic communities: an

experimental test of the intermediate disturbance hypothesis". Lomnol. Oceanogr. 44:

pp. 1114-1119.

FLOREK, K., LUKASZEWIEZ, J., PERKAL, J., STEINHAUS, H., ZUBRZCHI, S.

"Sur la liason et la division des points d’un ensemble fini". Colloquium Mathematicum,

2: pp. 282-285, 1951.

FOLSE, L.J., PACKARD, J.M., GRANT, W.E., 1989. "AI modelling of animal

movements in a heterogeneous habitat" Ecological Modelling 46, pp. 57-72.

FUKUNAGA, K., Introduction to statistical pattern recognition. Academic Press, New

York, 1972.

FUNK, M., APPEL, D., ROCK, Ch., HOCHSTRASSER, D., PELLEGRINI, Ch.,

MÜLLER, A. F. Knowledge acquisition in expert system assisted diagnosis: a machine

learning appoach. In Proc. AIME-87, pages 99-103. Spring Verlag, 1989.

FUSSMANN, G., HERBER, G., 2002. "Food web complexity and chaotic population

dynamics". Ecology Letters 5: pp. 394-401.

GALLEGOS, C.L., PLATT, T., HARRISON, W. B., IRWIN, B., 1983. “Photosynthetic

parameters of Arctic marine phytoplankton: vertical variations and time scale of

adaptation”. Limnol. Oceanogr., v.28, pp. 698-708.

GLOVER, H.E., 1980, “Assimilation numbers in cultures of marine phytoplankton”. J.

Plank. Res., v.2, pp.69-79.

GOLDMAN, C.R., MANSON, D.T., 1962, “Inorganic precipitation of carbon in

productivity experiments utilizing carbon 14”. Science, v.136, pp.1049-1050.

GUIMARÃES, M.A., COUTINHO, R. 1996. “Spatial and Temporal variation of

benthic marine algae at the Cabo Frio upwelling region, Rio de Janeiro, Brazil”Aquatic

Botany, v. 52, pp. 283-299.

GREEN, P. E., FRANK, R. E., ROBINSON, P. J. 1967, "Cluster analysis in test market

selection". Management Science, 13(8): pp. 387-400,. Series B.

GUAN, B.T., GERTNER, G.Z., PARYSOW, P., 1997. "A framework for uncertainty

success in assessment of mechanistic forest growth models: a neural network example".

Ecological Modelling 98, pp. 47-58.

GUÉGAN, J. F., LEK, S., OBERDORF, T., 1998. "Energy availability and habitat

heterogeneity to predict global riverine fish diversity". Nature 391, 382-384.

GUILLAUME, S. 2001, “Designing fuzzy inference systems from data: an

interpretability-oriented review”, IEEE Transactions on Fuzzy Systems,v.9, n.3, pp. 426-

HAN, J., KAMBER, H. 2001, Data Mining – Concepts and Techniques – Chapters 6, 7

and 8.

HANS, J. 1986. Effects of temperature and salinity on larval development of Elminius

modestus (Crustacea, Cirripedia) from Helgoland (North Sea) and New Zealand.

Helgoländer Meeresunters 40:355-376.

HARDING, L. E. 1992. "Measures of marine environmental quality". Mar. Pollut.

Bull.25, pp. 23-27.

HARRIS, G. P., 1983, Mixed layer physic and phytoplankton population studies in

equilibrium and non-equilibrium ecology. In F.E. Round & D.J. Chapman (eds).

Progress in Phycological Research. 2. Biopress. England: pp. 1-46.

HARRISON, W.G., PLATT, T., 1980, “Variations in the assimilation number of costal

marine phytoplankton: effects of environmental covariates”. J. Plankton Res.,v.2, pp.

249-260.

HARRISON, W.G., PLATT, T., IRWIN, B., 1982, “Primary production and nutrient

assimilation by natural phytoplankton population of the eastern Canadian Artic”. Can. J.

Fish. Aquat. Sci., v. 39, pp. 335-345.

HAYKIN, S., 2001, Redes Neurais, princípios e prática, 2a edição, Rio de Janeiro,

Bookman.

HECTOR, A. et al., (34 authors). 1999. "Plant diversity and productivity experiments in

European grassland". Science 286: pp. 1123-1127.

HERDENDORF, C.E., 1992. "Lake Erie coastal wetlands: an overview" J Gt Lakes

Res. 18: pp. 533-551.

HERRERA, F., LOZANO, M., VERDEGAY, J. L. 1995a. Fuzzy Connectives Based

Crossover Operations to Model Genetic Algorithms Population Diversity, University of

Granada Technical Report DECSAI-95110, Spain.

HERRERA, F., LOZANO, M., VERDEGAY, J. L. 1995b. A Learning Process for

Fuzzy Control Rules using Genetic Algorithms, University of Granada Technical Report

DECSAI-95108, Spain.

HILLEBRAND, H., CARDINALE., B.J. 2004. " Consumer effects dicline with prey

diversity". Ecol. Lett. 7: pp. 192-201.

HILLEBRAND, H. 2003. "Opposing effects of grazing and nutrients on diversity".

Oikos, vol. 10, No. 3, pp. 592-600.

HILLEBRAND, H. 2003. Influence of natural environmental factors on benthic diaton

communities from the Windmill Islands, Antarctica. Phycologia MAPS.

HILLEBRAND, H., WORM, B., LOTZE, H. 2000. "Marine macrobenthic community

structure regulated by nitrogen loading and grazing pressure". Marine Ecology Progress

Series 204: pp. 27-38.

HIRATA, H., ULANOWICZ, R.E., 1985. "Information theoretical analysis of the

aggregation and hierarchical structure of ecological networks". Journal of theoretical

Biology 116: pp. 321-341.

HIXON, M. A., P. DEE BOERSMA, MALCOLM L. HUNTER Jr., FIORENZA

MICHELI, ELLIOTT A. NORSE, HUGH P. POSSINGHAM, PAUL V. R.

SNELGROVE. Ocean at Risk: Research Priorities in Marine Conservation Biology. In

M. E. Soulé and G. H. Orians. Eds. 2001 Conservation Biology: Research Priorities for

the Next Decade. pp. 125-154. Island Press; Washington, D.C.

HOBBIE, J. E., 1 ed. Estuarine Sciences – A Synthetic Approach to Research and

Practice. Washington, DC: Island Press 2000.

HODSON, F. R. Numerical typology and prehistoric archaeology. In F. R. Hodson, D.

G. Kendall, and P. A. Taütu, editors, Mathematics in the Archaeological and Historical

Sciences. University Press, Edinburgh, 1971.

HOLLAND,J. 1975, Adaptation in Natural and Artiticial Systens. University of

Michigam Press.

HOPKINS, C.C.E. 2005. The concept of Ecosystem Health & association with the

Ecosystem approach to Management and related initiatives. ICES

BSRP/HELCOM/ENEP regional Sea Workshop on Baltic Sea Ecosystem Health

Indicators. 30 March-1April 2005. Sopot, Poland.

HOUSTIS, C., NIKOLAOU, C., PATRIKALAKIS, N. “A Coastal Zone Management

System.” Second Meeting of the Monitoring committee for the Euro-Med Co-operation.

Capri, Italy, May 1996.

HOUHOULIS, P.F., MICHENER, W.K., 2000. “Detecting Wetland Change: A Rule-

Based Approach Using NWI and SPOT-XS Data.” Photogrammetric Engineering and

Remote Sensing, 66, 2, 205-211.

HSU, C. N., HUANG, H. J. & WONG, T. T. (2000). Why discretization works for

naïve Bayesian classifiers. Proceedings of the 17th International Conference on

Machine Learning, pp. 309-406.

HSU, C. N., HUANG, H. J. & WONG, T. T. 2003. "Implications of the Dirichlet

assumption for discretization of continuous variables in naïve Bayesian classifiers".

Machine Learning, 53 (3), pp. 235-263.

HUISMAN, J., WEISSINg, F.J. 1999. Biodiversity of plankton by species oscilations

and chaos. Nature 402: pp. 407-410.

HUSTON, M.H. 1994. Biological diversity: the coexistence of species on changing

landscapes. Cambridge University Press, Cambridge.

INTERLAND, S.J., KILHAM, S.S. 2001. "Limiting resources and the regulation of

diversity in phytoplankton communities". Ecology, 85 (5), pp. 1270-1282.

IRIGOIEN, X., HUISMAN, J., HARIS, R.P. 2004. "Global biodiversity patterns of

marine phytoplankton and zooplankton". Nature 429: pp. 863-867.

ISHIBUCHI, H., YAMAMOTO, T., & NAKASHIMA, T. 2001. Fuzzy data mining:

Effect of fuzzy discretization. Proceedings of the 2001 IEEE International Conference

on Data Mining, pp. 241-248.

JAECKLE, W. B. 1994. "Rates of energy consumption and acquisition by lecithotrophic

larvae of Bugula neritina (Bryozoa: Cheilostomata)". Marine Biology 119: pp. 517-523.

JACKSON, J. B. C., KIRB, M. X., BERGER, W. H., BJORNDAL, K. A.,

BOTSFORD, L. W., BOURQUE, B. J. 2001. "Historical overfishing and recent

collapse of coastal ecosystem". Science 293: pp. 629-638.

JAKEMAN, A. J., BECK, M. B., McALEER, M. J. Eds. Modelling Change in

Ecological Systems. Wiley, Chicherster, 1993, 584 p.

JAPKOWICZ, N. Class imbalance: Are we focusing on the right issue? In Proceedings

of the ICML’03 Workshop on Learning from Imbalanced Data Sets, 2003.

JARRETT, J. N., PECHENIK, J. A . 1997. "Temporal Variation in Cyprid Quality and

Juvenile Growth Capacity for an Intertidal Barnacle". Ecology, 78 (5). pp.1262-1265.

JAYALAKSHIMI, G, A., MUTHARASU, D., RAJARAM, S., PANDIYAN, S. G.,

KANNIAPPAN, P., 2000, “An Evolutionary Programming Approach to Evolve the

Architecture of Artificial Neural Networks”.

http://www.ise.nus.edu.sg/proceedings/apros2000/fullpapers/28-06.htm

JOHNS, D. M., 1981a. Physiological studies on Cancer irroratus larvae, I. Effects of

temperature and salinity on survival, developmental rate and size, Marine Ecological

Progress Series, 5, pp. 75.

JOHNS, D. M., 1981b. Physiological studies on Cancer irroratus larvae, II. Effects of

temperature and salinity on survival, physiological performance, Marine Ecological

Progress Series, 6, pp. 309.

JONES, J.L., GOWEN, R. L., TETT, P., 1984, “Water column structure and summer

phytoplankton distribution in the Sound of Jura, Scotland”. J. Exp. Mar. Ecol. v.78,

pp.269-289.

JOSHI, M., KULMAR, V., AGRAWAL, R. Evaluating boosting algorithms to classify

rare classes: Comparison and improvements. In Proceedings of the First IEEE

International Conference on Data Mining, pages 257-264, San Jose, CA, 2001.

KAREM, A. STEIGINGER, L. M. WALKER, 1984. Marine plankton life cycles

strategies. CRC Press, Inc, Boca Raton, Florida, p.93-120.

KARR, J.R., 1981. Assessment of biotic integrity using fish communities. Fisheries 6,

pp. 21-27.

KARR, J. R. “Ecological integrity. Protecting earth’s life support systems.” In

Ecosystem Health, Costanza, R., Norton, B. G., and Haskell, B. D., Eds. Island Press,

Washington, D.C., 1992, pp. 223-238.

KAY, J.J., GRAHAM, L.A., ULANOVICZ, R.E., 1989. A detailed guide to network

analysis. Pp. 51-61 in F. Wulff, J.G. Field, and K. H. Mann. Network Analysis in

Marine Ecology: Methods and Applications. Springer-Verlag, Berlin, 248pp.

KAY, J.J., 1993. On the nature of ecological integrity. In: Ecological integrity and the

management of ecosystem. Pp. 201-212. St. Lucie Press.220 p.

KELLY, J.R., HARWELL< M.A., 1990. Indicators of ecosystem recovery. Environ.

Manage. 14, pp. 527-545.

KERBER, R.1992. Chimerge: Discretization for numeric attributes. Proceedings of 10th

National Conference on Artificial Intelligence, pp. 123-128.

KOHAVI, R. 1995. “A Study Of Cross-Validation and Bootstrap for Accuracy

Estimation and Model Selection”. In: The 1995 International Joint Conference on

Artificial Intelligence, pp. 1137-1145, Quebec, Canada, 20-25 August.

KONDOH, M. 2001. Unifying the relationships of species richness to productivity and

disturbance. Proc. R. Soc. Lond. Ser. B 268, pp. 269-271.

KONDOH, M. 2003. Foraging adaptation and the relationship between food-web

complexity and stability. Science 299: pp. 1388-1391.

KUBAT, M., MATWIN, S. Addressing the curse of imbalanced training sets: One side

selection. In Proceedings of the Fourteenth International Conference on Machine

Learning, pages 179-186, Nashville, Tennessee, 1997. Morgan Kaufmann.

KUTKA, F.J., BACHAMAN, M.D., 1990. Acid sensitivity and water chemistry

correlates of amphibian breeding ponds in northern Wisconsin, USA. Hydrobiologia

208: 153-160.

LANCE, G. N., WILLIAMS, W. T. 1966 A general theory of classificatory sorting

strategies. 1. hierarchical systems. The computer Journal , 9: pp. 373-380.

LEGENDRE, L., DEMERS, S., 1984, “Towards dynamic biological oceanography and

limnology”. Can. J. Fish. Aquat. Sci., v. 41, pp.2-19.

LEIBOLD, M.A. 1996. A graphical model of Keystone predators in food webs: trophic

regulation of abundance, incidence, and diversity patterns in communities. American

Naturalist 134: pp. 922-949.

LEK, S. ,BELAUD, A., DIMOPOULOS, I., LAUGA, J., MOREAU, J., 1995. Improved

estimation, using neural network, of the food consumption of fish populations. Marine

and Freshwater Research 46, pp. 1229-1236.

LEK, S., DELACOSTE, M., BARAN, P., DIMOPULOS, I., LAUGA, J.,

AULAGNIER, S., 1996 a. Application of neural networks to modelling nonlinear

relationships in ecology. Ecological Modelling 90, pp. 39-52.

LEK, S., BELAUD, A, BARAN, P. DIMOPOULOS, DELACOSTE, M., 1996 b. Role

of some environmental variables in trout abundance models using neural networks.

Aquatic Living Resources 9, pp. 23-29.

LEVINE, S. PILOWSKI, I. BOULTON, D. M. 1969 The classification of depression by

numerical taxonomy. The British Journal of Psychiatry, 115: pp. 937-945.

LEVINE, E.R., KIMES, D.S., SIGILLITO, V.G., 1996. Classifying soil structure using

neural networks. Ecological Modelling 92, pp. 101-108.

LEVRAT, E., BOMBARDIER, V., LAMOTTE, M., BREMONT, J. Multi-level image

segmentation using fuzzy clustering and local membership variations detection. In IEEE

International Conference on Fuzzy Systems, pages 221-8. IEEE, New York, 1992..

LEWIS, N.R.; CULLEN, J.J., PLATT, T., 1984, “Relationship between vertical mixing

and photoadaptation of phytoplankton: similarity criteria”. Mar. Ecol. Prog. Ser., v. 10,

pp.1-6.

LIU, B., and HSU, W. “Post-analysis of learned rules.” AAAI-96, pp. 828-834.

LIU, B., HSU, W., CHEN, S., MA, Y. 1998. “Integrating Classification and Association

Rule Mining”, KDD-98, August, New York.

LIU, B., HSU, W., CHEN, S., MA, Y. 2000. “Analyzing the subjective interestingness

of association Rules” IEEE Intelligent Systems, University of Singapore.

LUBCHENCO, J. 1978. Plant species diversity in a marine intertidal community:

importance of herbivore food preferences and algal competitive abilities. American

LÜNNING, K., 1990, Seaweeds their environment, biogeography and ecophysiology.

New York, Wiley-Interscience.

MACCAULL, W.A., PLATT, T., 1977, “Diel variation in the photosynthetic

parameters of costal marine phytoplankton”. Limnol. Oceanogr. V. 22, pp. 723-731.

MACKAY, A., 1981. The generalized inverse. Practical Computing, (Sept.): 108-110.

MACARTHUR, R.H. 1955. Fluctuations of animal populations and a measure of

community stability. Ecology 36: pp. 533-536.

MAESTRINI, S.Y., DROOP, M.R., BONIN, D.J., 1984, Test of algae as indicator of

sea water quality: Prospects, pp 133-188. In L.E. Shubert (ed.), Algae as ecological

indicators, Academic Press, London.

MAKI, J. S., RITTSCHOF, D., MITCHELL, R. 1992. Inhibition of Larval Barnacle

Attachment to Bacterial Film: An Investigation of Physical Properties. Microbial

Ecology, 23: pp. 97-106.

MALONE, T.C. 1971, “Diurnal rhythms in netplankton and nanoplankton assimilation

ratios”. Mar. Biol. V.10, pp. 285-289.

MALONE, T.C., 1977, “Light-Saturated photosynthesis by phytoplankton size fraction

in the New York Bight. USA. Mar. Biol., v. 42, pp. 281-294.

MALOOF, M. Learning when data sets are imbalanced and when costs are unequal and

unknown. In Proceedings of the ICML’03 Workshop on Learning from Imbalanced

Data Sets, 2003.

MANEL, S., DIAS, J.M., PUCKTON, S.T., ORMEROD, S.J., 1999 a. Alternative

methods for predicting species distribution: an illustration within Himalayan river birds.

Journal of Applied Ecology 36, pp. 734-747.

MANEL, S., DIAS, J.M., ORMEROD, S.J., 1999 b. Comparing discriminant analysis,

neural networks and logistic regression for predicting species distribution: a case study

with a Himalayan river bird. Ecological Modelling 120, pp. 337-347.

MAY, R.M., 1972. Will a large complex system be stable? Nature, 238: pp. 413-414.

MENGE, B. A, 1975. Brood or broadcast, the adaptive significance of different

reproductive strategies in the two intertidal seastars Leptasterias hexactis and Pisaster

ochraceus, Marine Biology, 31: pp. 87.

MARGALEF, R., 1978, “Lês types biologiques de phytoplancton consideres comme

dês alternatives de survie dans um milieu instable”, Ocoanol. Acta., v. 1, n. 4, pp. 493-

MARGALEF, R. 1951. Diversidad de especies en las comunidades naturales. Publ. Inst.

Biol. Apl., Barcelona, 9: pp. 15-27.

MARGALEF, R.1958. Temporal succession and spatial heterogeneity in phytoplankton.

In: Perspectives in marine biology, pp. 323-349, Ed. By A. A. Buzzati-Traverso,

California, University Press.

MARTINEZ, N.D. 1991. Artifacts or attributes? Effects of resolution on the Little Rock

Lake food web. Ecol. Monogr 61: pp. 367-392.

MARTINEZ, N.D., HAWKINS, B.A., DAWAH, H., FEIFAREK, B.P. 1999. Effects of

sampling effort on characterization of food-web structure. Nature 410: pp. 1044-1055.

MASTERS, T., 1993. Practical Neural Network Recipes in C++. Academic Press,

Harcout Brace Jovanovich, Publishers. San Diego.

MASTRORILLO, S., LEK, S., DAUBA, E., 1997. Predicting the abundance of minnow

Phoxinus phoxinus (Cyprinidae) in the River Ariège (France) using neural networks.

Aquatic Living Resources 10, 169-176.

MAY, R.M. 1973. Stability and complexity in Model Ecosystems. Princeton University

Press, Princeton.

MAY, R.M. 1972. Will a large complex system be stable? Nature 238: pp. 413-414.

MILGRAM, S. 1967. “The Small World Problem.” Psycology Today, May 1967, pp.

60-67.

MONACO, M.E., ULANOWICZ, R.E., 1997. Comparative Ecosystem Trophic

structure of Three U.S. Mid-Atlantic estuaries. Marine Ecological Progress Series 161:

pp. 239-254.

MONTOYA, J.M., SOLÉ, R.V. 2002. Small world patterns in food webs. J. Theor Biol.

214: pp. 405-412.

MOORE, P. A., WEISSBURG, M. J., PARRISH, J. M., ZIMMER-FAUST, R. K.,

GERHARDT, G. A. 1994. Spatial distribution of odors in simulated benthic boundary

layers flows. Journal of Chemical Ecology, vol. 20, no. 2, pp. 225-279.

MOORE, A.B., MORRIS, K.P., BLACKWELL, G.K., “COAMES – Towards a Coastal

Management Expert System” In Proceedings Ith International Conference on

GeoComputation (University of Leeds, 1996), 2: 629-646.

MOORE, A.B., MORRIS, K.P., BLACKWELL, G.K., JONES, A.R., SIMS, P.C., 2001.

“Using Geomorphological Rules to Classify Photogrammetrically-derived Digital

Elevation Models.” International Journal of Remote Sensing 7: pp. 247-262.

MOREIRA DA SILVA, P. de C., 1968, “O fenômeno da ressurgência na costa

meridional brasileira”. Publicações Inst. Pesq. Mar., v. 24, pp. 1-38.

MOREIRA DA SILVA, P.C., 1971, Fertilization on the sea as a by-product of an

industrial utilization of deep water. In: Fertility of the sea. Costlow,J.D. (ed.). Gordon &

Breach Sci. Publ. New York, Paris, T I,II.

MOREIRA DA SILVA, P. de C., 1973, “A ressurgência de Cabo Frio”. Publicações

Inst. Pesq. Mar. v. 78, pp.1-56

MOYSE, J. 1963. A comparison of the value of various flagellates and diatoms as food

for barnacle larvae. Jounal du Conseil pour l’Exploration de la Mer 28: 175-187.

NAEEM, S., THOMPSON, L.J., LAWLOR, S.P., LAWTON, J.H., WOODFIN, R.M.

1994. Declining biodiversity can alter the performance of ecosystems. Nature 368: pp.

734-737.

NAKASHIMA, T., ARIYAMA, T., ISHIBUCHI, I. 2003, “Extracting Linguistic

Knowledge and Its Use as Decision Support in a Vital Futures Market”, In: Proceedings

of the IEEE International Conference on Fuzzy Systems, pp. 708-713, St. Louis, USA,

25-28 May.

NCR. (National Research Council). 2000. Ecological Indicators for the Nation. National

Academy Press. Washington, DC: 164 pp.

NCSTRL Documentation - http://www.ncstrl.org/Dienst/htdocs/document_menu.html.

National computer Science Technical Report Library, Cornell University.

NIELSEN, N. O. 1999. The meaning of health. Ecosystem Health 5, pp. 65-66.

NIIMI, A., TAZAKI, E. Object oriented approach to combined learning of decision tree

and ADF GP, 1999 International Joint Conference on Neural Networks, Washington

DC, USA, 1999.

NIKOLAOU, C., HOUSTIS, C., SAIRAMESH, J., PATRIKALAKIS, N., “Impact of

Scientific Advanced Networks for Transfer of Knowledge and Technology in the field

of Coastal Zones”, EuroMediterranean Workshop on Coastal Zone Management,

Alexandria, Egypt, November 10-14, 1996.

NIKOLAOU, C., MARAZAKIS, M., PAPADAKIS, D., YEORGIANNAKIS, Y.,

SAIRAMESH, J., “Towards a Common Infrastructure for Large-Scale Distributed

Applications.” First European Conference on Research and advanced Technology for

Digital Libraries, Pisa, Italy, September 1997. URL

http://www.ics.forth.gr/~maraz/euroDL97.ps.

O’CONNOR, R.J., WALLS, T.E., HUGUES, R.M. 2000. Using multiple taxonomic

groups to index the ecological condition of lakes. Environ. Monit. Assess. 61: 207-228.

ODUM, E. 1953. Fundamentals of Ecology. Saunders, Philadelphia.

ODUM, H.T., 1983. System Ecology. Wiley Interscience, New York, 510 p.

OLIVER, F., TREMBLAY, R., BOURGET, E., RITTSCHOF, D. 2000. Barnacle

settlement: field experiments on the influence of larval supply, tidal level, biofilm and

age on Balanus amphitrite cyprids. Marine Ecological Progress Series, Vol. 199: pp.

185-204.

ÖZESMI, S. L., ÖZESMI, U., 1999. An artificial neural network approach to spatial

habitat modelling with interspecific interaction. Ecological Modelling 116 (1), pp. 15-

PACALA, S.W., CRAWLEY, M.J. 1992. Herbivores and plant diversity. American

PAINE, R.T. 1966. Food web complexity and species diversity. American Naturalis,

1000: pp. 65-75.

PAIVA, A.M., 1993, Estudo das variações do nível médio do mar em Arraial do Cabo-

RJ. In.Technical Report IEAPM.18-25.

PARUELLO, J.M., TOMASEL, F., 1997. Prediction of functional characteristics of

ecosystems: a comparison of artificial neural networks and regression models.

Ecological Modelling 98, pp.173-186.

PAUL, J.F., 2003. Development and applying an index of environmental integrity for

the US Mid-Atlantic region. Envieron Manage. 67: 175-185.

PAULY, D., CHRISTENSEN, V., WALTERS, C., 2000. Ecopath, Ecosim, and

Ecospace as tools for evaluating ecosystem impact of fisheries. ICES Journal of Marine

Science, 57: pp. 697-706.

PEDEYCZ, W., GOMIDE, F. 1998. An Introduction to Fuzzy Sets: Analysis and

Design, 1ª ed. Massachussets, MIT Press.

PEREIRA, G. C. 2002, Previsão da Variabilidade dos Fatores Químicos e Biológicos

em Área de Ressurgência da Arraial do Cabo através de Redes Neurais. (Rio de Janeiro

– Brasil). Tese de Mestrado, Universidade Federal do Rio de Janeiro – COPPE, RJ –

Brasil

PEREIRA, G. C., COUTINHO, R., EBECKEN, N.F.F. 2002. Biological response

neural network prediction in coastal upwelling field. Oil and Hydrocarbon Spill III,

Modelling and Analysis Control Series: Water Studies. v.1, Wit Press, ISBN 1-85312-

922-4 Rhods, Greece , pp. 301-310, September 22-24.

PEREIRA, G.C., BONOMO, A., EBECKEN, N.F.F. 2004. Neural network based

model to flow cytometric data interpretation. The 2004 European Simulation and

Modelling Conference. 25-27 october, Eurosis publications pp 143-147. ISBN 90-

77381-14-7.

PERSHING, A.J., GREENE, C.H., JOSSI, L., O’BRIEN, L., BRODZIAK, J.K.T.,

BAILEY, B.A., 2004. “Interdecadal variability in the Gulf of Maine zooplankton

community with potential impacts on fish recruitment.” (submitted to ICES J. Mar.

Sci.).

PERSON, K. 1901. On lines and planes of closest fit to systems of points in space.

Philosophical Magazine, Sixth Series 2: pp. 559-572.

PIATESKI-SHAPIRO, G., MATHEUS, C. “The interestingness of deviations.”KDD-

94, 1994.

PIELOU, E.C. 1966. The measure of diversity in different types of biological

collections. J. Theor. Biol., 13: pp. 133-144.

PIMM, S.L., LAWTON, J.H., COHEN, J. 1991. Food web patterns and their

consequences. Nature 350: pp.669-674.

POFF, N.L., TOKAR, S., JOHNSON, P., 1996. Stream hydrological and ecological

responses to climate change assessed with an artificial neural network. Limnology and

Oceanography 41, pp. 857-863.

POLOVINA, J.J., 1984. Model of a coral reef ecosystem. I: the ECOPATH model and

its application to French Frigate Schoals. Coral Reefs, 3: pp. 1-11.

POURVAKHSHOURI, S.Z., MANSOR, S., 2003. Decision support system in oil spill

cases (literature review) Disaster Prevention and Management, Vol. 12, no. 3, pp. 217-

PROVASALI, L., 1963, Organic regulation of phytoplankton fertility, In M. M. Hill

(ed.) The Sea, Vol. 2, Intersc. Publish., New York.

PROULX, M., MAZUMDER, A. 1998. Reversal of grazing impact on plant species

richness in nutrient-poor vs. nutrient-rich ecosystems. Ecology 79: pp. 2581-2592.

PUNJ, G., STEWART, D. W. 1983 Cluster analysis in marketing research: Review and

suggestions for applications. Journal of Marketing Research, 20: pp. 134-48.

PYLE D., 1999, Data Preparation for Data Mining, Morgan Kaufmann Publishers, Inc.

San Francisco, California.

QUINLAN, R. C4.5: program for machine learning. Morgan Kaufmann, 1992.

RAHEL, F.J., 2000. homogenization of fish faunas across the United States. Science

288: 854- 856.

RAPPORT, D. J. State of Canada’s Environment. Environment Canada, Ottawa, ON,

RAY, G. C., McCORMICK-RAY, J. 2004. Coastal-marine Conservation: Science and

Policy. Malden, MA: Blackwell Publishing.

RECKNAGEL, F., FRENCH, M., HARKONEN, P., YABUNAKA, K., 1997. Artificial

neural network approach for modelling and prediction of algal blooms. Ecological

Modelling 96, pp. 11-28.

REICH, Y., FENVES, S. The formation and use of abstract concepts in design. In D.

Fisher, M. Pazzani, and P. Langley, editors, Concept Formation: Knowledge and

Experience in Unsupervised Learning, pages 323-54. Morgan Kaufmann, San Mateo,

California, 1991.

REINHARDT, E., WRIGHT, A H., JACKSON, D.H., 1989. An advisory expert system

for designing fire prescriptions. Ecological Modelling 46, pp. 121-133.

RICHARD, A., WICHERN, DEAN and J. Applied Multivariate Statistical Analysis.

Prentice Hall, New Jersey, third edition, 1992.

RITCHIE, J.R., 1989. An expert system for a rangeland simulation model. Ecological

Modelling 46, pp. 91-105.

ROBINSON, S.K., THOMPSON III, F.R., DONOVAN, T.M., WHITEHEAD, D.R.,

FAABORG, J., 1995. Regional forest fragmentation and the nesting success of

migratory birds. Science 267: pp. 1987-1990.

RODRIGUEZ, E. G., 1991, “A ressurgência de Cabo Frio (RJ, Brasil): Fertilidade e

fatores nutricionais limitantes da biomassa fitoplanctônica”. Rev. Brasil. Biol., v.51, n.2,

pp. 471-486.

RODRIGUEZ, E. G., 1994, “Yearly variation in primary productivity of marine

phytoplankton from Cabo Frio (RJ, Brazil) region”. Hydrobiologia, n. 294, pp. 145-156.

RODRIGUEZ, E. G., TENEBAUM, D. R., 1995, “Variação diurna da capacidade

fotossintética do fitoplânctom de Cabo Frio (RJ, Brasil)” Acta Biológica Leopoldina, v.

17, n.1, pp. 35-52.

RODRIGUEZ, E. G., VALANTIN, J.L., ANDRÉ, D.L., JACOB, S.A., 1992,

“Upwelling and downwelling at Cabo Frio (Brazil): Comparison of biomass and

primary production responses”. Journal of Plankton Research., v. 14, n. 2, pp. 289-306.

ROSENZWEIG, M.L. 1971. Paradox of enrichment: destabilization of exploration

ecosystems in ecological time. Science, 171: pp. 385-387.

ROSENZWEIG, M.L., ABRAMSKY, Z. 1993. How are diversity and productivity

related? Pp. 51-65 In R. E. Ricklefs and D. Schluter, eds. Species diversity in ecological

communities: historical and geographical perspectives. University of Chicago Press,

Chicago.

ROTHSCHILD, B.J. 1988. Toward a Theory on Biological-Physical Interactions in the

World Ocean, Series C: Mathematical and Physical Sciences, vol. 239, 650 pp., Kluwer

academic Publishers, The Netherlands.

RUMELHART, D.E.; HILTON, G.E., WILLIANS, R.J., 1986. “Learning

representations by back-propagation error”. Nature, v. 323, pp. 533-536.

RUNGE, J.A., FRANKS, P.J.S., GENTLEMAN, W.C., MEGREY, B.A., ROSE, K.A.,

WERNER, F.E., ZAKARDJIAN, B., 2004. “Diagnosis and prediction of variability in

secondary production and fish recruitment processes: developments in physical-

biological modelling.” The Sea. Vol. 13: The Global Coastal Ocean: Multi-Scale

Interdisciplinary Processes. A. R. Robinson and K. Brinks, eds. Havard Univ. Press.

RYKIEL, E.J., 1989. Artificial intelligence and expert system in ecology and natural

resource management. Ecological Modelling 46, pp. 3-8.

RYTHER, J.H., GUILLARD, R.R.L., 1959, “Enrichment experiments as a means of

studying nutrients limiting to phytoplankton production”. Deep Sea Res., v. 6, pp. 65-

SANTOS, D.P., 1996, Distribuição espacial e temporal de propágulos de macroalgas

marinhas e sua relação com o recrutamento no costão na região de Arraial do Cabo e

adjacências. Tese de D.Sc., Universidade de São Paulo, S.P., Brasil.

SATSMADJIS, J., 1982. Analysis of benthic fauna and measurement of pollution.

Revue Internationale Oceanographie Medicale 66-67, pp. 103-107.

SCARDI, M., 1996. Artificial Neural Networks as empirical models for estimating

phytoplankton production. Marine Ecological Progress Series 139, pp. 289-299.

SCIENCE 1999. special issue, Vol. 284, no. 5411,

(http://www.sciencemag.org/content/vol284/issue5411).

SHANNON, L.J., CURY, P.M., JARRE, A., 2000. Modelling effects of fishing in the

Southern Benguela ecosystem. ICES Journal of Marine Science, 57: pp. 720-722.

SHERMAN, K. 2000 Why regional coastal monitoring for assessment of ecosystem

health? Ecosystem Health 6, pp. 205-216.

SILBERSCHATS, A , TUZHILIN, A “What makes patterns interesting in knowledge

Discovery systems.” IEEE Trans. On KNOW. And Data Eng. 8 (6), 1996, pp.970-974.

SIMBERLOFF, D., 1997. Flagship, umbrellas, and Keystones: is single species

management passé in the landscape era? Biol. Conservation 83, pp. 247-257.

SKINNER, L.F., COUTINHO, R., 2002. Preliminary results on settlement of the

barnacles Tetraclita stalactifera and Chthamalus bisinuatus on a Brazilian tropical

rocky shore under upwelling conditions. Invertebrate Reproduction and Development,

41:1-3, pp. 151-156.

SMAYDA, T.J., 1970, “Growth potential Bioassay of water masses using diatoms

culture. Phosphorescent Bay (Puerto Rico) and Caribbean waters”. Helgoland. Wiss.

Meeresunters., v. 20, pp. 172-194.

SMAYDA, T.J., REYNOLDS, C.S., 2001. Community assembly in marine

Phytoplankton: Application of Recent Models to Harmful Dinoflagellate Blooms.

Journal of Plankton Research vol. 23, no. 5, pp. 447-461.

SMILEY, B., THOMAS, D., DUVALL, W., EADE, A. State of the Environmental

Reporting. Selecting Indicators of Marine Ecosystem Health: A Conceptual Framework

and an Operational Procedure. Environment Canada, Occasional report series no. 9,

Environment Canada, Ottawa, ON, 1998, 33 p.

SMITH, J.C.. PLATT, T., LI, W.K.W., HORNE, E. P. W., HARRISON, W. G.,

SUBBA, RAO, D.W., IRWIN, D. W., 1985, “Artic marine photoautotrophic

picoplankton. Mar. Ecol. Prog. Ser., v. 20, pp. 207-220.

SOLÉ, R.V., MONTOYA, J.M. 2001. Complexity and fragility in ecological networks.

Proc. R Soc. Lond. B 268: pp. 2039-2045.

SOLORZANO, L., STICKLAND, J.D.H, 1968, “Polyphosphate in sea waters”. Limnol.

Oceanogr., v. 13, pp. 515-518.

SOMMER, U. 1999. The impact of herbivore type and grazing pressure on benthic

microalgal diversity. Ecol. Lett. 2: pp. 65-69.

SOKAL, R. R., SNEATH, H. A. Principles of numerical taxonomy. W. H. Freeman,

San Francisco, 1963.

SORENSEN, T. 1948. A method of establishing groups of equal amplitude in plant

sociology based on similarity of species content and application to analyses of

vegetation on Danish commons. Biol. Skr, 5: pp. 1-34.

SPEARMAN, C. 1904. “general Intelligence”, objectively determined and measured.

American Journal of Phycology,15: pp. 201-293.

SRIKANT, R. and ARRAWAL, R. “Mining generalized associations rules.” VLDB-95,

STARFIELD, A M., FARM, B.P., TAYLOR, R.H., 1989. A rule-based ecological

model for the management of an estuarine lake. Ecological Modelling 46, pp. 107-119.

STEINER, C.F. 2001. Effects of prey heterogeneity and consumer identity on the

limitation of trophic-level biomass. Ecology 82: pp. 2495-2506.

STERNER, R.W., ELSER, J.J. 2002. Ecological stoichiometry: the biology of elements

from molecules to the biosphere. Princeton University Press.

STICHLAND, J.D.H., PARSONS, T. R., 1968, “A practical handbook of sea water”. J.

Fish. Res. Bd. Can. Bull., v. 167, pp. 311.

STONEBRAKER, M., CHEN, J., NATHAN, N., PAXTON, C., WU, J., “Tioga:

Providing Data Management Support for Scientific Visualization Applications.” In R.

Agrawal, S. Baker, D. Bell (Eds.), Palo Alto, California, Morgan Kaufmann Publishers

STROGATZ, S.H. 2001. Exploring complex networks. Nature 410: pp. 268-276.

TAKAHASHI, M.,BIEFANG, P. K., 1983, “Size structure of phytoplankton biomass

and photosynthesis in subtropical Hawaii”. Mar. Biol., v.76, pp. 203-211.

TAMBURRI, M. N., ZIMMER-FAUST, R. K., TAMPLIN, M. L. 1992. Natural

Sources and Properties of Chemical Inducers Mediating Settlement of Oyster Larvae: A

Re-examination. Bioll. Bull. 183: pp. 327-338.

TAN, S. S., SMEINS, F.E., 1996. Predicting grassland communities changes with an

artificial neural network model. Ecological Modelling 84, pp. 91-97.

TILMAN, D., REICH< P.B., KNOPS, J., WEDIN, D., MIELKE, T., LEHMAN, C.

2001. Diversity and productivity in a long-term grassland experiment. Science 294: pp.

843-845.

TUHILL, G. S. Knowledge engineering : concepts and practices for knowledge-based

systems. Tab Books Inc., 1989.

ULANOWICZ, R.E., 1986. Growth and development: ecosystem phenomenology.

Springer-Verlag, New York. 203 p.

VALANTIN, J.L., 1974, O plâncton na ressurgência de Cabo Frio (Brasil). II

Primeiras observações sobre a estrutura física, química e biológica das águas da

estação fixa (período 04/02 a 16/04/73). Inst. Pesq. Mar. Rio de Janeiro.

VALANTIN, J.L., MOREIRA, A.P., 1978, “A matéria orgânica de origem

zooplanctônica nas águas de ressurgência de Cabo Frio. (Brazil)”. Nac. Acad. Brás.

Ciênc., Rio de Janeiro, v. 50, n.1,pp.103-112.

VALANTIN, J.L., ANDRÉ, D.L., JACOB, S.A., 1987, “Hydrobiology in Cabo Frio

(Brazil) upwelling: two-dimensional structure and variability during a wind cycle”.

Continental Shelf Research. v. 7, n. 1, pp. 77-88.

VALANTIN, J.L., 1988, A dinâmica do plâncton na ressurgência de Cabo Frio-RJ.

Inst. Pesqui. Mar., Rio de Janeiro. Coletânea de trabalhos, In: F.P. Brandini (editor)

Memórias de III EBP Curitiba, 1989.

VALANTIN, J.L., COUTINHO, R., 1990, “Modelling maximum chlorophyll in the

Cabo Frio (Brazil) upwelling: a preliminary approach”. Ecol. Modelling., v. 52, pp.

103-113.

VALANTIN, J.L., MACEDO-SAIDAH, F.E., TENENBAUM, D.R., SILVA, N.M.L.,

1991. A diversidade específica para a análise das sucessões fitoplanctônicas, aplicação

ao ecossistema da ressurgência de Cabo Frio (RJ). Nerítica, Curitiba, n 6 (1-2), pp. 7-26.

editora UFPR.

VANDERMEULEN, H. The development of marine indicators for coastal zone

management. Ocean Coast. Manage. 39, 63-71, 1998.

VARIELLA, I., 1994, Marine Ecological Process, Spring Verlag.

VISA, S., RALESCU, A. Learning imbalanced and overlapping classes using fuzzy

sets. In Proceedings of the ICML’03 Workshop on Learning from Imbalanced Data

Sets, 2003.

VRML. Virtual Reality Modeling Language – http://hiwaay.net/~crispen/vrml/fag.html

WALTERS, C., 1996. Suggested improvements for Ecopath modeling. In Mass-Balance

Models of North-Eastern Pacific Ecosystem, pp. 82-86. Ed. D. Pauly and V.

Christensen. Fisheries Center Research Reports 4(1).

WARD, J. H. Hierarquical grouping to optimize an objective function. Journal of the

American Statistical Association, 58: 236-244, 1963.

WATTS, D., STROGATZ, S. 1998, “Collective dynamics of small-world networks.”

Nature 393: pp. 440-442.

WEISS, G. Mining with rarity: A unifying framework. SIGKD Explorations, 6(1): 7-19,

WEISS, S.M., KULIKOWSKI, C.A., 1984. A Practical Guide to Designing Expert

Systems. Rowman and Allenheld: Totawa NJ.

WEST, T. L., J. D. COSTLOW, 1987. Size regulation in the crustacean Balanus

eburneus (Cirripedia: Thoracica). Marine Biology 96: pp. 47-58.

WHITTIER, T. R., PAULSEN, S.G., LARSEN, D.P., PETERSON, S.A., HERLIHY,

A.T., KAUFMANN, P.R. 2002. Indicators of ecological stress and their extent in the

population of northeastern lakes: a regional assessment. BioScience 52: 2pp. 35-247.

WIECZOREK, S. K., TOOD, C. D., 1998. Biofilm cues and larval settlement.

Biofouling 12: 81-118.

WINEMILLER, K.O. 1990. Spatial and temporal variation in fish trophic networks.

Ecol. Monogr. 60: pp. 331-367.

WIKIPEDIA ENCYCLOPEDIA 2005. http://em.wikipedia.org/wiki/Complex_system

WILLIAMS, R.J., BERLOW, E.L., DUNNE, J.A., BARABÁSI, A.L., MARTINEZ,

N.D. 2001. Two degree of separation in complex food webs. Santa Fe Institute Working

Paper 01-07-036.

WILSON, E.O. 2003. What is nature whorth? In Allem J.L., ed. Annual editions:

Environment 03 / 04. Gilford, C.T: McGrow-Hill/Dushkin. Pp. 121-130.

WOLLENWEIDER, R. A., GIOVANARDI, F., MONTANARI, G., RINALDI, A.

1998. Characterization of trophic conditions of marine coastal waters with special

reference to the NW Adriatic Sea: proposal for a trophic scale, turbidity and generalized

water quality index. Environmetrics 9, pp. 329-357.

WOODRUFF, A.G. 1994. “GIPSY: Geo-referenced Information Processing System,”

Journal of the American society for Information Science, 45, pp. 645-655.

WOODRUFF, A.G., Automated Geographic Indexing of Text Documents (sequoia

2000 technical Report 94/41). Berkeley, Cal, University of California, EECS, 1994.

WORM, B.H., LOTZE, H., HILLEBRAND, H., SOMMER, U. 2002. Consumer versus

resource control of species diversity and ecosystem fuctioning. Nature 417: pp. 848-

WU, X. 1999. Fuzzy interpretation of discretized intervals. IEEE Transactions on Fuzzy

Systems, 7 (6), pp. 753-759.

YANG, Y. & WEBB, G. I. 2002. Non-disjoint discretization for naïve Bayes classifiers.

Proceedings of the 19th International Conference on Machine Learning, pp. 666-673.

YANG, Y. & WEBB, G. I. 2004. Discretization for naïve-Bayes learning: Managing

discretization bias and variance.

YAO, X. 1993 A review of evolutionary artificial neural networks. International

Journal of Intelligent Systems. 8(4): pp. 539-577.

YODZIS, P., WINEMILLER, K.O., 1999. In search of operational trophospecies in a

tropical aquatic food web. Oikos 87: pp. 327-340.

YONESHIGUE, Y., 1985, Taxonomie et écologie des algues marines dans la région de

Cabo Frio (Rio de Janeiro, Brésil). Ph.D. dissertation, Université de Marseille, France.

ZADEH, L. A. 1973 Outline of a new approach to the analysis of complex systems and

decision processes. IEEE Transactions on Systems, and Cybernetics,3(1): pp. 28-44.

APÊNDICE

Questionário aplicado aos especialistas entrevistados:

1) Como funciona a ressurgência no universo dos dados disponíveis?

2) Quais as relações existentes entre clorofila e as larvas meroplanctônicas?

3) Pode existir alguma relação entre fatores físicos e as larvas (temperatura,

salinidade pH, etc.)? Explique dando exemplos se possível.

4) Pode existir alguma relação entre concentração de nutrientes e larvas? Explique.

5) Na sua opinião, como se dão as relações entre os diversos tipos de larvas?

Existe alguma predominância em relação a presença de algumas espécies em

conseqüência de diferentes condições ambientais, coexistência, competição, ou

alguma alternância de padrões em relação as massas d’águas, etc.

6) Gostaria de acrescentar algo que você acha ser relevante que não tenha sido

perguntado?

Segue-se com a entrevista do Dr. Ricardo Coutinho, pesquisador do IEAPM e

responsável pelo setor de bioincrustação.

R1) O Dr. Ricardo Coutinho acha que no local em que são coletados as amostras para se

obter os dados ocorre muito pouca ressurgência e que considerando-se que esta é

caracterizada por águas com temperaturas abaixo 18 C°, constitui fenômeno raro.

Segue dizendo que por ser um local de pouca profundidade (5 ou 6 metros) a coluna

d’água é homogênea e que quando se observa alguma estratificação se deve à

penetração de águas de ressurgência através do canal do “boqueirão”. Sendo assim, o

comum é ter águas de origem de ressurgência que sofreram algum aquecimento mas

apresentam claramente características em termos de salinidade e nutrientes de água de

ressurgência. Estes parâmetros são mais conservativos.

R2) As águas de ressurgência (ou as “águas esquentadas”) são normalmente

caracterizadas por níveis mais elevados de nutrientes, então, inicialmente não se verifica

uma alta produção de clorofila. Quando se analisa águas de superfície com 16 ou 17

graus, verifica-se baixos valores de clorofila, a produção somente ocorre depois que o

fitoplâncton “chega” a superfície e aí começa o crescimento que pode durar um dois ou

quatro dias dependendo da intensidade da ressurgência. O local estudado por ser

“parado”, pode apresentar alguns valores mais altos de clorofila mas, na verdade, veio

do lado de fora da ilha e penetrou ali com a massa d’água.

Entrevistador – Então, na sua opinião, a produção primária não ocorre no ponto de

coleta dos dados e sim originada noutro local?

Ricardo – Sim, ela é oriunda de outro local.

Entrevistador – E a relação entre as larvas meroplanctônicas e essa clorofila?

Ricardo – Normalmente essa relação depende da espécie. Algumas delas possuem um

ciclo de desenvolvimento no plâncton muito rápido, ascídias por exemplo, neste caso

não há uma relação direta pois já tem seu conteúdo alimentar dentro dela mesma e então

não precisa da clorofila, pode-se dizer que não é uma larva herbívora. Já as larvas de

cirripédios, demonstram intensa atividade de filtração durante seu longo período de

permanência no plâncton (dois meses), sendo assim, pode-se atribuir que maiores

concentrações de clorofila podem acelerar o seu desenvolvimento (seis estádios) até

chegar a fase de cipris. Normalmente, apenas as formas naupliares se alimentam no

plâncton, o cipris já passou por essas fases de metamorfose e não se alimenta mais no

plâncton.

Entrevistador – Já é uma pré-competência?

Ricardo – É uma pré-competência, então não tem tanta relação de alimentação quanto se

tem na fase de nauplios.

Entrevistador – As larvas coletadas no local estudado também viriam de outros locais

junto com essa produção primária que segundo o senhor é oriunda de outros locais?

Ricardo – Não, essas larvas vem dos costões rochosos, são larvas de organismos

bentônicos que são liberadas ali mesmo nas imediações. Em sistemas mais dinâmicos,

as larvas vem de várias fontes, em sistemas mais estáveis, enseadas como no caso em

questão, as larvas vem mais localizadas. No local estudado tem-se correntes muito

atuantes, então as larvas viriam pelos dois processos inclusive empurradas pelo vento já

que ocorrem junto a superfície, neste caso pode-se ter um acumulo de larvas que não é

decorrente da produção local e sim de outros locais.

Entrevistador – A concentração de larvas é então devido a fatores físicos?

Ricardo – Exatamente, fatores físicos e não biológicos.

Entrevistador – E quanto as interações? Existe alguma exclusão por tamanho em

relação ao alimento, já que o ponto de amostragem encontra-se em zona muito nerítica,

muito perto de uma praia, portanto com possível dominância de populações de

diatomáceas

Ricardo – Não.

Entrevistador – Melhor dizendo, pode-se ter uma dominância de algumas populações de

larvas devido a diferentes composições das populações fitoplanctônicas?

Ricardo – Não, não, as larvas não são seletivas neste nível.

Entrevistador – Bem, falando agora dos nutrientes químicos, o senhor acha que existem

relações entre os nutrientes e as larvas? Uma vez que as larvas estão inseridas num

contexto de massas d’água em que as condições do habitat apresentam diferentes

concentrações de diferentes nutrientes, teriam alguma preferência por determinadas

características ambientais ou não?

Ricardo – Bem, se você tivesse um sistema em que as massas d’águas fossem bem

separadas, bem distintas, poder-se-ia ter uma caracterização direta entre o fito e a

produção planctônica e as larvas no caso da ressurgência ... quando se tem muita

clorofila, uma maior produção de fitoplâncton, vai ter depois uma maior de larvas, o que

se tem mesmo de produção está na realidade relacionado com o zooplancton e não tão

diretamente com o merozooplancton, é importante distinguir. O meroplancton (larvas),

é liberado de acordo com outros fatores, pode estar influenciado principalmente pela

temperatura então, águas com altos níveis de clorofila derivadas de águas com altos

níveis de nutrientes podem aumentar processo de liberação de larvas e seu

desenvolvimento das larvas.

Entrevistador – Então a que fator o senhor atribui uma maior concentração de larvas?

Ricardo – à desova influenciada pela temperatura e alimentação.

Entrevistador – Durante quanto tempo pode ocorrer esta desova?

Ricardo – O organismo adulto pode ficar desovando durante uma semana, dependendo

da maré. Após a maré baixa, quando se tem a maré alta as larvas são liberadas por

causa de um tipo de ... não é bem um estresse, tem-se um tipo de modificação para que

isso ocorra.

Entrevistador – Na sua opinião, como se dão as relações entre os diversos tipos de

larvas, quero dizer, existe predominância de um tipo em relação a outros, são

competidoras, coexistem, compartilham ou fragmentam o nicho ecológico? O senhor já

detectou algum tipo de padrão de curto ou longo prazo?

Ricardo – É difícil dizer, porque existem níveis de saturação diferentes para cada

espécie então, uma espécie que tenha saturação de um determinado fator pode estar

limitada por isso e não limitada por outro como por exemplo, o tipo de alimento, então a

combinação destes vários fatores limitantes é que possibilita a coexistência. Uma larva

poderia comer tudo e não sobrar nada para outra, só que ela normalmente reduz o

alimento naquilo que é mais limitante para ela mesma e não para a outra.

Entrevistador – Então ela é seletiva!

Ricardo – É seletiva no sentido de reduzir o fator em que se ela reduzir muito ela

própria vai morrer, e não no que a outra vai comer, por isso ela não exerce uma

competição de exclusão mas sim de um equilíbrio estável dependendo da situação, com

a renovação das águas é o que acontece. Então a presença de uma larva, a não ser em

caso de exclusão competitiva, não necessariamente deveria estar associado a presença

de outra. A não ser que possuam exigências fisiológicas semelhantes de existência.

Entrevistador – Na sua opinião, no ponto de amostragem, pode ocorrer valores baixos

de oxigênio dissolvido devido a grande mortalidade de fitoplâncton?

Ricardo – Se for em grande escala, poderia afetar sim.

Segue-se agora com a entrevista da Dra. Vanda Maria Cordeiro Ribas pesquisadora do

IEAPM há trinta anos.

R1) Vanda - O afloramento das águas frias da ACAS se dá por causa principalmente do

vento nordeste que afasta da costa a Corrente do Brasil e da pequena faixa de

plataforma continental que aqui em Cabo Frio é muito próxima da linha costeira. Os

nutrientes então darão a possibilidade de maior florescimento algal, alimento

conseqüentemente a proliferação de animais numa seqüência primeira de herbívoros

principalmente os copépodos que são os mais abundantes aparecem em grandes

quantidades.

Entrevistador – Você fala de copépodos mas quanto aos decapodas meroplanctônicos?

Vanda – Neste caso refere-se as larvas de siris, carangueijos e camarões também,

especificamente é mais complicado, porque tem um grande número de espécies que

estão desovando durante o período, não é só no período de ressurgência, porque

depende da espécie que se esteja considerando. Por exemplo, se está-se focando uma

larva abundante como as de cirripédios, existem várias espécies desse grupo como

também diversas espécies de mitilideos, então, quando não se esta em nível específico

fica complicado para determinar a massa d’água com a abundância desses organismos.

Isso vem acompanhado de um número enorme desde foraminíferos,que são

protozoários, hidromeduzas, cnidários, várias larvas.

Entrevistador – Na sua opinião, você acha então que não se deve trabalhar com níveis

taxonômicos muito elevados, por exemplo, acima de família em um programa de

monitoramento ambiental?

Vanda – Acho que não, populações ó podem ser determinadas por espécies.

Entrevistador – Quais as relações existentes entre massas d’águas e clorofila ?

Vanda – Se a massa d’água tem mais nutrientes a clorofila vai ter de aumentar de modo

geral.

Entrevistador – A clorofila demora muito a responder a um aumento de nutrientes?

Vanda – Não, a coisa é quase imediata, mais ou menos uma hora, mas é muito variável

porque cada espécie tem seu próprio tempo de resposta.

Entrevistador – Então a clorofila é um conjunto de populações? Talves para se

monitorar as larvas a clorofila não seria uma boa estratégia porque as larvas são

seletivas o nível de alimento ?

Vanda – É, dentro dessas populações (de larvas) tem tamanhos diferentes de absorção

de partículas que estão no meio, quando se extrai a clorofila não se tem indicação a

quem pertence este pigmento e não se pode relacionar com os animais que ali estavam

presentes. Existem trabalhos que medem o tamanho da “boca” do copépodo para poder

dizer que tamanho de partícula ele pode ingerir.

Entrevistador – Então, refrindo-se as larvas meroplanctônicas você acha que podem

existir situações de exclusão alimentar devido a diferenças de tamanhos de alimento ?

Vanda – Acho que sim, se você se baseia pelo tamanho do orifício de absorção ou

“boca” o tamanho do alimento tem de variar.

Entrevistador – Essas larvas são seletivas pelo alimento ao nível de espécie e condições

nutricionais ?

Vanda – Sim eu acho.

Entrevistador –. Você quer dizer que elas pastam em algumas espécies e não em outras?

Vanda – Sim, elas podem selecionar e isto está relacionado ao tamanho, dependendo do

tamanho ela vai ingerir.

Entrevistador – A ocorrência das larvas meroplactônicas no ponto de amostragem é em

sua opinião oriundas de desovas de organismos adultos do próprio costão rochoso da

ilha ou vem de outros lugares ?

Vanda – Tem da ilha e tem da massa d’água que entra ali.

Entrevistador – As larvas são sensíveis as condições físicas e químicas da água, podem

ser seletivas as características do habitat ?

Vanda – Não tenho experiência quanto a esta questão especificamente então, não

saberia responder.

Entrevistador – E sobre possíveis relações entre as diversas populações de larvas, elas

competem entre si ?

Vanda – Não sei dizer se competem a ponto de impedir o desenvolvimento de outra de

grupos diferentes. Mas é claro que competem por alimento, vão competir, no

ecossistema existe isso, mas não sei se uma que seja maioria exerce uma exclusão

competitiva, acho que tudo tem um equilíbrio. A própria especificidade pelo alimento

propicia a coexistência.

Entrevistador – Você já notou se existem diferentes composições de populações de

larvas em diferentes massas d’águas ?

Vanda – É, pode ser, quando você tem uma região costeira, na região oceânica elas são

muito poucas, na ACAS tem menos, eu acho que a água fria nem tanto proporciona uma

desova tão grande. A maioria delas são de águas mais quentes. Eu acho que a ACAS

não tem muitas larvas.

Entrevistador – E quanto a salinidade e o oxigênio?

Vanda – Na Corrente do Brasil a salinidade é mais alta e tem mais matéria orgânica que

as larvas também se alimentam.

Larvas também comem matéria orgânica ?

Vanda – Ah!, tudo que estiver fragmentado elas filtram, então elas comem, pode não ser

o alimento preferido...

Entrevistador – Briozoário é sorte de pegar na amostragem ?

Vanda – É, o ciclo de vida é muito rápido, 15 min., o não aparecer não quer dizer que

não existe, é nós que não pegamos.

Segue-se com a entrevista com o Dr. Jean Louis Valatim atualmente professor

de biologia marinha da UJRJ e pesquisador aposentado IEAPM.

Entrevistador – Professor, como funciona a ressurgência de arraial do Cabo e quais suas

implicações biológicas ?

Jean – Lá em Cabo Frio o aspecto mais importante é o vento nordeste que é sazonal e

ocorre principalmente durante o verão, por causa da conformação da costa há uma

divergência da Corrente do Brasil. A conseqüência é a entrada de energia mineral

provocando uma produção primária e a cadeia alimentar.

Entrevistador – O senhor conseguiria me descrever em formas de regras quais nutrientes

estão relacionados com a clorofila ?

Jean – Ah! Sim, nitrato e fosfato, toda a produção primária é devido a entrada desses

dois nutrientes.

Entrevistador – Qual a relação entre as larvas meroplanctônicas e a clorofila ?

Jean – A clorofila é a expressão do fitoplancton e as larvas comem fitoplancton. Quanto

mais clorofila tiver mais fitoplancton ter e mais herbívoro também.

Entrevistador – Poderia me dizer alguma relação que possa existir entre as larvas e

fatores físicos ?

Jean – A salinidade influencia as larvas mas na ilha não tem rios por perto então a

influência não é marcante. Você me diz que o seu maior valor de Ph é de 10.4 o que eu

acho que é um dado errado, mas o Ph também exerce influências nas larvas.

Entrevistador – E quanto a concentração de oxigênio, esta variável apresenta um único

valor de 1,32, também seria um valor que está errado ou isso pode realmente acontecer

Jean – Pode sim, se tiver uma de grande produção. Você está trabalhando num lugar

que é na realidade um micro-habitat devido as características locais.

Entrevistador – O senhor poderia me dizer algo sobre o nitrito ? Minhas análises

demonstram sempre uma maior significância desta em relação ao nitrato e a amônia ?

Jean – O nitrito aparece normalmente muito baixo ou quando tem muita matéria

orgânica e é um produto da transformação da amônia para o nitrato pelas bactérias. A

via normal é de matéria orgânica para amônia seguido-se do nitrito e depois o nitrato

mas os picos de concentração não aparecem simultâneos existe uma defasagem.

Segue-se com a entrevista com a bióloga Jurema Trindade Quintanilha que

trabalha no IEAPM a 15 anos e uma das principais pesquisadoras que contam as

amostra.

Entrevistador – O que a senhora poderia me destacar como sendo importante no seu

trabalho de contagens das amostras e das larvas ?

Jurema – O que posso citar é que eu não consigo encontrar sazonalidade nos resultados

encontrados como alguns de meus colegas afirmam.

Entrevistador – Seu trabalho é fundamentalmente o de identificação e contagem das

larvas, então a senhora poderia me dizer se existe qual espécie é normalmente a mais

abundante ?

Jurema – Normalmente a mais abundante são as larvas de cirripédia, quando ela ocorre

junto com as outras é a mais abundante. Mas tem amostras que eu não acho essas

larvas.

Entrevistador – A que você atribui este fato ?

Jurema – A fatores físico-químicos da água ou a época do ano, o que está acontecendo

no meio ambiente entendeu! Tem períodos que ocorre muitos salpas ou ctenóforos e

quando isso ocorre a gente não consegue encontrar larvas nas amostras.

Entrevistador – Você acha que as salpas e os ctenóforos comem as larvas ?

Jurema – Podem comer – Fabiana, outra pesquisadora concorda pois são filtradores e

predadores e que a presença destes dois está ligada a temperaturas mais frias, Jurena

acena confirmando também.

Segue-se com a entrevista de Fabiana Figueiredo Silva pesquisadora do IEAPM

que trabalha na identificação e contagem de plâncton.

Entrevistador – Fabiana, como funciona a ressurgência no seu entender ?

Fabiana – ocorre devido a uma topografia especial da costa e do vento nordeste que faz

as águas da corrente do Brasil derivarem para alto mar e o afloramento da ACAS que

aumenta a concentração de nutrientes.

Entrevistador – Você poderia me dizer alguma relação existente entre as massas d’água,

nutrientes e a clorofila ?

Fabiana – O que eu percebo é que dependendo da massa d’água tem mais nutriente e

então a clorofila aumenta. O aumento da clorofila está ligado a águas com temperatura

mais fria. Na ressurgência tem mais clorofila mas nas águas da ACAS tem pouca

quantidade de larva.

Entrevistador – Essas larvas comem esta clorofila ?

Fabiana – Acho que algumas sim, outras não.

Entrevistador – Tem larvas que não comem por não serem herbívoras ?

Fabiana – Não, não comem por causa do tamanho , palatabilidade, seletividade.

Entrevistador – O que você pode ressaltar sobre fatores físicos e as larvas ?

Fabiana – certamente tem mais a ver com a temperatura.

Entrevistador – Existe alguma predominância de algum grupo ?

Fabiana – Eu acho, cirripédia, mitilídeo e decapoda.

Entrevistador – Você conhece relações mais específicas como competição ou exclusão

entre as larvas?

Fabiana – Quando tem mais cirripédia a larva do mitilídeo diminui né! mas não sei se é

uma regra, não sei se elas competem por espaço, por comida etc.

Entrevistador – Existe algum padrão sazonal ou de longo prazo que você poderia me

dizer ?

Fabiana – Não sei, mas depois que eu cheguei aqui teve o “el nono” teve “la nina”, qual

padrão ? Teve uma vez em que a ressurgência não aconteceu no período que ela deveria

acontecer e isso deve afetar a vida das larvas de alguma forma.

3594 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04

Temperatura oC

Figura 3.1a - Flutuação interanual da Temperatura.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Temperatura oC

Figura 3.1b - Variação das médias interanuais da Temperatura

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04

Salinidade g/l

Figura 3.2a - Flutuação interanual da Salinidade.

34.034.234.434.634.835.035.235.435.635.836.036.2

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Salinidade g/l

Figura 3.2b - Variação das médias interanuais da Salinidade.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04

Oxigênio ml/l

Figura 3.3a - Flutuação interanual dos valores de Oxigênio.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Oxigênio ml/l

Figura 3.3b - Flutuação das médias interanuais de Oxigênio.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04

Fosfato ug/l

Figura 3.4a - Flutuação interanual dos valores de Fosfato.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Fosfato ug/l

Figura 3.4b - Variação das médias interanuais de Fosfato.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04

Nitrito ug/l

Figura 3.5a – Flutuação interanual dos valores de Nitrito.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Nitrito ug/l

Figura 3.5b – Variação das médias interanuais de Nitrito.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04

Nitrato ug/l

Figura 3.6a – Flutuação interanual dos valores de Nitrato.

0,00,10,20,30,40,50,60,70,80,91,0

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Nitato ug/l

Figura 3.6b – Variação das médias interanuais de Nitrato.

94 95 95 96 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04

Amônia ug/l

Figura 3.7a – Flutuação dos valores interanuais de Amônia.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Amônia ug/l

Figura 3.7b – Variação das médias interanuais de Amônia.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04

Figura 3.8a – Flutuação interanual dos valores de Ph.

7,37,47,57,67,77,87,98,08,18,28,38,4

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Figura 3.8b – Variação das médias interanuais de Ph.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 02 03 03 04

Clorofila-a mg/l

Figura 3.9a – Flutuação interanual dos valores de Clorofila-a.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Clorofila-a ml/l

Figura 3.9b – Variação das médias interanuais de Clorofila-a.

94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04

Cirripedia org/m3

Figura 3.10a – Flutuação interanuais da ocorrência de sub-classe Cirripedia.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Cirripedia org/m3

Figura 3.10b – Variação das ocorrências médias interanuais da sub-classe Cirripedia.

20003000

40005000

60007000

80009000

94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04

Mytilidae org/m3

Figura 3.11a- Flutuação interanuais da família Mytilidae.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Mytilidae org/m3

Figura 3.11b - Variação das ocorrências médias interanuais da família Mytilidae.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04

Decapoda org/m3

Figura 3.12a – Flutuação interanual da ordem Decapoda.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Decapoda org/m3

Figura 3.12b – Variação das ocorrências médias interanuais da ordem Decapoda.

94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04

Polychaeta org/m3

Figura 3.13a – Flutuação interanual da classe Polychaeta.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Polychaeta org/m3

Figura 3.13b – Flutuação das ocorrências médias interanual da classe Polychaeta.

94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04

LD org/m3

Figura 3.14a – Flutuação interanual das Larvas em D.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

LD org/m3

Figura 3.14b – Variação das ocorrências médias interanuais das Larvas em D.

94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04

Ostreidae org/m3

Figura 3.15a – Flutuação interanual dos valores da família Ostreidae.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Ostreidae org/m3

Figura 3.15b – Variação das ocorrências médias interanuais da família Ostreidae.

94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04

Cipris org/m3

Figura 3.16a – Flutuação interanuais das larvas do tipo Cipris.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Cipris org/m3

Figura 3.16b – Variação das ocorrências médias interanuais das larvas do tipo Cipris.

94 95 96 96 97 97 98 98 99 99 00 01 01 02 02 03 03 04

Ascidiaceae org/m3

Figura 3.17a – Flutuação interanual da família Ascidiaceae.

1 2 3 4 5 6 7 8 9 10 11 12

Ascidiaceae org/m3

Figura 3.17b – Variação das ocorrências médias interanuais da família Ascidiaceae.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04

Bryozoa org/m3

Figura 3.18a – Flutuação interanual da classe Bryozoa.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Bryozoa org/m3

Figura 3.18b – Variação das ocorrências médias interanuais da classe Bryozoa.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04

Equinoide org/m3

Figura 3.19a – Flutuação interanual da classe Equinoide.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Equinoide org/m3

Figura 3.19b – Variação das ocorrências médias interanuais da classe Equinoide.

94 95 95 96 97 97 98 98 99 99 00 00 01 01 02 03 03 04 04

Bivalvia org/m3

Figura 3.20a – Flutuação interanual da classe Bivalvia.

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Bivalvia org/m3

Figura 3.20b – Variação das ocorrências médias interanuais da classe Bivalvia.

Aplicação de Redes Neurais no Estudo da Variabilidade dos ... · se sabe sobre sua diversidade...

Documents

Transcript of Aplicação de Redes Neurais no Estudo da Variabilidade dos ... · se sabe sobre sua diversidade...

Http:// Redes Neurais Artificiais Christiano Lima Santos Redes Neurais Artificiais.

Caracterização quali-quantitativa do fitoplâncton da zona ...

Sistemas Neurais Híbridos: Redes Neurais Artificias e ...wiki.icmc.usp.br/images/7/7b/Apresentacao_Leonardo.pdf · 18 Redes Neurais Evolucionárias Definição da Topologia das redes

Redes Neurais para Inferência Estatísticarvicente/RNcomMatlab.pdfRedes Neurais para Inferência Estatística -FEA/USP Jun/2002 Renato Vicente∗ Programa 1. Introdução: Redes Neurais,

Radiação Ultra-Violeta e Fitoplâncton · Introdução Danos provocados pelo UV Combate ao danos causados pelo UV Estudos de casos Radiação Ultra-Violeta e Fitoplâncton Seminários

Redes Neurais Convolucionais - inf.ufpr.br · Redes Neurais Redes Neurais Convolucionais Funções de Ativação Rede Neural Artificial (MLP)

Estrutura e Dinâmica do fitoplâncton e bacterioplâncton em ...arquivos.info.ufrn.br/arquivos/2011066061c09b5948393994114380bf/... · Estrutura e Dinâmica do fitoplâncton e bacterioplâncton

Redes Neurais 1 Redes Neurais - nacad.ufrj.brfalcao/ag/RN1.pdf · Redes Neurais são sistemas computacionais massivamente paralelos, inspirados nas redes neurais biológicas, constituídas

Redes Neurais

ESTRUTURA E DINÂMICA DO FITOPLÂNCTON E FATORES ... · mônica hessel silveira estrutura e dinÂmica do fitoplÂncton e fatores direcionadores da dominÂncia de cianobactÉrias em

Próteses neurais

Protocolo de amostragem e análise para o Fitoplâncton

New EFEITOS DO ZOOPLÂNCTON SOBRE O FITOPLÂNCTON E AS … · 2018. 10. 4. · SEVERIANO, J. S. Efeitos do zooplâncton sobre o fitoplâncton e as cianotoxinas: abordagem experimental

Fitoplâncton de Água Doce

Redes Neurais Artificiais - cin.ufpe.brrso/redesneurais1tbl.pdf · Redes Neurais - Teresa Ludermir Cin - UFPE O que são Redes Neurais Artificiais RNA: estruturas distribuídas formadas

SÉRIE TEMPORAL DO FITOPLÂNCTON NO ESTUÁRIO DE … · Série temporal do fitoplâncton no estuário de Barra das Jangadas ... As bibliotecárias do CTG: ... 6.1.2 Temperatura do

Redes Neurais Prof. Alex F. V. Machado. Redes Neurais Artificiais (RNA)

REDES NEURAIS ARTIFICIAIS APLICADAS ... - … · redes neurais artificiais aplicadas À ... pÓs-graduaÇÃo em engenharia elÉtrica redes neurais artificiais aplicadas À previsÃo

Comportamento espectral do fitoplâncton de um reservatório ...

Processadores Neurais Chips neurais Ednaldo José Ferreira Prof. Stela.