Inteligência Artificial - Carlos F. Nogueira

110
INTELIGÊNCIA ARTIFICIAL QUEBRANDO PARADIGMAS na ANÁLISE DE EMPRESAS Carlos Fernando Nogueira PAPEL VIRTUAL

description

Inteligência Artificial

Transcript of Inteligência Artificial - Carlos F. Nogueira

  • INTELIGNCIAARTIFICIAL

    QUEBRANDO PARADIGMAS

    na

    ANLISE DE EMPRESAS

    Carlos Fernando Nogueira

    PAPEL VIRTUAL

  • Copyright 1999 por Carlos Fernando Nogueira

    Ttulo Original: UTILIZAO DE INTELIGNCIA AR-TIFICIAL NA ANLISE DO DESEMPENHO DE EM-PRESASEditor-Chefe: Tomaz AdourEditorao Eletrnica: Srgio Porto

    Papel Virtual EditoraRua Marqus de So Vicente, 225Prdio Genesis - sala 21-A - PUC-RioGvea - Rio de Janeiro - RJ CEP: 22453-900

    Tel: (021) 239-0170 Ramais: 2057 / 2026 (fax)E-mail: [email protected] Eletrnico: www.papelvirtual.com.br

  • Dedico este trabalho aoProf. Augusto Sampaio, Vice-Reitor Comunitrio da PUC-Rio,que um dia me sugeriu fazereste curso, e as profundasmudanas que ocorreram desdeento na minha vida.

  • Agradeo minha me,Maria Apparecida, pelo apoiomaterial e intelectual; ao Prof.Dr. Nelson Ebecken, Coppe-UFRJ, pela imensa dispo-n ib i l idade e cooperao,determinantes para o sucessodeste trabalho; e ao Prof. Dr.Jorge Ferreira da Silva, pelaorientao e pela confiana quedispensou, ao aceitar o convitepara or ientar-me nestaproposta indita para ambos.

  • SUMRIO

    PREFCIO ......................................................... 09Prof. Nelson Ebeck

    1. O PROBLEMA1.1 Introduo ................................................. 111.2 Objetivo .................................................... 141.3 Delimitao do Estudo .................................. 151.4 Relevncia do Estudo ................................... 15

    2. REFERENCIAL TERICO2.1. O desenvolvimento ..................................... 172.2. A ferramenta utilizada: IntelignciaArtificial.......................................................... 192.3. Caractersticas da Inteligncia Artificial relevantespara este estudo .............................................. 272.4. O papel da ferramenta de IA neste estudo ...... 272.5. rvores de Deciso ..................................... 292.6. Redes Neurais ............................................ 38

    3. METODOLOGIA3.1. Tipo de Pesquisa ........................................ 533.2. Universo e Amostra .................................... 533.3. Coleta de Dados ........................................ 533.4. Anlise dos Dados ...................................... 543.5. Limitaes do Mtodo ................................. 563.6. O Escopo e a Avaliao do Estudo ................. 56

    4. O EXPERIMENTO4.1 Rodando as rvores de Deciso ..................... 594.2. Rodando as Redes Neurais ........................... 70

  • Fernando Nogueira

    8

    5. CONCLUSES SOBRE O ESTUDO5.1. Das ferramentas ........................................ 795.2. Do conhecimento extrado do Bancode Dados ........................................................ 80

    6. BIBLIOGRAFIA ................................................ 83

    7. ANEXOS7.1. Listagem de Empresas ................................. 877.2. rvores de Deciso ................................... 105

  • Inteligncia Artificial

    9

    APRESENTAO

    Transaes no mundo dos negcios geram dadosque so os prprios fundamentos do negcio. H algumtempo estes dados esto sendo coletados, tratados earmazenados em bancos de dados de grandes dimenses.

    Na comunidade cientfica os dados esto maisdispersos, uma vez que nesta rea a formulao demodelos procura definies matemticas precisas.Entretanto, reconhece-se hoje em dia que estasdescries precisas, nem sempre so possveis.Conhecimento incompleto e impreciso, observaes decaracter qualitativo, a grande heterogeneidade dosparmetros de fenmenos de natureza, condies iniciaise de contorno no perfeitamente estabelecidas tmgerado a necessidade de modelos de dados.

    Para construir um modelo de dados no sonecessrias complexas equaes diferenciais, osuficiente a obteno de dados representativos.

    A extrao de conhecimento expl c ito ecompreensvel escondido em bancos de dados gerainformaes preciosas. As tecnologias de Data Miningtem aberto novos campos de oportunidades,revolucionando completamente a estratgia de soluode problemas.

    Data Mining um campo multidisciplinar queenvolve diversas tcnicas. As metodologias tradicionaisde sistemas de suporte a deciso no satisfazem mais asnecessidades de descobrir estruturas escondidas emgrandes massas de dados dentro dos limites de tempoatualmente exigidos nos ambientes cientficos e comerciais.

  • Fernando Nogueira

    10

    O presente livro tem por objetivo apresentar ediscutir a avaliao de rentabilidade de empresas. Osresultados obtidos atravs de data mining explicitamclaramente a extrao de conhecimento sobre perfislucrativos de empresas em ambientes de acentuadacomplexidade.

    Nelson Francisco Favilla Ebecken

  • Inteligncia Artificial

    11

    1. O PROBLEMA

    1.1. Introduo

    Sabemos respirar, caminhar, andar de bicicleta emuito mais. Uma infinidade de funes que, s sequisermos desenvolver mquinas para execut-las,perceberemos a complexidade, bem como o quanto anatureza generosa ao nos permitir execut-las semtermos que entend-las.

    Ao passear de bicicleta, uma pessoa que jamaistenha aprendido a aritmtica bsica poder estarresolvendo equaes diferenciais complexas, e o estarfazendo com uma rapidez ainda no atingida nem mesmopor supercomputadores.

    Alguns outros exemplos de situaes em quecomplexas funes so executadas pelo homem semque tenham sido compreendidas:

    (a) Imagine dois automveis andando (ou correndo) a120 quilmetros por hora, em sentidos contrrios,em uma estrada de mo dupla. A uma distncia de100m, os dois motoristas sabem se a direo queseguem os conduz a uma coliso, bem comoconseguem estimar a que distncia se cruzaro.

  • Fernando Nogueira

    12

    (b) Compare agora com dois grandes navios, a 12quilmetros por hora, estando navegando em rotasparalelas prximas, em um canal. mesma distncia,os dois comandantes no conseguem estabelecerum rumo que os d a certeza de que evitaro acoliso, e menos ainda, conseguem estabelecer aque distncia se cruzaro.

    (c) Mudando de ambiente, abstraia a incerteza de umleigo ao investir no mercado financeiro. Por outrolado, especialistas conseguem estimar oscomportamentos das aes, sendo que por vezesatribuem esta capacidade a razes subjetivas,intuies.

    O que podemos inferir das situaes descritas, que existem limitaes em observar e determinar asvariveis que explicam certos fenmenos. No caso dosnavios, o complexo movimento das ondas, ocomportamento de uma embarcao que desliza sobresua sustentao ( a gua ) e os baixos valores que asderivadas do movimento do navio tm, enfim acomplexidade do modelo, torna difcil ao homemextrapolar seu comportamento. Tambm no mercadofinanceiro, a complexidade de variveis extrema,muitas sendo propositadamente camufladas.

    Afinal, quem pode garantir que o vo de umaborboleta no altera o clima no lado oposto do planeta?

    Entretanto, estes problemas no so insolveis. parte das diferentes aptides para resolver estesfenmenos, mesmo os menos iluminados evoluiro noaprendizado. Ou seja, a exposio aos eventos aumentao back ground de cada um, dando mais oportunidades

  • Inteligncia Artificial

    13

    de perceber, mesmo inconscientemente, parmetrosque expliquem os fenmenos.

    Obviamente, h limites para isso, limites dedisponibilidade, de capacidade e de sensibilidade. Afinal,as pessoas no so mquinas...

    Chamemos, ento, as mquinas.

    A Engenharia do Conhecimento tem a misso deintroduzir na mquina o conhecimento existente nosespecialistas, viabilizando a sua utilizao em escala, etambm aquele enrustido em Bancos de Dados,transformando-os em informao. Atravs da IntelignciaArtificial tentamos desvendar padres no perceptveisa olho nu e, a partir deles, inferir e prever ocomportamento de um novo elemento. Ou seja, ela vemtentar suprir as limitaes humanas atravs da principalvirtude das mquinas, a capacidade de tratar dados,de tentar seguidas vezes associar elementosaparentemente dissociados, testando hipteses que nonos disporamos a testar.

    O computador ento compensa a sua falta decapacidade de perceber pela sua velocidade deprocessamento, fazendo tentativas de associao emfraes de microsegundo.

    Apesar de ser uma procura cega e nodeterminstica, trata-se de um processo extremamentefamiliar. Poucos motociclistas sequer tm noo de que,em alta velocidade, pressionam o guido para o ladooposto ao da curva que querem fazer. Talvez uma

  • Fernando Nogueira

    14

    porcentagem ainda menor seja a dos que, tendopercebido, entendam o que esto fazendo, isto porvezes a 100 quilmetros por hora. Parece arriscado,no? Mais at do que o experiente investidor comprandomilhes em aes, baseado por vezes em fatores queele mesmo julga, erroneamente, subjetivos.

    Da mesma forma que o motociclista e o investidortm domnio, ainda que parcial, sobre os referidosfenmenos, pode o computador procurar assimilar outros,como o desempenho financeiro de empresas atravsdos seus dados financeiros, no se utilizando de modelosj testados.

    Como se classificam os perfis das empresas maisou menos lucrativas de acordo com seus dadosfinanceiros? possvel prever o desempenho de empresasa partir dos seus padres financeiros?

    1.2. Objetivos

    O objetivo deste estudo ser compreender e sepossvel, prever o desempenho de empresas, atravsdos seus dados financeiros disponveis, utilizando-separa tal de ferramentas de Inteligncia Artificial .

    Para que seja possvel atingir este objetivo, sernecessrio:

    obter Banco de Dados sobre o desempenho deempresas;

    estabelecer as regras que determinem o desempenhodas empresas utilizando ferramentas de Inteligncia

  • Inteligncia Artificial

    15

    Artificial; tentar prever o desempenho destas empresas,

    observando seu perfil financeiro, podendo, ou no,fazer uso de informaes histricas;

    comparar com os resultados obtidos na realidade,verificando a capacidade de previso e de explicaoda ferramenta utilizada;

    1.3. Delimitao do Estudo

    Ao utilizar-se de Bancos de Dados j disponveis,do Sistema Economtica, o universo de variveisanalisveis fica restrito aos listados nestes, de cunhoeminentemente financeiro .

    Cabe ressaltar que os dados so fornecidos pelasempresas. Alm das imprecises que possam ocorrerdevidas falta de iseno, faltariam informaesimportantes como: market share, patrimniotecnolgico, capital intelectual, qualidade, valor damarca, processos e satisfao dos stakeholders, entreoutros. Apesar da clara relevncia destes parmetros,eles no sero abordados, concentrando-se o estudona avaliao da ferramenta Inteligncia Artificial comoinstrumento eficaz e confivel de apoio analise depadres em Empresas.

    1.4. Relevncia do Estudo

    Existem variados modelos que se propem aexplicar porque uma Empresa mais lucrativa que outra.Alm da dificuldade evidente em propor-se um modelo

  • Fernando Nogueira

    16

    consistente sob o ponto de vista terico, dificuldadeesta que se estabelece pelo fato de estarem envolvidosmuitos fatores, existe tambm a dificuldade em validartais modelos.

    Este estudo vem apresentar e testar ferramentascom modelo aberto, com capacidade de testarassociaes no experimentadas, at por seremimprovveis aos paradigmas vigentes. Alm disso, estasferramentas permitiriam, uma vez que simplificariam muitoa anlise de dados, que se estabelecesse modelosespecficos para cada Indstria, ou at cada setor,amenizando a perda de informao que as generalizaespossam trazer. Impe-se entretanto a esta segmentao,a disponibilidade de volume de empresas suficiente paraa utilizao de ferramentas de IA.

  • Inteligncia Artificial

    17

    2. REFERENCIAL TERICO

    2.1. O desenvolvimento

    Nas ltimas dcadas, poucas reas doconhecimento experimentaram desenvolvimentosemelhante ao da computao. De mquinas do tamanhode salas, capazes de resolver alguns clculos e comcapacidade de memria pequena, vemos hoje mquinasextremamente capazes, manipulando imagens e sons,armazenando bibliotecas, e a um custo inexpressivo secomparado aos primeiros computadores. Hojecarregamos no bolso equipamentos com maiorcapacidade de memria que as antigas maravilhas dacomputao.

    Com o tempo, de uma mera ferramenta de realizarclculos, a informtica distanciou-se da matemtica,desenvolvendo suas prprias reas e teorias. Seuespao cresceu, e ela se difundiu nos diversos camposda vida humana.

    Como conseqncia deste crescimento, surgiua Inteligncia Artificial, uma rea do conhecimento cujonome j incmodo, quanto mais a proposta.

    O primeiro marco da Inteligncia Artificial foi a

  • Fernando Nogueira

    18

    mquina de decriptografia automtica (Inglaterra) que,na Segunda Guerra Mundial, se propunha a descobriras cifras utilizadas pelos alemes. Deste desenvolvimentoveio a aspirao de criar-se um tradutor automtico,que ainda no se realizou. A complexidade das estruturassemnticas, to diferentes para cada lngua, no foramsuperadas pelos recursos e desenvolvimento disponveisna poca (1955). Em 1956 criou-se o demonstradorautomtico de teoremas, que no chegou a descobrirum novo teorema, apesar de ter demonstrado algunsento existentes.

    De l para c observa-se o crescimentoexponencial da informtica. Do projeto (parcial) deembarcaes previso do tempo, passando pela anlisede fraudes, a informtica vem reproduzindo atividadesanteriormente desempenhadas por especialistas.Estariam elas nos substituindo?

    Segundo Cavalcanti (1996), no h fundamentocientfico que justifique a crena de que existammquinas que raciocinem como seres humanos.

    Se aparentemente as mquinas no tmcapacidade de pensar como os humanos, resta saberse os humanos no tm capacidade de assimilar deforma semelhante s mquinas. Quem sabe at j ofazem sem perceber.

  • Inteligncia Artificial

    19

    2.2. A ferramenta utilizada: Inteligncia Artificial

    2.2.1. A Descoberta do Conhecimento

    Segundo Fayyad (1996): Knowledge Discoveryin Databases is the non-trivial process of identifyingvalid, novel, potentially useful, and ultimatelyunderstandable patterns in data.

    Onde:

    * Padro uma sentena que descreve fatosem um subconjunto dos dados obedecendo auma classificao.

    Estabelece-se assim uma forma racional e lgicade aquisio de conhecimento. Fica explicitada, nadefinio do Prof. Fayyad, a complexidade envolvidanesta descoberta, uma vez que os padres devem serdescobertos a partir de uma fonte no necessariamentepreparada para isso. Ressalta-se tambm a importnciada validao das informaes extradas.

    * O Processo tem mltiplos passos, envolven-do: preparao de dados, pesquisa de pa-dres, avaliao de conhecimento e refina-mento.

    * Validao a verificao de que os pa-dres descobertos so extensivos a novosdados, no utilizados na descoberta dospadres.

  • Fernando Nogueira

    20

    Data Mining is a step in the KDD processconsisting of particular Data Mining algorithms that,under some acceptable computacional efficiencylimitations, produces a particular enumeration ofpatterns Ej over F (Fayyad,1996)

    Ej a expresso, e F o conjunto de dados.

    Como isto implementado? Atravs de algoritmosdedicados que buscam modelar os fenmenos queencontram. Esta modelagem pode ser voltada para aclassificao ou mesmo para a previso.

    KDD process is the process of using dataminingmethods (algorithms) to extract (identify) what isdeemed Knowledge according to the specifications ofmeasures and thresholds, using the database F alongwith any required preprocessing, subsampling, andtransformations of F. (Fayyad,1996)

    Ressalta-se a importncia da definio dosparmetros de exigncia, ou tolerncia, para o que seconsidera aprendizado e classificao.

    Em se saindo do mundo terico determinstico,caracterstico da matemtica, e entrando-se no mundoreal, da natureza, faz-se essencial a agregao de umadas principais caractersticas naturais, a tolerncia. Masat que ponto? essencial esta definio para atentativa de criar inteligncia onde no h, paratransformar um sistema em um decisor, um caso extremo,no necessariamente adequado a qualquer situao .

  • Inteligncia Artificial

    21

    2.2.1.1. O processo de aquisio de conhecimento

    So os passos da Descoberta do Conhecimento, segundoFayyad (1996).

    1. Desenvolver o entendimento do domnio, oconhecimento prvio necessrio e a identificaodos objetivos do usurio.

    2. Criar um subconjunto-alvo de dados, onde sedescobrir os padres.

    3. Preparao da base de dados, com remoo derudos, coletar as informaes necessrias para amodelagem e escolha da estratgia paratratamento de campos incompletos.

    4. Reduo e Projeo de dados, encontrando osprincipais aspectos representativos dos dados,reduzindo a dimenso do Banco de Dados.

    5. Escolha da tarefa do Data Mining, se classificao,regresso, clusterizao ou previso.

    6. Escolha do algoritmo do Data Mining, selecionandoo mtodo apropriado a ser utilizado na descobertados padres.

    7. Data Mining. A procura, propriamente dita, dospadres, ut i l i zando-se das ferramentasselecionadas no item 6.

    8. Interpretao dos padres obtidos, com possvelretorno a um dos passos 1 a 7.

    9. Consolidao do conhecimento adquirido, comimplementao ou mesmo apenas relatrio. Isto

  • Fernando Nogueira

    22

    i nc lu i ver i f i cao de cons is tnc ia com oconhecimento j existente.

    Este processo interativo, podendo haverloops entre passos. Apesar de haver uma tendnciaao enfoque no passo 7, Data Mining, todos os passosso importantes.

    2.2.1.2.Os objetivos e passos intermedirios.

    Os dois principais objetivos do Data Mining so:predio e descrio (Fayyad,1996). A predioconsiste na utilizao de variveis exgenas nadeterminao de variveis endgenas, baseando-seem padres descobertos anteriormente ou com outrosdados. A descrio consiste na segmentao dosdados sendo estes agrupados segundo caractersticascomuns, dentro da tolerncia desejada.

    Para que se alcance os objetivos citados, sonecessr ios a lguns passos intermedir ios(Fayyad,1996), quais sejam:

  • Inteligncia Artificial

    23

    Classificao. Consiste no agrupamento dos dados(variveis exgenas) dentro de alguma regraestabelecida para uma ou mais variveis (variveisendgenas). Como exemplo, pode-se utilizar aconcesso de emprstimos por um banco, baseadono valor solicitado pelo cliente e seu escore derelacionamento com o banco.

    No empresta

    Empresta

    Valorsolicitado

    Escore derelacionamento

  • Fernando Nogueira

    24

    Regresso. Consiste na possibilidade de extrapolar-se uma varivel endgena, baseando-se nos valoresde variveis exgenas.

    Para exempl i f icar esta funo, observe-se aconcesso de emprstimos em funo do escore derelacionamento, do valor emprestado e do pagamentoinadimplncia. O cruzamento destas trs variveispermitem extrapolar que valores podem seremprestados a um cliente com um dado escore, comdeterminado grau de confiana de que o dbito serhonrado.

    ValorSolicitado

    Escore derelacionamento

  • Inteligncia Artificial

    25

    Segmentao. Consiste no agrupamento coerente dedados que detenham caractersticas semelhantes.Estes agrupamentos podem ou no ser mutuamenteexcludentes.

    No exemplo abaixo observa-se uma possvelsegmentao das expectativas de cada tipo decliente, podendo-se criar produtos adequados a cadaum.

    ValorSolicitado

    Escore derelacionamento

    Segmento 1

    Segmento 2

    Segmento 3

  • Fernando Nogueira

    26

    Sumarizao. A procura de uma forma sinttica derepresentao de subconjuntos dos dados. Porexemplo, a representao destes por frmulas que odefinam, ou mesmo por sua mdia e desvio padro.

    Ex: Se o valor solicitado menor que 10 e o escoredo relacionamento maior que 20, ento pertenceao segmento 1, com 85% de certeza. A este segmentoseria associado algum tipo de comportamento, porexemplo, alto risco de inadiplncia.

    2.2.1.3. Os componentes dos algoritmos de DataMining

    Os principais componentes de um algoritmo deData Mining so (Fayyad,1996): representao domodelo, avaliao do modelo e pesquisa.

    1. Representao do Modelo. a linguagem querepresenta os padres descobertos. Ela deve sersimples e abrangente. Vale ressaltar que alimitao da representao de um modeloexcessivamente simplificado no se compensa porum maior tempo de aprendizagem, havendo perdas

    significativas de informao.

    2. Avaliao do Modelo. Tem a funo de avaliar o

    quo boa foi a modelagem obtida naqueleaprendizado, em re lao aos cr i tr iosestabelecidos. A validao, ou seja a avaliaoda capacidade preditiva, se baseia na CROSSVALIDATION. J a capacidade descritiva, dautilidade e da facilidade de compreenso tambmdevem ser avaliadas.

  • Inteligncia Artificial

    27

    3. Mtodo de Pesquisa. Dividido em pesquisa deparmetros e de modelo. Na pesquisa deparmetros, o algoritmo procura pelos parmetrosque melhor atendem aos critrios estabelecidosde avaliao do modelo. Na pesquisa de modelos, feita uma procura sobre a procura deparmetros. Para cada modelo experimentado,realiza-se uma procura de parmetros. Esteprocesso imprime a necessidade de umainterferncia heurstica escolha de modelos, vistoque a complexidade do Banco de Dados podetornar invivel a busca para todo o espectro de

    modelos possveis.

    2.3. Caractersticas da Inteligncia Artificial

    relevantes para este Estudo

    A principal caracterstica da IA a utilizaode mtodos heursticos. Devido s limitaes damquina, ela tem que experimentar cada soluo,percorrer todos os caminhos possveis, sem se utilizarde solues analticas.

    Outra importante face da IA a capacidadede lidar com informaes conflitantes, insuficientes

    e at inexatas.

    2.4. O papel da ferramenta de IA neste Estudo

    A IA tem o papel de classificador e previsorda varivel escolhida como endgena, no caso sera rentabilidade sobre o patrimnio das empresas.

    Classificador, atravs da utilizao de rvoresde Deciso, onde nveis de rentabilidade segmentam

  • Fernando Nogueira

    28

    o Banco de Dados, determinando-se as faixas dasvariveis exgenas que correspondem a estasegmentao.

    A capacidade de previso se faz com o usodas Redes Neurais, onde se utilizou das variveisexgenas contnuas, cujas participaes na gerao

    das variveis endgenas so determinadas.

    2.4.1. A escolha das ferramentas

    Esta escolha obedece critrios tcnicos eprticos.

    Os critrios tcnicos preocupam-se com aviabilidade da ferramenta em alcanar os objetivosdesejados. Para tal avaliao, so observados osseguintes parmetros: tamanho da amostra, emfuno da acurcia e da complexidade de padresque se procura, conhecimento prvio (certamenteo parmetro mais importante a ser considerado), quesimplifica muito a tarefa do KDD, e a relevncia dosatributos (exgenos), se eles tm capacidade deexplicar o padro e se no h excesso de rudo.

    Os critrios prticos dizem da disponibilidadeda ferramenta e de seu custo.

    Devido adequao proposta deste estudo,bem como a disponibilidade de verses shareware,com capac idade suf ic iente para o nocomprometimento das anlises desejadas, visto queos Bancos de Dados so relativamente pequenos,adotou-se os programas PROFILER e ThinksPro, como

  • Inteligncia Artificial

    29

    ferramentas de rvores de Deciso e Redes Neurais,respectivamente.

    A utilizao de rvores de Deciso e RedesNeurais se deveu ao fato de atenderem plenamenteao tipo de anlise desejado, alm de serem asferramentas de datamining mais difundidas eexploradas atualmente.

    Em especial, as rvores de Deciso tm o papelde geradoras de conhecimento prvio para a anlisepor Redes Neurais, alm da funo de classificadoras.

    2.5. rvores de Deciso

    2.5.1. O que so?

    Trata-se de um mtodo baseado em divisessucess ivas dos dados, a part i r de valoresdeterminados de suas variveis, uma a cada vez,gerando um modelo de inferncia de fci lcompreenso. um mtodo que oferece grandefacilidade de apresentao do conhecimento queextrai. Porm, como conseqncia direta dasimplicidade de representao, pode ocorrer umalimitao sua capacidade de classificao. Aoaumentar-se a complexidade do modelo, admitindoento expresses mais abrangentes, este fica maispoderoso, tornando-se entretanto de mais difcilcompreenso.

    H vrios algoritmos que implementam rvoresde Deciso e induo de regras (Agrawal et al.,1996),

  • Fernando Nogueira

    30

    seu uso a princpio ocorreu preponderantemente emcasos de previso, sendo hoje largamente utilizadopara classificao, regresso e descrio (Agrawalet al.,1996).

    2.5.2. Como funcionam?

    2.5.2.1. Um exemplo:

    Para auxiliar a explicao da lgica das rvoresde Deciso, torna-se muito eficaz o acompanhamentode um exemplo. A seguir mostrado superficialmenteo processo ao qual os dados so submetidos, naprocura de padres.

    Por exemplo: Qual o Perfil dos Motoristas deautomveis BMW?

    Para chegar-se a estes padres, submeter-se-ia os dados a perguntas que os dividisse emsubgrupos, ou seja em classes.

    Pergunta: Os motoristas de BMW gostam de carrosesportivos?

    Esta pergunta j agruparia as respostas emdois grupos distintos, to mais distintos quanto maisapropriada e exata ela fosse.

    Pode-se apresent-la de uma forma maiseficiente: Os motoristas de BMW gostam muito decarros esportivos? Nesta nova verso atribuiu-se umvalor varivel gostar, no caso muito.

    Em seguida se far ia outra pergunta,obedecendo, claro, s variveis disponveis no

  • Inteligncia Artificial

    31

    Banco de Dados. Por exemplo, outra perguntaabordaria a classe social dos motoristas de BMW,podendo surgir uma segregao que retiraria apenasos de classe mdia da resposta. O que pareceevidente, visto que normalmente apenas pessoas ricase seus motoristas dirigem carros deste valor nestepas.

    As perguntas se repetiriam at quehouvesse apenas um tipo de resposta para osubgrupo formado em uma dada pergunta.

    Caso o outro ramo, subgrupo, para aquelapergunta tenha mais de uma classificao, teriamcontinuidade as perguntas.

    Atravs destas respostas, o Banco de Dadosse classificaria e poderamos obter regras como:

    Pessoas abastadas, que gostam muito decarros esportivos, no tenham uma Ferrari, residamem uma cidade onde haja um ou mais revendedoresda BMW e no haja nenhum da AUDI, tm 15% dechance de dirigir um BMW.

    Facilmente se reconstruiriam as perguntas queteriam sido feitas para chegar-se a esta regra:

    1. Pessoas ricas guiam BMW?2. Pessoas que gostam muito de carros

    esportivos guiam BMW?3. Pessoas que tm Ferrari guiam BMW?4. H motoristas de BMW onde no h

    revendas ?5. H motor is tas de BMW onde h

    revendas AUDI ?

  • Fernando Nogueira

    32

    Teriam ento constitudo uma rvore que teria

    como um de seus ramos o seguinte:

    S

    N

    N

    S

    S

    G o s t a d e c a r r o sespor t ivos?

    G o s t a d e c a r r o sespor t ivos?

    G o s t a d e c a r r o sespor t ivos?

    G o s t a d e c a r r o sespor t ivos?

    G o s t a d e c a r r o sespor t ivos?

    G o s t a d e c a r r o sespor t ivos?

    G o s t a d e c a r r o sespor t ivos?

    G o s t a d e c a r r o sespor t ivos?

    T m u m aFer r a r i ?

    T m u m aFer r a r i ?

    T m u m aFer r a r i ?

    T m u m aFer r a r i ?

    T m u m aFer r a r i ?

    T m u m aFer r a r i ?

    T m u m aFer r a r i ?

    T m u m aFer r a r i ?

    T m C o n c . B M Wn a c idade?

    T m C o n c . B M Wn a c idade?

    T m C o n c . B M Wn a c idade?

    T m C o n c . B M Wn a c idade?

    T m C o n c . B M Wn a c idade?

    T m C o n c . B M Wn a c idade?

    T m C o n c . B M Wn a c idade?

    T m C o n c . B M Wn a c idade?

    T m C o n c . A U D In a c idade?

    R e n d a > X ?

    T m u m a B M WP = 1 5 %

    2.5.2.2. Os dados

    Para a utilizao de rvores de Deciso, osdados devem estar organizados de forma regular,como uma srie de atributos a cada dado, podendohaver valores discretos e contnuos.

    Devido a esta restrio, h limitaes nadiversidade possvel de utilizaes, como ocorreria

  • Inteligncia Artificial

    33

    para a anlise de dados descritos subjetivamente,como uma ficha mdica, por exemplo. Esta limitaopoderia ser contornada possivelmente com a utilizaode algoritmos identificadores de palavras, quepoderiam gerar um arquivo adequado utilizao, ouna utilizao de um formulrio padronizado para aficha mdica, como ocorre em vrios locais, como oHemoCentro-RJ.

    Apesar da relativa tolerncia a inconsistnciade dados, deve-se evitar o excesso de dadosincompletos ou claramente dspares. Mesmo que aferramenta seja robusta a algum nvel de rudo, suaeliminao prvia certamente catalisa o aprendizado.Note-se que no se est abordando as variveis esuas aparentes inconsistncias, mas sim aos seus

    dados que estejam corrompidos.

    2.5.2.3. As classes

    A definio das classes - para as variveisendgenas - deve ser realizada previamente, noscasos em que se houver necessidade, ou seja, quandoas variveis se apresentarem com valores contnuos.As rvores de Deciso apresentam rendimentosensivelmente superior ao classificar nveis de padresdo que se obtm com valores contnuos (Quinlan,96).

  • Fernando Nogueira

    34

    2.5.2.4. A estrutura

    As rvores de Deciso tm a estruturabaseada em: folhas, que seriam as classificaes existentes e

    ns de deciso, onde se encontram os testes quea rvore faz aos dados.

    Estes funcionam da seguinte forma: Um dadoentra na rvore atravs da raiz, percorrendo os nse neles sendo direcionados de forma a alcanarem asfolhas a que se referem, suas classes.

    2.5.2.5. A produo de regras.

    A partir das classificaes obtidas pelas folhas,em que se enquadraram os dados, e dos ns, queforam percorridos para chegar-se a elas, geram-seas regras que determinam aquela classificao.

    O exemplo dado, Motoristas de BMW, mostraos testes realizados (ns), correspondendo sperguntas feitas: maior de 18 anos?, por exemplo,bem como as folhas, Dirige um BMW.

    2.5.2.6. Estatstica e rvores de Deciso.

    H muito em comum entre estatstica e rvoresde Deciso. Na verdade, alguns modelos utilizadosforam criados por estatsticos, como o CART (Breimanet al, 1984).

    Convm ressaltar, entretanto, que modelosestatsticos so focados em tarefas onde os atributos

  • Inteligncia Artificial

    35

    so normalmente contnuos; na verdade muitos soparametrizados, sendo o modelo baseado emcombinaes lineares das variveis que o compem.

    Outra premissa importante a normalidade dosdados, visto que se utilizam de suas mdias, desviospadro, etc..2.5.2.7. O compromisso explicao x entendimento.

    At onde pode-se ir na classificao de umBanco de Dados?

    Alm da qualidade evidente de classificadoras,as rvores de Deciso tm uma grande virtude, seusmodelos so de fcil compreenso. As perguntas, outestes, a que so submetidos os dados acabam porgerar regras inteligveis, visto que o prprio processode obteno do conhecimento extremamentesimples, na verdade lgico, uma lgica binria de fcildigesto.

    Entretanto, ao exigir-se um refinamentoexcessivo da anlise, as informaes extradas passama se tornar mais complexas.

    2.5.2.8. A pureza, a tolerncia e a probabilidade.

    As rvores de Deciso, como visto, so divisessucessivas de blocos de dados. A cada n se tentasegmentar os blocos em dois grupos, distintos pelapergunta chave a que se submeter o bloco.

    Nota-se ento a importncia da escolha dasperguntas a serem feitas aos blocos, que visarosempre a gerao de sub-blocos, de maior purezapossvel.

  • Fernando Nogueira

    36

    Para tal, faz-se clara a necessidade de umadefinio da impureza (Breiman et al, 1984; Feng &Michie, 1994). Esta funo tem diversas formas. Apureza ideal seria conseguida pela obteno de umbloco que fosse descrito com apenas um determinadoarranjo de variveis, no havendo ocorrncia comqualquer variao de qualquer parmetro. Algo poucoprovvel em situaes complexas.

    Dito de outra forma, medida que os blocosque chegam a um determinado n apresentam umaclassificao francamente preponderante, est esten se aproximando da pureza, sendo a situao idealdefinida como aquela em que s haja uma classificaopara os elementos daquele bloco, o n puro.

    Para que se alcance a pureza, so utilizadosalgoritmos diversos, entre eles o CART (Breiman etal, 1984).e o Xpertrule PROFILER (Attar Software),que tm a funo de segmentar os blocos, levandoem considerao apenas um parmetro por vez.

    As divises se sucedem at que as variaesde impureza vo diminuindo, atingindo os nveisconsiderados tolerveis pelo especial ista, sepossvel.

    Dificilmente se obter ns puros, associa-seportanto probabilidades de ocorrncia a cadaclassificao.

  • Inteligncia Artificial

    37

    2.5.2.9. Quando parar?

    A determinao do tamanho ideal das rvores outro problema a ser tratado.

    A existncia de rudos no Banco de Dadospode gerar uma rvore com mais informaes do queo Banco de Dados que ela representa.

    Ao criar-se um refinamento excessivo, cria-seuma maior propenso incluso dos rudos, como seinformaes fossem.

    Por outro lado, em uma situao semelhante das Redes Neurais excessivamente treinadas, queser comentada no captulo referente, pode-se teruma rvore super-ajustada. Por outro lado bvia apossibilidade de pobreza de representao ao secercear precocemente o desenvolvimento de umarvore.

    Deve-se, por isso, avaliar o momento dotrmino da segmentao, aquele a partir do qual aevoluo da pureza fica estagnada, passando a rvorea gerar no regras, mas excees.

    Duas so as formas de evitar os doisdesequilbrios acima descritos: forward prunning ebackward prunning . No primeiro faz-se oacompanhamento da evoluo da impureza dos ns,da forma j descrita. No segundo se efetua podasnas rvores obtidas, simplificando os modelos obtidos.(Breiman et al, 1984).

  • Fernando Nogueira

    38

    2.5.2.10. A representatividade.

    A capac idade das regras geradas derepresentar os padres procurados, fica obviamenteatrelada representatividade da amostra. Ou seja, autilizao de blocos desbalanceados em relao aouniverso certamente trar este desbalanceamentopara as regras que se obter.

    2.6. Redes Neurais2.6.1. O que so?

    As Redes Neurais, na busca de seu objetivo,que simular o raciocnio associativo humano, vmemular um computador analgico em uma mquinadigital, uma vez que a capacidade de lidar comquantidades, com valores contnuos, ou seja, commodelos fsicos, naturais, em muito se restringiu aoadotar-se a lgica binria dos computadores atuais.

    Dizer se algo ou no extremamenteconsistente com a estrutura e as ferramentasoferecidas pelas CPUs (Unidades Centrais deProcessamento) e suas tenses de 0V e de 5V.

    Por outro lado, o peso exato que uma variveldeve tomar, muito mais semelhante ao sutil equilbriode presses controlado pelo diafragma de uma vlvulareguladora de presso, tem um carter muito maismecnico, fsico, contnuo, enfim analgico.

    Para suprir esta deficincia, existem poderosasferramentas nos computadores atuais, ferramentas

  • Inteligncia Artificial

    39

    com grau de acurcia muito mais alto que nossapercepo, e que, por isso, nos fazem acreditarestarmos vendo algo contnuo.

    Estamos ento atendidos para nossos clculospontua is e determin s t i cos. Poucas vezesencontraremos os limites da mquina, poucas vezesexigiremos da mquina fraes do nosso limite.

    Jamais esperaremos dela que intua, quedescubra, que crie uma classificao, que percebasimilaridades, ou mesmo encontre igualdades em meioa dissimilaridades, atividades de complexidade muitomaior que um simples clculo, cujo erro pode estarna nona casa decimal. Basta atentarmos para o efeitoque cada inflexo de uma curva tem para a equaoque ela modela.

    Se em algum momento conseguirmos issobaseados no paradigma digital, certamente o sercom grandes limitaes no nmero de dados, naquantidade de variveis, na no linearidade delas.Jamais algo semelhante capacidade humana de nosreconhecermos sorrindo ou chorando, a cores ou empreto e branco.

    As Redes Neurais tentam fazer o papel dastais vlvulas reguladoras de presso. Em alguns casostm uma referncia que tentam buscar (a presso dereferncia), em outros apenas um grau de semelhanadesejado. Para cada Banco de Dados, pode haverum comportamento diferente, assim como a equaoreal que regeria uma reguladora tem seus coeficientesvariando com a temperatura, presso, desgaste,impurezas e outras razes. Mas, como um equilibrista,

  • Fernando Nogueira

    40

    elas (Redes Neurais) buscam ficar sobre a corda, ouseja, de forma interativa, com uma gama relevantede variveis, e com aprendizado contnuo, vodominando seu modelo, cuja complexidade, maiorjustificativa para a utilizao de mtodos estatsticos, to grande que paradoxalmente, os inviabilizam.

    Como mtodo de regresso no linear, as RedesNeura is cons istem na tentat iva de comporconvenientemente funes lineares e no linearesbsicas, como sigmides, splines e polinmios, gerandouma fronteira no linear que divida os dados.

    Se, por um lado, estes mtodos possuemacurcia superior aos de rvores de Deciso, sotambm de mais difcil entendimento. Suas divises,ou fronteiras tm formas complexas, e no binrias,como nas rvores de Deciso. Este o fator que lhepermite a extrapolao, ou previso, s custas dacompreenso do modelo.

    2.6.2. Como funcionam?

    Trata-se de um mtodo de previso muitosemelhante regresso, utilizada em estatstica,tendo inclusive incorporado procedimentos deestatstica paramtrica, em que se ajusta pesosatribudos a parmetros (ns) visveis ou no, obtendoum modelo que permite prever o valor de uma dadavarivel para um determinado vetor exgeno.

    O modelo estudado, a propagao retrgrada,

  • Inteligncia Artificial

    41

    tem como caracterstica no ser paramtrico,construindo o modelo previsor de acordo com os dadosfornecidos, podendo ser linear, quadrtico, cbico ououtro.

    A sensibilidade das Redes Neurais a rudo seestabelece pelo fato de elas trat-los comocomplexidade do Banco de Dados. Elas tentam entose adequar complexidade encontrada, o que podeser impossvel, perdendo capacidade de explicaosobre os padres do Banco de Dados e,consequentemente, capacidade de previso.

    A escolha de alguns parmetros tm grandeinfluncia na facilidade, ou mesmo na viabilidade destaprocura. Entre eles poderamos citar por hora, opreprocessamento dos dados de entrada, visto quepodem ter faixas muito distintas de valores, o queatrapalha muito a sensibilidade da rede.

    2.6.2.1. Os paradigmas

    Segundo Bigus (1996), os trs principaisparadigmas seriam:

    aprendizado com superviso, aprendizado sem superviso e aprendizado por reforo.

    Poderamos explic-los atravs de exemplos:

  • Fernando Nogueira

    42

    2.6.2.1.1. Redes Supervisionadas.

    Ao aprender a ler com sua carinhosa me, umacriana ter sempre a sinalizao dos seus acertos eerros atravs dos comentrios dela. Sua me suasupervisora e ela (a criana) ter sempre umareferncia a buscar.

    Ou seja, ao tentar-se resolver um problema,dispe-se tanto das variveis quanto das respostas.

    A estatstica pode hoje resolver uma infinidadede problemas com esta configurao, porm h casosem que a existncia de grandes no linearidades, derelacionamentos muito complexos entre variveis, ainexistncia de modelos, ou mesmo a variao domodelo ao longo do tempo, tornam as redessupervisionadas uma possibilidade atrativa.

    2.6.2.1.2. Redes No Supervisionadas.

    Aquela criana cresceu e foi trabalhar em umaempresa que no disponibi l izou algum paraacompanh-la. Essa pessoa agora se depara com umapilha de reclamaes de clientes, devendo agrup-las de forma coerente. No h referncia a buscar, oBanco de Dados lhe dir seus padres.

    Temos ento muitos dados, no sabemos asrespostas, mas sabemos a pergunta: Qual a relaoentre estes dados?

    2.6.2.1.3. Redes por reforo.

    Agora olharemos para esta pessoa desde oincio da sua vida, as opes que tomou, e os

  • Inteligncia Artificial

    43

    resultados que alcanou. Se teve real izaofinanceira, profissional ou pessoal. Resultados queso conseqncias de vrios fatores, ocorrendo muitoaps cessadas as causas, como a real izaofinanceira, funo dos estudos entre outros fatores.

    Muitos outros exemplos poderiam surgir,sintetizam medidas de sucesso, cujos componentesalm de complexos e distantes, formam um grande ecomplicado somatrio de fatores.

    H portanto uma menor evidncia dacontribuio das opes feitas durante a vida, valoresdas variveis exgenas, com o sucesso, varivelendgena.

    2.6.2.2. As topologias

    As Redes Neurais se formam pelasinterconexes entre seus ns, sejam eles visveis ouno. Ou seja, desempenham um papel de interfacecom o mundo externo, para entrada ou sada dedados, ou desempenhando um papel interno, intangvelexternamente.

    NvelE s c o n d i d o

    Nvel de Sada

    N v e l d eE n t r a d a

  • Fernando Nogueira

    44

    2.6.2.2.1

    Segundo Bigus (1996), existem trs topologiasque representam a forma como os dados fluem atravsdestes ns. So elas: feedforward, limited recurrent efully recurrent.

    Figura B: Configurao feedforward

    Os dados de entrada so colocados nos ns deinput, sendo atenuados ou aumentados pelos pesos dasconexes entre os ns, em um nico sentido, vindo aafetar desta forma o valor dos ns de sada.

    Figura C: Configurao Limited Recurrent

    Nvel de Sada

    NvelEscondido

    Nvel deEntrada

    2.6.2.2.2. Limited Recurrent

    Nvel de Sada

    NvelEscondido

    Nvel de Entrada

    2.6.2.2.1. Feedforward

  • Inteligncia Artificial

    45

    De forma semelhante, os dados so colocadosna entrada, sendo que, nesta topologia, h influnciado fluxo de dados passado no clculo da sada atual, ouseja h memria, porm esta influncia no se fazcom os dados da sada, apenas informaesintermedirias so consideradas.

    Nvel de Sada

    Nvel Escondido

    Nvel de Entrada

    2.6.2.2.3. Fully Recurrent

    Figura D: Configurao Fully Recurrent

    Nesta topologia, as conexes entre os nsinternos e os de sada tm sentido duplo, permitindo arealimentao dos dados da sada.

    Esta caracterstica tem como conseqncia aimpossibilidade de previso do tempo de produo deum output, visto que ela se torna auto-gerida.

  • Fernando Nogueira

    46

    2.6.2.3. O modelo de Back Propagation.

    Uma determinada combinao de topologia,aprendizado e algoritmo fornece um modelo. Cada modelovisa uma adequao ao uso a que se destinam, sejaaprendizado rpido, timo, ou outra prioridade.

    Este modelo se utiliza da topologia feedfoward,com aprendizado supervisionado. Tem caractersticasde uso geral e, apesar de ter boa capacidade, exigeconfiguraes computacionais relevantes.

    Figura E: O Algoritmo Back-Propagation

    Neste algoritmo a funo de sada das unidades a funo identidade:

    e, deste ponto em diante, o valor de ativao aser utilizado tanto como valor de sada de uma unidadequanto como valor de entrada.

    o aj j=

    aj = (net i)

    erroj = tj - aj

  • Inteligncia Artificial

    47

    A partir desta comparao obtm-se o erro nasada, que o valor que se quer minimizar.

    Pode-se estabelecer um valor de referncia, umerro aceitvel, estando a rede treinada quando os errosdas suas sadas estiverem enquadrados nos valores dereferncia.

    Alm do erro, que poder ser expresso sob suaforma absoluta, quadrtica, mxima, ou outras deconhecimento geral, pode-se tambm adotar comomedidas do treinamento da rede a Acurcia e aCorrelao Linear (entre as sadas calculadas e as sadaspadro).1.1.1.1. A funo de Ativao

    Para corrigir-se os valores de sada, fazendo comque se aproximem dos valores desejados, existe a funode ativao. Ela procura minimizar o gradiente das sadas,denominada Regra de Delta Generalizada, obtendo aconvergncia entre os valores obtidos e esperados. Asfunes mais apropriadas para este propsito soaquelas com comportamento sigmoidal, sendo as maisusadas as logstica e a tangente hiperblica (Gallant,1994; Masters, 1994; in: Apostila de Redes Neurais

    Artificiais).0

    0,2

    0,4

    0,6

    0,8

    1

    x 0

    (a) funo logstica

  • Fernando Nogueira

    48

    -1

    -0,8

    -0,6

    -0,4

    -0,2

    0

    0,2

    0,4

    0,6

    0,8

    1

    -4 0 3,9

    a e ee e

    j

    net net

    net net

    j j

    j j= -

    +

    -

    -

    Figura -F: Funes de ativao

    O termo netj o valor da entrada total na unidade

    j, dado por:

    net w aj ji ii

    j= + q

    onde qj denominado bias (limiar) e pode serconsiderado como o peso de conexo com uma unidadeque tem o valor de sada igual a 1. Este termo ajustadodurante o treinamento pelo mesmo procedimento queos demais pesos.

    Cada parcela do somatrio acima, wji.ai ,representa a contribuio de cada uma das unidadesdo nvel inferior para a sada da unidade em questo.

    Apesar de intuitivo, a escolha errada de umafuno no impede o treinamento, apenas o retarda.

    Existe uma tendncia a uma mais rpidaadaptao dos pesos das conexes para funes com

  • Inteligncia Artificial

    49

    valores positivos e negativos, como a tanh (Masters,

    1994 in: Apostila de Redes Neurais Artificiais).

    Alm das funes citadas, existem diversasdesenvolvidas para variadas aplicaes (Hertz et al.,1990 in: Apostila de Redes Neurais Artificiais).

    2.6.2.5. O clculo do erro.

    O erro calculado da sada para a entrada,utilizando-se da derivada parcial da funo de ativao.No caso das funes citadas, seria:

    Tabela G: Deltas nas unidades

    2.6.2.6. Quando parar?

    Obtido o sinal de erro, pode-se determinar o fimdo treinamento atravs da comparao entre o valorobtido e um valor arbitrado de referncia. No h

    Funo logstica Funo tanh

    Derivada parcial

    Delta nasunidades de sada

    Delta nasunidades escondidas

  • Fernando Nogueira

    50

    entretanto garantias de que se alcance este valor,podendo ocorrer um super-treinamento da rede, queno representa um aprendizado mas uma memorizaodo Banco de Dados de treinamento. Para evitar isso,pode-se estabelecer que a rede cesse o treinamentopelo nmero de pocas, que so as passagens dotreinamento pelo Banco de Dados (ciclo de aprendizado).

    2.6.2.7. possvel acelerar-se a convergncia.

    Pode-se acelerar a convergncia do aprendizadoatravs da adio de coeficientes Regra de DeltaGeneralizada, coeficiente de smothing, ou simplesmentealterando os valores da taxa de aprendizado emomentum, a caracterstica de inrcia da rede agrandes alteraes das conexes, que ocorrendogerariam um valor acentuado no gradiente das sadas,instabilizando o aprendizado. H ainda a possibilidadeda incluso de termos de segunda ordem na funo deativao, entre outros mtodos (Hertz et al., 1990 in:Apostila de Redes Neurais Artificiais).

    2.6.2.8. Aspectos relevantes.

    No treinamento de uma rede pode-se chegar a umvalor de gradiente mnimo local, que no corresponde condio de treinamento mxima possvel. Tal podeser evitado atravs do retreinamento da rede a partirde pesos iniciais diferentes nas conexes. Existemmtodos que prevem esta situao, como o de(Vogl, 1988 in: Apostila de Redes Neurais Artificiais),com bons resultados.

  • Inteligncia Artificial

    51

    A escolha dos pesos iniciais deve ser por valorescom pequena amplitude, podendo ser positivos ounegativos, porm diferentes, entre [-2/z,2/z], ondez a quantidade de entradas de uma unidade(Gallant, 1994; in: Apostila de Redes NeuraisArtificiais). Uma rede com pesos iguais pode jamaisalcanar a condio tima de treinamento se estaocorrer para valores diferentes.

    Devido amplitude dos valores da entrada, estanecessita de tratamento para que a Rede Neuraltenha condies de treinamento. Como conseqnciadireta desta distoro dos dados, somada a limitaointrnseca das Redes Neurais quanto a valores desada, faz-se necessrio recorrigi-lo na sada.

    Um modelo com apenas um n invisvel capaz demodelar qualquer funo contnua com qualquer graude acurcia, segundo Bigus (1996).

    H muitas variaes do algoritmo original, entretantoele ainda o mais utilizado, principalmente devido sua simplicidade e versatilidade.

    Uma rede com um modelo de propagao retrgradapode facilmente modelar uma regresso linear, semnecessitar sequer de ns invisveis. Entretanto, aoadicionar-se um n invisvel, ela se torna no linear,ficando capaz de realizar regresses logsticasmultivariveis, de forma superior s tcnicasestatsticas, visto que podem ser geradas mltiplassadas simultneas.

    De uma forma geral, o uso de Redes Neurais abrangeclassificaes, modelagens e previses em sries

  • Fernando Nogueira

    52

    temporais.

    Entre outros modelos menos populares, pode-se citaro modelo de Kohonen, o modelo de PropagaoRetrgrada Recorrente, a modelo de Funo de BaseRadial, o da Teoria da Ressonncia Adaptativa edas Redes Probabilsticas. Cada um tem suascaractersticas e adequaes.

    2.6.2.9. Condensado.

    De forma sucinta, a lgica das Redes Neuraisconsiste de trs fases:

    1. Um dado fornecido a um n de entrada,encaminhado aos ns intermedirios, gerando umvalor nos ns de sada. Esta a previso obtida.

    2. Compara-se o vetor previso obtido com os valoresconhecidos, j que o aprendizado supervisionado.Da subtrao de um pelo outro, gerado um sinalde erro.

    3. O sinal de erro enviado de volta, atravs dasconexes, onde so obtidas suas contribuies paraaquele.

  • Inteligncia Artificial

    53

    3. METODOLOGIA

    3.1. Tipo de pesquisa

    Utilizando a tipologia de Vergara (1991), esteestudo se classifica quanto aos fins como exploratria,visto que se realizar em uma rea com poucoconhecimento acumulado, qual seja a utilizao deferramentas de Inteligncia Artificial na anlise dodesempenho de empresas.

    Quanto aos meios de investigao, umapesquisa bibliogrfica, uma vez que se utilizar de Bancosde Dados publicados.

    3.2. Universo e Amostra

    O universo da pesquisa so as empresasnacionais, de diversas indstrias, que tenham aesem bolsas de valores.

    3.3. Coleta de Dados

    Foram consultados os Bancos de Dadosdisponveis no programa Economtica.

  • Fernando Nogueira

    54

    3.4. A Anlise dos Dados

    3.4.1. A metodologia proposta

    Neste estudo prope-se a utilizao das duasferramentas, rvores de Deciso e Redes Neurais, emcadeia. Ou seja, submete-se o Banco de Dados anlisepor rvores de Deciso, seguida pela anlise por RedesNeurais.

    Tal ordenao visa explorar-se a caractersticade robustez e classificadora das rvores de Deciso,uma vez que se dispe de um Banco de Dadosrelativamente desconhecido, podendo inclusive conterparcela relevante de dados incompletos ou com rudos.

    Aps adquirida alguma base de conhecimento,pode-se partir para a utilizao de Redes Neurais, menosrobustas presena de variveis esprias.

    Entretanto, esta utilizao vem a requerer umtratamento de dados prvio, onde se devem retirar oscampos incompletos, bem como os dados claramenteerrados.

    3.4.1.1. As vantagens

    Da utilizao desta metodologia verifica-se apossibilidade de se criar uma base de conhecimentoinicial, na verdade uma classificao, obtida pelasrvores de Deciso, para ento partir-se para as RedesNeurais, em uma condio de utilizao mais segura.

  • Inteligncia Artificial

    55

    3.4.1.2. Em que casos seria mais conveniente?

    Esta metodologia se adequa a estudos em quese queira abrir o leque de variveis, bem como quelesem que se dispe de um Banco de Dados de grandesdimenses, em registros e em campos. Se aplica tambma Bancos de Dados em que se tenha pouco, ou nenhumconhecimento prvio, no se viabilizando uma seleode variveis.

    Para buscas conservadoras, em Bancos de Dadospequenos, pode-se tentar diretamente as Redes Neurais,caso a classificao seja dispensvel.

    A Anlise dos dados efetuou-se nas seguintes fases: Obteno dos dados Classificao dos dados Tentativa de previso Testes

    Estas etapas sero oportunamente explodidas,de forma sucinta se referiro a:

    Obteno de dados: Atravs dos Bancos deDados disponveis no programa Economtica,observando-se a qualidade dos dados, a possibilidadede explicao dos fenmenos a serem medidos e aquantidade de dados disponveis, entre outras.

    Classificao dos dados: Atravs da utilizaode rvores de Deciso, se buscar classificar os dadosde acordo com os tipos de sadas fornecidas. Estaclassificao explicitar as variveis de maior relevnciana explicao das variveis de sada, o que servir desubsdio ao passo seguinte.

  • Fernando Nogueira

    56

    Tentativa de Previso: Utilizando-se de RedesNeurais, e com uma expectativa de variveis maisrelevantes obtidas com as rvores de Deciso, setentar prever o comportamento das variveis de sada.

    Testes: Parte do Banco de Dados ter sidoseparada para que seja testado, e validado, o modeloobtido.

    3.5. Limitaes do Mtodo

    Esta pesquisa se limita a estudar os fatoresfinanceiros das empresas, o que explica apenas em parteseus desempenhos.

    Em nosso pas, devido atual poltica fiscal, deve-se olhar com restries os dados, mesmo oficiais,fornecidos pelas empresas. Para ilustrar tal afirmao,no ano de 1995, apenas 25% das 500 maiores empresasnacionais , em vendas, tiveram lucro superior a 6% noano. Ou seja, 75% sequer se igualaram ao rendimentomnimo garantido pela caderneta de poupana.

    A inexistncia de Bancos de Dados abrangentessobre empresas brasileiras pode obrigar a utilizao deempresas de segmentos distintos, forandogeneralizaes que significaro perda de informaes.

    3.6. O escopo e a avaliao do estudo.

    Neste estudo no se foca as ferramentas,evitando-se entrar em detalhes de setagens e dosefeitos conseguidos em cada opo, bem como nos

  • Inteligncia Artificial

    57

    labirintos da Inteligncia Artificial. Apesar de sernecessria a aquisio deste conhecimento para osucesso da proposta, seu detalhamento tiraria a atenodo estudo da metodologia para as ferramentas.

    Evita-se tambm a interferncia dos especialistano processo, tanto quanto possvel, o que poderiainfluenciar os resultados. Apesar de haver crticas aosresultados parciais, no se permitiu a influncia sobre oprocesso, o que refora a proposta inicial, de que muitasvezes se desconhece os modelos reais, devido aosparadigmas vigentes, que no permitem que se testealgumas hipteses.

    Considera-se a validao da amostra de testepor Redes Neurais como suficiente para a avaliao doprocesso, observando-se s ento sua consistncia.Ou seja, se esta metodologia for capaz de prever arentabilidade de empresas, ela consistente, ao menospara as caractersticas da amostra.

  • 4. O EXPERIMENTO

    4.1. Rodando as rvores de Deciso

    4.1.1. Economtica a origem dos Dados.

    Em uma breve descrio do programa, este sedestina a prover informaes financeiras emercadolgicas, entre outras, das empresas que tmaes nas Bolsas de Valores brasileiras.

    Estas informaes so de grande diversidade,especialmente as de carter financeiro, sendodisponibilizados, alm de dados crus, diversoscruzamentos relevantes de dados, sempre visandoanlises do desempenho passado e presente, bem comoextrapolaes para comportamentos futuros.

    So disponibilizadas tambm sries histricas dedados e pareceres sobre os ambientes destas empresas.

    1.1.2. O Banco de Dados .

    O Banco de Dados foi obtido atravs do programaEconomtica licenciado para a PUC-Rio.

    Dentro da grande gama de informaesoferecidas, foram selecionadas as que, a priori, seriam

  • Fernando Nogueira

    60

    indicadoras do desempenho das empresas. Nesta partese fez uso do especialista, o Prof. Dr. Jorge Ferreira daSilva, que conduziu esta seleo, tendo sido eleitos osseguintes indicadores:

    Indicador

    Rentabilidade sobre Ativos no ltimo Balano

    Rentabilidade sobre o Patrimnio Lquido no ltimoBalano

    Alavancagem Financeira no ltimo Balano

    Alavancagem Operacional no ltimo balano

    Ativos Permanentes no ltimo Balano

    Ativo Imobilizado no ltimo balano

    Salrios e Encargos no ltimo Balano

    Passivo Circulante

    Custo dos Produtos Vendidos

    Despesas Administrativas

    Lucro Antes do Imposto de Renda

    Incentivos Fiscais

    Aumento das Aes na Tesouraria

    Setor

  • Inteligncia Artificial

    61

    4.1.3. O formato.

    Apesar da aparente facilidade na obteno dosdados, tal aspecto no se estende ao formato em queele disponibilizado.

    O programa fornece um arquivo texto compadres de formatao que requerem tratamento, a fimde serem entendidos por programas de anlise de dados.

    4.1.4. Registros invlidos.

    Outra preocupao que deve ser considerada a existncia de grande parcela de registros com camposparcialmente fornecidos. Na verdade eles chegam acompor cerca de 45% do Banco de Dados para osindicadores que foram selecionados. Estes registrosdevem ser tratados, no caso eliminados, para que nohaja o comprometimento das anlises pelos Bancos deDados .

    Inicialmente este Banco de Dados oferecia 540registros contendo os dados selecionados (4.1.2.) dasaes negociadas nas bolsas brasileiras. Aps umafiltragem inicial, retirando apenas os registros com maisda metade dos campos em branco (no fornecidos) eas empresas que tivessem mais de uma ao na bolsade valores, passou-se a contar com 290 registros (7.1.),que foram os submetidos, aps tratamento, anlisepor rvores de Deciso.

    4.1.5. O experimento.

    Para a realizao da anlise por rvores deDeciso, foram seguidos os seguintes passos:

  • Fernando Nogueira

    62

    1. Tratamento dos dados. De posse dos dadosdisponibilizados no sistema Economtica, em arquivo.txt, foi gerado um Banco de Dados em dBase3, comformatao compreensvel pelo programa Profiler. Nagerao deste arquivo cumpriram-se as etapas quese seguem:

    Converso do Banco de Dados para o formatoExcel, onde pudesse ser manipulado eformatado.

    Reformatao do Banco de Dados, visto queo arquivo gerado pelo Economtica temformatao inadequada anlise, possuindolinhas em branco com finalidade puramenteesttica, tornando-se incompreensvel paraoutros programas;

    Eliminao dos registros com poucos camposdisponveis, o que se mostrou umanecessidade relevante pelo fato de havermuitas aes com falta de poro significativade parmetros (cerca de 45%);

    Gerao do Banco de Dados em dBase3 (paraser entendido pela interface ODBC);

    Submisso do Banco de Dados ao Administradorde ODBC.

    2. Anlise do Banco de Dados, utilizando oprograma Profiler. Escolha da varivel endgena, Rentabilidade sobre

    o Patrimnio - apenas uma pode ser escolhida -bem como a excluso daquelas que no serviriamcomo exgenas, por exemplo: NOME, RentabilidadeSobre Ativos e LAIR (que certamente teriam

  • Inteligncia Artificial

    63

    grandes correlaes com a Rentabilidade sobre oPatrimnio).

    Determinao dos parmetros de induo da rvorede Deciso. Neste ponto so escolhidos osprincipais parmetros que o programa utilizar paraas divises do Banco de Dados. So eles:

    Parmetro Setagem

    Menor Conjunto Admissvel 5

    Esta setagem permite adequar acomplexidade do modelo que sergerado. Ao l imitar-se ossubconjuntos a valores maiores,perde-se informao, por estarsendo mais generalista, porm acompreenso fica privilegiada, bemcomo os rudos existentes perdemparte da sua capacidade decomprometer a rvore a sergerada.

    Critrio de Diviso

    Apesar de ser recomendado o uso daentropia para variveis endgenasdiscretas, pode-se optar pelo critrioChi-quadrado.

    Entropia

    Mxima significncia por ramo

    Para variveis endgenasdiscretas deve-se utilizar o valor0,5%, para variveis endgenascontnuas pode-se ajust-lo paraoutros valores ( de 0,1% at 5,0%).

    0,5%

  • Fernando Nogueira

    64

    Alm destes parmetros, h tambm os que soconsiderados como default pelo programa, porm derelevncia para a rvore de Deciso. Estes fogem aoescopo do trabalho.

    Induo da rvore, propriamente dita. Ao determinar-se ao programa que induza automaticamente arvore de Deciso, este procede com os passoscitados no respectivo captulo, efetuando assubdivises sucessivas, otimizando os parmetrosde induo da rvore.

    Anlise da rvore obtida. O especialista avalia arvore gerada, bem como os indicadores de qualidadeoferecidos pelo programa, como o desvio padro,para o caso de variveis contnuas.

    Cabe aqui ressaltar que, como foi adotada umavarivel contnua como endgena, esbarrou-se naslimitaes do algoritmo (Quinlan, 96). Obteve-se entoelevados valores de desvio padro, ressaltando estalimitao. Isto gerou a necessidade de voltar-se aotratamento do Banco de Dados, com a criao de umavarivel discreta que retratasse a rentabilidade sobre opatrimnio.

    Tal procedimento, visivelmente limitador da gamade variao da varivel endgena, no traz grandeimpacto adequao da utilizao de rvores deDeciso, visto que sua proposta classificadora, e noprevisora. A sua razo pode ser explicada atintuitivamente, uma vez que, ao tratar-se uma varivelde forma contnua, automaticamente dispe-se de muitomenos registros para cada nvel de classificao.

  • Inteligncia Artificial

    65

    rvore 1 (ver anexo)

    Do ponto de vista prtico, e no matemtico,questiona-se o grau de certeza que se possa conferir adados de rentabilidade diferentes por at alguns pontospercentuais, em um mercado com a volatilidade do nosso,bem como com o grau de confiabilidade que se possaconferir aos dados financeiros fornecidos pelas empresasem um pas com a atual legislao fiscal, o mesmovalendo para a nossa fiscalizao das leis...

    Desta forma, considera-se a limitao que seimpe, pela utilizao de uma varivel classificadoradiscreta, sem impacto significativo para o mtodo aquiproposto, no qual as rvores de Deciso tm papelclassificador apenas.

    Voltando-se induo, obteve-se uma novarvore, que ser exposta a seguir, na qual foramoferecidos nveis de probabilidades de grande relevnciae com excelente grau de explicao, retomando obinmio, anlise versus poder de compreenso.Brindaram-se nesta nova rvore os trs nveis declassificao, existindo folhas com excelente nvel desegmentao e de representatividade, ou seja, comquantidades relevantes de ocorrncias e com elevadaacurcia.

    Classificao Acurcia Rentabilidade maior que 10% 61,1% Rentabilidade entre 0 e 10% 60,6% Rentabilidade menor que 0% 69,7% < Total> 63,6%

  • Fernando Nogueira

    66

    Entretanto, devido impossibilidade de utilizaoda varivel SETOR por Redes Neurais, esta foidesabilitada, obtendo-se uma nova rvore, cujos nveisde acurcia foram os seguintes:

    Classificao Acurcia

    Rentabilidade maior que 10% 75,5%

    Rentabilidade menor que 0% 52,8%

    < Total> 60,1%

    Demonstrando a importncia do SETOR para aclassificao das empresas como sensvel, porm noindispensvel.

    rvore 2 (vide anexo)

    O refinamento da rvore. Ao permitir-se maiorgrau de liberdade na segmentao dos subgrupos dasrvores, que se obteve ao diminuir-se a quantidademnima de ocorrncia por grupos, de 10 para 5 empresas,observou-se uma grande consistncia com a rvoreobtida anteriormente, o que ratifica a qualidade daquela.

    Classificao Acurcia

    Rentabilidade maior que 10% 75,0% Rentabilidade entre 0 e 10% 50,0% Rentabilidade menor que 0% 60,7% < Total> 62,5%

    Rentabilidade entre 0 e 10% 50,0%

  • Inteligncia Artificial

    67

    rvore 3 (vide anexo)

    4.1.6. Gerao das Regras.

    O programa gera as regras obtidas pela rvore,podendo ser fornecidos os cdigos de implementaoem diversas linguagens, bem como em lgica.

    As regras a seguir foram obtidas em um estgiointermedirio da anlise.

    Rules To Reach Leaf Profile 1IF ALAFIN_ULB < -0.463619834AND SETOR = Energia OR Mineracao OR Papel

    Cel OR BrinquedoTHEN RENT_DISCR = menor10 (Probability =

    0.7143)

    Rules To Reach Leaf Profile 2IF ALAFIN_ULB < -0.463619834AND ALAOPE_ULB < 0.736163792AND SETOR = Textil OR Petro Qui OR Alimento

    OR Siderurgi OR Construto OR Mat Trans OR QuimicaOR Madeira OR Seguros OR Informati

    THEN RENT_DISCR = maior10 (Probability =0.6000)

    Rules To Reach Leaf Profile 3IF ALAFIN_ULB < -0.463619834AND ALAOPE_ULB >= 0.736163792AND SETOR = Textil OR Petro Qui OR Alimento

    OR Siderurgi OR Construto OR Mat Trans OR QuimicaOR Madeira OR Seguros OR Informati

    THEN RENT_DISCR = menor0 (Probability =0.9091)

  • Fernando Nogueira

    68

    No Anexo 7.2.1. encontra-se a totalidade dasregras obtidas. Apenas para exemplificao, encontra-se no anexo 7.2.2. o cdigo automaticamente geradona linguagem C e, no anexo 7.2.3., o cdigo em SAS.

    Para cada folha a que nossa rvore chegou, ficaestabelecida uma regra que segmenta os grupos que acompe e a probabilidade associada.

    Estas regras so de fcil compreenso, o que jfora ressaltado como uma importante caractersticadesta ferramenta.

    4.1.7. Concluses sobre rvores de Deciso.

    4.1.7.1. A ferramenta.

    As rvores de Deciso se comprovaram comouma poderosa ferramenta classificadora.

    Chegou-se a resultados relevantes e de fcilcompreenso.

    Ao selecionar as variveis inseridas nas anlises,no se tinha a noo das diferenas de importncia decada uma na explicao dos padres existentes. Estessequer eram conhecidos, o que normalmente seresolveria atravs de uma anlise estatstica. Entretanto,utilizando-se de rvores de Deciso, isto foi alcanadorapidamente e com resultados de fcil digesto.

    O programa desconsiderou parcela relevante,em quantidade, das variveis prioristicamente eleitas,o que entretanto no causou perda da capacidade deexplicao do fenmeno, atravs de uma segmentaoabrangente . Isto comprova a qualidade desta

  • Inteligncia Artificial

    69

    metodologia de que se faam estudos de uma formamais ousada, visto que o prmio a ser pago muitomais baixo do que os das atuais metodologias, o quecertamente permitir associaes que antes seriamevitadas devido ao tempo que custariam e por poderemcomprometer os resultados gerais.

    Os resultados obtidos por rvores de Decisosero validados por Redes Neurais. Isto se implementaratravs da utilizao de trs Bancos de Dados, sendoum total e dois complementares e o mais excludentespossvel (no havendo comprometimento pela falta dedados), extrados do Banco de Dados geral, contendoou no os parmetros eleitos nesta etapa.

    4.1.7.2. As regras.

    A anlise ressaltou a importncia dasAlavancagens Financeira e Operacional, indicadorescrticos que, se por um lado viabilizam a existncia deuma empresa, podem tambm drenar sua lucratividade.

    Outro indicador que mereceu destaque foi oSetor, uma vez que cada qual tem o seu perfilfinanceiro, ou mesmo passa por momento distinto dosdemais. A eleio deste valida o modelo que percebeuestes perfis especficos, chegando a agrup-los, talvezem conjuntos que no seriam intudos.

    A rvore percebeu a significncia de Setor, , anica varivel no financeira, o que consistente como fato de setores da economia terem perfis erentabilidade distintas.

  • Fernando Nogueira

    70

    Ao retirar-se Setor do estudo, uma vez que nopoderia ser utilizado pelas Redes Neurais, observou-seainda uma classificao satisfatria.

    Finalmente os Ativos Permanentes, que naverdade um forte indicador da dimenso do negcio,ressaltando as oportunidades de ganhos em escala.

    4.2. Rodando as Redes Neurais.

    4.2.1. Utilizando todos os parmetros dos Bancosde Dados.

    4.2.1.1. Rodando

    Para a realizao da tentativa de previso porRedes Neurais, foram seguidos os seguintes passos:

    1. Tratamento dos dados. De posse dos dadosdisponibilizados no sistema Economtica, em arquivo.txt, foi gerado um Banco de Dados em Excel,podendo ou no efetuar-se um tratamento preliminardos dados. Na gerao deste Banco de Dadoscumpriram-se as etapas que se seguem:

    Eliminao dos registros com poucos camposdisponveis, de forma semelhante ao que sefez com rvores de Deciso, porm com maiornfase e durante o treinamento da rede(recurso do software), visto que a existnciade registros esprios tem grande efeitonegativo no treinamento. Neste Banco deDados constatou-se a existncia de algumasaes com falta de poro significativa deparmetros, assim como dados claramente

  • Inteligncia Artificial

    71

    absurdos. Aps este tratamento, o Banco deDados possua 268 registros.

    2. Anlise do Banco de Dados, utilizando oprograma Thinks Pro.

    Etapas: Escolha da varivel endgena (apenas uma

    pode ser escolhida), bem como a exclusodaquelas que no serviriam como exgenas,por exemplo: NOME, Rentabilidade Sobre Ativos(que certamente teria uma grande correlaocom a Rentabilidade sobre o Patrimnio quefoi escolhida como varivel endgena), bemcomo qualquer varivel no numrica, no casoSetor. Observa-se que variveis discretas soencaradas como contnuas.

    Determinao dos parmetros detreinamento da Rede Neural. So eles:

    Parmetro Setagem

    Arquitetura Multi Layer Full Feed Forward

    Tipo de erro Mdia do erro quadrtico

    Layers 5 (Input, Output e 3 Ocultos)

    Regra de Aprendizado Propagao Retrgrada Nor-

    mal (para todos)

    Funo de tratamento SumSq=1 (Input)

    de entradas L2 dist (Ocultos)

    Dot Prot (Output)

  • Fernando Nogueira

    72

    Alm destes parmetros h tambm os que soconsiderados como default pelo programa (Ward SystemsGroup, 1993), porm de relevncia para a Rede Neural.Estes fogem ao escopo do trabalho.

    Treinamento da Rede, propriamente dito. Aodeterminar-se ao programa que treineautomaticamente a Rede Neural, este procedecom os passos citados no respectivo captulo,adequando os pesos das conexes. Duranteo treinamento feito o acompanhamento dosvalores de erro total, mdio e mximo, bemcomo a porcentagem de acerto da amostrade treinamento, ou de teste, que se baseianos valores setados de tolerncia.

    Acompanhamento do treinamento. Deve-se observar que falsa a impresso de que ocontinuado treinamento melhora o aprendizadoda rede. Ao contrrio, a saturao dotreinamento bitola a rede que perde acapacidade de extrapolar seu aprendizadopara amostras inditas, limitando-se o acertoquelas da amostra de treinamento.

    Ajustes nas setagens da rede. Podem serexperimentadas variaes nos parmetros detreinamento da rede, sejam estes naquantidade de ns ocultos, nopreprocessamento dos dados, na topologia derede, ou qualquer outro disponibilizado pelosoftware. A tabela abaixo demonstra outrasvariaes tentadas neste experimento:

  • Inteligncia Artificial

    73

    4.2.1.2. Resultados

    Alm dos nveis alcanados no conjunto detreinamento, faz-se essencial a validao doaprendizado, para tal fazendo-se uso de amostra indita.No caso utilizou-se uma que fosse representativa doBanco de Dados, ou seja, possusse uma distribuiode nveis de sada semelhante do conjunto detreinamento. Esta amostra possua 24 registros.

    A seguir os resultados definitivos que foramobtidos, aps otimizaes e ajustes na rede:

    Arquitetura MultilayerFull FeedForward

    MultilayerFull FeedForward

    MultilayerFull FeedForward

    MultilayerFull FeedForward

    Layers 3 4 5 5

    Tratamentodas entradas

    sum sqr=1 sum sqr=1 sum sqr=1 feito no BD

    Erro mximo 44.31 42.78 43.49 32.63

    Erro mdio 4.95 4.89 4.89 7.37

    ClassificaoCorreta

    72.2 73.2 72.9 73.2

    Tolerncia(%)

    3 3 3 3

    Conjunto deTreinamento

    Conjunto de Teste

    Arquitetura Multilayer Full FeedForward

    N/A

    Layers 5 5Tratamento dasentradas

    sum sqr=1 sum sqr=1

  • Fernando Nogueira

    74

    Erro mximo 14,13 8,44Erro mdio 3,01 2,83ClassificaoCorreta (%)

    78,25 70,83

    Tolerncia (%) 3 3

    4.2.2. Rodando com os parmetros eleitos na r-vore de Deciso.

    4.2.2.1. Rodando

    Seguiu-se nesta etapa os mesmos passos doensaio que o precedeu (considerando todas as variveisdisponveis).

    Tentou-se entretanto avaliar a relevncia daclassificao obtida com a utilizao de rvores deDeciso. Para tal efetuaram-se dois experimentos, umcom contendo as variveis eleitas e outro com asdemais.

    As variveis eleitas:Alavancagem Financeira

    Alavancagem OperacionalAtivos Permanentes

    Alm destas observou-se o destaque dos Salriose Encargos e dos Incentivos Fiscais, entretanto noforam ratificados devido aos elevados nveis de dadosno fornecidos.

    Observou-se uma limitao do softwaredisponvel, devida utilizao de parmetros insuficientes

  • Inteligncia Artificial

    75

    (em quantidade, no em poder de explicao) para aarquitetura vigente.

    Objetivando no alter-la, evitando que osresultados obtidos fossem comprometidos ou privilegiadospor uma diferena de setagem, optou-se por incluir umavarivel a mais, escolhida entre as no eleitas,mantendo-se assim a setagem anterior da rede.

    Esta varivel extra foi trocada por outrasigualmente no eleitas, procurando-se variaes dedesempenho que indicassem que aquela seria um varivelrelevante, apesar de no eleita. Como esperado, istono ocorreu, obtendo-se nveis de treinamento evalidao semelhantes em todas as composiestestadas.

    4.2.2.2. Resultados

    Conjunto deTreinament

    o

    Conjunto deTeste

    Conjunto deTreinament

    o

    Conjuntode Teste

    Arquitetura Multilayer FullFeed Forward

    N/A Multilayer FullFeed Forward

    N/A

    Layers 5 5 5 5

    Tratamentodas entradas

    sum sqr=1

    L2 dist

    Dot prot

    sum sqr=1

    L2 dist

    Dot prot

    sum sqr=1

    L2 dist

    Dot prot

    sum sqr=1

    L2 dist

    Dot prot

    Erro mximo 14,30 5,45 28,46 11,48

    Erro mdio 3,18 2,81 5,57 6,98

    ClassificaoCorreta (%)

    77,63 73,33 63,73 20,00

    Tolerncia(%)

    3 3 3 3

  • Fernando Nogueira

    76

    4.2.3. Concluses sobre Redes Neurais

    O papel de previsor das Redes Neurais foicumprido de forma plenamente satisfatria. Osresultados obtidos, com as respectivas validaes,alcanaram ndices de acurcia incomuns.

    Evitou-se agregar ao experimento influnciasbaseadas no conhecimento de especialistas. Isto s sefez na escolha inicial das variveis que compuseram oestudo, sendo que mesmo essas se mostraram umuniverso muito maior do que o necessrio para chegar-se aos objetivos desejados.

    O conhecimento que foi aproveitado como pontode partida para a anlise com Redes Neurais foi apenaso obtido atravs da utilizao das rvores de Deciso,sendo que se confirmou a eficcia daquelas ao validar-se as escolhas feitas por estas, obtendo-se ndices deaprendizado completamente comprometidos ao retirar-se os indicadores eleitos pelas rvores de Deciso doconjunto de treinamento.

    As Redes Neurais que, divergindo das rvoresde Deciso, apresentam maior sensibilidade a rudos,exigiram uma maior precauo com os dados eexperimentos testados. Este cuidado foi tomado e notou-se a evoluo dos resultados ao filtrar-se dadosvisivelmente esprios, ou com lacunas relevantes. Destaforma evoluiu-se de ndices de aprendizado inferiores a50% para os valores finais listados.

    Conforme esperado, validou-se a utilizao dervores de Deciso. Os nveis de treinamento das redesalcanados demonstraram que as variveis eleitas

  • Inteligncia Artificial

    77

    explicaram o fenmeno, uma vez que ofereceram nveisde treinamento semelhantes aos obtidos com o Bancode Dados geral.

    No sentido contrrio, a utilizao de variveisdescartadas pelas rvores de Deciso, oferecem nveisde acurcia insignificantes nas amostras de teste, daordem de 20%, ou seja, nenhum, visto que, ao aplicar-se um valor constante e igual a zero a todas as sadas(nenhum aprendizado), obtm-se nveis desta ordem,pela simples distribuio dos valores endgenos.

  • 5. CONCLUSES SOBRE O ESTUDO

    5.1. Das Ferramentas

    A metodologia proposta demonstrou terqualidades que a tornam extremamente atrativa pararealizao de anlises de dados tabulados de empresas.

    Entre estas qualidades, cabe ressaltar o seupoder previsor e classificador, mesmo partindo-se dedados em excesso e, em especial, no caso de rvoresde Deciso contendo rudos e inconsistncias.

    Outro importante aspecto que no pode serdescartado a facilidade e a rapidez que ele oferece.O mtodo efetivamente inteligente e isto se faznotar pela baixa necessidade de interferncia do usuriono processo. Na verdade, tal interferncia se efetivouessencialmente no tratamento dos dados para a previsopor Redes Neurais, e nas escolhas dos parmetros deaprendizado, sejam eles as tolerncias, o tipo detratamento de dados iniciais e a arquitetura maisadequada.

    Apesar de ter sido proposta a utilizao dervores de Deciso seguida pela de Redes Neurais, cadaferramenta pode ser utilizada separadamente, sendo

  • Fernando Nogueira

    80

    isto decidido em funo da necessidade de classificarou prever. Na verdade foram feitas para seremferramentas autnomas, sendo a sugesto doacoplamento entre elas originria deste estudo, o quese mostrou til, mas no essencial para o Banco deDados utilizado.

    Por parte das rvores de Deciso, sendoadequada a classificao e as regras por ela oferecidas,esta funciona eficiente e robustamente quanto qualidade dos dados e existncia de informaessuprfluas.

    Entretanto, ao considerar-se as Redes Neurais,surge a necessidade de se ter melhor definido o escopodas variveis mais relevantes no fenmeno. Tal se deveao fato da funo previsora ser muito mais sensvel aosrudos que a classificadora.

    A se evidenciou a validade da metodologiaproposta, uma vez que as rvores de Decisoproporcionaram foco ao estudo por Redes Neurais. Estefoco, no caso de Bancos de Dados muito extensos, emregistros ou em campos, representaria um poderosocatalisador, evitando que as Redes Neurais tentassemo aprendizado em um Banco de Dados maior e pior.Mesmo antes disso, a filtragem de rudos ocorreria emum maior nmero de campos.

    5.2. Do conhecimento extrado do Banco de Dados.

    Alm da classificao e da previso conseguidas,j comentadas nos captulos de rvores de Deciso eRedes Neurais, respectivamente, observou-se um padroexistente no Banco de Dados, caracterstico da nossa

  • Inteligncia Artificial

    81

    economia, que certamente contribuiu para os elevadosnveis obtidos na classificao e previso: o peso daadministrao financeira no desempenho das empresas.

    Conforme comentado na Delimitao do Estudo(1.3.), o Banco de Dados estudado carente deinformaes de diversas naturezas, entre elas, capitalintelectual, satisfao dos stakeholders, valor da marca,qualidade dos processos, etc..

    O fato desta limitao no comprometer acapacidade de previso de rentabilidade das empresasdemonstra a distoro ainda existente no nosso pas, odomnio da administrao financeira sobre as demaisatividades das empresas, refletido na possibilidade dedispensa de outros indicadores, sem comprometimentodos resultados.

    Tal se deve obviamente atual poltica de juros,que tomam uma dimenso comparvel, em muitos casossuperior, ao lucro operacional das empresas.

    Se intuitivamente seria esperado que, quatroanos aps a estabilizao da economia, os desempenhosdas empresas teriam uma explicao menos financeirae mais produtiva (competitividade produtiva), uma vezque se deixara o ambiente inflacionrio, tal no seefetivou ainda, uma vez que as empresas pagam umcusto muito elevado pelo seu financiamento, deixandoa muito do que geram.

    Sugere-se batizar o padro descoberto com aoriginal alcunha de :

    CUSTO BRASIL.

  • AGRAWAL, R., MANNILA, H., SRIKANT, R., TOIVONEM,H., VERKANO, I.1996 Fast Discovery of Association Rules.:

    Advances in Knowledge Discovery andData Mining, MIT Press, pp. 307-329.

    A.A.1997 Apostila de Redes Neurais Artificiais,

    Programa de Engenharia Civil da COPPE/UFRJ.

    A.A.1997 Attar Software XpertRule Profiler.

    Documentao do Programa.

    BIGUS, J. P.1996 Data Mining with Neural Networks , 1 ed.

    USA, McGraw-Hill.

    BREIMAN, L. FRIEDMAN, J. H. OLSHEN, R. A., STONE, C. J.1984 Classification and Decision Trees, 1 ed.

    Monterrey, California, USA, Wadsworth &Brooks.

    FAYYAD, M., SHAPIRO, P. SMYTH, P., UTHURUSAMY, R.1996 Preface. Advances in Knowledge Disco-

    very and Data Mining. MIT Press, pp.xiii-xiv.

    6. BIBLIOGRAFIA

  • Fernando Nogueira

    84

    FENG, C. MICHIE, D.1994 Machine Learning of Rules and Trees.

    Machine Learning, Neural and StatisticalClassification, Ellis Horwood Series inArtificial Intelligence, pp 50-84.

    GAINES, B. R.1996 Transforming Rules and Trees into

    Comprehensible Knowledge Structures.Advances in Knowledge Discovery andData Mining, MIT Press, pp 205-229.

    GALLANT, STEPHEN I.1994 Neural Network Learning and Expert

    Systems, MIT Press, Cambridge.

    GUYON, I., MATIC, N. VAPNIK, V.1998 Discovering Informative Patterns and Data

    Cleaning. Advances in KnowledgeDiscovery and Data Mining. MIT Press, pp.181-205.

    HERTZ, J., KROGH, A., PALMER, R. G.1990 Introduction to the Theory of Neural

    Computing, Addison Wesley PublishingCompany,

    LU, H., SETIONO, R.,LIU, H.1996 Efective Data Mining Using Neural Networks,

    IEEE Transactions on Knowledge and DataEngineering, v. 8, n. 6, pp 957-961

    MANNILA, H.1997 Methods and Problems in Data Mining,

    Proceedings of Internacional Conferenceon Database Theory, Greece

  • Inteligncia Artificial

    85

    MICHIE, D. SPIEGELHALTER, D. J. TAYLOR, C. C.1994 Introduction. Machine Learning, Neural

    and Statistical Classification, Ellis HorwoodSeries in Artificial Intelligence, pp 1-5

    QUINLAN, J.1996 Improved Use of Continuos Attributes in

    C4.5. Journal of Artificial IntelligenceResearch 4. AI Access Foundation andMorgan Kaufmann Publishers, pp 77-90

    QUINLAN, J.1993 C4.5: Programs for Machine Learning. San

    Mateo, Calif.: Morgan Kaufmann

    SMITH, M.1996 Neural Networks for Statistical Modeling,

    1 ed. USA, International Thomson ComputerPress,.

    VERGARA, Sylvia Constant.1991 Sugesto para estruturao de um Projeto de

    Pesquisa. Cadernos de Pesquisa EBAP 02/91. Rio de Janeiro: Fundao Getlio Vargas

    VOGL, T. P., Mangis, J. K., Rigler, A. K., Zink, W. T.,Alkon, D. L.1988 Accelerating the Convergence of the

    Backpropagation Method, BiologicalCybernetics, Vol.4-5, N5, pp.257-263

    A.A.1993 Ward Systems Group, documentao do

    programa NeuroShell 2.

  • 7. ANEXOS

    7.1. Listagem de Empresas

    MPRESA RENTAT_ULB ALAFIN_ULB ALAOPE_ULB PERMAN_ULBIMOBIL_ULBAcesita P 0 0 5 0 0Acos Vill -4 -40 3 576257000 479584000Adubos Tr 1 0 6 117537000 114685000Agrale PN 1 1 -4 28581000 21868000Agroceres -15 12 -3 24568000 24115000Albarus O 16 1 4 141654000 51065000Alpargata 3 1 3 358935000 316976000Alpargata -20 1 -9 229234000 118622000Amadeo Ro -2 -1 -1 32137000 15554000America d 1 249664000 139130000Antarctic 14 3 2 106732000 87040000Antarctic 6 1 4 390153000 139036000Antarctic 3 1 5 0 447758000Antarctic 0 0 6 118919000 91815000Arno PN 9 2 3 58296000 54566000Artex PN -34 8 10 94689000 60254000Avipal ON 4 2 3 432814000 192452000Azevedo P -57 3 0 19799000 8606000Bahema PN 11 1 1 39678000 1454000Bahia Sul -6 -8 3 0 0Bandeiran -3 368758000 87698000Banrisul -1 197449000 80335000Bardella 6 -4 -1 80016000 32904000BCN PN -1 863551000 51105000Belgo Min 3 1 2 0 628205000Bemge PN 0 245275000 68178000Besc PNB 1 127709000 59755000Beta PNA -22 2 0 27444000 27334000Bic Caloi -61 -8 0 98994000 34365000Biobras P 19 2 4 15750000 14263000Boavista -8 430608000 42358000Bombril P 3 1 4 758552000 73907000Bompreco 5 1 9 523586000 270243000Bradesco 2 0 602322000Brahma PN 12 2 2 0 0Brampac P -31 10 0 100124000 4293000

  • Fernando Nogueira

    88

    Brasil PN 1 0 0Brasilit 28 1 9 249940000 10991000Brasinca -6 -9 -9 63850000 45370000Brasperol -3 -2 2 100880000 65816000Brazil Re 6 3 2 136126000 60540000Brumadinh -7 1 0 30697776 0Buettner -19 12 7 26603000 26495000C R T ON 4 1 2 0 0Cach Dour 0 0 3 0 0Cacique P 4 14 7 37045000 28035000Caemi Met 1 -1 0 625434000 370000Cambuci P -6 6 -14 40193000 34572000Casa Angl 5 2 1 172831000 6654000CBV Ind M 15 3 2 14842000 14842000CEB PN 5 1 4 432185000 430657000

    EMPRESA SLENCP_ULB PASCIR_ULB CPV_ULBA,E DESADM_ULBINCFIS_ULBAcesita P 22897000 578089000 472612000 61948000 0Acos Vill 12641000 287218000 316069000 40664000Adubos Tr 0 55834000 168947000 11455000 0Agrale PN 1301000 7667000 40212000 4439000 0Agroceres 4223000 52426000 40151000 16419000 0Albarus O 3916000 23548000 122371000 12585000 5192000Alpargata 8210000 176671000 311695000 24662000 0Alpargata 26268000 100106000 269596000 54367000 0Amadeo Ro 3321000 20837000 11865000 2041000America d 101704000Antarctic 0 50470000 48134000 8341000 727000Antarctic 0 88263000 96248000 18386000 231000Antarctic 0 350615000 331234000 34298000 1122000Antarctic 0 17728000 32035000 4647000 0Arno PN 5416000 45113000 187147000 15513000 0Artex PN 9203000 87256000 151346000 20142000 0Avipal ON 4262000 183783000 270774000 16696000 5847000Azevedo P 2471000 24035000 14760000 3487000Bahema PN 0 436000 0 743000Bahia Sul 0 516251000 226013000 41170000 0Bandeiran 295011000Banrisul 139951000Bardella 7725000 99036000 106405000 14567000 0BCN PN 242017000Belgo Min 36139000 306197000 371984000 26585000 0Bemge PN 103296000Besc PNB 96183000Beta PNA 547000 7112000 9003000 1792000Bic Caloi 2590000 54897000 87199000 11633000 0Biobras P 2508000 7603000 18356000 6878000 46000Boavista 130756000Bombril P 7914000 228907000 197002000 29562000 0Bompreco 7852000 199660000 909998000 26561000BradescoBrahma PN 68562000 159209000 4815000

  • Inteligncia Artificial

    89

    Brampac P 0 63928000 74625000 10688000Brasil PNBrasilit 1301000 41926000 37388000 2755000 183000Brasinca 3518000 74603000 15820000 3074000Brasperol 0 36758000 31656000 5330000Brazil Re 0 45042000 24192000 6381000 0Brumadinh 0 0 0 45470Buettner 1699000 25448000 41317000 3649000 0C R T ON 32712000 795883000 473376000 240665000 0Cach Dour 92000 22362000 0 16431000 0Cacique P 2402000 235174000 189902000 16846000 336000Caemi Met 431000 22916000 0 9467000Cambuci P 2379000 49349000 71708000 5316000 0Casa Angl 0 5903000 0 4880000CBV Ind M 0 42201000 48775000 9664000CEB PN 5825000 79767000 0 220989000

    EMPRESA RENTPA_ULB AUACTE_ULB SETOR RENT_DISCRLAIR_ULBA,Acesita P 0 0 Siderurgi menor10 -18251000Acos Vill -10 Siderurgi menor0 -31279000Adubos Tr 1 0 Fertiliza menor10 -29056000Agrale PN 2 0 Mat Trans menor10 771000Agroceres -37 0 Fertiliza menor0 -17813000Albarus O 18 0 Auto Peca maior10 35412000Alpargata 4 0 Textil menor10 16297000Alpargata -31 0 Textil menor0 -87852000Amadeo Ro -4 Metalurgi menor0 -2020000America d 13 Bancos maior10 35416000Antarctic 20 0 Bebidas maior10 44169000Antarctic 10 0 Bebidas maior10 36192000Antarctic 5 0 Bebidas menor10 63033000Antarctic 0 0 Bebidas menor10 -2568000Arno PN 12 0 Eletrodom maior10 29900000Artex PN -174 0 Textil menor0 -27445000Avipal ON 8 0 Alimento menor10 39700000Azevedo P -168 Construto menor0 -8517000Bahema PN 12 Comercio maior10 4440000Bahia Sul -13 0 Papel Cel menor0Bandeiran -53 Bancos menor0Banrisul -21 Bancos menor0 -91617000Bardella 10 0 Indust Me maior10 23068000BCN PN -14 Bancos menor0Belgo Min 4 0 Siderurgi menor10 62230000Bemge PN -37 Bancos menor0Besc PNB 10 Bancos maior10 42906000Beta PNA -35 Outros menor0 -7474000Bic Caloi 331 0 Mat Trans maior10 -83728000Biobras P 26 0 Quimica maior10 12998000Boavista -174 Bancos menor0Bombril P 5 0 Quimica menor10 48353000Bompreco 8 Comercio menor10 45277000Bradesco 15 Bancos maior10 830512000Brahma PN 34 0 Bebidas maior10 522872000

  • Fernando Nogueira

    90

    Brampac P -175 Outros menor0 -27463000Brasil PN 10 Bancos maior10 532014000Brasilit 35 0 Cimento maior10 135091000Brasinca -37 Mat Trans menor0 -9156000Brasperol -5 Textil menor0 -8208000Brazil Re 14 0 Construto maio