CLASSIFICAÇÃO DE TEXTOS APLICADA À AVALIAÇÃO ECONÔMICA - TCC

Post on 21-Jan-2015

122 views 4 download

description

Slides referentes à apresentação do TCC do aluno Fábio Magalhães Costa, da Faculdade de Computação e Informática da Universidade Presbiteriana Mackenzie.

Transcript of CLASSIFICAÇÃO DE TEXTOS APLICADA À AVALIAÇÃO ECONÔMICA - TCC

CLASSIFICAÇÃO DE TEXTOS APLICADA À AVALIAÇÃO ECONÔMICA

Trabalho de Conclusão de Curso

UNIVERSIDADE PRESBITERIANA MACKENZIE

Faculdade de Computação e Informática

Fábio Magalhães Costa

Orientador: Prof. Dr. Vivaldo José Breternitz

INTRODUÇÃO

Popularização da Internet

Melhoria e avanço dos portais de notícias

Grande volume de informações disponíveis

Análise e interpretação em grandes volumes de dados

Redução de custos e precisão em avaliações econômicas

OBJETIVO

Problemas identificados:

Grande quantidade de dados

Falta de normalização

Excesso de ruídos

Influência política e de agentes de mercado

Desenvolver um aplicativo que reconheça padrões e classifique textos extraídos de portais econômicos da WWW como notícias positivas, neutras e negativas utilizando técnicas de redes neurais e algoritmos similares

MERCADO FINANCEIRO

Caracterizado pela transferência de recursos

Investimentos são necessários para a visão macroeconômica e para o agente individual

Captação de recursos realizada a partir do mercado de capitais

Avaliação econômica

Hipótese dos Mercados Eficientes

Teoria dos Caminhos Aleatórios

Análise Fundamentalista

Análise Técnica

CONCEITOS DE MINERAÇÃO

Descobrir padrões em grandes quantidades de dados

Etapas básicas na descoberta de conhecimento em mineração:

Entrada de dados

Pré-processamento dos dados

Redução de dimensionalidade

Normalização e seleção do subconjunto de dados

Utilização de algoritmos de mineração

Pós processamento

Obtenção de informações

Pré processamento

Algoritimos de classificação

CONSTRUÇÃO DO APLICATIVO

Tecnologias Utilizadas

UML

Java, RMI, JDBC, Swing

MySQL

RSS

WEKA

Arquitetura Cliente-Servidor

COMPONENTES

RESULTADOS

Criação de base de dados inicial

6773 notícias classificadas

Portais utilizados:

Brasil Econômico

Folha Mercado

Valor Econômico

Classificação automática

72% de acerto

28% de erro

TRABALHOS FUTUROS

Setorização de notícias

Versão Web e Mobile

Suporte a multi-idioma

Migração para arquitetura SaaS

Integração com séries históricas de preços

OBRIGADO

Fábio Magalhães Costa

Orientador: Prof. Dr. Vivaldo José Breternitz

Agradecimentos a banca:

Prof. Dr. Luis Tadeu Raunheitte

Prof. Ms. Rafael Gamez Gamez