CLASSIFICAÇÃO DE TEXTOS APLICADA À AVALIAÇÃO ECONÔMICA - TCC
-
Upload
vivaldo-jose-breternitz -
Category
Data & Analytics
-
view
122 -
download
4
description
Transcript of CLASSIFICAÇÃO DE TEXTOS APLICADA À AVALIAÇÃO ECONÔMICA - TCC
CLASSIFICAÇÃO DE TEXTOS APLICADA À AVALIAÇÃO ECONÔMICA
Trabalho de Conclusão de Curso
UNIVERSIDADE PRESBITERIANA MACKENZIE
Faculdade de Computação e Informática
Fábio Magalhães Costa
Orientador: Prof. Dr. Vivaldo José Breternitz
INTRODUÇÃO
Popularização da Internet
Melhoria e avanço dos portais de notícias
Grande volume de informações disponíveis
Análise e interpretação em grandes volumes de dados
Redução de custos e precisão em avaliações econômicas
OBJETIVO
Problemas identificados:
Grande quantidade de dados
Falta de normalização
Excesso de ruídos
Influência política e de agentes de mercado
Desenvolver um aplicativo que reconheça padrões e classifique textos extraídos de portais econômicos da WWW como notícias positivas, neutras e negativas utilizando técnicas de redes neurais e algoritmos similares
MERCADO FINANCEIRO
Caracterizado pela transferência de recursos
Investimentos são necessários para a visão macroeconômica e para o agente individual
Captação de recursos realizada a partir do mercado de capitais
Avaliação econômica
Hipótese dos Mercados Eficientes
Teoria dos Caminhos Aleatórios
Análise Fundamentalista
Análise Técnica
CONCEITOS DE MINERAÇÃO
Descobrir padrões em grandes quantidades de dados
Etapas básicas na descoberta de conhecimento em mineração:
Entrada de dados
Pré-processamento dos dados
Redução de dimensionalidade
Normalização e seleção do subconjunto de dados
Utilização de algoritmos de mineração
Pós processamento
Obtenção de informações
Pré processamento
Algoritimos de classificação
CONSTRUÇÃO DO APLICATIVO
Tecnologias Utilizadas
UML
Java, RMI, JDBC, Swing
MySQL
RSS
WEKA
Arquitetura Cliente-Servidor
COMPONENTES
RESULTADOS
Criação de base de dados inicial
6773 notícias classificadas
Portais utilizados:
Brasil Econômico
Folha Mercado
Valor Econômico
Classificação automática
72% de acerto
28% de erro
TRABALHOS FUTUROS
Setorização de notícias
Versão Web e Mobile
Suporte a multi-idioma
Migração para arquitetura SaaS
Integração com séries históricas de preços
OBRIGADO
Fábio Magalhães Costa
Orientador: Prof. Dr. Vivaldo José Breternitz
Agradecimentos a banca:
Prof. Dr. Luis Tadeu Raunheitte
Prof. Ms. Rafael Gamez Gamez