Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido...
Transcript of Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido...
![Page 1: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,](https://reader035.fdocumentos.com/reader035/viewer/2022081602/552fc12a497959413d8ceab4/html5/thumbnails/1.jpg)
Text MiningText MiningSistemas de Informação e Gestão
![Page 2: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,](https://reader035.fdocumentos.com/reader035/viewer/2022081602/552fc12a497959413d8ceab4/html5/thumbnails/2.jpg)
IntroduçãoIntrodução
Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar, encontrar e descobrir informação escrita na linguagem natural.
É possível manipular mais facilmente as informações não estruturadas como notícias, textos em websites, blogs etc.
![Page 3: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,](https://reader035.fdocumentos.com/reader035/viewer/2022081602/552fc12a497959413d8ceab4/html5/thumbnails/3.jpg)
Extracção de InformaçãoExtracção de Informação
Exemplo:◦José da Silva é funcionário da Empresa XYZ,
mora na Rua X, número 31, tem 35 anos de idade, e ...
Resultado:◦Nome: José da Silva◦Empresa: XYZ◦Endereço: Rua X, 31◦Idade: 35 anos
![Page 4: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,](https://reader035.fdocumentos.com/reader035/viewer/2022081602/552fc12a497959413d8ceab4/html5/thumbnails/4.jpg)
Text MiningText Mining
O processo de mineração de textos foi definido por Martins Junior (2003) em função das seguintes actividades:
1. Obtenção dos Documentos2. Pré-Processamento dos Documentos3. Extracção do Conhecimento ou Classificação4. Avaliação do Conhecimento
![Page 5: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,](https://reader035.fdocumentos.com/reader035/viewer/2022081602/552fc12a497959413d8ceab4/html5/thumbnails/5.jpg)
Obtenção dos DocumentosObtenção dos Documentos
Selecção dos documentos textuais a serem utilizados no processo de mineração.◦Texto Puro◦HTML◦XML◦etc.
![Page 6: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,](https://reader035.fdocumentos.com/reader035/viewer/2022081602/552fc12a497959413d8ceab4/html5/thumbnails/6.jpg)
Pré-ProcessamentoPré-Processamento
Consiste em Determinar uma forma padrão para a extracção do conhecimento / Classificação no documento condido
![Page 7: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,](https://reader035.fdocumentos.com/reader035/viewer/2022081602/552fc12a497959413d8ceab4/html5/thumbnails/7.jpg)
Extracção do ConhecimentoExtracção do Conhecimento
Operações realizadas com o intuito de capturar informações / classificar dados num conjunto de entrada não estruturado.
É a etapa de “mineração” propriamente dita.
![Page 8: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,](https://reader035.fdocumentos.com/reader035/viewer/2022081602/552fc12a497959413d8ceab4/html5/thumbnails/8.jpg)
Avaliação do ConhecimentoAvaliação do Conhecimento
Determina se o conhecimento é válido (se está coreto, e se é útil).