Data Mining: o problema da seleção de atributos
-
Upload
guest163ad5c -
Category
Technology
-
view
267 -
download
1
Transcript of Data Mining: o problema da seleção de atributos
![Page 1: Data Mining: o problema da seleção de atributos](https://reader037.fdocumentos.com/reader037/viewer/2022102807/55b5c4f4bb61eb5a5b8b461f/html5/thumbnails/1.jpg)
O problema da seleção de atributos
Classifique estas personalidades
![Page 2: Data Mining: o problema da seleção de atributos](https://reader037.fdocumentos.com/reader037/viewer/2022102807/55b5c4f4bb61eb5a5b8b461f/html5/thumbnails/2.jpg)
Jogadores
Lutadores
ArtistasRevolucionários
CientistasPolíticos
A tarefa de classificação pode ser feita de diversas maneiras
![Page 3: Data Mining: o problema da seleção de atributos](https://reader037.fdocumentos.com/reader037/viewer/2022102807/55b5c4f4bb61eb5a5b8b461f/html5/thumbnails/3.jpg)
Argentina
Canadá Inglaterra
Brasil
EUA
A tarefa de classificação pode ser feita de diversas maneiras
China
Índia
Austria
Polônia
![Page 4: Data Mining: o problema da seleção de atributos](https://reader037.fdocumentos.com/reader037/viewer/2022102807/55b5c4f4bb61eb5a5b8b461f/html5/thumbnails/4.jpg)
Quais os melhores atributos?
Local de nascimento; Altura; Peso; Idade; Tipo sanguíneo; Formação; Atividade; Renda; ...
![Page 5: Data Mining: o problema da seleção de atributos](https://reader037.fdocumentos.com/reader037/viewer/2022102807/55b5c4f4bb61eb5a5b8b461f/html5/thumbnails/5.jpg)
Antes de tudo pensar em:
Para a função da base todos os atributos anteriores são necessários?
Como funciona o algoritmo? Algum atributo pode influenciar muito
nos resultados gerados?
Lembrar que:Maior parte dos algoritmos leva em conta todos os atributos da base, não seleciona apenas um (como nos slides da apresentação).
![Page 6: Data Mining: o problema da seleção de atributos](https://reader037.fdocumentos.com/reader037/viewer/2022102807/55b5c4f4bb61eb5a5b8b461f/html5/thumbnails/6.jpg)
Bases de dados
Tendência de grandes bases é tornar-se um “bando de dados” e não um banco de dados.
Se é necessário conhecimentos específicos um especilista pode dizer: Atributos mais relevantes; Atributos menos relevantes.
Isto pode melhorar resultados de qualquer algoritmo. Instance Based Learning: os valores descritos nos
atributos servem de comparação com novos exemplos. Então, quais são os melhores exemplos?