Mineração de Dados
-
Upload
thiago-furtado -
Category
Documents
-
view
562 -
download
15
Transcript of Mineração de Dados
Análise da Eficiência da Produção de Leite das Fazendas Brasileiras Utilizando
Mineração de Dados
Renan Marques dos Santos ([email protected])Thiago Bellotti Furtado ([email protected])
Custódio Gouvêa Lopes da Motta (custodio.motta@iceçufjf.br)
II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC
Descoberta de conhecimento em bancos de dados - KDD• Explorar grandes quantidades de dados à procura
de padrões consistentes.
II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC
• Etapas:– Consolidação dos dados– Seleção e pré-processamento– Mineração de dados– Avaliação e interpretação
Mineração de dados - DM
II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC
• É um conjunto de técnicas e ferramentas usadas para identificar padrões (conhecimentos) embutidos nos dados.
• Os padrões extraídos devem ser válidos, novos, potencialmente úteis e compreensíveis.
• DM é usada principalmente quando a solução matemática é muito cara ou impossível (exemplo: problemas relacionados com a natureza).
Mineração de dados
II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC
• Não é uma tecnologia nova, mas sim um campo de pesquisa multidisciplinar:
Banco de DadosData Warehouse
Arquiteturas ParalelasGrid Computing
Visualização de DadosMétodos Qualitativos
Aprendizado de MáquinaSistemas Especialistas
Métodos EstatísticosAnálise Multivariada
Lógica FuzzyRedes Neurais
Algoritmos Genéticos
Data Mining
O problema da produção de leite nas fazendas brasileiras
Informações dispersasInformações dispersas
Coleta (Embrapa e FGV)Coleta (Embrapa e FGV)
Base de dadosBase de dados
Pesquisas (estatísticas)Pesquisas (estatísticas)
MEDIDA DE EFICIÊNCIAMEDIDA DE EFICIÊNCIA
II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC
Base de dadosBase de dados
Mineração de dadosMineração de dados
MEDIDA DE EFICIÊNCIAMEDIDA DE EFICIÊNCIA
II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC
Avaliação e interpretaçãoAvaliação e interpretação
CONHECIMENTOCONHECIMENTO
Proposta de análise de eficiência
Material e Métodos
II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC
1. Medida de eficiência e as Bases de dados contendo todas as fazendas do Brasil e separadas por região e por raça de gado.
2. Softwares: Feature Selection e Weka.3. Tarefas de mineração: classificação de dados e seleção
de características.
Objetivos Principais1. Classificar as fazendas conforme suas produções de
leite sejam de Baixa, Média ou Alta eficiência.2. Identificar as características que mais influenciam na
eficiência da produção de leite e o grau de influênciade cada uma delas.
Agora eu tenho o conhecimento
II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC