Mineração de Dados

8
Análise da Eficiência da Produção de Leite das Fazendas Brasileiras Utilizando Mineração de Dados Renan Marques dos Santos ([email protected]) Thiago Bellotti Furtado ([email protected]) Custódio Gouvêa Lopes da Motta (custodio.motta@iceçufjf.br) II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC

Transcript of Mineração de Dados

Page 1: Mineração de Dados

Análise da Eficiência da Produção de Leite das Fazendas Brasileiras Utilizando

Mineração de Dados

Renan Marques dos Santos ([email protected])Thiago Bellotti Furtado ([email protected])

Custódio Gouvêa Lopes da Motta (custodio.motta@iceçufjf.br)

II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC

Page 2: Mineração de Dados

Descoberta de conhecimento em bancos de dados - KDD• Explorar grandes quantidades de dados à procura

de padrões consistentes.

II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC

• Etapas:– Consolidação dos dados– Seleção e pré-processamento– Mineração de dados– Avaliação e interpretação

Page 3: Mineração de Dados

Mineração de dados - DM

II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC

• É um conjunto de técnicas e ferramentas usadas para identificar padrões (conhecimentos) embutidos nos dados.

• Os padrões extraídos devem ser válidos, novos, potencialmente úteis e compreensíveis.

• DM é usada principalmente quando a solução matemática é muito cara ou impossível (exemplo: problemas relacionados com a natureza).

Page 4: Mineração de Dados

Mineração de dados

II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC

• Não é uma tecnologia nova, mas sim um campo de pesquisa multidisciplinar:

Banco de DadosData Warehouse

Arquiteturas ParalelasGrid Computing

Visualização de DadosMétodos Qualitativos

Aprendizado de MáquinaSistemas Especialistas

Métodos EstatísticosAnálise Multivariada

Lógica FuzzyRedes Neurais

Algoritmos Genéticos

Data Mining

Page 5: Mineração de Dados

O problema da produção de leite nas fazendas brasileiras

Informações dispersasInformações dispersas

Coleta (Embrapa e FGV)Coleta (Embrapa e FGV)

Base de dadosBase de dados

Pesquisas (estatísticas)Pesquisas (estatísticas)

MEDIDA DE EFICIÊNCIAMEDIDA DE EFICIÊNCIA

II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC

Page 6: Mineração de Dados

Base de dadosBase de dados

Mineração de dadosMineração de dados

MEDIDA DE EFICIÊNCIAMEDIDA DE EFICIÊNCIA

II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC

Avaliação e interpretaçãoAvaliação e interpretação

CONHECIMENTOCONHECIMENTO

Proposta de análise de eficiência

Page 7: Mineração de Dados

Material e Métodos

II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC

1. Medida de eficiência e as Bases de dados contendo todas as fazendas do Brasil e separadas por região e por raça de gado.

2. Softwares: Feature Selection e Weka.3. Tarefas de mineração: classificação de dados e seleção

de características.

Objetivos Principais1. Classificar as fazendas conforme suas produções de

leite sejam de Baixa, Média ou Alta eficiência.2. Identificar as características que mais influenciam na

eficiência da produção de leite e o grau de influênciade cada uma delas.

Page 8: Mineração de Dados

Agora eu tenho o conhecimento

II Workshop de Trabalhos de Graduação e Pós-Graduação do DCC