INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A...

14

Transcript of INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A...

Page 1: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.
Page 2: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE

ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA

DE DATAMINING

Aluna: Lúcia Salomé de Aguilar

Orientador: Prof. Heitor Garcia de Carvalho, Ph.D

Page 3: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

INTRODUÇÃO

Assim como o trabalho desenvolvido pelo bolsista PIBIC Minervino Martins Neto, este projeto avaliará dados recolhidos nos processos seletivos do CEFET-MG. Porém, a análise fatorial do conjunto de dados será substituída pela técnica de datamining com o intuito de captar bem certas informações em formato de texto e buscar padrões de dados em subconjuntos da população com cardinalidade reduzida.

 

 

Page 4: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

O QUE É DATAMINING?

A Mineração dos Dados, denominada Datamining, é uma das etapas principais dentro do Processo de Extração de Conhecimento em Base de Dados ( KDD – Knowledge Discovery Database). Através do uso de suas técnicas e algoritmos, padrões são “descobertos” dentro de uma Base de Dados, provendo assim, recursos para que o Analista do Conhecimento possa identificar informações relevantes e inteligentes no que antes, era uma massa de Dados.

Page 5: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

O QUE É WEKA?

WEKA (Waikato Enviroment for Knowledge Analysis) é uma ferramenta livre e disponível para download na Internet. Foi desenvolvida pela Universidade de Waikato na Nova Zelândia, sendo utilizada para Mineração de Dados.

Page 6: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

1. Investigar os padrões implícitos nos conjuntos de dados numéricos e em variáveis textuais dos bancos de dados relativos ao vestibular dos cursos de engenharia do CEFET-MG ;

2. A partir da investigação, identificar características dos perfis dos alunos que demandam o ingresso na escola e confrontá-los com o dos aprovados;

3. Após identificar tais características, subsidiar medidas de interesse pedagógico e administrativo.

OBJETIVOS

Page 7: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

METODOLOGIA

1. Estudo da teoria, do software e dos métodos;

2. Obtenção de dados do exame vestibular e derivados de documentos, além das respostas aos formulários de inscrição, fornecidos pelos candidatos;

3. Adaptação dos dados obtidos aos formatos eletrônicos requeridos para utilização no software de mineração de dados;

4. Crítica e depuração do banco de dados obtidos de forma a adequá–lo aos requisitos da ferramenta de datamining (WEKA);

Page 8: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

5. Elaboração de hipóteses de pesquisa de padrões de associação (estudo da probabilidade de um item ocorrer dado que outro item esteja presente) e de clusterização (identificação das classes dentro da base de dados e agrupamento de objetos em classes semelhantes);

6. Aplicação do software de datamining;

7. Interpretação e análise crítica dos resultados;

8. Elaboração de conclusões e de relatórios de pesquisa;

Page 9: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

EXEMPLOS1. QUESTIONÁRIO

Page 10: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

2. DADOS PASSADOS PARA PLANILHA

EntrA1 EntrA2Q1 nome ProfHA ProfGAQ2 contato 34854399 32259250Q3 sexo 2 2Q4 faixa_etaria 5 7

Q5.1a curso_magist 0 0Q5.1b instituicao_magist 0 0Q5.1c conclusao_magist 0 0

Q5.2a curso_grad Licenciatura Plena em História Geografia

Q5.2b instituicao_gradFafi-BH Católica - MG

Q5.2c conclusao_grad 1985 1974

Page 11: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

3. LISTAGEM DAS RESPOSTAS POSSIVEIS

Q2 sexo 0 Nenhum1 Feminino2 Masculino

9998 Outros9999 Branco

Q3 faixa_etaria 0 Nenhum1 18 aos 25 anos2 26 aos 30 anos3 31 aos 35 anos4 36 aos 40 anos5 41 aos 45 anos6 46 aos 50 anos7 mais de 50 anos

9998 Outros9999 Branco

Page 12: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

4. DADOS PRONTOS PARA O WEKA PROCESSAR

se

xo

faix

a_

eta

ria

cu

rso

_g

rad

1

tip

o_

ins

titu

ica

o_

gra

d1

ins

titu

ica

o_

gra

d1

co

nc

lus

ao

_g

rad

1

cu

rso

_g

rad

2

tip

o_

ins

titu

ica

o_

gra

d2

ins

titu

ica

o_

gra

d2

co

nc

lus

ao

_g

rad

2

2 5 13 7 11 3 0 0 0 02 7 12 7 16 1 0 0 0 01 3 23 8 22 5 0 0 0 01 4 3 7 14 4 0 0 0 01 7 19 7 11 2 0 0 0 02 6 20 11 28 2 0 0 0 01 5 15 7 16 2 0 0 0 02 2 15 8 18 5 0 0 0 01 5 14 7 16 4 0 0 0 01 7 5 8 13 1 0 0 0 01 6 7 8 18 3 0 0 0 02 4 17 7 15 5 8 8 18 51 3 3 7 14 5 0 0 0 0

Page 13: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

1. Informações sobre os perfis de alunos que demandam o ingresso nos cursos de engenharia do CEFET-MG contrastando-os com as características dos aprovados e que sejam relevantes para o seu atendimento pedagógico durante o curso;

2. Aquisição de proficiência pelo aluno bolsista em uma técnica aplicável a problemas no seu campo profissional.

RESULTADOS ESPERADOS

Page 14: INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.

BIBLIOGRAFIA

OLIVEIRA, Araceli Garcia. Descoberta de Conhecimento na Base de Dados do Processo Seletivo do UNIFOR-MG. Formiga, MG: Monografia, 2004.

MONTEIRO, Mário do Socorro Jardim; ROCHA, Vanderlene Covre. Descoberta de Conhecimento na Base de Dados do Processo Seletivo Seriado da UFPA – 2004, Usando Regras de Associação. Belém, PA: Monografia, 2005.