UM PROTÓTIPO DE DATA MINING APLICADO AO PROCESSO DE GESTÃO EDUCACIONAL PARA DETECÇÃO DE EVASÃO...

110
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ COORDENAÇÃO DE LICENCIATURA EM INFORMÁTICA DESENVOLVIMENTO DE SISTEMAS PARA INTERNET E DISPOSITIVOS MÓVEIS PEDRO HENRIQUE DE ALENCAR MACHADO UM PROTÓTIPO DE DATA MINING APLICADO AO PROCESSO DE GESTÃO EDUCACIONAL PARA DETECÇÃO DE EVASÃO ESCOLAR MONOGRAFIA DE ESPECIALIZAÇÃO 14

description

A necessidade de gestão da aprendizagem é um objetivo cada vez mais importante, tendo em vista os problemas encontrados em nosso país em prover uma educação eficiente e de qualidade. Dentre esses problemas podemos mencionar alguns, como por exemplo: Pouco investimento em tecnologia de gestão, sobrecarga de trabalho enfrentada pelos professores, falta de interesse dos alunos sobre temas abordados, entre tantos outros. Tendo em vista a gama de informações que as Instituições de Ensino Superior têm em suas bases de dados, uma análise dos dados pode prover mecanismos que auxiliem docentes e gestores em tomadas de decisões mais assertivas. Este trabalho descreve a criação de um protótipo web de mineração de dados que visa detectar a evasão escolar de alunos do curso de Licenciatura em Informática da Universidade Tecnológica Federal do Paraná – Campus Francisco Beltrão. Uma aplicação web foi criada, cuja foi preparada para receber parâmetros de um aluno e calcular a probabilidade do referente tornar-se um aluno evasivo.

Transcript of UM PROTÓTIPO DE DATA MINING APLICADO AO PROCESSO DE GESTÃO EDUCACIONAL PARA DETECÇÃO DE EVASÃO...

UNIVERSIDADE TECNOLGICA FEDERAL DO PARANCOORDENAO DE LICENCIATURA EM INFORMTICADESENVOLVIMENTO DE SISTEMAS PARA INTERNET E DISPOSITIVOS MVEIS

PEDRO HENRIQUE DE ALENCAR MACHADO

Um prottipo de data mining aplicado ao processo de gesto educacional para deteco de evaso escolar

MONOGRAFIA DE ESPECIALIZAO

FRANCISCO BELTRO2014

PEDRO HENRIQUE DE ALENCAR MACHADO

Um prottipo de data mining aplicado ao processo de gesto educacional para deteco de evaso escolar

Monografia de Especializao apresentada a Coordenao de Licenciatura em Informtica, da Universidade Tecnolgica Federal do Paran como requisito parcial para obteno do ttulo de Especialista em Desenvolvimento de Sistemas para Internet e Dispositivos Mveis.

Orientador: Ms. Paulo Jnior Varela

FRANCISCO BELTRO2014

Ministrio da EducaoUniversidade Tecnolgica Federal do ParanCampus Francisco BeltroDiretoria de Pesquisa e Ps-GraduaoCurso de Especializao em Desenvolvimento de Sistemas para Internet e Dispositivos Mveis

TERMO DE APROVAO

Dia 11 do ms de dezembro de 2014 s 16 horas, no mini auditrio do Cmpus Francisco Beltro, realizou-se a apresentao pblica da monografia pelo estudante Pedro Henrique de Alencar Machado intitulada Um prottipo de data mining aplicado ao processo de gesto educacional para deteco de evaso escolar. Finalizada a apresentao e arguio, a Banca Examinadora declarou aprovada a monografia do estudante, como requisito parcial para obteno do ttulo de Especializao em Desenvolvimento e Sistemas para Internet e Dispositivo Mveis.

__________________________________Professor Paulo Jnior Varela - UTFPR(Orientador)

___________________________________Professor Flvio de Almeida e Silva - UTFPR(Convidado)

___________________________________Professor Dr. Ademir Roberto Freddo - UTFPR(Convidado)

__________________________________Professor Dr. Ademir Roberto Freddo - UTFPR(Coordenao)

Ao meu paiMiguel Angelo Machado(in memoriam)

agradecimentosNo h dvidas que as palavras contidas neste tpico, no sero suficientes para expressar a minha total gratido quanto a todos os envolvidos nesta conquista, mas uma coisa cabe muito a este item, esta conquista de cada um descrito nos pargrafos que se segue, sem mais delongas.Aos meus pais, pela educao, pelo amor incondicional, apoio e confiana, sem as quais jamais idealizaria nada que foi um dia almejado. A todos meus amigos distantes, em especial meu irmo Jos (Obina), pelos momentos de descontrao, desordem e ciladas.Aos meus amigos Mauro e Cassio, que permitiram que este trabalho se tornasse realidade, me apoiando at nos momentos de descanso e relaxo.Ao meu professor orientador Sr. Ms. Paulo Jnior Varela, por quem demonstrei enorme admirao desde as primeiras aulas ministradas. Pela confiana no tema abordado, disposio em sempre ajudar e principalmente pelos conhecimentos transmitidos durante todo o processo.A minha amiga e noiva Julili, pelos momentos de refgio, conversas e silncio. Por sua conta aprendi o quanto tudo isso vale a pena. Deus, por ter me permitido a vida, e pessoas to especiais. Graas a ti, estou aqui.

No sabendo que era impossvel, ele foi l e fez.Jean Cocteau.19

ResumoA necessidade de gesto da aprendizagem um objetivo cada vez mais importante, tendo em vista os problemas encontrados em nosso pas em prover uma educao eficiente e de qualidade. Dentre esses problemas podemos mencionar alguns, como por exemplo: Pouco investimento em tecnologia de gesto, sobrecarga de trabalho enfrentada pelos professores, falta de interesse dos alunos sobre temas abordados, entre tantos outros. Tendo em vista a gama de informaes que as Instituies de Ensino Superior tm em suas bases de dados, uma anlise dos dados pode prover mecanismos que auxiliem docentes e gestores em tomadas de decises mais assertivas. Este trabalho descreve a criao de um prottipo web de minerao de dados que visa detectar a evaso escolar de alunos do curso de Licenciatura em Informtica da Universidade Tecnolgica Federal do Paran Campus Francisco Beltro. Uma aplicao web foi criada, cuja foi preparada para receber parmetros de um aluno e calcular a probabilidade do referente tornar-se um aluno evasivo.Palavras-chave: Minerao de dados. Educao. Prottipo.

abstractThe need for learning management is an increasingly effulgent goal, in view of the problems encountered in our country to provide an efficient and quality education. Among these we can mention some problems, such as: Little investment in technology management, workload faced by teachers, lack of interest from students about topics covered, among many others.Considering the range of information that higher education institutions have in their databases, an analysis of data can provide mechanisms to assist teachers and administrators in taken more assertive decisions. This paper describes the creation of a prototype web data mining that aims to detect the school dropout students of Bachelor in Informatics of the Federal Technological University of Paran - Campus Francisco Beltro. A web application was created, which was prepared to receive parameters of a student and to calculate the probability of referring to become an elusive.Keywords: Data mining. Education. Prototype.

LISTA DE ILUSTRAESFigura 1 - Etapas do KDD7Figura 2 - Diagrama de Caso de Uso16Figura 3 - Diagrama de Classe17Figura 4 - Analisar probabilidade19Figura 5 - DER Alunos25Figura 6 - Situao dos Alunos26Figura 7 - Cdigo para recuperar planilha xls27Figura 8 - Cdigo mdia de acontecimento27Figura 9 - Cdigo classificao dos alunos28Figura 10 - Design responsivo do prottipo33Figura 11 - Formulrio33Figura 12 - Mtodo preparaAluno()34Figura 14 - Criao da sesso para apresentao do resultado35Figura 15 - Grfico de probabilidade35

LISTA DE TABELASTabela 1 - Mtodos implementados na WEKA13Tabela 2 - Resultado da classificao questionrio scio educacional.34

LISTA DE SIGLAS E ABREVIATURASAPI Application Programming InterfaceARFF Attribute Relation File FormatCSS Cascading Style SheetsDCU Diagrama de Caso de UsoDER Diagrama de Entidade RelacionamentoGPL General Public Licence HTML HyperText Markup LanguageIDE Integrated Development EnvironmentIES Instituio de Ensino SuperiorJDBC Java DataBase ConnectivityJSF JavaServer Faces KDD Knowledge Discovery in Databases MD Minerao de DadosMVC Model View ControllerPIB Produto Interno BrutoSGBD Sistema Gerenciador de Banco de DadosSQL Structured Query LanguageTI Tecnologia da InformaoUML Unified Modeling LanguageUTFPR Universidade Tecnolgica Federal do ParanWEKA Waikato Environment for Knowledge Analysis

SUMRIO1. INTRODUO11.1 OBJETIVOS..............................................................................................................21.2 JUSTIFICATIVA........................................................................................................31.3 ESTRUTURA DO TRABALHO.................................................................................42. REFERENCIAL TERICO52.1 EVASO ESCOLAR NAS IES..................................................................................52.2 MINERAO DE DADOS........................................................................................62.3 TAREFAS DE MINERAO DE DADOS................................................................72.4 WEKA.......................................................................................................................93. MATERIAIS E MTODOS.......................................................................................123.1 MATERIAIS............................................................................................................123.2 MTODOS.............................................................................................................154. RESULTADOS........................................................................................................214.1 REQUISITOS.........................................................................................................214.2 ANLISE................................................................................................................224.3 EXPERIMENTOS...................................................................................................234.4 DESENVOLVIMENTO...........................................................................................255. CONCLUSO..........................................................................................................376. REFERNCIAS .......................................................................................................39ANEXO A ................................................................................................................... 44ANEXO B ...................................................................................................................50

1. INTRODUO

Uma pesquisa realizada pela UNESCO (2014) destacou uma problemtica relacionada ao nmero de analfabetos adultos no Brasil. A pesquisa coloca o pas como 8 (dentre 150 pases avaliados) com o maior ndice de analfabetos adultos. A pesquisa destaca como uma das provveis causas do nmero anteriormente citado, a m qualidade da educao, falta de preparao dos docentes, entre outras causas.A pesquisa ainda destaca que menos de 10% dos professores brasileiros, na poca do exame, estavam fazendo algum curso de preparao. Das 150 naes participantes da pesquisa, somente 25% delas aplicaram no ano anterior 6% do PIB (Produto Interno Bruto) na rea da educao, cuja uma inteno j anteriormente apresentada pela prpria UNESCO.Para a obteno de sucesso nos desafios do analfabetismo, da evaso escolar, entre outras problemticas ligadas educao brasileira, o uso da tecnologia da informao pode ser usado como mecanismo de auxlio, como por exemplo, nas seguintes atividades: Agilidade na anlise dos dados, armazenamento e centralizao das informaes, interatividade dos alunos com os educadores, automao de tarefas e processos, dentre tantas outras.Como ferramenta de auxlio na anlise de dados est a utilizao de tcnicas de minerao de dados para extrair as informaes implcitas existentes em grandes bases de dados das organizaes em questo. Lucas (2002) acredita que:A transformao da informao da informao em conhecimento pode fazer com que as grandes organizaes sobrevivam neste mercado globalizado, pois esta transformao fornecer informaes que aps serem analisadas de forma correta passam a ser utilizadas para tomadas de decises mais seguras.Um dos atuais desafios das Instituies de Ensino Superior organizar os dados e transform-los em informaes teis. O uso de tecnologias computacionais podem auxiliar gestores e educadores a obterem uma vantagem competitiva sustentvel.A extrao das informaes previamente destacadas, segundo Fayyad (1996) denomina-se Knowledge Discovery in Databases (KDD) ou ento descoberta de conhecimento em base de dados. Ainda segundo o autor, por mais comum que seja usar os termos KDD e Minerao de Dados com o mesmo significado, o mesmo define KDD como sendo o processo de extrao de conhecimento dos dados como um todo, e Minerao de Dados, como apenas uma etapa particular do KDD, sendo que nesta etapa a extrao de padres dos dados realizada atravs do uso de algoritmos especficos.Descobrir o conhecimento nas mais diversas bases de dados de diferentes instituies o objetivo da tarefa de Minerao de Dados, alm de permitir uma maior agilidade no processo de tomadas de decises por parte dos gestores responsveis. O armazenamento de dados por si s no traz nenhuma contribuio, necessrio realizar uma anlise sobre os elementos previamente armazenados e a partir da criar informaes relevantes que podem auxiliar em tomadas de decises. Chiara (2003) destaca que: Para a aplicao de tcnicas de minerao de dados necessrio que se tenha uma coleo de dados disponvel. Entretanto, o problema conseguir dados relevantes para extrair deles conhecimento potencialmente til.Tendo em vista todas as informaes anteriormente apresentadas, o presente trabalho prope o desenvolvimento e aplicao de tcnicas de minerao de dados sobre informaes, previamente coletadas, de alunos de diferentes perodos e situaes do curso de Licenciatura em Informtica da Universidade Tecnolgica Federal do Paran Campus Francisco Beltro, a fim de promoverdados e possveis estratgias para auxlio nas tomadas de decises por parte dos seus gestores.

1.1 OBJETIVOS

A seguir sero apresentados os objetivos gerais e especficos do trabalho em questo.

1.1.1 OBJETIVOS GERAIS

Aplicar tcnicas de minerao de dados sobre uma base de dados fornecida pela IES UTFPR Campus Francisco Beltro e outra criada com base em um questionrio aplicado em alunos do curso de Licenciatura em a fim de classificar e prever a evaso.

1.1.2 OBJETIVOS ESPECFICOS

Para a concretizao do objetivo geral, elencam-se a seguir os seguintes objetivos especficos:a. Aplicao de um questionrio scio educacional (Anexo A) sobre alunos que esto cursando Licenciatura em Informtica na IES UTFPR Campus Francisco Beltro;b. Levantar junto a IES informaes de alunos que esto cursando e que esto em situao desistentes do curso de Licenciatura em Informtica na IES UTFPR Campus Francisco Beltro;c. Estudar e configurar a ferramenta WEKA para utiliz-la na aplicabilidade de tcnicas de minerao de dados nas bases de informaes previamente criadas;d. Tratar as informaes coletadas e criar uma base de dados que ser utilizada nos testes;e. Estudar e aplicar o algoritmo Naive Bayes sobre as bases de dados criadas, a fim de identificar e classificar os registros armazenados;f. Construir uma aplicao capaz de receber uma nova instncia de um aluno e classific-lo nas bases de dados criadas;

1.2 JUSTIFICATIVA

A fim de permanecerem competitivas no mercado moderno, as IES devem considerar suas atividades como quaisquer outras exercidas dentro do mbito empresarial. Segundo Furtado (2004), desta forma, as instituies podem ser impactadas pelas mesmas situaes que afligem os mercados:[...]o setor educacional vem atraindo um nmero crescente de novos atores e o mercado educacional de novos integrantes, que passam a disputar o domnio deste mercado com as instituies tradicionais. Estas, por sua vez, vem-se foradas a rever suas prticas e mtodos at ento utilizados, como condio para que possam continuar tendo relevncia em seus servios prestados e que sobrevivam em um cenrio altamente competitivo.Frente s argumentaes anteriormente apresentadas, justifica-se da seguinte forma a relevncia ao tema proposto: a crescente importncia da gesto da informao em todas as organizaes e a pouca disponibilidade de estudos e pesquisas voltadas para esta rea tendo como foco a aplicao deste conceito dentro do mbito de uma IES. Alm disto, importante ressaltar o que fora previamente licitado no item 1 deste trabalho quanto a problemtica do analfabetismo no Brasil e o que est sendo planejado para resoluo e amenizao desta, torna de suma importncia prover tcnicas que auxiliem os gestores em tomadas de decises a fim de trabalharem de maneira mais especfica e minimizar o nmero de possveis egressos.

1.3 ESTRUTURA DO TRABALHO

O trabalho est dividido em 5 captulos. O primeiro apresenta a introduo, objetivos e justificativas para a realizao deste trabalho. O Captulo 2 apresenta uma contextualizao terica sobre os conceitos e caractersticas das tcnicas de minerao de dados. O Captulo 3 apresenta os materiais e mtodos utilizados para a realizao deste trabalho. O Captulo 4 apresenta os resultados obtidos, que se resume aos resultados obtidos com a aplicao do algoritmo e a aplicao de manipulao e apresentao de novas instncias de alunos ingressos, dentre outros recursos. Finalizando, no captulo 5 so apresentadas as concluses, dificuldades encontradas e as sugestes de trabalhos futuros.

2. REFERENCIAL TERICO

Este captulo apresenta o referencial terico do trabalho em questo, todas as tcnicas e tecnologias utilizadas como parmetro para a construo deste trabalho. A fundamentao terica serve como base para a fundamentao da pesquisa, neste item apresenta-se caractersticas sobre a Minerao de Dados com suas tcnicas e tarefas, ferramentas para data mining, a API WEKA, utilizado no sistema web desenvolvido para a deteco da evaso dos alunos do curso de Licenciatura em Informtica da IES UTFPR Campus Francisco Beltro.

2.1 A EVASO ESCOLAR NAS IES

De acordo com Gaioso (2005), a evaso escolar um problema social que causa, alm de outros, uma interrupo no ciclo de estudos. um problema que vem preocupando as instituies de ensino em geral, pois a evaso de alunos provoca graves consequncias sociais, acadmicas e econmicas. (BAGGI, 2010).Alunos desistentes fazem com que certos investimentos sejam aplicados de maneira errada, levando em considerao que o discente no prover nenhum dos retornos esperados. Dentre tantas, esta uma das mais agravantes problemticas da evaso escolar (LEAL, 2007).Hiplito (2009) descreve que, em 2009, somente 8% da populao brasileira adulta tem formao superior, em controversa com outros pases: Coreia, 32%, Espanha, 28%, Rssia, 55% e Chile, 13%. (HIPLITO, 2009).De acordo com uma pesquisa realizada pelo Inep em 2006, o percentual de evaso anual de alunos de cursos de Cincias, Matemticas e Computao tem uma taxa mdia de evaso em torno dos 28%, consideravelmente acima da mdia nacional abaixo apenas da evaso anual mdia registrada pelos cursos de Servios (LEAL, 2007).

2.2 MINERAO DE DADOS

A minerao de dados prov maneiras e mtodos automatizados para facilitar a descoberta de padres em dados, sem a tendenciosidade e a limitao de uma anlise baseada na instituio humana. (BRAGA, 2005).Devido ao avano da tecnologia da informao e o crescimento da Internet, as organizaes so capazes de coletar e armazenar enorme quantidade de dados. Pessoas, gradualmente, esto percebendo que os dados no so iguais informao, os devem ser analisados e extrados para torn-lo informao. A alta capacidade de armazenamento de dados tm dificultado a capacidade de interpret-los e convert-los em informaes de apoio a tomada de decises (PASTA, 2011).A relao entre grandes massas de dados e, posteriormente a descoberta de informaes e novos conhecimentos, podem ser teis para realizar atividades de tomada de deciso. (BAKER, 2011).Graas ao avano tecnolgico e a alta oferta de recursos tecnolgicos, corporaes esto armazenando em banco de dados milhares de informaes, que aliado s aplicaes, serve de base para tomadas de decises (SHIBA, 2008).Somente dados armazenados em grandes bases de dados, por si s, no representam nenhum tipo de informao, a atividade de descobrir conhecimento em banco de dados denomina-se Knowledge Discovery in Databases KDD (Descoberta de Conhecimento em Bases de Dados) (SILVA, 2004).Segundo Fayyad (1996) KDD a extrao de conhecimento dos dados previamente armazenados, onde uma das etapas a minerao de dados.Um dos principais desgnios da disciplina de Minerao de Dados descobrir os conhecimentos em grandes bases de dados de diferentes corporaes por meio da aplicao de algoritmos especficos. Segundo Oliveira e Rosa (2007): A descoberta de conhecimento em bases de dados multidisciplinar e, historicamente, se origina de diversas reas, dentre as quais podem ser destacadas a estatstica, inteligncia computacional, reconhecimento de padres e banco de dados. Os autores Goldschmidt e Passos (2005) agrupam as atividades do KDD em trs distintos grupos, cujos so ilustrados na Figura 1: Desenvolvimento tecnolgico; Execuo de KDD; Aplicao dos resultados.

Figura 1 - Etapas do KDD Fonte: Pasta apud Figueira (1988)Cada etapa do processo de Minerao de Dados entendida como um sub processo do KDD. Eles consistem em uma preparao mais refinada dos dados provenientes das etapas anteriores (HORST E MONARD, 2000): Consolidao dos dados: coleta e consolidao dos dados que dar incio ao processo de extrao do conhecimento. Seleo e pr-processamento: melhora na qualidade e transformao dos dados, a fim de evitar possveis distores na extrao do conhecimento. Minerao de dados: definio de quais algoritmos sero utilizados na extrao do conhecimento. Interpretao e avaliao: analise dos resultados obtidos para o julgamento do modelo obtido da fase anterior. Nesta etapa tambm se busca criar uma forma de interpretar os resultados visando leitura direta dos mesmos.

2.3 TAREFAS DE MINERAO DE DADOS

De acordo com o objetivo esperado, diferentes tarefas de MD podem ser realizadas. Tarefa de Minerao de Dados o modo como as informaes sero mineradas (PASTA, 2011).As tarefas possveis de um algoritmo de extrao de padres podem ser agrupadas em atividades descritivas e preditivas. Classificao e Regresso so consideradas tarefas de atividade preditiva, enquanto as atividades de Associao, Clusterizao e Sumarizao so as principais atividades descritivas. (GALVO, 2009).

2.3.1 CLASSIFICAO

A tarefa de classificao consiste na criao de classes previamente definidas de acordo com suas semelhanas, preconiza Pasta (2011).Essa tarefa determina um conjunto de classes (padres) que podem ser usadas para classificar novos objetos. A tarefa de classificao busca uma funo que permite associar corretamente cada registro de um banco de dados a um nico rtulo categrico de chamado de classe (RABELO, 2007).Os mais conhecidos algoritmos utilizados na tarefa de classificao so: Redes Neurais, Back-Propagation, Classificadores Bayesianos e Algoritmos Genticos.

2.3.2 REGRESSO

Por lidar com resultados contnuos, esta tarefa pode ser utilizada como uma tarefa de classificao, estabelecendo-se que diferentes faixas de valores correspondem a diferentes classes (PASTA, 2011).

2.3.3 ASSOCIAO

A tarefa descritiva de Associao consiste em identificar a relao entre atributos. Por exemplo, um cliente que adquire um produto X, em N% de vezes, adquire o produto Y tambm (CAMILO, SILVA, 2009).Os seus algoritmos procuram por relaes entre os itens das transaes, analisando os que ocorrem simultaneamente, dando possibilidade de entendimento de novos modelos (PASTA, 2011).

2.3.4 CLUSTERIZAO OU SEGMENTAO

A tarefa descritiva de clusterizao ou segmentao procura identificar a proximidade e similaridade entre registros. Um cluster uma coleo de registros similares entre si. (CAMILO, SILVA, 2009).Seu objetivo principal fazer a partio da base de dados em um nmero determinado de clusters, nos quais as instncias destes clusteres sejam similares. (PASTA, 2011).

2.3.5 SUMARIZAO

A tarefa descritiva de sumarizao tem por objetivo a identificao e apresentao das principais caractersticas dos dados, de forma concisa e compreensvel (PASTA, 2011).A sumarizao visa identificar e indicar as caractersticas comuns entre um conjunto de dados. Esta tarefa aplicada nos clusters obtidos na tarefa de clusterizao ou segmentao. As tcnicas de sumarizao so, na maior parte das vezes, aplicadas anlise exploratria de dados e gerao automtica de relatrios (GALVO, 2009).

2.4 WEKA

Waikato Environment for Knowledge Analysis WEKA uma ferramenta que contempla algoritmos de preparao de dados, minerao e validao de resultados (SILVA, 2004).O software WEKA tem sido bastante utilizado no meio acadmico em pesquisas que envolvam a rea de MD. Sua escolha se justifica por causa de sua ampla aplicabilidade j que lida com atributos numricos (reais e inteiros), nominais e caracteres (string) (PASTA, 2011).O WEKA foi desenvolvido por universitrios da Universidade de Waikato, na Nova Zelndia, no ano de 1999 e sua licena General Public Licence (GPL), o que significa que um programa de distribuio livre (SILVA, 2004).Este software formado por um conjunto de algoritmos que implementam vrias tcnicas que so utilizadas para a resoluo de problemas reais de MD. O WEKA foi desenvolvido na linguagem Java, cuja principal caracterstica sua portabilidade, assim sendo podendo ser executado em diversas plataformas, dentre as quais, Windows, MAC Os X e Linux. O nico requisito que o computador possua a mquina virtual Java instalada (MORATE, 2010).O software WEKA composto por dois pacotes: um pacote autnomo, para manipulao direta dos algoritmos, usando o formato de dados prprio, e um pacote de classes em Java que implementam estes algoritmos. Nessa segunda forma, possvel desenvolver uma aplicao em linguagem Java que faa uso destes algoritmos e aplic-los em quaisquer bancos de dados atravs de uma conexo JDBC (Java DataBase Connectivity) (PASTA, 2011).Alguns mtodos implementados no WEKA, so:ClassificaoPredio numricaAgrupamentoAssociao

rvore de deciso induzidaRegresso linearEMApriori

Regras de aprendizagem

Geradores de arvores modeloCobweb

FPGrowth

Naive BayesRegresso local de pesosSimpleKMeans

PredictiveApriori

Tabelas de deciso

Aprendizado baseado em instnciaDBScan

Tertius

Regresso local de pesosTabela de deciso

CLOPE

Aprendizado baseado em instnciaPerceptron multicamadas

Regresso logica

Perceptron

Perceptron multicamada

Comit de perceptrons

SVM

Tabela 1 - Mtodos implementados na WEKA Fonte: Adaptado de Pasta (2011)

3 MATERIAIS E MTODOS

Este captulo apresenta as ferramentas, tcnicas e tecnologias utilizadas para a elaborao e construo deste trabalho. Neste escopo descrita a metodologia utilizada para atingir o resultado final bem como artefatos de modelagem construdos para auxiliar na construo da ferramenta.

3.1 MATERIAIS

Os materiais e ferramentas usadas para desenvolver a aplicao data mining aplicado ao processo de gesto educacional para deteco de evaso escolar foram:a) JavaServer Faces (JSF): De acordo com Melo (2010), JSF um framework de componentes para desenvolvimento web em Java. Essa definio foi definida por meio do Java Community Process (JSP), o que significa que grandes empresas como Apache, BEA Systems, IBM, Oracle, entre outras, aprovam as suas especificaes, isso torna o JSF imediatamente um padro de mercado. A utilizao do JSF, entre outras, permite, tambm, a separao entre a lgica, a regra de negcio e a navegao entre os componentes da interface, seguindo o modelo MVC (Model View Controller). No JSF a controller fica por conta de um servlet, chamado Faces Servlet, cujo destinado a receber as requisies, encaminh-las a model e enviar respectivas respostas. A camada model constituda por classes de entidade e de negcio e que sendo assim recebem dados da camada view e executam as regras pertinentes ao negcio. A view composta por uma hierarquia de componentes visuais organizados.

b) IDE Net Beans: O Net Beans um ambiente de desenvolvimento integrado, gratuito e de cdigo fonte aberto. A IDE foi popularizada pela empresa Sun Microsystems em 1999, cuja nomeou o projeto como NetBeans Developer X2. Em junho de 2000 a Sun disponibilizou o cdigo fonte da aplicao, tornando-a uma plataforma OpenSource. A verso utilizada neste trabalho foi a 7.3, cuja proporciona ao desenvolvedor ferramentas teis de formatao de cdigo, marcao de pontos de parada (breakpoints) e outras ferramentas teis que facilitam o desenvolvimento.c) Bootstrap: um framework para a estruturao, diagramao e desenvolvimento da camada front-end de uma aplicao web. Construdo e distribudo de maneira OpenSource em Agosto de 2010 na empresa Twitter pelos engenheiros Mark Otto e Jacob, o Bootstrap foi o projeto que mais teve acesso desde a sua divulgao Outubro de 2014. O framework compatvel com a maior parte dos navegadores web, e desde a verso 2.0 tambm suporta e aplica o design responsivo.

d) HTML 5: Segundo Boneli (2011), o HTML 5 a prxima gerao da linguagem de marcao HTML, sucedendo HTML 4.01, XHTML 1.0 e XHTML 1.1. Oferece novas funes que so necessrias para aplicativos mveis modernos. Ele padroniza diferentes caractersticas de aplicaes web que desenvolvedores utilizam a anos, porm, que nunca foram documentados por um comit de padronizao. Um dos principais objetivos facilitar a manipulao dos elementos de interface, possibilitando o desenvolvedor modificar as caractersticas dos objetos de forma no intrusiva e de maneira transparente ao usurio final.

e) JQUERY: Segundo Silva (2008), Jquery uma maneira fcil e simples de escrever JavaScript e colocada ao alcance no somente de programadores experientes, mas tambm de designers e desenvolvedores com pouco conhecimento de programao. Em 22 de agosto de 2005, John Resig, um desenvolvedor americano de profundo conhecimento em JavaScript, escreveu em seu blog um artigo relatando sua frustao com a maneira verbosa de se escrever cdigo JavaScript para obter os resultados pretendidos. Neste artigo pblicou alguns exemplos no quais propunha o uso de seletores CSS com o principal objetivo de simplificar e dar mais versatilidade ao cdigo. O nome ainda no existia, mas nessa ocasio foi lanada a ideia que traria como resultado a biblioteca Jquery.

f) PrimeFaces: Segundo Melo (2010), o PrimeFaces uma biblioteca de componentes para JavaServerFaces com mais de 90 componentes registrados. uma das ferramentas mais completas e uma das primeiras a estar totalmente convertida para JSF 2.0. Para a aplicao em questo, foi utilizado a API em questo para a apresentao em forma de grficos, dos resultados do clculo de probabilidade evasiva de novas instncias de alunos.

g) WEKA: WEKA uma sute de minerao de dados muito popular no meio acadmico, desenvolvido utilizando a linguagem Java. Criada nas dependncias da Universidade de Waikato, Nova Zelndia. Atualmente mantida por uma comunidade de entusiastas por ser um software livre disponvel sobre a licena GPL. A ferramenta WEKA oferece uma srie de recursos, dentre os quais uma API que permite realizar a integrao dos algoritmos e tcnicas de minerao de dados uma aplicao JAVA. (SILVA, 2004).

h) Astah: uma ferramenta de diagramao UML, com ela possvel a criao de diagramas de caso de uso, diagramas de classe, alm de outros diagramas, tais como diagrama de fluxo de dados, diagrama de entidade-relacionamento e outras funcionalidades teis na fase de especificao e projeto de um sistema.Segundo o Astah Community (2014), este ambiente permite criar diagramas rapidamente possuindo inmeros recursos. Apesar de o Astah possuir verses pagas, o Astah Community de uso gratuito.

i) PostgreSQL: O PostgreSQL um poderoso sistema gerenciador de banco de dados objeto-relacional de cdigo aberto. Tem cerca de 15 anos de desenvolvimento ativo e uma arquitetura de grande reputao e confiabilidade na comunidade OpenSource. Funciona em todos os grandes sistemas operacionais, incluindo GNU/Linux, Unix e MS Windows. totalmente compatvel com ACID, tem suporte completo a chaves estrangeiras, junes, vises, gatilhos e procedimentos armazenados. Suporta tambm o armazenamento de objetos binrios, incluindo figuras, sons ou vdeos. Devido s caractersticas apresentadas e a sua alta compatibilidade com a API Weka, para o desenvolvimento da aplicao de data mining, cuja objeto principal deste trabalho, foi utilizado com sistema gerenciador de banco de dados o PostgreSQL verso 9.3.

3.2 MTODOS

O desenvolvimento da aplicao data mining aplicado ao processo de gesto educacional para deteco de evaso escolar foi divido em etapas de acordo com o modelo sequencial linear de Pressman (2002). As etapas so:a) Requisitos: A definio do escopo e requisitos foi realizada a partir da comparao e dos dados coletados no questionrio scio educacional aplicado sobre os alunos do curso de Licenciatura em Informtica da Universidade Tecnolgica Federal do Paran Campus Francisco Beltro, e as informaes coletadas junto secretaria da instituio a respeito dos alunos desistentes do mesmo curso.

b) Anlise: Nesta disciplina foram feitos estudos sobre os seguintes classificadores (a fim de detectar qual seria escolhido para aplicao do trabalho em questo): Naive Bayes, IBK.

c) Projeto: Nesta disciplina foi realizada a preparao dos dados para aplicao das tcnicas de minerao de dados. Ainda aqui foi construdo o modelo relacional do banco de dados.

d) Desenvolvimento: Nesta disciplina foi aplicado o algoritmo Naive Bayes sobre a base de dados previamente criada nos alunos que responderam o questionrio scio educacional alm da construo do prottipo web para a anlise de probabilidade da evaso escolar em novas instncias de alunos, cujas ferramentas e tecnologias utilizadas esto listadas na seo 3.1.

3.2.1 MODELAGEM DA APLICAO

Nesta seo, so apresentados artefatos gerados que auxiliaram no desenvolvimento da aplicao, so eles, diagramas de casos de uso, diagrama de classe e diagrama de sequencia.

3.2.2 CASO DE USO

Na viso de Bezerra (2007, p. 54), Um caso de uso representa um relato de uso de certa funcionalidade do sistema em questo, sem revelar a estrutura e o comportamento internos desse sistema. O diagrama de casos de uso (DCU) corresponde a uma viso externa do sistema e representa graficamente os atores, casos de uso e relacionamentos entre esses elementos. O diagrama de caso de uso tem o objetivo de ilustrar em um nvel alto de abstrao quais elementos externos interagem com que funcionalidades do sistema. (BEZERRA, 2007, p. 57)Neste tpico apresentado o diagrama de caso de uso da aplicao proposta, conforme Figura 2.

Figura 2 - Diagrama de Caso de UsoO diagrama de caso de uso apresenta as principais funcionalidades da aplicao, a funo Criar nova instncia de aluno compreende da ao do usurio em preencher as respectivas informaes de um novo aluno, criar um novo, e posteriormente solicitar o clculo de uma nova previso, cuja compreendida na funcionalidade Calcular probabilidade de evaso ao executada pela aplicao. Assim que o usurio executar a ao de instnciar novos aluno, automaticamente, a aplicao realiza o clculo da probabilidade de evaso do mesmo, e retorna os nmeros para a aplicao.

3.2.3 DIAGRAMA DE CLASSE

O diagrama de classe do tipo estrutural e especifica as Classes, abstraes e suas responsabilidades, dentro do escopo de um projeto. Define as estruturas, exibindo a colaborao entre classes e mostra a estruturao conceitual do banco de dados (modelo lgico). Na figura 3 ilustrado o diagrama de classe que fora utilizado para criao da aplicao e posterior para a criao do modelo lgico do banco de dados.

Figura 3 - Diagrama de ClasseO diagrama acima ilustra as trs classes com seus respectivos mtodos e atributos. A primeira classe Alunos elucida o modelo criado a partir dos dados que foram transformados e preparados na planilha de Relao de Alunos (Vide Anexo A). O mtodo trataExcecao() prepara uma instncia de Aluno para posteriormente realizar o clculo de probabilidade de evaso. A classe Utils tem um esteretipo do tipo static, o que implica em dizer que a referente classe ser do tipo Esttica. As classes estticas so aquelas que contm apenas membros estticos, alm de que elas no podem ser instnciadas. O mtodo replaceCaracter() tem a funo de tratar qualquer tipo de caractere especial que um atributo de Aluno possa conter, tendo em vista que a API Weka no trabalha com caracteres especiais. O mtodo processaXMS() recebe o caminho da planilha com o resultado do questionrio scio educacional (Vide anexo A), processa-os e os retorna com uma Lista de Alunos. Por ltimo a classe Weka, a responsvel por receber a Lista de Alunos j preparadas, aplicar a classificao utilizando o algoritmo Naive Bayes e calcular a probabilidade de evaso de cada um, atribuindo o resultado em uma mesma lista de Alunos.

3.2.4 DIAGRAMA DE SEQUENCIA

O diagrama do tipo comportamental que especifica determinado trecho de interao, formada por um conjunto de objetos e seus relacionamentos, incluindo as mensagens que podero ser enviadas entre eles. Exibindo a ordem temporal de determinada ao no sistema, ou seja, a ordem que os eventos ocorrem.Para o desenvolvedor, o diagrama de sequencia oferece informaes detalhadas de como determinada funcionalidade do sistema executada. Possibilita o entendimento do curso da aplicao ao ser efetuada determinada interao. utilizado principalmente para especificar o fluxo bsico de algum caso de uso, e suas variaes.Para melhor descrever o fluxo das aes que a aplicao deve executar no momento de realizar a anlise de probabilidade para cada instncia de alunos, foi criado um diagrama de sequencia, cujo ilustrado na figura 4.

19

Figura 4 - Analisar probabilidade

O respectivo diagrama ilustra a ao de requerer a probabilidade de evaso de uma nova instncia de aluno. Para tanto a ao iniciada assim que o usurio preenche o formulrio com os dados do novo aluno, em seguida solicitado a probabilidade de evaso do mesmo. A partir da a aplicao instancia um novo objeto do tipo Aluno com os parmetros que fora previamente informado e prepara seus dados. Na sequencia instnciado um objeto da classe WEKA que recupera as informaes na base de dados de alunos e calcula a probabilidade evasiva desse novo aluno. Feito isso retornado ao usurio da aplicao o resultado da anlise.

4 RESULTADOS

Este captulo apresenta uma viso geral, da realizao de cada uma das disciplinas destacadas no modelo sequencial linear de Pressman (2002) uma vez que o objetivo deste trabalho foi o estudo da matria de minerao de dados para possibilitar a criao de um prottipo de data mining aplicado ao processo de gesto educacional para deteco de evaso escolar.

4.1 REQUISITOS

Conforme o objetivo geral e os especficos propostos no incio deste trabalho e alinhados com a metodologia empregada, num primeiro momento buscou-se compreender o problema proposto, a evaso escolar dos alunos do curso de Licenciatura em Informtica da IES UTFPR Campus Francisco Beltro.O primeiro passo para se descobrir conhecimento em bases de dados uma correta definio do problema a ser tratado. Desta forma iniciou-se contato com a IES para obteno de dados a serem analisados, e posteriormente um questionrio foi criado e aplicado aos alunos que estavam cursando Licenciatura em Informtica, a fim de definir o tipo de informao que seria interessante de ser descoberta na base de dados e iniciar o processo de KDD.

4.1.1 INFORMAES DOS ALUNOS DE LICENCIATURA EM INFORMTICA

Nesta etapa entrou-se em contato com a secretaria de Licenciatura em Informtica da IES em questo solicitando acesso s informaes dos alunos que esto cursando ou j cursaram, para que fossem realizadas as respectivas etapas da minerao dos dados. Sendo assim, a secretaria forneceu uma planilha com 247 registros de alunos que cursam ou j cursaram Licenciatura em Informtica. (Vide Anexo B).

4.1.2 QUESTIONRIO SCIO-EDUCACIONAL

Feito uma anlise sob os atributos dos registros da planilha de relao dos alunos do curso de Licenciatura em Informtica, foi elaborado um questionrio com perguntas scio educacionais a fim de, alm de outros, obtermos uma maior variedade de atributos dos registros a serem testados e instnciados. Aplicado o questionrio, foram obtidas 36 respostas. (Vide Anexo A).

4.2 ANLISE

A partir das informaes coletadas, e das principais funcionalidades definidas foi ento dado incio anlise da aplicao proposta, abordando um estudo em alguns dos algoritmos de classificao de dados a fim de identificar qual se adequaria melhor ao trabalho proposto.

4.2.1 ANLISE DOS CLASSIFICADORES

Ainda durante a disciplina de Anlise, foi realizado um estudo sobre dois diferentes algoritmos de classificao, sendo eles: IBK e Naive Bayes. O estudo foi realizado a fim de definir qual o classificador seria mais bem aplicado soluo em questo. Neste tpico, ser descrito o estudo realizado com cada um, e as razes escolhidas para escolha do algoritmo proposto.

4.2.1.1 IBK

O algoritmo IBK uma verso do algoritmo de clusterizao k-NN (k-Nearest Neighbor) utilizado em tarefas de clusterizao.Atribui-se para o respectivo algoritmo (IBK), como ponto fraco, que o resultado atribudo pela ferramenta API WEKA, a probabilidade da proximidade com seus respectivos vizinhos mais prximos.

4.2.1.2 NAIVE BAYES

Uma caracterstica atraente desse classificador a sua capacidade de produzir estimativas de probabilidade ao invs de simples classificaes. Isto significa que, para cada rtulo de classe, o classificador pode gerar uma estimativa de o novo objeto pertencer mesma.

4.2.1.3 CONCLUSO DA ANLISE

Realizado os respectivos estudos e testes sobre cada um dos classificadores anteriormente citados, determinou-se pela utilizao do classificador Naive Bayes para sequncia do trabalho, pelas seguintes razes: Probabilidades nos resultados das classificaes; Amplo nmero de materiais didticos para pesquisa; Possibilidade de trabalhar com mais que dois resultados nas classificaes, por exemplo, diferentes tipos de desistncia de alunos: desistncia por motivo de trabalho, dificuldade na absoro de disciplinas, entre outros.

4.3 EXPERIMENTOS

Nesta seo so apresentados os artefatos e estudos realizados durante a disciplina de Projeto, cuja j fora previamente apresentada anteriormente. Durante a respectiva fase foi realizado a seleo dos dados conforme o processo de KDD, com o objetivo de analisar as informaes de real interesse. Junto seleo, limpeza e transformao dos dados, foi construdo o diagrama de classe e o modelo de entidade relacionamento correspondente s informaes posteriormente utilizadas.

4.3.1 Seleo, limpeza e transformao dos dados.

Aps um estudo sobre os dados contidos na planilha de Relao de Alunos (Vide Anexo B), entendeu-se que alguns dados seriam desnecessrios, como o nome, nmero do RG, CPF, nome da me e e-mail, que foram eliminados durante o processo de seleo dos dados.Efetuado a seleo dos dados, foi hora de realizar uma limpeza e transformao sobre os dados contidos na planilha, conforme ainda processo de KDD. Na planilha de relao de alunos foi criado um padro para a coluna Calouro. Nas informaes fornecidas pela secretaria os resultados para o campo em questo eram apresentados como Sim ou No, a transformao nos dados substituiu o valor Sim para o caractere S e para No o caractere N. Os resultados para a coluna Cotista foram tambm alterados. Anteriormente existiam variaes quanto a alunos do tipo cotistas, a regra foi alterada a fim de armazenar exclusivamente o valor S para alunos cotistas e N para alunos no cotistas, o mesmo ocorreu para a coluna Estudou em Escola Publica. Como no havia a coluna idade, a mesma foi criada e os resultados foram criados baseado nos valores atribudos para o atributo Data de Nascimento.A transformao mais relevante nos dados foi na coluna Situao, cuja anteriormente tratava diferentes resultados, Regular, Desistente, Trancado e Sem Cursar. Devido referente tratar-se do atributo classe, os resultados foram exclusivamente tratados como R (Regular) para alunos regulares e D (Desistente) para registros com situao diferente de regular.As seguintes tcnicas apresentadas corresponderam seleo, limpeza e transformao dos dados para posteriormente serem utilizados para a criao do banco de dados utilizados nas aplicaes.

4.3.2 DIAGRAMA DE ENTIDADE RELACIONAMENTO

De acordo com Rezende (2002, p.201) O principal propsito do DER representar os objetos de dados e suas relaes, sendo que cada entidade termina representada pelo menos uma tabela de dado. O DER representa toda a estrutura lgica do banco de dados expressa graficamente. A sua simplicidade e a clareza grfica podem explicar, em grande parte, a ampla disseminao do uso do modelo E-R.Na Figura 5 ser apresentado o diagrama de entidade relacionamento da aplicao proposta.

Figura 5 - DER AlunosA figura acima ilustra a tabela Alunos que compe o banco de dados que ser utilizado para aplicao das tcnicas de minerao de dados.

4.4 DESENVOLVIMENTO

Nesta seo sero apresentados os artefatos e estudos realizados durante a disciplina de Desenvolvimento, cuja j fora previamente apresentada. Durante a respectiva fase foi realizado a criao da base de dados (conforme descrito na seo 4.3.3) e a populao da tabela com os dados que foram previamente transformados (conforme de descrito na seo 4.3.1). Em seguida foi realizada a aplicao do algoritmo Naive Bayes sobre a base de dados previamente criada nos alunos que responderam o questionrio scio educacional (Vide Anexo A). Por ultimo foi construdo o prottipo web para a anlise de probabilidade de evaso escolar de novas instncias de alunos.

4.4.1 CRIAO DA BASE DE DADOS

A primeira atividade realizada na disciplina de desenvolvimento foi a criao da base de dados e suas respectivas tabelas, bem como a insero dos dados, conforme informaes que foram previamente limpas e transformadas.Conforme descrito na seo 4.3.3 o banco de dados construdo composto de uma nica tabela denominada Alunos. Com os dados previamente preparados e transformados, foi feito a importao da planilha xls Relao Alunos para a base de dados. Utilizando a funcionalidade de anlise de informaes dispostas na ferramenta WEKA, observa-se que, dos registros persistidos na tabela Alunos, 137 esto com situao regular, enquanto 109 esto com situao desistente, conforme ilustrado na figura 6.

Figura 6 - Situao dos Alunos

4.4.2 CLASSIFICAO DOS ALUNOS QUE RESPONDERAM O QUESTIONRIO SCIO EDUCACIONAL

Assim que realizado a criao e insero dos valores na base de dados, podem-se criar as primeiras classificaes, e assim treinarmos se nossas informaes, previamente coletadas, seriam suficientes para a anlise proposta. Para tanto, usou-se dos alunos que responderam o questionrio scio educacional (Vide Anexo A) para o treinamento. Cada resposta do questionrio, foi exposta ao algoritmo de classificao Naive Bayes encontrado na API WEKA, pacote classifier.bayes.NaiveBayes. Para tanto, foi criado uma aplicao que recuperasse todas as informaes contidas na planilha .xls, e as sujeitasse classificao do procedimento em questo.O que se esperava ao sujeitar um registro no algoritmo em questo era obter a probabilidade do referente se encaixar em uma das situaes, Regular, ou Desistente, ou seja, a probabilidade do respectivo ser um aluno desistente.Para a importao da planilha .xls foi usado a API JExcelAPI verso 2.6.10, conforme ilustrado na figura 7.

Figura 7 - Cdigo para recuperar planilha xlsComo algumas informaes contidas na base de dados de alunos no foram captadas no questionrio scio educacional foi usado a sua mdia de acontecimento como valor padro. Isso aconteceu para os seguintes atributos: boletim, histrico, coeficiente, turno, escore seleo e tnico, conforme ilustrado na figura 8.

Figura 8 - Cdigo mdia de acontecimentoCriado a lista de alunos com base na planilha scio educacional foi aplicada a classificao em cada um dos registros a fim e obter a probabilidade de desistncia de cada um dos alunos que responderam o questionrio. A figura 9 ilustra o cdigo que realiza a classificao em cada um.

Figura 9 - Cdigo classificao dos alunosConforme ilustrado acima, foi criado um lao de repetio sobre a lista de alunos previamente capturada da planilha de respostas do questionrio scio educacional. Para cada iterao foi criado uma instncia da classe DenseInstance, atribudo para cada ndice do objeto o referente atributo da classe Aluno e por fim aplicado o clculo de probabilidade. Como resposta, o mtodo retorna um vetor do tipo double, em que a primeira posio contm a probabilidade associada ao valor R (Regular) e na segunda posio a probabilidade associada ao valor D (Desistente). Na sequencia foi solicitado a impresso das informaes no console da IDE a fim de criarmos um relatrio para melhor anlise dos resultados. A tabela 2 exibe o resultado da execuo da aplicao em questo IDProbabilidade RegularProbabilidade Desistente

10.0205149223572733820.9794850776427266

20.48596636773839610.5140336322616039

30.0075367643571152270.9924632356428847

40.012519885357696870.9874801146423031

50.0188661416850677520.9811338583149323

60.0091601830996424440.9908398169003575

70.0069153875194201730.9930846124805798

80.0197596707423092730.9802403292576907

90.0104737254968157550.9895262745031842

100.0126948288373161970.9873051711626838

110.0035891074079100660.9964108925920898

120.0126948288373161970.9873051711626838

130.122576549870997880.877423450129002

140.0066505616296921960.9933494383703079

150.017036553450725110.9829634465492749

160.015479779614877630.9845202203851223

170.030885112430098840.9691148875699012

180.088485171394670550.9115148286053295

190.172491663937154450.8275083360628455

200.044370699209595970.9556293007904041

210.0360223314518949360.9639776685481051

220.287002273101177760.7129977268988222

230.0126948288373161970.9873051711626838

240.0138448698669562790.9861551301330438

IDProbabilidade RegularProbabilidade Desistente

250.0221094550411232160.9778905449588767

260.029532004352791710.9704679956472082

270.0190770167252963080.9809229832747037

280.019652904497152350.9803470955028477

290.012071550188190240.9879284498118098

300.018445305709663180.9815546942903368

310.033635128177333230.9663648718226667

320.0053335985914565090.9946664014085435

330.0190770167252963080.9809229832747037

340.0145909637662270250.985409036233773

350.015022308749953480.9849776912500464

Total035

Tabela 2 - Resultado da classificao questionrio scio educacional. Fonte: Autoria prpriaConforme descrito na tabela de resultados da classificao do questionrio scio educacional, 35 dos 35 alunos que responderam o questionrio, ou seja, 100% dos alunos tem maior probabilidade de se tornarem desistentes. Com base nos dados apresentados conclumos que, umas das possveis causas referentes aos resultados apresentados so que as informaes contidas na nossa base de dados de alunos no so suficientes para anlise e classificao das referentes predies de evaso, levando em considerao que a maior parte dos registros da nossa base de dados (56%) se trata de alunos com situao de desistncia. A fim de validarmos o clculo da probabilidade de evaso, foi criada uma tabela de testes, onde inserimos os mesmos 246 registros, porm alteramos a situao de alguns registros totalizando 220 alunos com situao Regular (89%) e 26 (11%) com situao Desistente. Aplicado o mesmo procedimento sobre a referente tabela, o resultado apresentado foi mais satisfatrio: 25 dos 35 registros, ou seja, 71,42% tem maior probabilidade de continuarem como alunos Regulares, em contra partida, 28,58% dos alunos teriam maior probabilidade de tornarem-se desistentes.Para os clculos das probabilidades de evaso acima destacados, os seguintes atributos foram utilizados como parmetros para os clculos: idade, sexo, coeficiente, perodo atual, turno, semestre que entrou na faculdade, cidade e estado de origem, aluno oriundo de escola publica ou no, aluno cotista ou no e se o aluno calouro ou no.Sendo assim, cabe como trabalho futuro, a coleta de maiores informaes dos alunos que esto cursando e alunos que desistiram do curso em questo, totalizando um maior nmero de registros, e uma maior variedade de informaes.

4.4.3 PROTTIPO WEB PARA A ANLISE DE PROBABILIDADE DE EVASO ESCOLAR DE NOVAS INSTNCIAS DE ALUNOS

Assim que criado a base de dados e a treinada com os resultados da planilha do questionrio scio educacional, foi realizado a implementao de um prottipo web, cujo objetivo receber a instncia de um novo aluno, aplicar o algoritmo sobre a base de dados previamente criada e obter a probabilidade do respectivo se enquadrar em uma das situaes: Regular ou Desistente. As tcnicas e ferramentas utilizadas para a construo da ferramenta em questo foram previamente descritas na seo 3 deste trabalho.

4.4.3.1 COMUNICAO COM O MODELO RELACIONAL

A primeira atividade realizada para a preparao e criao do prottipo web, foi criar a comunicao entre a API WEKA com o banco de dados relacional. A ferramenta WEKA trabalha preferencialmente com bases de dados noformato texto. Por esta razo, quase todos os tutoriais e apostilas sobre a ferramenta disponibilizados na Internet mostram como utilizar a WEKA para minerar bases de dados estruturadas nos formatos ARFF ou CSV. No entanto, possvel, tambm, utilizar a WEKA paraminerar dados diretamente detabelas deSGBDs relacionais. Esta forma de utilizao da WEKA bastante interessante j que, na maior parte das aplicaes prticas, os dados a serem minerados se encontram originalmente armazenados em algum banco relacional (MySQL, Oracle, PostgreSQL, SQL Server, etc.). Desta forma, quando se efetua a conexo da WEKA com um SGBD, deixa de existir a necessidade de exportar os dados do banco para texto e posteriormente format-los como ARFF (ou CSV) - atividades que, em geral, consomem um tempo considervel.Para realizar a comunicao entre a ferramenta WEKA e o banco de dados relacional, foi utilizado o driver JDBC do SGBD Postgresql: postgresql-9.3-1102.jdbc3.jar. Feito isso, foi necessrio configurar a API WEKA para comunicar-se com o banco de dados, previamente criado. Para tanto, a API oferece um arquivo nomeado DatabaseUtils.props, cujo pode ser extrado de dentro do arquivo weja.jar. No arquivo devem ser informados os seguintes parmetros: Driver JDBC, URL do banco de dados e informaes de login. Feito isso, a ferramenta est pronta para conectar-se ao nosso banco Postgresql.

4.4.3.2 CRIAO DA INTERFACE WEB

Preparado e testado a comunicao entre o banco de dados relacional e a ferramenta WEKA, o prximo passo foi a construo da interface web, cuja o meio de interao do usurio com a aplicao. Para tanto foi utilizado um template bootstrap (apresentado na seo 3.1) que se adequa a diferentes resolues, conceito conhecido como design responsivo, conforme ilustrado na figura 18. Segundo Garone (2012), design responsivo : ... uma tcnica de estruturao HTML e CSS, em que o site se adapta ao browser do usurio sem precisar definir diversas folhas de estilos para cada resoluo..

Figura 10 - Design responsivo do prottipoA figura 10 ilustra as adequaes que a pgina web realiza, baseado em diferentes resolues de interface.O prottipo web possui uma nica pgina xhtml, cuja realiza uma breve apresentao do tema proposto, apresenta os participantes do projeto e oferece um breve formulrio, ilustrado na figura 11, cujo ser objeto principal desta seo.

Figura 11 - FormulrioA figura 11 ilustra o formulrio que capturar os respectivos dados de uma nova instncia de aluno, aplicar as tcnicas de minerao de dados e retornar a probabilidade desse novo aluno se enquadrar em uma das duas situaes: Regular ou Desistente. O formulrio dispe dos seguintes campos: Nome, Cdigo de Matrcula, Coeficiente, Idade, Sexo, Calouro, Turno, Estudou em escola pblica, Perodo que cursa atualmente, Aluno Cotista, Cidade, Estado, Ms e Ano de ingresso na universidade. Com exceo dos campos Nome e Cdigo de Matrcula, os demais campos so utilizados para o clculo da probabilidade evasiva do novo aluno.

4.4.3.3 CRIAO DA REGRA DE NEGCIO

Com a interface de interao com o usurio pronta, o prximo passo foi o desenvolvimento da regra de negcio, cuja captura as informaes digitadas pelo usurio, aplica tcnicas de minerao de dados e apresenta as probabilidades da nova instncia de aluno. O primeiro mtodo da aplicao responsvel por recuperar os dados digitados na interface e criar, com base nessas informaes, uma nova instncia de aluno, conforme ilustrado na figura 12.

Figura 12 - Mtodo preparaAluno()Criado a instncia do aluno, o prximo mtodo aplica o algoritmo naive bayes, sobre o novo objeto. O processo em questo o mesmo que fora previamente apresentado na Figura 13 - Cdigo classificao dos alunos, com a diferena de que o clculo ser executado uma nica vez sobre o aluno que fora instnciado na imagem acima.Executado o clculo de probabilidade evasiva do aluno em questo, o prximo mtodo armazena as informaes calculadas em uma sesso que ser posteriormente recuperada para apresentao do resultado, conforme ilustrado na figura 14.

Figura 14 - Criao da sesso para apresentao do resultado4.4.3.4 APRESENTAO DO RESULTADO

Assim que executado o mtodo ilustrado na figura 12, as informaes previamente calculadas so exibidas graficamente em uma nova pgina, cuja ilustra a probabilidade do aluno se enquadrar em cada uma das situaes: Regular e Desistente, conforme ilustrado na figura 15.

Figura 15 - Grfico de probabilidadeA figura acima ilustra um teste fictcio efetuado sobre uma nova instncia do aluno Pedro Machado, cdigo de matrcula 1063081, coeficiente: 89,6, idade 26 a 29 anos, sexo masculino, calouro, estuda no perodo noturno, estudou em escola pblica, cursa atualmente o 6 perodo, ingressou na universidade por meio de alguma cota, de Dois Vizinhos PR e ingressou na universidade no segundo semestre de 2012. O resultado para a nova instncia do aluno de 79,97% de chance de ser regular contra 20,03% de chance de ser desistente.

5 CONCLUSO

A principal utilidade da pesquisa e da aplicao desenvolvida auxiliar os docentes em possveis tomadas de decises quanto aos alunos que ministra. Assim que sujeitado alunos ao clculo da probabilidade evasiva, depois que adquirido novas instncias e novos treinamentos no banco de dados, o professor poder tomar decises mais assertivas. A utilizao das tcnicas aqui aplicadas no ambiente proposto permitiu a viabilidade e a utilidade prtica da metodologia em um estudo de caso real, sendo que os resultados podero auxiliar os gestores a elucidar caractersticas relevantes em relao a diversas situaes observadas neste estudo.Devido ao baixo nmero de informaes contidas na nossa base de dados, pode-se observar a baixa confiabilidade nos clculos aplicados sobre os alunos que responderam o questionrio scio educacional. Essa dificuldade somente ser amenizada com o aprendizado da base de dados bem como o crescimento horizontal e vertical da base de dados.Essa dificuldade pode ser observada quando se aplica o algoritmo de classificao em nossa primeira base de dados (fornecida pela secretaria), cujo resultado foi que 100% dos alunos testados tm maior probabilidade de serem evasivos. O resultado deu-se devido aos registros na nossa base de dados possurem resultados semelhantes quando analisado a situao dos mesmos. 137 esto com situao regular, enquanto 109 esto com situao desistente. Uma base de dados fictcia foi criada cuja possua 220 alunos com situao Regular (89%) e 26 (11%) com situao Desistente, cuja se refere a um ambiente de ensino mais prximo do real (onde h mais alunos Regulares que alunos desistentes). O mesmo procedimento foi aplicado, e o resultado apresentado foi mais satisfatrio: 71,42% dos alunos tm maior chance de continuarem como alunos Regulares, em contra partida, 28,58% dos alunos teriam maior probabilidade de tornarem-se desistentes.Alguns desafios e dificuldades foram encontrados durante o processo de desenvolvimento do trabalho proposto, entre eles:a) A dificuldade inicial neste trabalho foi da liberao da base de dados os alunos do curso de Licenciatura em Informtica da Universidade Tecnolgica Federal do Paran Campus Francisco Beltro, haja vista tratar-se de dados pessoais dos acadmicos ali inscritos e matriculados; b) A limitao das informaes contidas na base de dados, que no contempla informaes a respeito de alunos aprovados e matriculados, bem como maiores informaes sociais, cujas foram capturadas no questionrio scio educacional aplicado.Aps o estudo abordado neste trabalho, estabelecem-se algumas recomendaes para pesquisas de mesmo cunho. Alguns assuntos merecem aprofundamento em pesquisas ou trabalhos futuros. Os principais so:a) Utilizao de outras tcnicas de Minerao de Dados no contempladas neste estudo, como por exemplo, Redes Neurais e Algoritmos Genticos;b) Aplicao de um questionrio scio educacional sobre alunos recm-matriculados, bem como em alunos desistentes do curso, a fim de aprimorar e colher um maior nmero de registros na nossa base de dados;c) Melhorias no prottipo web de clculo de evaso escolar, a fim de torna-lo uma ferramenta aos gestores da instituio, cujos podero estabelecer perodos que sero aplicados s respectivas tcnicas aqui apresentadas e planejar as tomadas de decises;

6 REFERNCIAS

BAGGI, Cristiane Aparecida dos Santos. Evaso e Avaliao Institucional no Ensino Superior: Uma discusso bibliogrfica. 2010. Dissertao Mestrado - PUC Campinas, SP.

BAKER, Ryan Shaun Joazeiro de. Minerao de Dados Educacionais: Oportunidades para o Brasil. 2011.

BATISTA P., SILVA M.J. Mining Web Access Logs of an On-line Newspaper., Departamento de Informatica, Faculdade de Ciencias . Universidade de Lisboa. Disponvel em:. Acesso em: 10 ago. 2014.

BEZERRA, Eduardo. Princpios de anlise e Projeto de Sistemas com UML. 2 Edio. Rio de Janeiro: Campus, 2007.

BOENTE, A. N. P. ; OLIVEIRA, F. S. G. ; ROSA, J. L. A.. Utilizao de Ferramenta de KDD para Integrao de Aprendizagem e Tecnologia em Busca da Gesto Estratgica do Conhecimento na Empresa. Anais do Simpsio de Excelncia em Gesto e Tecnologia, v. 1, p. 123-132, 2007.

BRAGA, Luis Paulo Vieira. Introduo Minerao de Dados. 2 edio, 2005. 212 p. 19 20.

BRASIL. Ministrio da Educao. Instituto Nacional de Estudos e Pesquisas Educacionais. Sinopses do ensino superior. Censos do ensino superior. Comunicaes pessoais. Disponvel em: www.inep.gov.br. Acesso em: 10 nov. 2014.

CAMILO, Cssio Oliveira; SILVA Joo Carlos da. Minerao de Dados: Conceitos,Tarefas, Mtodos e Ferramentas. Relatrio Tcnico. 2009CHIARA, Ramon. Aplicao de Tcnicas de Data Mining em Logs de Servidores Web. 2003. Dissertao (Mestrado). Instituto de Cincias Matemticas e de Computao - ICMC-USP. 2003.

CRISP-DM. Cross Industry Standart Process for Data Mining. Disponvel em:< http://www.crisp-dm.org/>. Acesso em: 10 out. 2014.

CRUZ, Armando J. R. da. Data Mining via Redes Neuronais Artificiais e Mquinas de Vectores de Suporte. 2007. 123 f. Dissertao (Mestrado em Sistemas de Informao) Universidade do Minho, Lisboa, 2007.

DIAS, Maria M. Um Modelo de Formalizao do Processo de Desenvolvimento de Sistemas de Descoberta de Conhecimento em Banco de Dados. 2001. 212 f. Tese (Doutorado em Engenharia da Produo) Universidade Federal de Santa Catarina UFSC, Florianpolis, 2001.

FAYYAD; PIATETSKY-SHAPIRO, G.; SMYTH, P. From Data Mining to Knowledge Discovery: An Overview. Menlo Park, CA: AAAI Press/The MIT Press, 1996

FIGUEIRA, Rafael. Minerao de dados e banco de dados orientados a objetos. 1988. Dissertao (Mestrado em Cincias da Computao) Universidade Federal de Santa Catarina, Florianpolis, 2011.

FURTADO, M. I. V. Inteligncia competitiva para o ensino superior privado: Uma abordagem atravs da minerao de textos. 2004. Tese (Doutorado). COPPE/UFRJ. Universidade Federal do Rio de Janeiro, Rio de Janeiro. 2004.

GAIOSO, Natalicia Pacheco de Lacerda. O fenmeno da evaso escolar na educao superior no Brasil. 2005. Dissertao Mestrado Programa de Ps Graduao em Educao da Universidade Catlica de Braslia, Braslia, 2005.GALVO, Noemi Dreyer. Tcnica de minerao de dados: uma reviso da literatura. Cuiab MT. 2009.

GOLDSCHMIDT, R.R.; PASSOS, E. Data Mining: Um guia prtico, conceitos, tcnicas, ferramentas, orientaes e aplicaes. So Paulo: Elselvier 2005.

HIPLITO, Oscar. Financiamento e expanso do ensino superior. Disponvel em: http://www.jornaldaciencia.org.br/Detalhe.jsp?id=62770. Acesso em 10 jan. 2015.

HIRAGI, GILBERTO de O.. Minerao de Dados em Base de Germoplasma. 2008, 108 f. Dissertao (Mestrado em Informtica) - Universidade de Braslia- UnB, Braslia, 2008.

LEAL, Roberto. A evaso no ensio superior brasileiro. Artigo. Instituto Lobo para o Desenvolvimento da Educao, da Cincia e da Tecnologia, 2007

LUCAS, Anelise de Macedo. Utilizao de Tcnicas de Minerao de Dados considerando os Aspectos Temporais. 2002. Dissertao (Mestrado). Porto Alegre: PPGC da UFRGS, 2002.

MELO, Alexandre. Programao JAVA para Web. NOVATEC; 2014

MORATE, Diego G. Manual de WEKA. Valladolid, 2010. Disponvel em: < http://www.metaemotion.com/diego.garcia.morate/>. Acesso em: 12 nov 2014PASTA, Arquelau. Aplicao da Tcnica de Data Mining na Base de Dados do Ambiente de Gesto Educacional: Um estudo de caso de uma Instituio de Ensino Superior de Blumenau SC. 2011. Dissertao (Mestrad). Univali.

PRESSMAN, R. Engenharia de software, 5 ed., Rio de Janeiro: McGraw-Hill, 2002.

RABELO, Emerson. Avaliao de Tcnicas de Visualizao para Minerao de Dados. 2007. 103 f. Dissertao (Mestrado em Cincia da Computao) - Universidade Estadual de Maring. Maring, 2007.

REZENDE, Denis Alcides. Engenharia de Software e Sistemas de Informao. 2 Edio. Rio de Janeiro: Brasport, 2002.

SCOSS, Anne M.. A Clusterizao e Classificao no Processo De Data Mining para Anlise do Desempenho Docente no Ensino de Graduao. 2006. 86 f. Trabalho de Concluso de Curso (Especializao) - Universidade do Extremo Sul Catarinense - UNESC, Cricima, 2006.

SHIBA, Sonia Kaoru. Modelagem de processo de extrao de conhecimento em banco de dados para sistemas de suporte deciso. 2008. Dissertao (Mestrado) - Escola Politcnica da Universidade de So Paulo. 2008

SILVA, Mauricio. JQUERY - A biblioteca do programador javascript. 3 Edio; NOVATEC; 2013

SILVA, Marcelino Pereira dos Santos. Minerao de Dados Conceitos, Aplicaes e Exeperimentos com Weka. 2004UNESCO. Relatrio sobre educao para todos. Disponvel em: Acessado em 10 set. 2014

ANEXO A Questionrio Scio Educacional

Questionrio Scio EducacionalQuestionrio destinado aos alunos do curso de Licenciatura em Informtica da UniversidadeTecnolgica Federal do Paran, Campus Francisco Beltro.Os itens abaixo fazem parte de um questionrio scio educacional aplicado aos alunos deLicenciatura em Informtica da UTFPR Campus Francisco Beltro. As respostas seroutilizadas nica e exclusivamente como material didtico de pesquisa, portanto sinta-se avontade em respond-las.Com o objetivo de traar um perfil dos alunos do curso de Licenciatura em Informtica daUTFPR Campus Francisco Beltro e avaliar a eficcia das disciplinas ministradas noreferente curso de graduao, solicitamos a sua ateno para responder o questionrio aseguir.* Required

1. Sexo *Mark only one oval.MasculinoFeminino

2. Idade *Mark only one oval.At 20 anos21 a 25 anos26 a 29 anos31 a 40 anosMais de 40 anos

3. Qual sua cidade de origem *Ex.: Curitiba

4. Ocupa atualmente *Escolha dentre as opes abaixo, qual a sua atual situao profissional.Mark only one oval.Empregado em empresa privadaFuncionrio pblicoTem negcio prprioAdministra negcio familiarNo trabalhaPesquisas cientficas dentro do mbito universitrioOther:

5. Estado civil *Mark only one oval.Solteiro(a)Casado(a)Separado(a)/Divorciado(a)Vivo(a)Other:

6. Reside atualmente *Mark only one oval.Com os paisCom esposo(a) e/ou filhosCom amigosSozinho(a)Other:

7. Qual a faixa de renda mensal da sua famlia *Escolha dentre as opes, qual a faixa mensal de renda total da sua famlia. A somatotal da renda mensal de cada um dos membrosMark only one oval.At R$2500,00De R$2500,00 a R$4000,00De R$4000,00 a R$6000,00De R$6000,00 a R$9000,00Mais de R$9000,00

8. Qual o meio de transporte utilizado para ir faculdade *Mark only one oval.Veculo PrprionibusCaronaOther:

9. Assinale a melhor opo quanto ao seu ponto de vista financeiro *Mark only one oval.No trabalho e meus gastos so financiados pelos meus paisTrabalho e tenho ajuda da minha famliaTrabalho e me sustentoTrabalho e contribuo com o sustento da minha famliaTrabalho e sou o principal responsvel pelo sustento da minha famlia

10. Em que tipo de escola voc cursou o ensino mdio *Mark only one oval.Toda em escola publicaToda em escola particularA maior parte do tempo em escola publicaA maior parte do tempo em escola particularMetade em particular e outra em publica

11. H quanto tempo concluiu o Ensino Mdio *Mark only one oval.Menos de 1 anoEntre 1 e 3 anosEntre 4 e 6 anosEntre 7 e 10 anosMais de 10 anos

12. O que voc mais utiliza para se manter atualizado? *Mark only one oval.JornaisRevistasTVRdioInternet, Redes Sociais.

13. Qual (is) meio(s) voc utiliza para acessar a Internet? *Mark only one oval.Internet mvel (2/3/4G)Em casaNa universidadeEm meios pblicosMais de uma das alternativas

14. Quais redes sociais voc possui conta *Mark only one oval.FacebookTwitterGoogle +LinkedINWhatsAPPMais de uma alternativaNenhumaOther:

15. Com que frequncia voc acessa suas redes sociais?Mark only one oval.DiariamenteSemanalmenteMensalmenteEsporadicamente (Semestralmente, Anualmente, ...)Nunca

16. Por que razo escolheu o curso de Licenciatura em Informtica *Mark only one oval.Adequao s minhas aptides pessoaisPrestgio da profissoBom mercado de trabalhoPerspectiva de Boa RemuneraoOther:

17. Quem tomou a deciso de escolha do seu curso *Mark only one oval.Eu mesmo(a)Meus paisCompanheiro(a)Eu e meus paisEu e meu companheiro(a)Other:

18. Qual perodo do est cursando atualmente *Mark only one oval.12345678

19. Qual o semetre e ano de ingresso nocurso *Ex.: 2/2010

20. Qual sua inteno aps concluir o curso *Mark only one oval.Atuar como empregado de empresa privadaRealizar concurso pblicoAdministrar Negcios da FamliaCriar meu prprio negcioDar sequencia nos estudos e pesquisa (Mestrado / Doutorado)Other:

21. Qual disciplina voc tem maior aptido *Caso tenha aptido por mais de uma rea abaixo, poder selecionar mais de uma opo.Check all that apply.Algoritmo / Lgica de ProgramaoEmpreendedorismo, Administrao e/ou ComunicaoFilosofia e/ou PsicologiaPedagogia, Gesto de Pessoas e/ou EducaoMatemtica, Clculos e/ou Fundamentos MatemticosEngenharia de Software (UML, IFML, entre outras)Linguagem de Programao Estruturada (C, Pascal, entre outras)Linguagem de Programao Orientada a Objetos (C#, JAVA, C++, entre outras)

22. Quantas horas semanais (em mdia) voc disponibiliza para estudo dasdisciplinas fora do ambiente das aulas. No conte as horas em sala de aula *Mark only one oval.01 a 34 a 67 a 910 a 1516 ou mais

23. Quais as maiores dificuldades encontradas no curso at o presente momento *Check all that apply.Conciliao com atividades extracurricularesProblema de relacionamento com professores e/ou alunosDificuldade no aprendizado do contedo das aulasConcentrar-se nas referentes disciplinasProblema com disciplinas de lgica e/ou programaoProblema com disciplinas de gesto educacionalFalta de interesse nos assuntos abordadosDificuldade com alguma disciplina em especficoNenhumaOther:

24. Comentrios e/ou sugestesPor favor, caso haja necessrio, descreva abaixo possveis novos questionamentos ouremoo de outros. Sinta-se a vontade para criticas, sugestes e/ou elogios.

ANEXO B Lista de Alunos Regulares e Desistentes

65

1343629Adair Perdomo FalcaoBH6,28E+0985950339 [SESP] [PR] []MMaria Marcilia Perdomo Falcao0,85135N632,2jan/12FRANCISCO BELTRO / PR1 - No cotista[] No InformadoBrancaRegularSem Motivo

1268546Adan De BorbaBH5,68E+09127420424 [SESP] [PR] [10/03/2009]MSalete Maria Camara De Borba0,07921N556,9jan/14FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1226703Adan Rafael Bier Da SilvaBH6,06E+0995197817 [SESP] [PR] [22/03/2002]MSoeli Da Aparecida Ramos Da Silva01N548,4jan/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoBrancaDesistenteReprovao 1. Perodo

1147919Adao CorreaBH7,07E+099.317.801-7 [SESP] [PR] [04/10/2011]MLuiza Dos Santos Correa01N602,6jan/14FRANCISCO BELTRAO / PR5 - Categoria 3 - cotista independente de renda (sem necessidade de comprovao) e que no se declarou preto, pardo ou indgena[1] PblicaPardaRegularSem Motivo

1496000Adnir Luiz De Andrade JuniorBH1,05E+09124600880 [SESP] [PR] [20/02/2008]MEva Partocki De Andrade0,69031N648,9jan/14PRUDENTOPOLIS / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1321889Adriana Aparecida Carneiro Lobo ZmozinskiBH8,83E+09128758682 [SESP] [PR] [29/09/2009]FMaria Ivete Carneiro Lobo0,2781N549,4fev/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1321390Adriano Chagas JuniorBH8,47E+0910684517-4 [SESP] [PR] [10/07/2008]MDoris Benoni Correa0,13921N0.0000fev/11PATO BRANCO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1343343Adriano LamonatoBH8,96E+107060226854 [SSP] [RS] [05/08/1991]MOtilia Salete Lamonato01N570,8jan/12FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1562967Adriano PollaBH1,04E+10127613290 [SESP] [PR] [22/11/2012]MMaria Joana Ribeiro Polla01N470,3fev/13NOVA CONCRDIA / PR3 - Categoria 1 - cotista oriundo de famlia com renda, comprovada, igual ou inferior a 1,5 salrios mnimos (um salrio-mnimo e meio) per capita e que no se declarou preto, pardo ou indgena[] No InformadoNo DeclaradoDesistenteReopo De Curso

1491385Alana Greici Morandi DiasBH7,57E+09108462965 [SESP] [PR] [25/01/2007]FEdna Regina Morandi Dias0,49692N431,6jan/13FRANCISCO BELTRAO / PR5 - Categoria 3 - cotista independente de renda (sem necessidade de comprovao) e que no se declarou preto, pardo ou indgena[] No InformadoNo DeclaradoRegularSem Motivo

1440004Alano FreireBH6,68E+0994334462 [SSP] [PR] [14/11/2001]MMaria Helena Costin Freire0,67114N552,2fev/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoRegularSem Motivo

1490893Alari NavariniBH2,86E+0975538741 [SESP] [PR] [14/12/2006]MZenilde Brancalione Navarini0,36421N581,4jan/13FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1343351Alari NavariniBH2,86E+0975538731 [SESP] [PR] [14/12/2006]MZenilde Brancalione Navarini0,05121N573,2jan/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1491695Alex Porto Dos SantosBH9,86E+0998124888 [SESP] [PR] [14/04/2003]MMarizete Tonial Porto Dos Santos0,88352N636,1fev/13SANTA IZABEL DO OESTE / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1491105Alex Sandro Da CostaBH7,5E+09106681015 [] [] []MMarli Aparecida Telles Da Costa0,36641N541,5jan/13FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1604023Aline Cristiane FochiBH1,01E+1013.448.038-6 [SESP] [PR] [13/12/2011]FTeresinha Maria Fochi01N477,9jan/14FRANCISCP BELTRO-PR / PR5 - Categoria 3 - cotista independente de renda (sem necessidade de comprovao) e que no se declarou preto, pardo ou indgena[1] PblicaNo DeclaradoRegularSem Motivo

1306766Aline TeixeiraBH3,08E+0977818480 [SESP] [PR] [10/06/1996]FRita Stahnke Teixeira0,09121N513,5fev/11PATO BRANCO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1343637Allan Patrick Dos Santos FragaBH7,76E+09110945213 [SESP] [PR] [25/07/2007]MNeiva Dos Santos Fraga0,17641N604,5jan/12SALTO DO LONTRA / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1306464Alucir Messias NevesBH9,28E+1056047557 [] [] []MGiriadita Silva Neves01N582,9fev/11FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoErro De CadastroSem Motivo

1491270Ana Carolina Amaral NunesBH9,6E+0916413636 [PCMG] [MG] [20/06/2006]FCristina Maria Amaral Alves0,59232N513,3jan/13FRANCISCO BELTRO / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1306774Ana Carolina PasqualiBH8,83E+09105077513 [SESP] [PR] [04/10/2005]FLucia Clair Flach Pasquali0,46161N561,3jan/12MARMELEIRO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1562975Ana Claudia Chaves LodiBH7,69E+09102314450 [SESP] [PR] [19/11/2004]FAida Chaves Pachuri0,57812N505,6fev/13SO JOO / PR6 - Categoria 4 - cotista independente de renda (sem necessidade de comprovao) e autodeclarado preto, autodeclarado pardo ou autodeclarado indgena[] No InformadoNo DeclaradoRegularSem Motivo

1596705Ana Claudia PetriBH8,95E+0912.895.213-6 [SESP] [PR] [24/11/2009]FIzolete Borges Petri01N439,7jan/14FRANCISCO BELTRAO / PR3 - Categoria 1 - cotista oriundo de famlia com renda, comprovada, igual ou inferior a 1,5 salrios mnimos (um salrio-mnimo e meio) per capita e que no se declarou preto, pardo ou indgena[1] PblicaNo DeclaradoRegularSem Motivo

1321382Ana Julia De GodoisBH6,72E+09105498799 [SESP] [PR] [09/11/2005]FNoeli Aparecida De Godois01N0.0000fev/11SANTA IZABEL DO OESTE / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteProblemas Com Horrio Das Aulas

1440250Ana Paula Juliana PerinBH8,09E+09110953879 [SSP] [PR] [30/05/2007]FArlete Franzen Perin0,69553N493,5fev/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoRegularSem Motivo

1563149Ana Paula SandrinBH6,61E+09098199446 [] [] []FZilma Sandrin01N507,8fev/13FRANCISCO BELTRO / PR3 - Categoria 1 - cotista oriundo de famlia com renda, comprovada, igual ou inferior a 1,5 salrios mnimos (um salrio-mnimo e meio) per capita e que no se declarou preto, pardo ou indgena[] No InformadoNo DeclaradoTrancadoProblema De Sade

1343360Anderson Lourenco Dos SantosBH6,97E+0910689176-1 [SESP] [PR] [19/12/2005]MSolange Lourenco Dos Santos01N546,6jan/12BITURUNA / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1343645Anderson Luiz MichelsBH9,84E+1080910363 [SESP] [PR] [30/05/1997]MAnita De Lurdes Michels0,77154N617,1jan/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoRegularSem Motivo

1306782Andre Felipe Dias AdornesBH7,8E+09108200448 [SESP] [PR] [11/05/2007]MSalett Aparecida Dias Adornes0,11641N559,1fev/11CHOPINZINHO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1596217Andre Luiz Borges De AraujoBH4,74E+099.079.197 4 [SESP] [PR] [17/07/2000]MCelina Borges01N509,8jan/14FRANCISCO BELTRAO / PR1 - No cotista[1] PblicaNo DeclaradoRegularSem Motivo

1343653Andrei Meneghetti BigolinBH8,48E+091087498117 [SESP] [RS] [10/08/2011]MIres Meneghetti Bigolin0,68264N640,8jan/12CORONEL VIVIDA / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1440268Angela Cristina Luzzi Dall AgnolBH6,38E+0910331381-3 [SSP] [PR] [01/04/2005]FClecy Maria Ampese Luzzi0,68482N493fev/13ITAPEJARA DOESTE / PR2 - Cotista[] No InformadoNo DeclaradoTrancadoGravidez

623210Angelo Rafael Arruda De CostaBH4,02E+096569080-2 [SESP] [PR] [10/08/1992]MMaria Esmeria Arruda De Costa0,43962N527,2fev/13MARMELEIRO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1554751Antonio Valdeci De AlmeidaBH4,53E+1010660309 [SESP] [MG] [25/05/2001]MMaria Valmi Soares0,71592N549,6fev/13FRANCISCO BELTRAO / PR3 - Categoria 1 - cotista oriundo de famlia com renda, comprovada, igual ou inferior a 1,5 salrios mnimos (um salrio-mnimo e meio) per capita e que no se declarou preto, pardo ou indgena[] No InformadoNo DeclaradoRegularSem Motivo

1307100Barbara Camila Franca Da SilvaBH7,58E+09109263168 [SESP] [PR] [01/06/2006]FCecilia Kutchma0,28641N497,3jan/12PATO BRANCO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1490605Bartany Kyoman Rosina Cavalcanti VasconcelosBH2,55E+09715516-6 [SIM] [PR] [30/06/2009]FClaribel De Souza Rosina Pires0,59612N613,8jan/13FRANCISCO BELTRO / PB1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1549154Bianca Wai Kuen ChuBH1,22E+0912.370.833-4 [SESP] [PR] [21/12/2011]FYe Xiao Ping01N594fev/13FOZ DO IGUACU / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteReopo De Curso

1440012Bruno Lovera MarostegaBH2,87E+098096444198 [SSP] [RS] [18/05/2004]MBeatriz Lovera01N562,5fev/12CAPANEMA / PR1 - No cotista[] No InformadoNo DeclaradoDesistente (Sem Cursar)Outros No Especificados

1343661Bruno Manoel DobrovolskiBH9,14E+09106686505 [SESP] [PR] [11/05/2006]MIrene Felisberto Dobrovolski01N609,4jan/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteOpo Curso Superior

1513044Bruno PoleselloBH9,83E+09128112596 [SESP] [PR] [25/06/2009]MVanair Goncalves Polesello0,46642N0.0000fev/13PATO BRANCO / PR1 - No cotista[] No InformadoNo DeclaradoTrancadoOpo Curso Superior

1307118Camila BiavaBH8,54E+09103183790 [SESP] [PR] [03/03/2005]FMaria Aparecida Biava0,24561N495,6fev/12MARMELEIRO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1378341Carla Vieira MinossoBH6,78E+09123468708 [SESP] [PR] [14/10/2007]FMaria Salette De Oliveira Vieira0,37292N474,3jan/13RENASCENCA / PR1 - No cotista[] No InformadoBrancaDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1439863Carlos Eduardo Brittes De LimaBH4,08E+1036.192.286-3 [SSP] [SP] [05/11/2009]MZelir Brittes Souza Lima01N586,8fev/12SOROCABA / SP1 - No cotista[] No InformadoNo DeclaradoDesistente (Sem Cursar)Outros No Especificados

1562983Carlos Nei Boschi JuniorBH5,34E+0994412781 [SESP] [PR] [26/11/2001]MFatima Boschi0,68962N493,9jan/14PATO BRANCO / PR1 - No cotista[] No InformadoNo DeclaradoTrancadoProblema De Sade

1562991Caroline De Souza CampanhaBH8,88E+095096725 [SESP] [SC] [21/01/2013]FRita Ribeiro De Souza0,86772N498,2fev/13SO LOURENO DO OESTE / SC1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1343378Cassia Cleia VicelliBH5,58E+0994419182 [SESP] [PR] [22/11/2001]FRosani Cleia Klim Vicelli0,03921N568,8jan/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1440020Cassiane CoperciniBH7,25E+09102472934 [SSP] [PR] [14/12/2004]FCatarina De Fatima Mendonca Copercini0,01121N556fev/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1343386Cassiano Guareschi MontanariBH7,58E+099793182-8 [SESP] [PR] [21/03/2003]MMaria Guareschi Da Silva0,6173N592,6jan/12FRANCISCO BELTRO / PR2 - Cotista[] No InformadoNo DeclaradoRegularSem Motivo

1321919Claudinei SoaresBH8,87E+09128237151 [SESP] [PR] [20/07/2009]MIvanir Nogueira0,05121N0.0000fev/11/1 - No cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1490613Claudiomar Dos SantosBH7,04E+10521966143 [SESP] [PR] [02/05/1989]MAntonia Marcal Dos Santos01N573,2jan/13FRANCISCO BELTRAO / PR6 - Categoria 4 - cotista independente de renda (sem necessidade de comprovao) e autodeclarado preto, autodeclarado pardo ou autodeclarado indgena[] No InformadoNo DeclaradoDesistenteMudana De Cidade

1490729Cleiton Marcos WapplerBH8,82E+0998416307 [SESP] [PR] [24/09/2012]MAdelires Koch Wappler0,82442N608,5fev/13AMPERE / PR1 - No cotista[] No InformadoNo DeclaradoTrancadoOutros No Especificados

1306324Crisly Briggitte Mamani HuamanBH4,1E+10V 608384-X [] [] []FBrigida Huanan Carlos01N618,4fev/11SAO PAULO / SP1 - No cotista[] No InformadoNo DeclaradoErro De CadastroSem Motivo

1306332Cristian Lucas Da SilvaBH3,1E+096105415852 [] [] []MGladenice Teresinha Da Silva01N600,5fev/11GRAMADO DO LOUREIROS / RS1 - No cotista[] No InformadoNo DeclaradoErro De CadastroSem Motivo

1306790Dancler GalliBH5,46E+0988756614 [SESP] [PR] [24/11/1999]MMaria Leonir Galli0,14281N525,9fev/11FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1491393Daniel Jose Copelli LuciniBH8,87E+09108463945 [SESP] [PR] [06/02/2007]MIvonete Terezinha Copelli0,68492N486,3jan/13FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1343394Diandra Caroline Alves De OliveiraBH7,78E+09101182444 [] [] []FIvanete De Oliveira Gomes De Oliveira01N552,3jan/12REALEZA / PR2 - Cotista[] No InformadoNo DeclaradoDesistente (Sem Cursar)No Informado

1306804Diego Willian DobrovolskiBH7,67E+0998178139 [SESP] [PR] [16/04/2003]MCarmem Sachetti Dobrovolski0,10681N564,8fev/11FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1307126Dionelli Alegna MussoiBH6,42E+09104897533 [SESP] [PR] [03/10/2005]FEloize Aparecida Almeida De Oliveira Mussoi0,67393N486,9fev/11LARANJEIRAS DO SUL / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1549464Dirlei Cezar GalvaoBH3,26E+0975651384 [SESP] [PR] [16/07/2012]MJesuina Da Silva Galvao0,55622N448fev/13FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1306472Dirlene Cassia Reiner BerlattoBH2,25E+0966240002 [] [] []FOliva Rigon Reiner01N587,4fev/11VERE / PR2 - Cotista[] No InformadoNo DeclaradoErro De CadastroSem Motivo

1440276Douglas BegniniBH9,08E+09126648065 [SSP] [PR] [29/10/2008]MMarines De Fatima De Abreu Begnini01N512,8fev/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1343840Edemir Cleverson NesiBH1,83E+0961314881 [SESP] [PR] []MClementina Skrzel Nesi0,41561N603,8fev/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1491407Edenilce WanotBH4,85E+0993912470 [SESP] [PR] [18/09/2001]FNeli De Souza Wanot0,70923N488,8jan/13FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1383671Edenilson GuisttiBH9,55E+1057670517 [SESP] [PR] [02/05/1996]MLeonita Guistti01N527,1jan/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1596713Edivandro BernardelliBH3,47E+098.209.921-2 [SESP] [PR] [17/09/1997]MLuiza Kobielski Bernardelli01N464,9jan/14FRANCISCO BELTRAO / PR1 - No cotista[1] PblicaNo DeclaradoRegularSem Motivo

1306480Edson Dos SantosBH8,94E+1068479401 [] [] []MMaria Dos Santos01N586,4fev/11FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteSem Motivo

1343408Edson Goncalves ChortaszkoBH6,64E+0987507483 [SESP] [PR] [07/06/1999]MMaria Dorlei Goncalves Chortaszko0,12481N553jan/12AMPERE / PR1 - No cotista[] No InformadoBrancaDesistenteReprovao 1. Perodo

1596721Eduardo Colonetti ConstantinoBH7,25E+0910.651.764-9 [SESP] [PR] [17/10/2011]MClair Colonetti01N447,9jan/14DOIS VIZINHOS / PR1 - No cotista[] No InformadoNo DeclaradoDesistente (Sem Cursar)Outros No Especificados

1490621Eduardo SteinbachBH8,85E+0910.669.677-7 [SESP] [PR] [12/05/2006]MAna Elisa Hellmann Steinbach0,75343N604,7jan/13FRANCISCO BELTRAO / PR5 - Categoria 3 - cotista independente de renda (sem necessidade de comprovao) e que no se declarou preto, pardo ou indgena[] No InformadoNo DeclaradoRegularSem Motivo

1260081Edvanio CancelierBH8,82E+09102174720 [SESP] [PR] [05/11/2004]MCezira Navarini Cancelier0,93652N568,1fev/13FRANCISCO BELTRAO / PR3 - Categoria 1 - cotista oriundo de famlia com renda, comprovada, igual ou inferior a 1,5 salrios mnimos (um salrio-mnimo e meio) per capita e que no se declarou preto, pardo ou indgena[] No InformadoBrancaRegularSem Motivo

1490907Eliel Albino De AbreuBH8,15E+09104784127 [SESP] [PR] [15/09/2005]MElza Pinheiro De Abreu0,69323N574,5jan/13FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1306812Elio Machado CostaBH7,34E+0991964287 [] [] []MRosa Da Silva Machado Costa01N577,2fev/11FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1343416Elio Machado CostaBH7,34E+0991964287 [SESP] [PR] [22/12/2000]MRosa Da Silva Machado Costa0,58163N593,5jan/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoRegularSem Motivo

1306820Eliseu Sanches GimenezBH8,87E+0884185523 [SESP] [PR] [29/05/1998]MIlidia Batistela Gimenez0,53563N559jan/14FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1440420Eliton Andrade Da SilvaBH8,2E+103093349714 [SSP] [RS] [20/11/2001]MDiomira Andrade Da Silva01N602fev/12FRANCISCO BELTRAO / PR2 - Cotista[] No InformadoNo DeclaradoDesistenteOpo Curso Superior

1307134Eliton PinheiroBH5,38E+0986372207 [SESP] [PR] [06/07/2001]MNadir Ellwanger Pinheiro0,50562N495,8jan/14FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

1306839Elizandra Carlon SchreiberBH1,95E+0969134904 [SESP] [PR] [02/09/1993]FRosa Carlon0,62283N560,7fev/11FRANCISCO BELTO / PR1 - No cotista[1] PblicaNo DeclaradoRegularSem Motivo

1554735Elizeo Antonio Lourenco LinsBH5,46E+1036377313 [SESP] [PR] [19/03/2008]MJair Teresinha Lins01N609,9fev/13FRANCISCO BELTRAO / PR5 - Categoria 3 - cotista independente de renda (sem necessidade de comprovao) e que no se declarou preto, pardo ou indgena[] No InformadoNo DeclaradoDesistenteOpo Curso Superior

1491288Elizete Balduino BeckerBH2,99E+0976246645 [SESP] [PR] [07/01/2010]FIroni Rocha Machado Balduino01N502,7jan/13FRANCISCO BELTRAO / PR5 - Categoria 3 - cotista independente de renda (sem necessidade de comprovao) e que no se declarou preto, pardo ou indgena[] No InformadoNo DeclaradoDesistenteReprovao 1. Perodo

1260561Elton Pasqualli NunesBH7,03E+101047364367 [SJS] [RS] [18/11/1998]MDioneide Maria Pasqualli Nunes0,79442N0.0000jan/14SALGADO FILHO / PR1 - No cotista[] No InformadoNo DeclaradoDesistenteDesistncia Gerada Sistema - Falta De Matrcula

949680Emanuelle De Zorzi MarinBH6,66E+0913.434.443-1 [SESP] [PR] [28/11/2011]FIvonete Libera De Zorzi0,75856N590,5fev/11FRANCISCO BELTRAO / PR1 - No cotista[] No InformadoNo DeclaradoRegularSem Motivo

1513761Emanuelli Maira BoschettiBH6,82E+09105871449 [SESP] [PR] [18/11/2005]FMaria Goreti Boschetti0,58132N0.0000jan/13PATO BRANCO / PR3 - Categoria 1 - cotista oriundo de famlia com renda, comprovada, igual ou inferior a 1,5 salrios mnimos (um salrio-mnimo e meio) per capita e que no se declarou preto, pardo ou indgena[] No InformadoNo DeclaradoR