Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de...

Post on 16-Apr-2017

292 views 0 download

Transcript of Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de...

Mineração dedadoscom

Classificação deDados

Umestudo decaso sobre oChurnRateem serviços detelefonia

PROF. JOÃO GABRIEL L IMA@JGABR IE L_ L IMA

L INKED IN .COM/ IN / JOAOGABR IE L L IMA

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Prof.João GabrielLima

• Pesquisador emMineração dedadoseInteligência Computacional;

• Engenheiro daComputação,especialista em SoftwareeHardware;

• Doutorando em Computação Aplicada;

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Processo deExtração doconhecimento

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Conhecendo nossa basededadosENTENDER ODOMÍNIO EOCONHECIMENTO QUEPODEMOSEXTRAIR

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Serviço detelefoniaNesta basededados,temos os dadosdosclientes deuma empresa detelefonia.

Vamos focar noChurnRate

Oqueé oChurnRate?

◦ Trata-sedeuma métrica queavalia aquantidade declientes queabandonam/cancelam um

determinado serviço.

◦ Parauma empresa expandir é imprescindível queoseu GrowthRate(índice decrescimento)supere o

seu ChurnRate.

◦ Objetivo é criar estratégias paralidar comos clientes demodo acompreender ediminuir oChurnRate.

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Serviço detelefoniaNesta basetemos asseguintes informações:

- TECNOLOGIA:4G,Telefone Móvel,Telefone Fixo,Fibra

- IDADE

- DATADEADESÃO

- LIGACOES_SUPORTE_ULTIMO_ANO:quantidade totaldeligações feitas paraaosuporte

- MEDIA_FATURA_MENSAL

- TAXA_DE_CHURN:probabilidade decancelamento

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Qual oobjetivo chave?EM MINERAÇÃO DEDADOS,TRAÇAR OOBJETIVO É OPRIMEIROPASSO.É FUNDAMENTAL!

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Classificar eprever oChurnRatedeacordo comoperfil ecomportamentodosclientes.

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Ótimo!Vamos aos negócios!

Conhecendo nossaferramenta!

AWESOMEDATAMINETOOL

Passo 1– Abrindo nossos dadosna ferramentaAbra oarquivo telefonia_churn_rate.csv comocomponente LoadData.

Passo 2– ETLepreparação dedadosPrecisamos marcar acoluna queserá oalvo

dasanálises (TAXA_DE_CANCELAMENTO)e

convetê-ladenumérica parabinária.

Componentes:

- SetRule

- NumericaltoBinomial

Passo 3– Preparando avalidação domodeloValidar seu modelo é achave dosucesso.Ocross-validationsepara oconjunto dedadosem

consjunto detreinamento edeteste.

Componente:

*X-Validation

Passo 3.1– Preparando ogrupo detreinamentoA maioria dos clientes querem ficar com umserviço ao invés de abandoná-lo (rsrsr)

Para isso precisamos equilibrar nossoconjunto de treinamento para focar sobre ocaso que estamos interessados. Como seestivéssemos colocando uma lupa sobre ataxa de cancelamento.

Componentes:

- Sample

Passo 3.1– Preparando ogrupo detreinamento

Passo 3.2– Preparando ogrupo detreinamentoEm vez de apenas fazer a configuração manual, vamos otimizá-lo.

Utilizando o modelo Wisdom of the Crowd para uma árvore de decisão nós vamos otimizar aprofundidade máxima no intervalo [20-29]

Componente:

- Optimize Parameters (Grid)

Passo 4– Preparando nosso classificadorAbrindo o ”Otimizador de Parâmetros”, o modelo será treinado e avaliado.Leitura recomendada:

Wisdom of the Crowd

Componentes:

- Decision Tree; Apply Model; Performance

Passo 3.3– Configurando ootimizador

Passo 3.2– Preparando ogrupo detesteO modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados

Componentes:

- Apply Model

- Performance (Binominal Classification)

Passo 3.3– Preparando ogrupo detesteO modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados

Componentes:

- Apply Model

- Performance (Binominal Classification)

Passo 3.3– Preparando ogrupo detesteO modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados

Componentes:

- Apply Model

- Performance (Binominal Classification)

Interpretando osresultadosENTENDENDO OPODER DENOSSA MODELAGEM

Interpretando assaídas- Ummodelodeárvore(treinadocomosdados),queanalisaocomportamentodochurn epodeseraplicadaaqualquerclienteindividualparaestimaraprobabilidadedechurn.

- Osdadosdeentradaoriginal

- Aestimativa(istoécross-validado)dodesempenhodomodelo.

Utilizando omodeloQueremos prever ocomportamento denovos clientes.Paraisso vamos utilizar odataset:telefonia_churn_rate_final.csv

Componentes:

- ReadCSV

- NominaltoDate

- SetRole

ApplyModel

Analisando osResultados

Analisando os Resultados

Mano…queloucoisso!

Agoraéminha vez!

Atividade

Apartir deuma basededadosdesua escolha,com,nomínimo 100.000registros,aplique aclassificação dedadosdemodo queseja possível prever ocomportamento doseu objeto de

estudo,destacando ainterpretação dosresultados.

Devem apresentar deacordo comoexporto em sala deaula.

Mineração dedadoscom

Classificação deDados

Umestudo decaso sobre oChurnRateem serviços detelefonia

PROF. JOÃO GABRIEL L IMA@JGABR IE L_ L IMA

L INKED IN .COM/ IN / JOAOGABR IE L L IMA

Mineração dedadoscomRapidMiner - Prof.João GabrielLima