Detecção preventiva de fracionamento de compras
-
Upload
rommel-carvalho -
Category
Government & Nonprofit
-
view
299 -
download
2
Transcript of Detecção preventiva de fracionamento de compras
Detecção Preventiva de Fracionamento de Compras
Brasil 100% Digital: 1º Seminário sobre Análise de Dados na Administração Pública | 11/09/2015 @ TCU
Dr. Rommel Novaes Carvalho – Coordenador-Geral do ODP/DIE/CGU | https://about.me/rommelnc
2
USING BAYESIAN NETWORKS TO IDENTIFY
AND PREVENT SPLIT PURCHASES IN BRAZIL
Rommel N. Carvalho, Leonardo J. Sales, Henrique A. da Rocha, and Gilson L. Mendes
Coordenador-Geral do ODP / Cientista de Dados / Professor
https://about.me/rommelnc
Departamento de Pesquisas e Informações Estratégicas (DIE) / Departamento de Ciência da Computação (CIC)
Controladoria-Geral da União (CGU) / Universidade de Brasília (UnB)
BMAW workshop @ UAI 2014
Quebec City, Quebec, Canada - 07/27/2014
Artigo: http://ceur-ws.org/Vol-1218/bmaw2014_paper_7.pdf
Slides: http://pt.slideshare.net/rommelnc/bmaw-2014-using-bayesian-networks-to-identify-and-prevent-split-purchases-in-brazil
Apresentação: https://www.youtube.com/watch?v=UVOsztdSQ3A
Baseado no Artigo
Introdução
Metodologia
Entendimento e Preparação dos Dados
Modelagem e Avaliação
Implantação
Conclusão
Agenda
3
Introdução
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão4
Trilha de Fracionamento
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
R$ 9.890,00
5
Será que vai fracionar?
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
?6
Metodologia
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão7
CRISP-DM
CRoss Industry Standard Process for Data Mining
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão8
Entendimento e Preparação
dos Dados
Entendimento para levantar hipóteses sobreo melhor uso dos dados e preparação para transformar os dados brutos em um conjuntode dados utilizados para criação do modelo
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão9
Dados Utilizados
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
SIASG CPF CNPJ CNAE
2005 a
2010
Compras de materiais e
serviços de TI
42 atributos ~ 70 mil registros
‘
?
IDs ?
26 atributos
~ 50 mil registros
centavos e bilhões
análise do especialista
10
Modelagem e Avaliação
Aprendizagem de modelos a partir dos conjuntode dados finais, ajuste de parâmetros para melhorar performance, escolha do melhormodelo baseado na validação e teste com conjunto desconhecido de dados
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão11
Será que vai fracionar?
?12Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
De Volta à Preparaçao
13Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Naïve Bayes vs Bayes Net (K2) –
com e sem Resampling
14Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Mudando algoritmos e
número de pais
15Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Tem como melhorar?
16Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
ImplantaçãoDescoberta de novas regras, validação das regras
existentes, documentação e elaboração de
relatório com resultados finais, e implantação do
modelo final em produção
17Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Possível Fracionamento
O sistema identificou que há outras
compras semelhantes a essa, que
podem caracterizar um fracionamento.
Usuário XXXX, matrícula YYYY, tem
certeza que deseja continuar?
Confirmar operação?
18Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
?
Conclusão
19Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Conclusões
É possível usar Mineração de Dados para prevenção
Resultados satisfatóriosTodos fracionamentos foram classificados corretamente
AUROC bastante alta (.999)
Acurácia bastante alta (99.197%)
É preciso fortalecer integração entre diferentes Órgãos
Entender e avaliar resultados com dados mais atuaisAvaliar tabelas de probabilidades da rede
Cuidado com overfitting
Aplicar técnicas em novos problemas governamentais
20Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão