Proposta de arquitetura para coleta
e disponibilização de informações
públicas sobre compras
governamentais
Prof Dr Eduardo MoresiCoordenador do Laboratório de Cibernética e Inteligência
[email protected] Gilson Libório
Diretor de Informações Estratégicas – SPCI - CGU
[email protected] MSc Wesley Vaz Silva
Auditor do TCU
Contexto:
◦ O orçamento do Governo Federal impacta vários
setores da Economia.
◦ A corrupção está entranhada na Administração
Pública nas esferas Federal, Estadual e Municipal.
◦ A justiça apura as irregularidades de forma lenta, mas
não pune os corruptos.
◦ A capacidade de auditoria dos profissionais de
controle (auditores e analistas) cresce em taxa inferior
ao aumento do volume de aquisições efetuadas pelo
Governo Federal.
2
Óbices ao controle pela sociedade:
◦ interfaces de consulta disponibilizam somente
informações específicas sobre licitações;
◦ Informações resultantes da consulta são complexas e
de difícil entendimento;
◦ impossibilidade de cruzamento de informações de
procedimentos licitatórios provenientes de duas
consultas distintas.
Resultado: apesar da informação ser pública,
não permite análises conclusivas.
3
Lei Nr 8.666/93 - normas gerais sobre
contratações na Administração Pública;
Lei Nr 10.520/02 - regulamenta a modalidade de
licitação pregão para aquisição de bens e
serviços comuns;
Princípio básico: publicidade da despesa
pública;
Em 2005 – pregão eletrônico – ComprasNet –
Portal de Compras do Governo Federal.
4
A arquitetura é composta pelos seguintes
módulos:
◦ um extrator de informações do Portal Comprasnet;
◦ parser para estruturar as informações sobre as atas
de pregões em formato HTML em um repositório de
dados semi-estruturados;
◦ interface direta entre os usuários e o SGBD.
7
Estágio atual de desenvolvimento:
◦ extração automática de Atas de Pregões, por Órgão,
por período ou por Estado (UF);
◦ transformação em informações semi-estruturadas;
◦ Atas já processadas: 31.583.
O funcionamento de cada módulo da solução
depende dos parâmetros de entrada associados
ao tipo de informação disponível a ser tratada.
13
Como o formato das Atas armazenadas no
ComprasNet é variável, a melhora do algoritmo
de parser do arquivo HTML é iterativa para cada
nova estrutura diferente identificada e codificada.
Atualmente a eficiência do parser, em teste
realizada em uma amostra de 400 Atas (total de
10.000) resultou em 60% de acertos (margem de
erro < 5%).
14
Conclusão Os dados presentes na ata de pregão caracterizam
todo o processo de compra governamental, desde a
abertura das propostas até a adjudicação do resultado
ao vencedor.
Pela completude das informações, a ata de pregão é
um objeto interessante para a análise exploratória
tanto pelos cidadãos quanto pelos auditores, que
buscam nas informações indícios de irregularidades
ou impropriedades no processo de compra.
A arquitetura da solução, embora ainda incompleta,
provê elementos para coleta, armazenamento e
disponibilização das informações obtidas sobre
pregões.
15
Conclusão
Trabalhos em andamento:◦ melhoria dos algoritmos utilizados para o parser de
informações sobre atas de pregão;
◦ modelagem relacional dos elementos de dados gerais
do pregão para cada um dos seus tipos;
◦ validação dos dados obtidos e tratados por meio da
comparação com repositórios de referência;
◦ execução das fases de modelagem, avaliação e
implantação previstas no CRISP-DM, visando finalizar
o ciclo de descoberta de conhecimento para os dados
públicos sobre compras governamentais;
◦ cruzamento com informações publicadas no Diário
Oficial da União.
16
http://www.del.icio.us/moresi
http://www.slideshare.net/moresi
Top Related