Reltorio Dados Abertos TCU

download Reltorio Dados Abertos TCU

of 78

description

Relatório sobre dados abertos do TCU

Transcript of Reltorio Dados Abertos TCU

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    GRUPO I CLASSE V PlenrioTC 005.003/2014-8 Natureza(s): Relatrio de Levantamentorgos/Entidades: Controladoria -Geral da Unio; Empresa deTecnologia e Informaes da Previdncia Social; Secretaria deLogstica e Tecnologia da Informao - MP; Servio Federal deProcessamento de Dados Interessado: Secretaria de Fiscalizao de Tecnologia daInformao - SeftiAdvogado constitudo nos autos: no h.

    S U M R I O : R E L AT R I O D E L E VA N TA M E N T O .PUBLICAO DE DADOS ABERTOS NA ADMINISTRAOP B L I C A F E D E R A L . S O L U E S D E C O L E TA ,ARMAZENAMENTO E PROCESSAMENTO DE GRANDESVOLUMES DE DADOS (BIG DATA). TRANSPARNCIA.MODERNIZAO DA GESTO PBLICA.

    Adoto como relatrio o trecho a seguir da manifestao da equipe de auditoria (pea 63):

    1. Introduo1.1 Deliberao1. A fiscalizao foi autorizada por meio do Despacho de 24/2/2014 do Ministro BenjaminZymler, no mbito do TC 033.814/2013-9, que trata de proposta de fiscalizao formuladapor esta unidade, sendo que as razes que motivaram a sua proposio encontram-sedescritas a seguir.2. O Governo Federal h anos vem realizando iniciativas referentes a governo aberto naAdministrao Pblica Federal, tendo passado a integrar a Parceria para GovernoAberto (Open Government Partnership OGP) em 2011, institudo a poltica de dadosabertos em 2012, alm de ter implementado diversos stios de dados governamentaisabertos.3. A poltica de dados abertos possui potenciais diversos, como a melhoria da gestopblica, provimento da transparncia, o fomento ao controle social, a promoo daparticipao social e o fomento inovao. Por outro lado, h riscos associados, como,por exemplo, o comprometimento tanto do acesso s informaes, quanto da seguranadas informaes disponibilizadas.4. Verifica-se que h grande volume de dados pblicos de interesse coletivo ou geral(dados passveis de serem abertos) e que novas tecnologias surgem como ferramentaspara coleta, armazenamento e processamento de dados em grandes volumes, velocidade evariedade, a exemplo do chamado Big Data, com potencial de gerao de conhecimento einsumos para a tomada de deciso com objetivos estratgicos. 5. Por oportuno, o TCU manifestou inteno em realizar seminrio internacional comvistas ao aprofundamento dos conhecimentos sobre tecnologias para coleta,armazenamento e processamento de grandes volumes de dados, a exemplo de Big Data,motivado, entre outros, pela deliberao do Plenrio do TCU a partir de Comunicao doMinistro Aroldo Cedraz, de 7/8/2013. Em que pese o seminrio internacional tenha sido

    1

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    adiado para 2015, o levantamento tambm uma oportunidade de o TCU conhecermelhor o assunto.6. Considerando o exposto, esta unidade entendeu a importncia de conhecer asiniciativas de publicao de dados abertos na Administrao Pblica Federal, bem comoo uso atual de solues de tecnologias para o tratamento de grandes volumes de dadospelo governo e sociedade como estratgias de transparncia e modernizao da gestopblica, para que, de posse desse conhecimento, este Tribunal possa planejar e realizar,futuramente, trabalhos de fiscalizao sobre o tema.1.2 Viso geral do objeto7. Trata-se de fiscalizao do tipo levantamento, conforme previsto no art. 238 doRegimento Interno do Tribunal de Contas da Unio (RI/TCU) e no art. 3 da Portaria-Segecex 15/2011.1.3 Objetivo8. O objetivo do trabalho conhecer iniciativas de publicao de dados abertos naAdministrao Pblica Federal (APF), considerando ainda o uso atual de solues decoleta, armazenamento e processamento de grandes volumes de dados (Big Data) pelogoverno e sociedade como estratgias de transparncia e modernizao da gestopblica.1.4 Metodologia utilizada9. Esta fiscalizao foi realizada em consonncia com os padres de levantamentoaprovados pela Portaria-Segecex 15/2011.10. Inicialmente, a equipe de fiscalizao buscou estabelecer o escopo e o noescopo do trabalho, bem como a profundidade dos procedimentos de levantamento.11. Para a definio do escopo, foi considerada, inicialmente, a necessidade deentender o significado do tema dados abertos e sua relao com temas subjacentes, comogoverno aberto, governo eletrnico e Big Data, alm de identificar os potenciaisbenefcios da utilizao de dados governamentais abertos, tais como a possibilidade deservir de insumo para a utilizao de solues de Big Data, estimular novasoportunidades de mercado etc. Tambm foram abordados potenciais riscos associados abertura dos dados governamentais. 12. Em paralelo, mediante pesquisa preliminar, a equipe tomou conhecimento deiniciativas de abertura de dados e solues criadas a partir deles em diversos pases e emalguns entes nacionais nas trs esferas de governo. Desse modo, optou-se por descreverum panorama internacional e um panorama nacional sobre a disponibilizao de dadosgovernamentais abertos e, no caso brasileiro, foi includo o cenrio de utilizao de BigData. Observou-se que muitas das solues criadas a partir das iniciativas identificadasinicialmente, em geral, relacionavam-se s reas de educao, sade, transporte esegurana. 13. Assim, na descrio do panorama nacional, elegeu-se como candidatos a serementrevistados rgos responsveis pela produo e/ou custdia de dados das reas daeducao e da sade, com vistas a verificar se rgos responsveis por informaes de talvalor social j se encontram sensibilizados com o tema de dados abertos e aspossibilidades de sua aplicao em proveito da gesto pblica e da sociedade. 14. Considerando a abrangncia do assunto e a opinio de alguns rgos federaisenvolvidos com os temas de governo aberto e dados abertos, a equipe definiu o escopo dotrabalho.

    2

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    15. Quanto profundidade dos procedimentos, foi elaborada matriz deplanejamento, conforme o escopo definido, contendo as seguintes questes:a) Q1. Quais as caractersticas principais de governo aberto, dados abertos e Big Data, ecomo se relacionam com a transparncia e a gesto pblica?b) Q2. Qual o panorama internacional da disponibilizao de dados governamentais emformatos abertos?c) Q3. Qual o panorama nacional da disponibilizao de dados governamentais e dautilizao de Big Data?16. Nesse processo, tambm foi definido o no escopo deste trabalho, tendo sidodefinidos produtos que no seriam entregues por esse levantamento e que tambm estorelacionados a dados abertos, governo aberto e Big Data, a exemplo de:a) descrio de detalhes tecnolgicos de solues de Big Data ou de suporte abertura dedados;b) descrio de eventuais projetos de Big Data com base em dados sigilosos e cujosresultados no poderiam ser publicados diretamente;c) proposio de mtrica para avaliar o grau de abertura de dados dos entes daAdministrao Pblica Federal;17. Ressalta-se, ainda, que a pesquisa realizada para levantar soluesinternacionais e nacionais que utilizam dados abertos no foi exaustiva, e que os exemplostrazidos neste relatrio so aqueles que se destacaram dentre as solues das quais aequipe teve conhecimento. 18. Durante a execuo, a equipe visitou os seguintes rgos/entidades:Departamento de Governo Eletrnico da Secretaria de Logstica e Tecnologia daInformao do Ministrio do Planejamento, Oramento e Gesto (DGE/SLTI/MP),Secretaria de Transparncia e Preveno da Corrupo da Controladoria-Geral da Unio(STPC/CGU), Departamento de Participao Social da Secretaria Nacional deArticulao Social da Secretaria-Geral da Presidncia da Repblica (DPS/SNAS/SG/PR),Laboratrio Hacker da Cmara dos Deputados, Instituto Nacional de Estudos e PesquisasEducacionais Ansio Teixeira (Inep), Departamento de Informtica do SUS (Datasus),Dataprev e Serpro. Para conhecer a percepo da sociedade, alm da viso dos gestores,foi realizada uma reunio com Alexandre Gomes, que foi representante da organizao dasociedade civil Transparncia Hacker e estudioso e defensor do tema.19. Registra-se que as consideraes manifestadas por cada ente fiscalizado foramincorporadas ao tpico de descrio do panorama nacional no presente relatrio delevantamento.20. Cabe mencionar que os stios da internet referenciados neste relatrio foramacessados nos meses de junho e julho de 2014. 1.5 Limitaes21. No houve fatores que limitassem a definio do escopo e da profundidade deanlise considerados ideais para este trabalho.1.6 Processos conexos22. No h.2. Caractersticas Principais de Governo Aberto, Dados Aberto e Big Data, e como se relacionam com a transparncia e a gesto pblica23. Este captulo pretende apresentar algumas definies a partir de publicaes eestudos acadmicos sobre dados abertos, governo aberto, governo eletrnico, Big Data e

    3

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    suas relaes. Ademais, abordam-se os potenciais benefcios de dados abertos, a exemploda possibilidade de sua utilizao como instrumento de participao social e como fontepara a aplicao de solues de Big Data. Por fim, destaca-se o registro de benefciosobtidos por pases em decorrncia da abertura de dados, bem como a enumerao dealguns riscos potenciais inerentes tal.2.1 Governo Aberto24. Consoante a Parceria para Governo Aberto (Open Government Partnership OGP), a expresso governo aberto refere-se a projetos e aes que visam promoo datransparncia, luta contra a corrupo, ao incremento da participao social e aodesenvolvimento de novas tecnologias, de modo a tornar os governos mais abertos,responsveis por suas aes e aptos a atender s necessidades dos cidados(opengovpartnership.org).25. De acordo com a Organizao para Cooperao e Desenvolvimento Econmico(OCDE), para a construo de um governo aberto existem trs princpios-chave a seremlevados em considerao:a) Responsabilizao e Prestao de Contas (Accountability) necessrio que existammecanismos que possibilitem aos cidados fiscalizarem o governo quanto ao desempenhode suas polticas e de seus servios;b) Transparncia Disponibilizao de informaes confiveis, relevantes e tempestivassobre as atividades do governo, de forma que os cidados compreendam as aesrealizadas por ele;c) Participao Social O governo deve escutar os cidados e levar em considerao osseus anseios, tanto no desenho quanto na implementao das polticas pblicas e dosservios pblicos prestados. 26. O Brasil reconhecido como um protagonista no cenrio internacional no quediz respeito a governo aberto, tendo sido convidado para compor, juntamente com outrospases, a OGP, qual foi o primeiro a presidir, juntamente com os Estados Unidos. Aotrmino da fase de execuo deste levantamento, o Brasil compunha o comit diretor daOGP e a parceria j contava com 64 pases signatrios. A OGP uma iniciativainternacional que pretende difundir e incentivar globalmente prticas governamentaisrelacionadas transparncia dos governos, ao acesso informao pblica e participao social.27. No lanamento da Parceria, os oito pases fundadores (frica do Sul, Brasil,Estados Unidos, Filipinas, Indonsia, Mxico, Noruega e Reino Unido) assinaram aDeclarao de Governo Aberto (pea 35), em que reconheceram a reivindicao dasociedade por mais abertura nos governos e se comprometeram com os princpios e comos objetivos de um governo aberto. 28. Segundo a Declarao de Governo Aberto (pea 35, p 1-3), para um governoser considerado aberto, ele deve se comprometer a:a) aumentar a disponibilidade de informaes sobre atividades governamentais;b) apoiar a participao social;c) implementar os mais altos padres de integridade profissional na Administrao;d) aumentar o acesso a novas tecnologias que promovam a transparncia e a prestao decontas.29. A OGP define que um compromisso por um governo aberto deve seguir quatroprincpios, sendo trs deles tambm declarados pela OCDE transparncia, participao

    4

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    cidad e responsabilizao e prestao de contas alm do princpio tecnologia einovao, por meio do qual o governo deve reconhecer a importncia das novastecnologias no fomento inovao, provendo acesso tecnologia e ampliando acapac idade da soc i edade de u t i l i z - la ( cgu .gov.br /governoaber to /a -ogp/o_que_e_Governo_Aberto.asp).30. Alm disso, os compromissos da OGP devem ser estruturados em torno de umconjunto de cinco reas de atuao denominadas Grandes Desafios pela Parceria. Poroutro lado, a OGP reconhece que os pases encontram-se em diferentes contextos e que,assim, cada pas membro deve selecionar os desafios e compromissos mais relacionados sua realidade (cgu.gov.br/governoaberto/a-ogp/como_Funciona.asp).31. Os cinco grandes desafios propostos pela OGP so:a) melhoria dos servios pblicos;b) aumento da integridade pblica;c) gesto mais efetiva dos recursos pblicos;d) criao de comunidades mais seguras;e) aumento da responsabilidade corporativa.32. Para a OGP, a melhoria da qualidade da governana do pas, bem como dosservios pblicos prestados aos cidados, so a base para a sustentabilidade de umgoverno mais transparente, mais receptivo participao popular e mais disposto prestao de contas e responsabilizao (opengovpartnership.org/about/mission-and-goals#sthash.uiuyIhXz.dpuf).33. O governo aberto tambm definido como uma doutrina de governana queestabelece o direito dos cidados a acessar documentos e procedimentos do governo, def o r m a a p e r m i t i r s u p e r v i s o p o r p a r t e d a s o c i e d a d e(en.wikipedia.org/wiki/Open_government).34. Como pode ser observado, os conceitos de governo aberto e transparncia estofortemente correlacionados. Governo aberto e, consequentemente, transparncia, sofrequentemente considerados indutores da responsabilizao e da prestao de contas(accountability) e do combate corrupo, ineficincia e ao desperdcio.35. Defensores do governo aberto costumam frisar que no se obtm atransparncia somente com a edio de normas legais, mas sim com a participao detoda a sociedade civil, por meio de uma imprensa livre, de organizaes nogovernamentais e da atuao de instncias fiscalizadoras dentro do prprio governo.36. Nesse sentido, cabe citar que associaes no governamentais tais como aTransparncia Internacional (transparency.org), a Open Society Foundations(opensocietyfoundations.org) e a Open Knowledge Foundation (okfn.org) se tornaramreferncias mundiais que influenciam os debates e rumos adotados em diversos pases noque diz respeito a governo aberto.37. O comprometimento dos pases perante a OGP e suas diretrizes se materializana forma de um plano de ao nacional, contendo as aes concretas e mensurveis parao fortalecimento da transparncia e para a construo de um governo aberto no mbito decada pas membro. Seguindo os preceitos da OGP, esse plano deve ser elaborado com aparticipao da sociedade civil. 38. poca dos trabalhos de campo, estava em vigor o 2 Plano de Ao Brasileiro,com 52 compromissos relacionados temtica do governo aberto (pea 60).

    5

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    39. A evoluo relativa execuo das aes estabelecidas no plano de ao acompanhada por meio do Mecanismo de Avaliao Independente (Independent ReportMechanism) estabelecido pela OGP. Segundo esse mecanismo, cada pas participante daOGP deve publicar seus relatrios independentes de avaliao bianuais contendo oestgio atual de cada ao, bem como recomendaes tcnicas quanto implementaodo plano. A avaliao do 2 Plano de Ao Brasileiro foi realizada e est disponvel napgina da CGU (cgu.gov.br/governoaberto/no_brasil/plano-brasileiro /segundo-plano/index.asp).2.2 Relao entre Governo Eletrnico e Governo Aberto40. O conceito de governo aberto muitas vezes aparece associado ao de governoeletrnico (e-gov), embora se refiram a objetivos diferentes. Observa-se que algumaspublicaes tentam delimitar o conceito de governo eletrnico. 41. A OCDE, no artigo intitulado The e-Government Imperative, define governoeletrnico como o uso de tecnologias da informao e comunicao, e em particular ainternet, como uma ferramenta para alcanar um governo melhor (OCDE, 2003, p. 23),disponvel em oecd-ilibrary.org/governance/oecd-e-government-studies_19901054.42. A Organizao das Naes Unidas (ONU) e a American Society for PublicAdministration (Aspa) realizaram, em 2002, um estudo em que definem governo eletrnicocomo a utilizao da internet e da world-wide-web para a entrega de informaes es e r v i o s d o g o v e r n o p a r a c i d a d o s , d i s p o n v e l e munpan1.un.org/intradoc/groups/public/documents/un/unpan021547.pdf.43. Atualmente, as Naes Unidas (ONU) definem governo eletrnico como autilizao das TIC e sua aplicao, por parte do governo, para a prestao deinformaes e servios pblicos populao. A ONU classifica governo eletrnico emtrs grupos: Governo para Governo (G2G), que envolve o compartilhamento de dadosentre atores de governos em todos os nveis federativos; Governo para Negcios (G2B),que envolve transaes especficas, como pagamentos e compras pblicas; e Governopara Cidados (G2C), que so as iniciativas voltadas para facilitar a interao entre aspessoas e o governo, o que inclui a entrega de servios pblicos e a participao doc i d a d o n o p r o c e s s o d e t o m a d a d e d e c i s o , d i s p o n v e l e munpan1.un.org/intradoc/groups/public/documents/un/unpan021547.pdf, acessado em4/6/2014.44. Embora sejam conceitos distintos e que tm objetivos diferentes, existe umaclara sobreposio entre governo aberto e governo eletrnico no que diz respeito transparncia. Portanto, entende-se que governo aberto pode envolver aes de governoeletrnico, sendo, no entanto, mais abrangente, visto que inclui aspectos relacionados responsabilizao e ao incremento da participao social. 45. A Administrao Pblica Brasileira disponibiliza, hoje, inmeros servios degoverno eletrnico, em diferentes estgios de maturidade, sendo que alguns deles j soamplamente utilizados pelos cidados, como, por exemplo, o servio de declarao deimposto de renda e o servio de consulta ao Cadastro de Pessoa Fsica (CPF) oferecidospela Receita Federal do Brasil. Outros exemplos de aes de governo eletrnico no Brasilso os portais institudos com o objetivo de prover acesso populao a informaessobre servios pblicos (servicos.gov.br) e a aplicativos para prestao desses servios(aplicativos.gov.br) oferecidos pelo Governo Federal.

    6

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    2.3 Dados Abertos46. Com o advento das tecnologias digitais, a prtica de governo aberto no que dizrespeito informao e transparncia governamental passou gradativamente a seapropriar dos recursos de processamento e disseminao de dados eletrnicos em grandevolume e alta velocidade. Atualmente, a transparncia est fortemente associada disponibilizao dos chamados dados abertos, por meio dos quais possvel, a princpio,escrutinar o universo de aes governamentais de forma mais detalhada.47. Segundo a definio da Fundao do Conhecimento Aberto (Open KnowledgeFoundation OKF) , dados so abertos quando qualquer pessoa pode livremente us-los, reutiliz-los e redistribu-los, estando sujeito a, no mximo, a exigncia de creditar asua autoria e compartilhar pela mesma licena (dados.gov.br/dados-abertos e versooriginal da OKF em okfn.org/opendata). Nesse caso, uma licena refere-se ao regramentode como os dados podem ser compartilhados. 48. A OKF uma organizao sem fins lucrativos, criada no Reino Unido em 2004,que busca promover o chamado conhecimento aberto, ou seja, qualquer contedo,informao ou dado que as pessoas possam usar livremente, reusar ou redistribuir semqualquer restrio legal, tecnolgica ou social (princpios do conhecimento aberto podemser vistos em opendefinition.org/od). No captulo seguinte, sero apresentados maisdetalhes sobre a atuao da OKF. 49. O Portal Brasileiro de Dados Abertos (dados.gov.br), um ponto focal nadisponibilizao de dados abertos no Brasil, usa a definio de dados abertos propostapela OKF. O portal toma como referncia, ainda da OKF, as chamadas trs leis (regras) eos oito princpios que devem reger os dados abertos.50. As trs leis foram propostas pelo especialista em polticas pblicas e ativistados dados abertos David Eaves e, embora tenham sido apresentadas para dados abertosgovernamentais, pode-se dizer que elas se aplicam aos dados abertos de forma geral. Astrs leis so:1. Se o dado no pode ser encontrado e indexado na Web, ele no existe;2. Se no estiver aberto e disponvel em formato compreensvel por mquina, ele no pode serreaproveitado; e3. Se algum dispositivo legal no permitir sua replicao, ele no til.

    51. Em 2007, um grupo de trabalho da OKF definiu os oito princpios dos dadosabertos governamentais:1. Completos: todos os dados pblicos so disponibilizados. Dados so informaeseletronicamente gravadas, incluindo, mas no se limitando a, documentos, bancos de dados,transcries e gravaes audiovisuais. Dados pblicos so dados que no esto sujeitos alimitaes vlidas de privacidade, segurana ou controle de acesso, reguladas por estatutos.2. Primrios: os dados so publicados na forma coletada na fonte, com a mais fina granularidadepossvel, e no de forma agregada ou transformada.3. Atuais: os dados so disponibilizados o quo rapidamente seja necessrio para preservar o seuvalor.4. Acessveis: os dados so disponibilizados para o pblico mais amplo possvel e para ospropsitos mais variados possveis.5. Processveis por mquina: os dados so razoavelmente estruturados para possibilitar o seuprocessamento automatizado.6. Acesso no discriminatrio: os dados esto disponveis a todos, sem que seja necessriaidentificao ou registro.7. Formatos no proprietrios: os dados esto disponveis em um formato sobre o qual nenhumente detenha controle exclusivo.

    7

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    8. Livres de licenas: os dados no esto sujeitos a regulaes de direitos autorais, marcas,patentes ou segredo industrial. Restries razoveis de privacidade, segurana e controle deacesso podem ser permitidas na forma regulada por estatutos.

    52. Na gnese dessas leis (regras) e princpios, existem razes e justificativasfortemente ligadas realidade do mundo digital e aos princpios da prpriatransparncia. 53. O mundo digital fortemente conectado e a busca automtica um dos seusprincpios. Os mecanismos de busca automtica dentre os quais o da Google(google.com) atualmente o mais popular servem como indexadores do contedoexistente na internet. Solues como essas no exigem, por exemplo, que se conhea oendereo de rede no qual um contedo disponibilizado. Os indexadores permitem, pormeio de palavras-chave ou fraes de contedo, obter o endereo e ento acessar ocontedo integral procurado. 54. A primeira lei dos dados abertos proposta pela OKF reflete a realidade dainternet. Um dado que no pode ser indexado no existe. Para que exista, o dado abertoprecisa ento ser disponibilizado em um local de rede livremente acessvel pelosindexadores e pelos internautas interessados em acess-lo. Os princpios 4 e 6 tambmrefletem essa regra.55. Outro pilar do mundo digital o tratamento automatizado dos dados por meiode ferramentas que permitam a anlise de grandes quantidades de registros seminterveno manual. Mas, para que essa anlise seja possvel, necessrio que: a) o dadodisponibilizado o seja j em formato digital, sendo possvel replic-lo em bloco nocomputador onde a anlise ocorrer; b) o dado respeite princpios bsicos de estruturatabular (organizados de modo que se possa associar diferentes itens e atribuir-lhes umvalor, seja nmero ou texto); e c) o dado no esteja codificado em formato que exijatransformao prvia, que por sua vez requeira ferramentas proprietrias (pagas ou deacesso restrito). Essas regras esto refletidas na segunda e terceira leis e nos princpios 5,7 e 8 da OKF.56. Com relao transparncia, de senso comum que prover transparncia aalgo supe informar, e que informar supe fornecer informaes completas e atuais. Daderivam os princpios 1 e 3.57. Quanto ao princpio 2, tem-se que dados primrios, tambm chamados de dadosbrutos, derivam tipicamente de sistemas informatizados baseados em bancos de dados. Osbancos de dados armazenam as transaes geradas durante o uso de um sistemainformatizado. Uma transao est normalmente associada a um fato atmico, a exemploda incluso ou excluso de um dado, a qual uma operao que no pode sersubdividida, e por isso resulta no registro do dado de mais fina granularidade. Trazendopara um campo de aplicao, tal como a educao, podemos citar como exemplo de dadoprimrio o registro da escolaridade de um aluno do ensino bsico. 58. Em contraposio aos dados primrios, utiliza-se a expresso dados analticosou informacionais, que seriam aqueles derivados dos dados primrios por meio do usode regras e ferramentas que transformam o dado primrio em informaes agregadas(grossa granularidade) e/ou traduzem o dado para formatos, codificaes ou vocabulriosmais facilmente compreensveis por certo pblico alvo. Esses so tipicamente aquelesdados apresentados em sistemas de informaes gerenciais e de apoio deciso. Na reade educao, um exemplo de dado agregado seria o grau de escolaridade de todo osalunos do ensino bsico em um determinado Estado.

    8

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    59. O que o princpio 2 busca atingir a transparncia absoluta, na qual todos osfatos informados em um sistema estejam acessveis. A partir desses dados primrios, oconsumidor da informao poder ele mesmo criar suas prprias anlises ou agregaes,de forma a tirar suas prprias concluses, sem ser direcionado ou influenciado por algumintermedirio que, ao aplicar regras de anlise, agregao ou traduo, tenha criadoalgum vis ou interpretao equivocados.60. As leis, princpios e conceitos propostos pela OKF foram adotados por diversospases, entre eles o Reino Unido, os EUA e o prprio Brasil. Entretanto, no possvelevidenciar uma padronizao a nvel mundial no que diz respeito aos dados abertos. Uml e v a n t a m e n t o f e i t o p e l a G l o b a l O p e n D a t a I n i t i a t i v e ( G o d i ;globalopendatainitiative.org/survey-and-interview-report) indica que, embora os padresda OKF sejam os mais citados, diversos pases at ignoram a existncia desses padres ouno consideram que a padronizao seja relevante. O mesmo levantamento mostrabastante diversidade de implementaes das polticas de dados abertos governamentais.Em muitos pases, por exemplo, dados so obtidos por meio de demandas baseadas emleis de liberdade de informao ou raspadas de stios governamentais para depoisserem publicadas por organizaes da sociedade civil ou institutos de estatstica.Raspagem de dados, do ingls data scraping, um jargo utilizado por desenvolvedoresde aplicativos para a internet, significando a atividade de extrair dados de stios econvert-los a um formato legvel para programas de computador, para que possam seranalisados e cruzados com mais facilidade. 61. Em relao ao caso brasileiro, no se pode deixar de citar interpretao dosdispositivos da Lei 12.527/2011, Lei de Acesso Informao (LAI), acerca do conceito dedados abertos governamentais. Consoante o art. 8 da LAI, dados abertos so asinformaes de interesse coletivo ou geral que devem ser obrigatoriamente divulgadaspelos rgos e entidades pblicos em seus stios oficiais e que devem atender, entre outros,aos seguintes requisitos: possibilitar o acesso automatizado por sistemas externos emformatos abertos; serem estruturados e legveis por mquina; estarem acompanhados dedetalhes sobre os formatos utilizados para estruturao da informao; serem autnticos,ntegros e atualizados. 62. Outros princpios que merecem ser citados so os adotados pelo G8, o grupodas oito maiores economias do mundo, na Declarao de Dados Abertos do G8 (G8 OpenData Charter; international.gc.ca/g8/open_data-donnees_ouvertes.aspx?lang=eng), ospassos estabelecidos pelo governo Obama na chamada Open Government Directive(White House 2009, whitehouse.gov/open/documents/open-government-directive) para acriao de um governo aberto, e as recomendaes do comit de polticas pblicas docaptulo americano da tradicional Association of Computing Machinery USACM(acm.org/public-policy/open-government). Observa-se que, a despeito da especificidadeou nfase adotada por cada uma dessas instituies, em sntese, todas elas harmonizamcom os princpios de David Eaves, ao pregar que os dados: so pblicos por princpio;devem ser abertos; e devem ter qualidade,utilidade, inteligibilidade e reusabilidade, nointuito de propiciar a inovao e a melhoria da gesto pblica por meio da criao eestabelecimento de uma cultura de dados abertos.2.4 Big Data63. Inicialmente associada s pesquisas cientficas em meteorologia, genmica es i m u l a e s f s i c a s , q u e l i d a m c o m gr a nd e s qu a n t i d ad e s d e d ad o s(nature.com/nature/journal/v455/n7209/edsumm/e080904-01.html), a expresso Big Datapassou a ser associada internet, com o processamento de dados associados ao

    9

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    comportamento dos usurios em mdias sociais, como no caso do Facebook ou empesquisas da Google. 64. Considerando-se que a expresso recente e que existem inmeras definies(opentracker.net/article/definitions-big-data), considera-se que Big Data ainda umtermo vago e com definio imprecisa.65. De forma geral, h definies para Big Data que ressaltam aspectos maistcnicos, enquanto h outras que buscam definir o termo sem o emprego de refernciastcnicas, tais como a proposta por Victor Mayer Schnberger e Kenneth Cukier, no livrointitulado Big Data: A Revolution that Will Transform How We Live, Work and Think, quedefine Big Data como:Big Data se refere a anlises de dados em larga escala que no so possveis quando em baixaescala, para extrair novas ideias ou criar novas formas de valor, que alteram mercados,organizaes, o relacionamento entre os cidados e os governos, e muito mais (traduo livre).

    66. A seguir, tem-se duas definies que consideram aspectos tcnicos.67. Segundo o Gartner, Big Data a expresso empregada para descrever ativos deinformao em grande volume de dados, velocidade de atualizao ou consulta evariedade de formatos, que demandam formas de processamento da informao prpriaspara essas caractersticas, para melhor compreenso e tomada de deciso, de um modoque no estaria disponvel em uma menor escala do conjunto de dados (gartner.com/it-glossary/big-data).68. Desse modo, a expresso Big Data frequentemente utilizada em sentido latopara designar quaisquer grandes bases de dados, cuja anlise escapa aos mtodostradicionais em banco de dados relacionais e em estatstica descritiva ou que requeiramgrande capacidade computacional distribuda em numerosas mquinas para serexecutada. A estatstica descritiva a parte que procura descrever e avaliarcaractersticas de uma amostra da populao sem generalizar concluses ou infernciassobre a populao como um todo.69. Assim, tem-se as seguintes caractersticas tecnolgicas associadas a solues deBig Data:69.1. complexidade do conjunto dos dados: dados em diversos formatos e poucoestruturados que no se adequam ao modelo de armazenamento, manipulao erecuperao de dados adotado em bancos de dados relacionais;69.2. mtodos prprios de anlise: mtodos baseados em estatstica indutiva (a parteda estatstica que, baseando-se em resultados obtidos da anlise de uma amostra dapopulao, procura inferir, induzir ou estimar as regras de comportamento da populaocomo um todo) e em aprendizado automtico (machine learning o desenvolvimento de algoritmos e tcnicas que permitam ao computador aperfeioar seu desempenho emalguma tarefa). Essa anlise busca identificar padres nos dados e correlaes entre suasvariveis de forma a construir modelos que permitam realizar previses mais confiveis e,em ltima instncia, que guiem aes mais eficientes;69.3. uso de recursos computacionais distribudos: devido s dimenses do conjuntode dados e complexidade das anlises estatsticas, seu processamento tipicamenterealizado de forma distribuda, sob numerosas mquinas independentes que atuam deforma coordenada e regidas por softwares prprios, tais como MapReduce(research.google.com/archive/mapreduce.html) e Hadoop (hadoop.apache.org). 70. Exemplo bem sucedido e conhecido de uso de Big Data, o servio de traduoautomtica da Google (translate.google.com) consegue bons resultados utilizando

    10

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    correlaes estatsticas entre textos que j foram previamente traduzidos por tradutoreshumanos, obtidos a partir de imensas bases de documentos escritos em vrias lnguas e depublicaes da Organizao das Naes Unidas (ONU).71. Por oportuno, cita-se que o governo dos EUA anunciou, em 2012, umainiciativa de Big Data (whitehouse.gov/blog/2012/03/29/big-data-big-deal) que agrupadiversos projetos associados tecnologia em reas to diversas quanto defesa, energia,m e i o a m b i e n t e , s a d e , e s p a o e e s p i o n a g e m(whitehouse.gov/sites/default/files/microsites/ostp/big_data_fact_sheet_final_1.pdf). Essainiciativa levou a um relatrio de atividades, de maio de 2014, que aponta concluses dae x p e r i n c i a a m e r i c a n a(whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf), dasquais se destacam: o carter inevitvel da adoo de Big Data no governo daquele pas;riscos relacionados proteo da privacidade; a relevncia dos dados abertosgovernamentais que podem servir de insumos para projetos de Big Data; e a necessidadede investimento de recursos para tirar o mximo proveito da tecnologia em benefcio dapopulao.72. Diversas publicaes propem benefcios potenciais alcanveis com o uso deBig Data. Dentre esses benefcios, incluem-se:a) personalizao das respostas geradas por sistemas de informao, como nasrecomendaes de compra da Amazon (amazon.com), que sugerem automaticamentenovos produtos em funo de comparaes de histricos de compras de sua base declientes;b) captao de informaes dispersas em redes de sensores ou por meio de contribuiesindividuais voluntrias, como a iniciativa da cidade de Boston, nos Estados Unidos, quelanou um aplicativo para celulares que detecta a vibrao causada pela passagem de umcarro sobre um buraco na estrada, registra a posio geogrfica em que isso ocorreu como GPS e transmite esses dados pela internet para os servidores do departamento deestradas do municpio, que pode ento alocar seus recursos em resposta incidncia deburacos e seu impac to sobre os motor i s tas que usam o ap l ica t ivo(cityofboston.gov/doit/apps/streetbump.asp).c) deteco de fraudes: controle aduaneiro do trnsito de mercadorias(fcw.com/Articles/2013/09/25/big-data-transform-government.aspx?p=1);d) resposta a incidentes e emergncias: antecipao de problemas de trnsito; priorizaode resposta a catstrofes (fcw.com/Articles/2013/09/25/big-data-transform-government.aspx?p=1);e) democratizao do acesso informao: pelo uso de solues de Big Data em conjuntocom solues baseadas em plataformas abertas, em que dados abertos podem suportarnovas aplicaes de governo eletrnico desenvolvidas por quaisquer pessoas. Comoexemplo, citam-se as avaliaes de qualidade e disponibilidade de hospitais e escolas, oque permitiria maior empoderamento da populao e eventuais ganhos em participaosocial (fcw.com/Articles/2013/09/25/big-data-transform-government.aspx?p=1);f) ganhos de eficincia e produtividade com a otimizao do processo produtivo ereduo de desperdcios (fcw.com/Articles/2013/09/25/big-data-transform-government.aspx?p=1);g) novas oportunidades de negcio: como, por exemplo, o desenvolvimento do setor demapeamento, georreferenciamento e rastreamento, aps a abertura de bancos de imagensde satlites e acesso rede GPS.

    11

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    73. Identifica-se um consenso de que entre os principais desafios para se obter osbenefcios esperados com o uso do Big Data destacam-se questes organizacionais, comoacesso aos dados brutos, melhora no uso de mtodos estatsticos empregados na anlised o s d a d o s ( f t . c o m / c m s / s / 2 / 2 1 a 6 e 7 d 8 - b 4 7 9 - 1 1 e 3 - a 0 9 a -00144feabdc0.html#axzz2yyxPpCGB) e riscos privacidade das pessoas(whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf), maisdo que questes propriamente tecnolgicas, em que h rpidas inovaes e contnuoaperfeioamento de solues.2.5 Benefcios potenciais de dados abertos 74. As prticas de governo aberto, quando promovidas pelo governo, podem gerarbenefcios tanto para a sociedade como para o prprio governo. Ao levar conhecimento eentendimento sobre a execuo de suas polticas, aes, servios e desempenho, o governose permite fiscalizar, expondo junto sociedade sucessos e insucessos. 75. Em artigo intitulado Effective Open Government: Improving Public Access toGovernment Information, publicado em 2005, a OCDE j registrava que a transparncia ea abertura de dados figuram como aspectos essenciais de um governo moderno(papers.ssrn.com/sol3/papers.cfm?abstract_id=2069870), destacando como benefcios aparticipao democrtica e compreenso do cidado, a melhoria do processo de tomadade deciso, do gerenciamento dos dados governamentais, da eficincia da gesto, dosservios oferecidos aos cidados, alm da reduo da corrupo. 76. A literatura lista outros potenciais ganhos decorrentes da abertura dasinformaes pblicas. A OKF (okfn.org/opendata) ressalta a participao do cidado nagesto do governo, uma vez que a disponibilizao dos dados governamentais nosomente leva informao aos cidados, mas tambm a possibilidade de que eles seenvolvam no processo de deciso e contribuam com as aes pblicas. oempoderamento do cidado que passa ao papel de agente da transformao social pormeio do acompanhamento e da fiscalizao das aes governamentais, das polticaspblicas, enfim do desempenho do governo. Por outro lado, com mais poder econhecimento, o cidado pode passar a ter mais confiana no poder pblico e a se sentirparticipante desse poder. 77. O aplicativo Poltica Aberta (politicaaberta.org), por exemplo, apresenta arelao das empresas maiores doadoras de campanhas eleitorais de 2012 e a relao dasempresas mais contratadas do governo federal no mesmo ano, fornecendo informaopara o exerccio do controle social e acompanhamento do processo eleitoral (pargrafo222). Outro exemplo a soluo QEdu, que constitui um portal aberto e gratuito cominformaes sobre a qualidade do aprendizado dos alunos do 5 e 9 anos em cada escola,municpio e estado do Brasil, permitindo o acompanhamento da evoluo de determinadaspolticas pblicas educacionais (pargrafo 228). 78. Ao disponibilizar seu dados, o governo tambm favorece a criao de negciose servios inovadores com valor tanto comercial como social. Organizaes, cidados,acadmicos, empresas e at mesmo as instituies pblicas tm a possibilidade de utilizarbases de dados pblicos para a produo e o compartilhamento de novos conhecimentos ede novos servios, numa concepo de coparticipao entre ente privado e governo naoferta de servios pblicos. Uma vez que o Estado no tem capacidade de prover aquantidade e a diversidade de servios que a sociedade pode e quer consumir, aconjuno de esforos se mostra oportuna.79. Em outro artigo, intitulado Do More Transparent Governments Govern Better?e publicado em 2003, o Banco Mundial ressalta que o acesso informao pode, ainda,

    12

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    induzir a melhoria do gerenciamento de riscos, do desempenho econmico do governo ede sua eficincia burocrtica (www.oecd.org/gov/46560184.pdf). 80. Nota-se, portanto, a diversidade de potenciais benefcios oriundos de prticasde abertura de dados pblicos, sendo que alguns deles j esto sendo mensurados, como o caso dos exemplos a seguir.81. A OKF publicou, em novembro de 2013, uma apresentao em que mostra osganhos obtidos por pases em decorrncia da abertura de dados (pea 59, p. 56-65). Porexemplo, no Canad, dados abertos expuseram um esquema de fraudes relacionadas aiseno de impostos sobre doaes a instituies de caridade, que permitiu a contestaode U$ 32.000.000.000,00 em impostos devidos. Na Espanha, um estudo realizado apontaque cerca de cinco mil empregos esto relacionados a empresas que criam aplicativos,produtos e servios, utilizando informaes do setor pblico. Em Uganda, a poltica deacesso informao e a decorrente divulgao dos recursos pblicos recebidos por cadaescola contribuiu para a reduo da corrupo que se apoderava desses valores, e asescolas, que antes se apropriavam de apenas 20% do valor a elas destinado, passaram adispor de 90% desse valor. Ao divulgar a localizao de trezentos mil pontos de nibus, acomunidade do Reino Unido retificou dezoito mil deles, contribuindo para a melhoria daqualidade das informaes pblicas.2.6 Oportunidades de utilizao de dados abertos em conjunto com Big Data82. Dados abertos governamentais frequentemente atingem dimenses quepoderiam qualificar a utilizao de solues de Big Data, dado o volume elevado deinformaes, a velocidade em que os dados so atualizados e a variedade dos dados. Paraexemplificar, tomam-se as informaes acerca das compras governamentais no mbito dogoverno federal que so volumosas e diversificadas, constituindo fontes de conhecimentosvariados, profundos e inovadores, passveis de serem extrados com a utilizao deferramentas de Big Data, para diversos fins, tais como deteco de fraudes. A fiscalizaorealizada por esta secretaria, que analisou as informaes registradas no sistemaComprasnet, especificamente quanto ao cumprimento do disposto na Lei 10.520/2002, art.7 (TC 015.239/2012-8), foi realizada utilizando-se ferramentas de auditoria de dados(Audit Command Language). Para esse objeto, portanto, seria adequado o uso deferramentas de Big Data, que poderiam trazer mais e mais diversas inferncias sobre arelao entre gestores, empresas e licitaes.83. Alm disso, dados abertos governamentais fornecem informaes bsicas quepodem ser necessrias e teis para projetos de construo de aplicaes a partir dospreceitos do Big Data, como informaes de georreferenciamento, bases de cdigospostais, informaes climticas, dados histricos ou dados de levantamentos estatsticos(como os do IBGE). 84. Adicionalmente, repositrios de dados pblicos que se tornam abertos podemestimular novos projetos de Big Data especficos para aproveitar seu contedo, comoexemplifica o sistema de mapas interativos da Google (maps.google.com), construdo,inicialmente, sobre a base de dados espaciais do instituto do censo dos EUA(theatlantic.com/technology/archive/2012/09/how-google-builds-its-maps-and-what-it-means-for-the-future-of-everything/261913).85. Entende-se que as tecnologias de Big Data podem e devem fazer uso de dadosabertos no mbito governamental, seja para informar o cidado, gerar conhecimento,promover o controle social ou para qualquer outro fim que favorea o progresso da gestoEstado e dos servios que por ele so prestados.

    13

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    2.7 Oportunidades de utilizao de dados abertos com participao social86. A participao social um dos pilares de governo aberto, estimulando que ocidado conhea, verifique, fiscalize, se esclarea e acompanhe as aes pblicas de seuinteresse. Por outro lado, com as vias de comunicao estabelecidas, o cidado pode,tambm, fornecer informaes ao Estado, contribuindo para a avaliao e ajustes daspolticas pblicas e para a melhoria dos dados pblicos, entre outros benefcios. 87. Essa relao entre Estado e sociedade j se faz presente em soluesdesenvolvidas com base em dados abertos. A Open Knowledge Foundation (okfn.org)relaciona alguns exemplos em que a participao social propiciou a melhoria daqualidade dos dados (blog.okfn.org/category/open-government-data/page/5/). O ReinoUnido, por exemplo, ao disponibilizar os dados referentes s trezentas mil paradas denibus, tornou possvel a contribuio da comunidade Open Street Map(openstreetmap.org), que atuou na correo das informaes de dezoito mil paradas denibus, colaborando para a melhoria das informaes do transporte pblico daquele pas(pea 59, p. 61). 88. No entanto, para que a sociedade realmente participe, a simples publicao dosdados governamentais no suficiente. necessrio que a disponibilidade dasinformaes pblicas, com fcil acesso aos cidados, seja divulgada e tenha despertado ointeresse para o seu uso, tanto para a criao de novos produtos e servios, como para aconstruo de novas e diferentes vises das informaes. 89. Para fomentar a participao social com o uso de dados abertos, parecen e c e s s r i o q u e s e j a c r i a d a u m a c u l t u r a d e d a d o s a b e r t o s(mckinsey.com/insights/public_sector/how_government_can_promote_open_data). Almde levar ao pblico o conhecimento do acesso s suas informaes, o governo devepromover eventos que estimulem o uso dessas informaes pela sociedade civil(universidades, empresas, organizaes etc.). Vrias estratgias tm sido utilizadas parainstigar a utilizao de dados abertos em dezenas de pases, incluindo Reino Unido,Estados Unidos, Austrlia, Canad, Nigria, Singapura e Brasil. Uma delas a realizaode encontros presenciais, tais como hackathon, desconferncia, barcamp, meetup,speedgeek, lightning talk, etc, que, grosso modo, permitem aos gestores pblicos conhecerquem so os provveis usurios dos dados pblicos, quais suas demandas e como elesquerem reutilizar os dados produzidos ou custodiados pelo Estado. Da mesma forma,esses encontros permitem aos membros da sociedade conhecer os dados jdisponibilizados e potenciais dados a serem publicados. 90. O modelo de competies em torno de dados abertos tem sido bastanteutilizado, em geral com o nome de Hackathon ou Hack Day. Nesse evento, um conjunto dedados pblicos disponibilizado aos desenvolvedores de aplicativos reunidos num mesmolocal durante um perodo de tempo, de 48 horas a at algumas semanas, para que elesconstruam uma soluo (software) utilizando os dados objeto do concurso. Ao trmino dotempo definido, elege-se e premia-se a melhor soluo desenvolvida. No Brasil,Hackathons j foram promovidos pela Cmara dos Deputados, Instituto Nacional deEstudos e Pesquisas Educacionais Anysio Teixeira (Inep), MJ, alm de vrios rgos dasesferas estaduais e mesmo por entidades no governamentais como a Fiesp. Um dosprodutos oriundos do Hackathon promovido pelo Inep foi a soluo Escola queQueremos (pargrafo 226).91. Apesar das ideias e prottipos de solues inovadoras que surgem nesseseventos, muitos dos produtos gerados no encontraram um ecossistema que os fomente emantenha como produto de mercado, ficando desatualizados e caindo em desuso. Uma

    14

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    questo que se discute atualmente nas comunidades de dados abertos a sustentabilidadedas solues produzidas nesses eventos. aconselhvel que exista um ecossistema, nosquais os seus elementos (sociedade, universidades, estudantes, empresas e governo) seestruturem para prover e permitir continuidade aos produtos e ideias gerados que tenhamsido considerados potencialmente teis para agregar valor para o cidado, disseminando-o na sociedade. 92. Se por um lado aborda-se muito a temtica de participao popular eacompanhamento para o envolvimento da populao na poltica do pas, tendo atecnologia como valioso instrumento viabilizador das diversas formas de participaohoje existentes, por outro lado, pouca parece ser a evoluo no sentido de mensurar como,se, e em que intensidade essa participao est efetivamente ocorrendo (pea 42, p. 13).Na busca realizada pela equipe de fiscalizao, pouco se obteve de informao. Diantedisso, cita-se que a OKF tem procurado coletar casos que mostrem os resultados daparticipao da sociedade na melhoria da qualidade das informaes(blog.okfn.org/category/open-government-data/page/5/) e da gesto pblica (pea 59, p.56-64). 2.8 Principais riscos inerentes abertura dos dados93. A convergncia e a ampla adoo dos conceitos e princpios relativos a dadosabertos pelos governos das naes desenvolvidas demonstram sua solidez e um razovelconsenso em torno da sua utilidade. Juntamente a esses conceitos e princpios, anecessidade de transparncia governamental e a relao umbilical entre governo aberto,transparncia e dados abertos so tambm consenso na maioria dos pases estudados.94. Entretanto, a disponibilizao dos dados abertos por parte dos governos nodeve ser considerada um fim em si mesma. Diversos profissionais e pesquisadores vmalertando para uma certa iluso de transparncia que os dados abertos podem criar,alm de jogar luz a uma srie de questes adjacentes ao tema que no esto sendodiscutidas na profundidade requerida. 95. Prope-se, neste trabalho, expor um conjunto de riscos inerentes adoo dosdados abertos, divididos em trs grandes grupos:a) custos da disponibilizao continuada dos dados; b) qualidade, utilidade, e usabilidade dos dados;c) privacidade e proteo dos dados pessoais.2.8.1 Custos da disponibilizao continuada dos dados96. Rob Kitchin, um especialista irlands sobre dados abertos, no seu artigo Fourcritiques of open data initiatives (nuim.ie/progcity/2013/11/four-critiques-of-open-data-initiatives), destaca os custos e a sustentabilidade como um risco considervel implantao das polticas de dados abertos. Segundo os princpios mais largamenteaceitos a respeito de dados abertos, os custos da gerao e disponibilizao desses dadosdevem ser arcados pelo fornecedor, que nesse caso o governo. Para justificar esse gastopblico, o principal argumento econmico seria o de que o dado aberto estimula ainovao e, em consequncia, a economia, abrindo novas possibilidades de negcios. 97. A questo que, segundo o autor, esse retorno dificilmente mensurvel,imprevisvel e mal distribudo. Enquanto algumas bases de dados pblicas podem ser degrande valia, como as que disponibilizam mapas ou dados sobre transporte, outras tantastm pouco ou nenhum valor econmico. Considerando-se que o dado aberto s til sefor amplo, atual e detalhado, estima-se que os custos continuados em manter enormes

    15

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    quantidades de dados disponveis pode vir a ser um peso considervel para aadministrao pblica.2.8.2 Qualidade, utilidade e usabilidade dos dados98. Em um artigo publicado no stio da W3C, o consrcio da World Wide Web, sob ot t u l o A R e a l i s t i c L o o k a t O p e n D a t a(w3.org/2012/06/pmod/pmod2012_submission_38.pdf), a pesquisadora Sharon S. Dawes,da Universidade de Albany, Nova York, faz uma anlise crtica muito pertinente dos dadosabertos e levanta uma srie de questes importantes. O artigo comea destacando que,ironicamente, a informao geralmente tratada como uma caixa-preta pelomovimento de dados abertos. Muita ateno dada aos atores, ferramentas tecnolgicas,e tcnicas de anlise. Mas a informao disponibilizada pelos governos vista comoentregue, utilizada sem esprito crtico e com o rtulo de confivel, mesmo antes de serexaminada. Contudo, como a autora alerta, os dados disponibilizados sob a bandeira dosdados abertos provenientes de sistemas administrativos foram criados ou coletados paraoutros propsitos, diferentes de sua divulgao ampla. Apesar de terem um inegvel valorpotencial, no se pode desconsiderar alguns riscos substanciais com relao validade,relevncia e confiana dos dados abertos. 99. Como ponto de partida na anlise dos riscos inerentes aos dados abertos, aautora busca, ainda, diferenciar as fontes governamentais de dados tipicamente voltados anlise externa, ou seja projetadas para uso informativo, como o caso das informaesdos institutos de pesquisa, dos censos e das sries estatsticas, daquelas quedisponibilizam dados administrativos, provenientes da automatizao das atividadesgovernamentais, voltadas apenas para o seu registro. 100. Por terem finalidade informativa, os dados voltados anlise externa so demais fcil interpretao se comparados aos dados administrativos. Frisa-se, todavia, queambos devem incorporar o fornecimento de informaes voltadas especificamente inteligibilidade dos dados (metadados), de forma a evitar entendimentos equivocados porparte da sociedade.101. Outro trabalho interessante foi publicado pela Association of GovernmentAccountants (AGA), associao americana de profissionais financeiros no governo,intitulado What Do Citizens Want From Public Sector Reporting? Findings From FourFocus Groups (pea 61). O artigo inicia destacando duas escolas de pensamento emtransparncia. A primeira pensa dados no seu formato bruto e em forma granular,disponibilizados na web, de forma que os usurios possam criar seus prprios relatrios.Eles acreditam que dados disponibilizados de forma agregada contm o vis da entidadegovernamental que realizou as agregaes. A segunda escola acredita que os dadosdeveriam ser agregados e apresentados de forma amigvel e compreensvel, alm deserem distribudos por diversos meios e mdias, inclusive a internet. Esse grupo acreditaque o dado no organizado no genuinamente informao. Para a AGA, os doiscaminhos so vlidos e deveriam existir esforos nos dois sentidos por parte do governo:o de fornecer dados primrios e tambm dados analticos.102. O mesmo artigo apresenta os achados de grupos de trabalho que contaram coma participao dos membros da associao, diretamente ligados difuso e uso de dadosgovernamentais. Desses achados, destacamos:a) entidades esto publicando informaes oramentrias aos cidados, outras estocolocando detalhes de pagamentos na internet, e com isso dizem estar sendotransparentes. Entretanto, a informao no est sendo lida ou utilizada pelos cidados

    16

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    e/ou pagadores de impostos, porque muito difcil de ser assimilada e compreendida emseu contexto;b) as pessoas estariam mais interessadas em relatrios financeiros se elas pudessementender como essas informaes esto associadas aos resultados da entidade;c) antes que haja progresso (no que diz respeito ao uso dos dados abertos) preciso haveruma mudana cultural.103. O levantamento sobre dados abertos realizado pela Global Open Data Initiative(Godi), j citado anteriormente, refora o primeiro desses achados acima. A elevadacomplexidade tcnica das bases de dados disponibilizadas, que inibe seus uso e suaexplorao, foi citada como um dos principais desafios s polticas de dados abertos. Essemesmo levantamento destacou tambm problemas de qualidade dos dadosdisponibilizados, dados incompletos e desatualizados como desafios a serem vencidos.104. Outra questo que merece reflexo com relao utilidade e usabilidade dosdados abertos diz respeito ao tratamento a posteriori dos dados abertos, uma vezdisponibilizados pelo governo. Andrea Di Maio, do Gartner Group, em seu artigo OpenData and the New Divide ( blogs.gartner.com/andrea_dimaio/2012/05/14/open-data-and-the-new-divide) discorre sobre o dilvio dos dados abertos, e o risco de afogamentodo usurio devido ao volume avassalador dos dados brutos disponveis ou simplesmentedevido a sua completa falta de sentido quando apresentados sem a preparao adequada.A questo altamente relevante que Di Maio coloca : quem deve processar esses dadospara que eles faam sentido? O prprio governo? Mas isso contrariaria o princpio 2proposto pela OKF e suas razes subjacentes (pargrafos 57 a 59). Seria, ento, asociedade organizada, por meio dos seus ativistas, militantes, hackers e suas associaesno governamentais? Di Maio pondera que, por mais bem intencionados que a maioriadesses atores sejam, o risco de interpretaes errneas, casusticas e/ou direcionadas aoconvencimento de certo pblico com relao a certos pontos de vista ainda existe. No queo autor chama de lado negro dos dados abertos, o cenrio que se desenha aps umaprimeira primavera da transparncia pode ser o de uma forte diviso entre quem temrecursos e habilidades para manipular os dados abertos e quem no tem, e essa divisopode ser ainda mais insidiosa que a diviso entre quem tem, e quem no, acesso stecnologias em geral e, em particular, internet. 105. No mesmo sentido, a crtica j citada de Rob Kitchin (pargrafo 2.8.1) destacao potencial efeito dos dados abertos no sentido de municiar os poderosos: embora ainteno intrnseca transparncia seja o fortalecimento da democracia e o acesso iguale indiscriminado aos dados pblicos, a fora de grupos e empresas, j preparadas edotadas de recursos tecnolgicos para a anlise e explorao de grandes quantidades dedados, faz com que haja necessariamente diferenas com relao ao potencial deaproveitamento e obteno de resultados a partir dos dados abertos, favorecendo certossegmentos. 2.8.3 Privacidade e proteo dos dados pessoais106. Da mesma forma que os dados abertos vm sendo impulsionados pelos ativistasdo mundo digital, a luta pela proteo dos direitos dos cidados referentes privacidadee contra o uso no autorizado ou danoso de informaes pessoais mantidas pelo Estado tambm comea a despontar entre comunidades transnacionais na internet.107. A questo da privacidade e do uso danoso de dados pessoais na internet umtema recorrente e amplamente debatido, principalmente a partir do advento das redessociais, onde pessoas tendem a se expor em demasia e acabam sofrendo com o uso noautorizado ou no previsto de informaes que lhes dizem respeito. O termo direitos

    17

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    digitais (pt.wikipedia.org/wiki/Direitos_digitais) refere-se aos direitos humanosassociados s tecnologias digitais, e est particularmente relacionado proteo erealizao dos direitos existentes, tais como o direito privacidade ou liberdade deexpresso. 108. A privacidade e a proteo dos dados pessoais foi destacada pela ONU, nadeclarao de princpios da Sociedade da Informao resultante do World Summit on theInformation Society (WSIS; itu.int/dms_pub/itu-s/md/03/wsis/doc/S03-WSIS-DOC-0004!!PDF-E.pdf), em 2003, entre os princpios chave de uma sociedade da informao paratodos. Diversos grupos militam em torno desse tema. Um deles, o Open Rights Group(ORG; openrightsgroup.org/campaigns/opendata/open-data-privacy), abordaespecificamente o tema da privacidade em dados abertos. A ORG apoia os dados abertos,mas afirma que privacidade primordial. Para eles, os governos devem admitir e tratar osriscos de reidentificao de cunho pessoal nos dados abertos. A reidentificao oprocesso de identificao de dados pessoais a partir de informaes ditas anonimizadas(smartplanet.com/blog/pure-genius/privacy-reidentification-a-growing-risk). As bases dedados com informaes anonimizadas contm, normalmente, dados pessoais, mas buscamimpedir a identificao das pessoas ali referenciadas ao excluir ou mascarar, total ouparcialmente, atributos chave tais como nome, nmero de telefone ou outros documentosde identificao dos indivduos. A reidentificao feita atravs da chamadatriangulao de informaes, onde diversas bases, anonimizadas ou no, sopesquisadas at que se encontre coincidncias to restritivas que acabem isolando asinformaes de um indivduo em meio aos demais. 109. Para a ORG, deve haver um debate pblico apropriado antes de serem lanadasiniciativas amplas de disponibilizao de bases de dados pessoais anonimizadas pelosgovernos, assim como uma anlise criteriosa das tecnologias de anonimizao utilizadas.110. Kieron OHara, da Universidade Southampton Reino Unido, em seu relatrioTransparent Government, Not Transparent Citizens: A Report on Privacy andTransparency for the Cabinet Office, preparado por encomenda do gabinete do PrimeiroMinistro Britnico, chegou s seguintes concluses com relao divulgao de dadospessoais anonimizados:a) privacidade extremamente importante para a transparncia. A legitimidade polticade um programa de transparncia depender crucialmente de sua habilidade em reter aconfiana do pblico. Privacidade deveria, ento, ser parte integrante de qualquerprograma de transparncia e no somente uma preocupao subsequente;b) privacidade e transparncia so compatveis, desde que essa ltima sejacuidadosamente protegida e considerada a cada estgio;c) discusses sobre anonimizao tm sido conduzidas largamente por demandas legais,com um consequente negligenciamento das consideraes feitas pela comunidade tcnica;d) inexistncia de consenso tcnico ou legal para a questo da anonimizao. Devemoscontinuar a anonimizar dados sensveis, mas nos manter cautelosos em disponibiliz-loslivremente enquanto continuamos a avanar no sentido de administrar e pesquisar osriscos da anonimizao;e) a transparncia deve ser debatida com transparncia metatransparncia.111. O mesmo relatrio faz, ainda, uma srie de recomendaes, entre as quaisdestacam-se:a) incluir a proteo da privacidade j na definio das iniciativas de abertura de dadosgovernamentais, e no aps sua instalao;

    18

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    b) quando a disponibilizao de uma base de dados possa vir a ameaar a privacidadedas pessoas ali retratadas, e caso seja possvel criar mecanismos de controle de acesso,ento esses controles devem ser considerados;c) incluir o paradigma tcnico na discusso da transparncia;d) atuar em direo a uma transparncia sob demanda: disponibilizar preferencialmentebases para as quais existe demanda comprovada, deixando aos prprios setoresdemandantes a demonstrao de que ela no trar nenhuma violao de privacidade; e) criar um catlogo de bases de dados governamentais, descrevendo, entre outrascaractersticas, o nvel de confidencialidade e as restries de acesso das informaesnelas armazenadas. Mesmo bases de dados no disponibilizadas devem constar nocatalogo, incluindo a razo da sua no disponibilizao. Dessa forma, setores dasociedade podero solicitar mais facilmente bases de seu interesse e at questionar asrazes da no disponibilizao de algumas informaes;f) criar painis setoriais para discutir a transparncia sobre questes relacionadas disponibilizao de bases e privacidade;g) definir procedimentos de anlise prvia de dados a serem abertos para garantir orespeito privacidade;h) avanar nas pesquisas no tema da privacidade e reidentificao.112. Uma questo interessante a respeito de dados pessoais foi levantada pela OKFno texto intitulado Open Data & My Data (blog.okfn.org/2013/02/22/open-data-my-data),que vai alm da questo da privacidade. Segundo o artigo, bastante provvel que cadacidado seja referenciado em inmeras bases de dados, algumas delas governamentais eoutras mantidas por empresas privadas. Mas muito pouco provvel que um cidadotenha conhecimento sobre os dados que lhe dizem respeito ou em que bases ele referenciado, com que propsito e como essa base est sendo usada. Em um cenrio ondecada cidado pudesse questionar o governo e obter os dados por ele custodiados que lhedizem respeito, a relao entre dados pessoais e dados abertos tomaria outra dimenso. Ocidado poderia no s ser agente de controle de sua privacidade, mas, em alguns casos,escolher autorizar e compartilhar certos dados pessoais a seu respeito, se desejasse. Umpaciente de cncer, por exemplo, poderia voluntariamente abrir seus dados mdicos seisso pudesse contribuir para pesquisas.113. As polticas pblicas que tratam da abertura de dados podem se beneficiar daexperincia obtida diante das dificuldades enfrentadas por outros pases, de forma que suaimplementao considere as principais armadilhas associadas a essas iniciativas.114. Por outro lado, considerando que programas de dados abertos tendem acontribuir para que o Estado atue com mais transparncia (princpio bsico dagovernana corporativa) e que, em certa medida, ainda estimula a participao ecolaborao da sociedade na melhoria da gesto pblica, entende-se que a execuo deuma poltica de abertura de dados, considerando os riscos relacionados, deve ser objetode futuros trabalhos do TCU sobre o tema.3. Panorama Internacional de Disponibilizao de Dados Governamentais em Formatos abertos115. Esse captulo tem o objetivo de apresentar o cenrio da poltica de aberturadados governamentais no mbito internacional, trazendo algumas das iniciativas que ospases tm realizado e o avano por eles obtido. So relatadas aqui, tambm, asavaliaes publicadas por organizaes sobre o nvel de abertura de dados dos pases.

    19

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    116. Durante a etapa de execuo da fiscalizao, foram coletados exemplos desolues construdas sobre dados governamentais, sendo listadas nesse captulo as maisinteressantes na avaliao da equipe.117. Cabe mencionar o documento do qual a equipe de fiscalizao teveconhecimento, que consiste no primeiro relatrio de tendncias de dados abertos realizadopelo Tribunal de Contas da Holanda, em maro de 2014. O relatrio, semelhana destafiscalizao, abordou conceitos de dados abertos, polticas e legislao correlata, alm docenrio nacional (pea 43) e evidencia a preocupao em relao avaliao doscontroles relacionados ao tema, da qual este Tribunal compartilha.3.1 Pases em que se observam iniciativas relevantes de abertura de dados118. H anos organizaes de vrios pases se empenham para compartilharprincpios e prticas de governo aberto e dissemin-los entre os governos. Apesar disso, oassunto dados abertos ainda constitui um domnio em evoluo, sendo inclusive novidadepara muitos, tanto no exterior como no Brasil. crescente o interesse em tornar os dadosgovernamentais abertos e difundir o seu uso. Espalhadas pelo mundo, essas organizaespregam que, dentre outros efeitos, o acesso informao empodera o cidado e lhe dliberdade, conhecimento e possibilidade de participao nas aes governamentais. OpenGovernment Partnership (OGP), Open Data Institute (ODI), W3C, W3C Brasil, OpenKnowledge Foundation (OKF), OKF Brasil, Open Institute, Fundar, Sunlight Foundatione Global Open Data Initiative so algumas das organizaes hoje atuantes nesse tema.119. O governo britnico foi o pioneiro na publicao de dados abertos com oobjetivo inicial de disponibilizar a maior quantidade de dados possvel, criar umap e q u e n a i n f r a e s t r u t u r a e f a z e r a l g u n s e x p e r i m e n t o s(w3c.br/Noticias/MissaoTecnologicaSobreDadosAbertos), e, desde ento, se mantm naliderana em relao a prticas de governo aberto (pargrafo 126). Todavia, em que pesea constatao de que ainda h muito a evoluir, os esforos para a consolidao da culturade dados abertos permanece na agenda do governo, como relatou Francis Maude,Ministro do Governo Britnico:The UK is a world-leader in opening up data because we know that it creates a more accountable,efficient and effective government. Open Data is a raw material for economic growth, supportingthe creation of new markets, business and jobs and helping us compete in the global race. Toensure this agenda continues to thrive, we are supporting a number of projects which will driveforward this culture of openness.

    120. Hoje, dezenas de pases j adotam a abertura como poltica pblica e abremseus dados a cidados e empreendedores. 121. Sessenta e trs (63) pases integram hoje a OGP, desenvolvendo aes para aimplementao de um governo aberto. As aes so estabelecidas pelos prprios pasesnos seus planos de ao (pargrafo 37), de acordo com sua realidade. As estratgiasadotadas variam de pas para pas, o que, dentre outros fatores, torna desafiadora acomparao da evoluo das aes entre os pases. 122. Com o intuito de estimular a inovao e ampliar a transparncia e aresponsabilizao pelos gastos pblicos, naes e organizaes ao redor do mundo estobuscando conhecer como os dados abertos agregam valor. Para isso, precisam medir onvel de abertura dos pases, bem como o impacto social e econmico das prticasassociadas. A medio do nvel de abertura, contudo, complexa e difcil, ante aprematuridade do tema. Muitas definies ainda esto por serem estabelecidas epadronizadas; as estratgias e polticas relacionadas a dados governamentais abertosainda encontram-se em evoluo; a gesto desses dados , muitas vezes, delegada a

    20

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    governos locais ou regionais; isso tudo dificulta a definio de indicadores prprios aessa medio. 123. Um dos indicadores utilizados o nmero de conjuntos de dados (datasets)disponibilizados pelo pas. Entretanto, a simples comparao desse nmero pode induzir aconcluses equivocadas, pois o essencial a informao que est sendo disponibilizada(seu contedo) e seu potencial impacto. Se o cidado tem acesso a centenas de datasets,mas esses dados no trazem a informao que ele deseja, esto desatualizados outampouco so capazes de produzir os benefcios esperados (item 2.5 do presenterelatrio), consider-los em uma mtrica desaconselhvel (pea 40, p. 15). Alm disso,h outras variveis que diferenciam conjuntos de dados disponibilizados, como, porexemplo: a utilidade dos dados; o modelo de publicao adotado, isto , se utilizado umportal centralizado, de mais fcil acesso, ou vrios portais regionais; e a adequao dodataset aos requisitos estabelecidos no conceito de dados abertos, entre outras. 124. Portanto, o nmero total de dadasets pode ser considerado na avaliao dograu de abertura de um pas ou estado, desde que conjuntamente com outros indicadores,e, na medida do possvel, estabelecendo-se critrios para que o dataset possa serconsiderado.125. Metodologias e parmetros de medio do nvel de abertura dos pases tm sidodesenvolvidos e testados por organizaes. Em pesquisa, a equipe de auditoria teveconhecimento de algumas anlises j realizadas, descritas a seguir. Open Knowledge Foundation (OKF)126. A OKF criou um Open Data Census, do qual participam, voluntariamente,setenta pases, com informaes sobre as suas bases de dados disponibilizadas. Com essasinformaes, publicou, em 2013, um ndice que mede a disponibilizao de dados abertos:o Open Data Index (index.okfn.org/country). O ndice calculado a partir de dez temasgovernamentais: tabelas de horrio do transporte, oramento governamental, gastosgovernamentais, resultados de eleies, registros de empresas, mapa nacional, estatsticasnacionais, legislao, cdigos postais e emisso de poluentes. No mbito de cada tema, avaliada a existncia dos dados e seus atributos (disponvel, atualizado, formato digital,acessvel por mquina, divulgado, completo, bruto, gratuito e licenciado). No rankingobtido por meio desse ndice, o Brasil aparece em trigsimo sexto lugar com 410 pontosde um total de mil pontos (index.okfn.org/country/overview/Brazil). No topo desse ranking,est o Reino Unido com 940 pontos.Organisation for Economic Co-operation and Development (OECD)127. A OECD (Organizao para Cooperao e Desenvolvimento Econmicotambm tem buscado desenvolver indicadores para avaliar a abertura dos governos, deforma que sejam complementares aos indicadores j utilizados para avaliar osmecanismos legais e institucionais na inteno de promover a transparncia, aacessibilidade e a capacidade de resposta dos governos. Esses indicadores so utilizadosna anlise de comparao internacional sobre o desempenho do setor pblico, divulgadosno documento Government at a Glance, e apresentados no captulo Open and InclusiveGovernment (pea 41). A avaliao da OECD realizada a partir de informaes de seus34 pases membros (pea 41, p. 13 e 14). Alguns dos indicadores apresentados naavaliao abarcam, tambm, informaes dos pases que no so membros da OECD, masparticipam do seu Comit de Governana Pblica (Brasil, Egito, frica do Sul e Ucrnia).Para esses quatro pases, as informaes so apresentadas separadamente, ao final dastabelas e figuras.

    21

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    128. O captulo Open and Inclusive Government aborda quatro aspectos: dadosgovernamentais abertos; conflito de interesse e divulgao de recursos; transparnciaoramentria; e participao no processo legislativo, classificando a abertura de dadosem trs nveis: baixo, mdio e alto. O Brasil figura no ranking somente quanto ao aspectode divulgao dos bens e recursos dos agentes pblicos, encontrando-se em posiointermediria em relao aos demais pases.

    Figura 1 OECD Government at a Glance Nvel de divulgao das informaes referentes aopatrimnio e recursos dos agentes pblicos (pea 41, p. 142 e 143)

    129. Em termos de dados abertos governamentais, a avaliao de 2013, com dadosde 2012, apresenta o Canad, a Holanda, Eslovnia e os Estados Unidos como os pasesda OECD com o maior nmero de datasets disponibilizados no seu portal centralizado dedados abertos governamentais, excluindo-se da avaliao os pases que no possuam, poca, um portal centralizado (pea 41, p. 140 e 141). Nessa avaliao, realizada em2013, o Canad tinha 188.921 datasets. No dia 1/8/2014, momento em que foi consultadoo Portal Brasileiro de Dados Abertos (pargrafo 282), o Brasil tinha 239 conjuntos dedados.World Wide Web Foundation130. A World Wide Web Foundation criou o Web Index (thewebindex.org) paraavaliar a contribuio da internet para o desenvolvimento e o fortalecimento dos direitosdo cidado em 81 pases, com indicadores que abrangem quatro dimenses: AcessoUniversal, Liberdade e Nvel de Abertura, Contedo Relevante e Empoderamento. 131. A classificao apresentada no Web Index de 2013 (pea 42, p. 6) traz, nascinco primeiras posies, os seguintes pases: Sucia, Noruega, Reino Unido, EstadosUnidos e Nova Zelndia. Na dimenso Liberdade e Nvel de Abertura, o Brasil ocupa aposio 41, sendo que os cinco primeiros pases foram: Noruega, Finlndia, Islndia,Holanda e Frana Na classificao geral, de 81 pases, o Brasil figura na posio 33.Dentre os pases emergentes abrangidos pela pesquisa, o Mxico figura em primeiro lugar,seguido da Colmbia, Brasil, Costa Rica e frica do Sul.132. O documento aponta que os governos avaliados ainda no se desenvolveramconvenientemente quanto disponibilizao de dados governamentais brutos. Nos pasespesquisados, menos de dez por cento dos datasets considerados prioritrios (key datasets)so disponibilizados online em formato aberto, permitindo sua reutilizao (pea 42, p. 4e 14).Open Data Barometer (ODB)

    22

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    133. O Open Data Barometer (opendatabarometer.org) um projeto do Open DataInstitute e da World Wide Web Foundation que busca desenvolver mtodos de avaliaopara dados abertos. O objetivo do projeto desvendar o impacto das iniciativas de dadosabertos, lanando um olhar para a disseminao da poltica governamental de dadosabertos e sua prtica em todo o mundo. O projeto realiza a anlise das tendncias globaise classifica os pases por meio de uma metodologia que pondera a prontido para garantiros benefcios de dados abertos, os nveis reais de implementao e o impacto dasiniciativas de dados abertos. 134. Em 2013 foi realizado um estudo abrangendo 77 pases e publicado no relatrioOpen Data Barometer Global Report (pea 40). Esse trabalho apontou o Reino Unidocomo o pas mais avanado em termos de dados abertos governamentais, seguido dosEstados Unidos, Sucia, Nova Zelndia, Dinamarca e Noruega, estando os dois ltimosempatados em quinto lugar. 135. Nessa anlise, houve a preocupao para que os dados abertos fossemavaliados no apenas quantitativamente, mas buscou-se ponderar sua relevncia, formato,localidade e todos os demais atributos que compem o conceito de dados abertos(pargrafos 50 e 51). No total, foram coletadas informaes de 1.078 conjuntos de dadosde catorze categorias selecionadas como prioritrias (pea 42, p. 15-17). 136. Para a anlise especfica dos conjuntos de dados (datasets) realizada peloestudo, foram selecionadas catorze categorias: mapa, registro de imveis, censo,oramento, gastos, registro de empresas, legislao, transporte pblico, comrciointernacional, sade, educao, estatstica de crimes, estatsticas ambientais e resultadosde eleies. Os resultados so representados por um crculo, cujo tamanho representaquatro nveis de abertura, ou seja, quanto maior o crculo, maior a abertura dos dados. Seo dataset enquadra-se na definio de dado aberto, o crculo apresenta uma borda maisgrossa. Abaixo, so trazidas as anlises dos datasets de alguns pases. O Brasil ocupa aposio 33, juntamente com outros trs pases.

    (...)

    23

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    Figura 2 - Anlises dos conjuntos de dados (datasets)

    (Fonte: Open Data Barometer 2013 Global Report, pea 40)

    137. Segundo o estudo, verifica-se que o Reino Unido disponibiliza, em formatoaberto, todos os conjuntos de dados cujos contedos so considerados de maiorrelevncia para que os benefcios de dados abertos possam ser usufrudos pelo pas. Nascategorias analisadas, o estudo conclui que o Brasil no apresenta nenhum dataset queapresente todos os atributos de dados abertos. Na rea de educao, apresenta o nvel 3de abertura, e na sade apresenta o nvel 1.138. O relatrio sustenta que o sucesso das iniciativas requer mais do que apenas adisponibilizao de conjunto de dados. necessria a ao de agentes, chamados deintermedirios, capazes de transformar os dados governamentais em plataformas eprodutos com valor social e econmico, equipados para trabalhar com os dados dediferentes maneiras. Nesse sentido, o Open Data Barometer reconhece que, para sealcanar os benefcios dos dados abertos e assegurar sua sustentabilidade, necessriocuidar de um nmero diverso de variveis, visando construir e manter um ecossistema emtorno da infraestrutura dos dados centrais de um programa de dados abertosgovernamentais.139. O estudo traz as seguintes consideraes (pea 40, p. 6-7):a) polticas de dados governamentais abertos tm sido difundidas e publicadas pelospases nos ltimos anos, embora a disponibilizao de dados abertos, no real sentido deabertura, permanece baixa, com menos de 7% dos conjuntos de dados pesquisadospublicados em formato compreensvel por mquina e sob uma licena aberta;b) pases mais avanados em dados abertos (lderes do ranking) esto investindo eminfraestruturas de dados abertos nacionais como base para inovao e eficincia pblicoe privada. Todavia, nenhum pas pode ser declarado aberto por padro, antes da difusodas prticas de dados abertos nos rgos e entidades governamentais;c) pases intermedirios na abertura tm implementado iniciativas de dados abertos, taiscomo a criao de um portal de dados abertos e a promoo de eventos para induzir o usodesses dados. Todavia, tm falhado na disponibilizao de informaes relevantes e naimplementao dos fundamentos que possibilitam uma efetiva reutilizao dos dados. Aausncia de lei de acesso informao, em pases especficos, impede o uso dos dadosabertos no controle social. A falta de treinamento e incentivo utilizao dos dadoscompromete a gerao de benefcios sociais e econmicos;d) pases imaturos em dados abertos (ltimos do ranking) ainda no comearam atrabalhar com a disponibilizao dos dados, e muitos dos pases em desenvolvimento nopossuem os fundamentos da poltica, tais como dados gerenciados e digitalizados;e) diferentes pases e regies enfrentam diferentes desafios no processo de abertura dedados. No h uma receita nica para a poltica de dados governamentais abertos;

    24

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    f) conjuntos de dados relevantes, como o registro de imveis e registro de empresas, soos menos disponibilizados dentre os conjuntos de dados listados como prioritrios. Issoindica que as iniciativas de dados abertos governamentais ainda no garantem adisponibilizao de dados politicamente relevantes, que contribuem para aresponsabilizao de governos e empresas;g) na maioria dos pases, conjuntos de dados voltados ao empreendedorismo e para amelhoria das polticas pblicas no so, em geral, disponibilizados ou sodisponibilizados em formatos no padronizados;h) categorias de dados gerenciados por autoridades estatsticas so as mais provveis deserem acessveis online, mas, muitas vezes, so disponibilizadas apenas de formaagregada e com licenas restritivas;i) ainda h carncia de evidncias dos impactos da utilizao dos dados governamentais.Poucos programas de dados abertos so avaliados. 140. O Brasil figura na 28 posio da anlise do Open Data Barometer (dentre 77pases), com uma pontuao de 36,83, numa escala de zero a cem, sendo que a pontuaomxima, cem, pertence ao Reino Unido. Destaca-se o fato de, para o Brasil, a anliseapresentar como nulo o impacto econmico oriundo das iniciativas de dadosgovernamentais abertos (pea 40, p. 26).

    Figura 3. ODB Dados do Brasil

    (Fonte: www.opendatabarometer.org Explore the data: Interactive Charts)

    141. Na tentativa de padronizar uma classificao dos dados abertos, Tim Bernes-Lee, o inventor da Web, sugeriu um modelo progressivo para a publicao de dadosabertos, atribuindo o nome de Five Stars of Linked Data (Figura 4). O modelo buscainduzir os governos a darem o primeiro passo para a abertura das informaes,publicando seus dados online, no formato em que se encontrarem, e, progressivamente,irem aperfeioando seu nvel de abertura, tornando-os legveis por mquina,complementando com dados que contribuam para a inteligibilidade da informao,publicando-os em formatos no proprietrios, e, posteriormente, identificando unicamentetais dados e finalmente relacionando esses dados a outros para prover um contexto sobrea informao a que se refere. 142. Essa evoluo, em ltima anlise, faria com que todos os requisitos de um dadoaberto fossem paulatinamente cumpridos (5stardata.info). Embora citada no relatrio do

    25

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    Open Data Barometer, e tambm em reunio entre a equipe de fiscalizao erepresentantes da Dataprev (item 4.5 do presente relatrio), a equipe de auditoria noevidenciou a utilizao desse modelo pelos gestores da poltica de dados abertos noBrasil.

    Figura 4 - Exemplos para cada nvel do modelo de classificao de abertura de dados 5 star Open Data

    (Fonte: http://5stardata.info)

    National Health Service (NHS)143. Mtricas so elementos crticos para a avaliao do sucesso ou do fracasso deum projeto ou atividade. Alm da preocupao em se mensurar o nvel de abertura de umanao, a preocupao com a avaliao dos impactos reais da abertura dos dados temcrescido na comunidade internacional. 144. A conscincia de que h pouco entendimento de se e como as iniciativas dedados abertos realmente conduzem aos resultados prometidos (item 2.5 do presenterelatrio) unnime. Diante disso, o Sistema de Sade da Inglaterra, National HealthService (NHS), publicou recente artigo, elaborado pelo GovLab (thegovlab.org), com aproposta de uma estrutura conceitual destinada a auxiliar na mensurao dos impactos deabertura de dados na rea de sade e na avaliao de circunstncias especficas que ospotencialize (pea 44, p. 6). 145. A inteno dos autores que esse modelo possa ser usado por pesquisadores egestores de programas no momento da definio de iniciativas de dados abertos na reade sade, estabelecendo prioridades e forma de mensurao de seu impacto, no somenteao trmino do processo de implementao das iniciativas, mas tambm ao longo dele(pea 44, p. 7). Cabe citar que o GovLab um centro de pesquisa da Universidade deNova York, com atuao global, que busca novos caminhos para solucionar problemaspblicos utilizando os avanos da tecnologia e da cincia. Seu objetivo avanar noconhecimento de como o comprometimento do cidado pode contribuir para umagovernana mais legtima e efetiva (pea 44, p. 81). 146. Com a ambio de que esse se torne um modelo mundial para a abertura dedados da sade, o NHS define seis proposies de valor decorrentes do uso de dadosabertos da sade: a) prestao de contas;b) escolha;c) eficincia;d) servios prestados e satisfao do paciente;

    26

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    e) crescimento econmico e inovao;f) resultados.147. Para que os dados abertos agreguem valor, o modelo prope, ainda, a quebrado processo de abertura em sete etapas: inputs, usurios, atividades, produtos, resultados,impactos e metodologia (pea 44, p. 64). 148. A relevncia do estudo, que, com as adaptaes necessrias, pode ser estendidoa todas as demais reas da administrao pblica, encontra-se no estabelecimento damensurao dos resultados em um momento inicial, no qual se define a iniciativa deabertura de dados. Isso reflete a devida importncia que deve ter a avaliao dosresultados potenciais e reais relativos ao processo de abertura de dados.3.2 Exemplos internacionais de iniciativas de abertura de dados149. Com a abertura dos dados governamentais, organizaes, cidados,acadmicos, empresas e instituies pblicas tm construdo solues para a produo e ocompartilhamento da informao pblica, levando conhecimento e estabelecendo umcanal de comunicao direto do governo com o cidado. Muitas dessas solues incluem ainterao com a sociedade, de forma que ela possa contribuir com informaesespecficas do seu prprio ambiente, estabelecendo, assim, um rico fluxo bidirecional deinformao.150. As sociedades ao redor do mundo j contam com solues para algumas de suasdemandas. Tambm chamadas de aplicaes cvicas, as solues podem ser voltadas paraagilizar os servios pblicos oferecidos aos cidados, promover a cooperao naexecuo dos servios pblicos, levar conhecimento, criar novas oportunidades denegcios e empregos, guiar o governo na elaborao ou conduo das polticas pblicasou empoderar o cidado. Durante a fase de execuo deste levantamento, a equipe defiscalizao realizou pesquisa e selecionou algumas solues internacionais com o intuitode ilustrar essa realidade. 3.2.1 Englands best places to live Inglaterra http://illustreets.co.uk/151. O servio proposto por esse stio auxilia o cidado na escolha da sua moradiana Inglaterra, apresentando indicadores da regio selecionada. A soluo apresenta ummapa interativo, colorido de acordo com o padro de vida, no qual o cidado seleciona oponto (regio) para a pesquisa. So, ento, apresentados inmeros indicadores da regioselecionada, tais como: padro de vida (ONS 2010), ndice de criminalidade, preosmdios de aluguis, caractersticas da populao da regio, taxa de desemprego,distribuio da utilizao (parques, prdios, residncias, estradas etc.), escolas da regioe da redondeza, e transporte pblico (illustreets.co.uk/about-illustreets). A soluooferece, ainda, o detalhamento dessas informaes. Ao clicar no menu referente a escolas,por exemplo, so listadas as cinco escolas mais prximas e apresentados os indicadores. 152. Os dados abertos utilizados na soluo so oriundos de vrias fontesgovernamentais, incluindo gov.uk, police.uk, departamento de transporte e departamentode educao (illustreets.co.uk/about-illustreets).

    27

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    Figura 5 - Illustreets - Padro de vida por regies

    (Fonte: http://illustreets.co.uk/explore-england)

    Figura 6 - Detalhamento dos indicadores de 28 Hoxton Street, Londres

    (Fonte: http://illustreets.co.uk/explore-england/28-hoxton-street-londres/overview)3.2.2 iTriage EUA https://www.itriagehealth.com 153. A soluo americana iTriage oferece ao usurio informaes sobre clnicas,hospitais, medicamentos, procedimentos, mdicos, apresentando inclusive o currculoresumido dos mdicos e os links dos telefones para agendamento de consultas. Traz,ainda, uma funcionalidade que realiza um pr-diagnstico, indicando as possveis doenas

    28

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    relacionadas aos sintomas informados pelo usurio. Na construo, so utilizadas vriasbases de dados, inclusive dados governamentais abertos (pea 56). As informaes demdicos e hospitais so georreferenciadas, com um mapa de visualizao de localizao,permitindo a subseleo por especialidade. 154. Segundo artigo da revista ComputerWorld, publicado em 9 de julho de 2013,aproximadamente 9,5 milhes de pessoas haviam feito o download do aplicativo na poca(pea 56).3.2.3 School Comparison EUA http://dashboard.dcpcsb.org/comparison 155. Essa soluo permite comparaes entre escolas do distrito de Columbia, EUA,com a visualizao de resultados em diversas mtricas, tais como: evoluo dosestudantes em leitura e matemtica no tempo, percentuais de estudantes que obtiveramnvel avanado ou de proficincia em leitura e matemtica; resultados em disciplinaschave para o sucesso educacional, bem como apresenta indicadores sobre a frequnciados estudantes, percentual de estudantes que renovam suas matrculas a cada ano etc. Ostio apresenta a funcionalidade de simulador, em que diretores podem, a partir depossveis melhoras em algumas dimenses onde pode influir ou que pode priorizar, testaros efeitos sobre diversas mtricas de avaliao da sua escola. 156. A soluo gerenciada pelo Public Charter School Board (PCSB) do Distritode Columbia e os dados utilizados na soluo esto disponibilizados no portaldata.dcpcsb.org. 3.2.4 US Hospital Finder EUA http://www.ushospitalfinder.com157. A soluo US Hospital Finder, oferecida em uma pgina na internet e tambmcomo aplicativo mvel (itunes.apple.com/us/app/ushospfinder/id412630399), identifica oshospitais prximos a uma localidade dos Estados Unidos especificada pelo usurio,permitindo que sejam obtidas informaes detalhadas dos hospitais que o usurioselecionar. No detalhamento, so apresentados os servios oferecidos pelo hospital ealguns indicadores de qualidade, como taxas de mortalidade comparada com nmerosnacionais, e tambm os ndices de satisfao dos usurios do hospital.158. A s o l u o d e c l a r a u t i l i z a r d a d o s g o v e r n a m e n t a i s a b e r t o s(ushospitalfinder.com/abouts/#terms).

    29

  • TRIBUNAL DE CONTAS DA UNIO TC 005.003/2014-8

    Figura 7 - Resultado de pesquisa do cdigo 10013 nasoluo US Hospital Finder (Fonte:

    http://www.ushospitalfinder.com)

    Figura 8 - Detalhamento de umhospital na soluo US Hospital

    Finder (Fonte:http://www.ushospitalfinder.com)

    3.2.5 Sistema de Medicin de la Calidad de la Ed