Dados Abertos Conectados

Post on 11-Apr-2017

388 views 0 download

Transcript of Dados Abertos Conectados

Dados Abertos ConectadosArmando BarbosaJudson BandeiraWilliams Alcantara

0,988x10¹² GB

40x10¹² GB

Fonte: http://www.emc.com/leadership/digital-universe/2012iview/executive-summary-a-universe-of.htm

Mas, o que isso significa?Publicação e Compartilhamento de:

Fotos;Vídeos;Áudios;Livros;Textos;Artigos.

Grande quantidade de informações para usuários do mundo inteiro;

Só que existem alguns problemas...

Estado de Alagoas

https://www.google.com.br/maps/@-7.9033028,-43.3830091,6z?hl=pt-BR

É necessário muito esforço computacional para

processar esses dados

E porquê isto ocorre?

Não é legível por máquina

Não é formato aberto

Não é conectado a outras fontes

Dados abertos

Definição

“Dados abertos são dados que podem ser livremente usados, reutilizados e redistribuídos por qualquer pessoa - sujeitos, no máximo, à exigência de atribuição da fonte e compartilhamento pelas mesmas regras.”

[Dietrich et al. 2009]

Elementos

LegalmenteDomínio público

Restrições mínimas

TecnicamenteFormato eletrônico

Legível por máquinaNão proprietário

[James 2013]

Princípios

Disponibilidade e acesso

Reúso e redistribuição

Participação universal

Visão geral de dados abertos

https://opengovdirective.pbworks.com/w/page/1832552/FrontPage

Exemplo: Wikipédia

https://pt.wikipedia.org/wiki/Macei%C3%B3

Exemplo: DBpedia

http://dbpedia.org/page/Macei%C3%B3

Exemplo: OpenStreetMap

http://www.openstreetmap.org/relation/303815

Publicadores de dados abertos

Consumidores de dados abertos

Questionamentos

PDF é um formato para publicação de dados abertos?

Um dado publicado sem licença é um dado aberto?

Um dado que necessita de software específico é aberto?

Dificuldade: Como conectar?

http://dbpedia.org/page/Macei%C3%B3 http://www.openstreetmap.org/relation/303815

Alguns formatos para dados abertos

Imagens extraídas do Google Images

Resource Description Framework

Por que usar RDF?

Por que usar RDF?Nós identificamos e interpretamos a informação!

As máquinas não!

Por que usar RDF?

Definição

“É um modelo de representação para a interoperabilidade de dados na web.”

[RDF Working Group, 2014]

CaracterísticasCria estrutura comuns/padrão

Integrando e compartilhando para todos reusarem

CaracterísticasDescreve recursos

Qualquer coisa que existe no mundo“Coisas” físicas;Conceitos abstratos;Documentos;Strings;Números.

CaracterísticasTermos

Uniform Resource Identifier - URIURL: http://www.livrariacultura.com.br/p/romeu-e-julieta-687319URN: urn:isbn:0-486-27557-4

Literal“Maceió”^^xsd:string“1”^^xsd:integer“1.5”^^xsd:float

CaracterísticasÉ composto por um conjunto de triplas

Maceió é um lugar.

Sujeito ObjetoPredicado

Maceió Lugar é um

Características

RDF fornece uma estrutura para representação e nós precisamos de semântica.

schema:Place rdf:type

dbr:Maceió

Vocabulários RDF

VocabulárioComponentes de um vocabulário

Indivíduos/InstânciasPropriedadesClasses

● Componentes de um vocabulário

Indivíduos/InstânciasTambém conhecidos como instâncias de classes.

Alagoas

Pernambuco

Recife

Maceió

Rio largo

● Componentes de um vocabulário

Propriedadesrelações binárias entre indivíduos.Há vários tipos e características diferentes.

511 km²área

Maceiópopulação

996733

● Componentes de um vocabulário

Tipos de PropriedadesPropriedades de objetos

conectam um indivíduo a outro indivíduo.Propriedades de dados

Rio Largovizinho

Maceió

● Componentes de um vocabulário

Tipos de PropriedadesPropriedades de objetosPropriedades de dados

conectam um indivíduo a um valor.“996733”^^xsd:integer

populaçãoMaceió

● Componentes de um vocabulário

ClassesSão conjuntos que contêm os indivíduos.As classes podem ser organizadas em hierarquias, também

conhecidas como taxonomias

pertenceMaceió

Alagoas

PernambucoNatal

Cidades Estados

ExemplosMaceió é um lugar com população igual a 996.733 habitantes

PREFIX dbr:<http://dbpedia.org/resource/>PREFIX dbp:<http://dbpedia.org/property/>PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX schema:<http://schema.org/>

schema:Place rdf:type

dbr:Maceiódbp:populationTotal

“996733”^^xsd:integer

Exemplos

Dados conectados

Definição

"Conjunto de boas práticas para publicar e conectar dados estruturados na web [...]."

[Hyland, B., & Wood, D. ,2011]

PrincípiosUse URIs como nome para coisas

Use HTTP URIs para que as pessoas possam navegar por esses nomes

Ao acessar uma URI forneça informações úteis (RDF e SPARQL)

Conecte a outras URIs

VantagensModelo padrão para representação de dados (RDF)

Legível por máquina

Conecta diversas fontes

Dados abertos conectados

Dados Abertos Conectados

Última atualização do diagrama em nuvem sobre Dados Abertos Conectados foi feito em 2011 por Richard Cyganiak e Anja Jentzsch. http://lod-cloud.net/

Dados Abertos Conectados

Fonte: http://5stardata.info/en/

Dados Abertos Conectados

Fonte: http://www.w3.org/2007/Talks/0306Dortmund-KB-IH/Slides.html

Como faço para publicar meus dados?

Preparar Stakeholders;Selecionar um dataset;Modelar os dados;Especificar uma licença apropriada;Utilizar boas URIs para dados conectados;Usar vocabulários padrão;Converter os dados;Prover acesso de máquina aos dados;Anunciar novos datasets;Reconhecer o contrato social;

Best Practices for Publishing Linked Data - W3C

Como faço para publicar meus dados?

Preparar Stakeholders;Selecionar um dataset;Modelar os dados;Especificar uma licença apropriada;Utilizar boas URIs para dados conectados;Usar vocabulários padrão;Converter os dados;Prover acesso de máquina aos dados;Anunciar novos datasets;Reconhecer o contrato social;

Converter os dados

Converter os dados - Ferrovias

1.Baixar os shapefiles para conversão;2.Utilizando o QGIS, salvar em geojson;3.Transformar geojson em .csv;4.Converter utilizando o google refine.

Converter os dados - Baixar shapefiles

Converter os dados - QGIS para .geojson

Converter os dados - .geojson para .csv

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Converter os dados - .csv para .rdf

Consumindo D.A.C.

Step 1 Step 3

Specify concrete use cases

Evaluate relevant data sources and data sets

Check respective licenses

Create consumption patterns

Manage Alignment, caching and updating mechanisms

Create Mash ups, GUI's, services and applications on top

Stablish sustainable new partnership

Step 4 Step 5 Step 6 Step 7Step 2

(Bauer & Kaltenböck, 2011)

Rodovias de Alagoas (Mapa)

1. Conexões entre as rodovias;2. Total de KM de rodovias;3. Maior rodovia;

Conexões entre as rodovias

http://yasgui.org/short/V1JcoEkee

Total de KM de rodovias

http://yasgui.org/short/NyZ46EJgl

Maior rodovia

http://yasgui.org/short/EyXtOSygg

Rodovias do Brasil (Mapa)1. Conexões entre as rodovias;2. Total de rodovias;3. Total de KM de rodovias;4. Maior rodovia;

Conexões entre as rodovias

http://yasgui.org/short/VJZbYrJge

Total de rodovias

http://yasgui.org/short/Ekd_YSkge

Total de KM de rodovias

http://yasgui.org/short/4yuyqHkxg

Maior rodovia

http://yasgui.org/short/NyZEqBkel

ReferênciasDietrich, D., Gray, J., McNamara, T., Poikola, A., Pollock, P., Tait, J., & Zijlstra, T. (2009). Open data handbook. 2013-01-29. http://opendatahandbook.org.Heath, Tom. (2012) “Linked Data-Connect Distributed Data across the Web”.Hyland, B., & Wood, D. (2011). The joy of data-a cookbook for publishing linked government data on the web. In Linking government data (pp. 3-26). Springer New York.James, L. (2013) Defining Open Data. Open Knowledge Blog. Disponível em http://blog.okfn.org/2013/10/03/defining-open-data/. Acessado em 17/09/2015.RDF Working Group. Disponível em http://www.w3.org/RDF/. Publicado em 2014.

Obrigado!

Dúvidas?Armando - abs@ic.ufal.brJudson - jmb@ic.ufal.brWilliams - wla@ic.ufal.br