Vários dados que viviam isolados em ilhas de informação.
3
<....> <....> <....> <....>
<....> <....> <....> <....>
<....> <....> <....> <....>
Os dados eram guardados em arquivos e tinham muitos problemas de redundância entre si.
motivação
Um belo dia, para resolver esses problemas, os dados resolveram se organizar em bancos de dados.
4
Disciplinas! Prof!
Cursos!
motivação
Médico! Paciente!
Enferm.!
Livro ! Editora !
Autor !
Com o passar do tempo, os bancos de dados foram se organizando em grupos e daí surgiram os
sistemas de bancos de dados distribuídos e as federações de bancos de dados.
5
motivação
E os anos foram passando…
6
… até que um dia, Tim Berners Lee teve uma ideia brilhante e criou a World Wide Web.
motivação
7
O volume de dados digitais cresceu imensamente e a Web tornou-se um espaço global de
informações.
<....> <....> <....> <....>
<....> <....> <....> <....>
<....> <....> <....> <....>
<....> <....> <....> <....>
<....> <....> <....> <....>
<....> <....> <....> <....>
<....> <....> <....> <....>
<....> <....> <....> <....>
Páginas html!
WWW!
motivação
Hoje, aos vinte e poucos anos, a Web já não é mais a mesma…
Além de ser um espaço global de informações, ela está se transformando em uma Web de dados.
8
<....> <....> <....> <....>
<....> <....> <....> <....>
<....> <....> <....> <....>
WWW!
motivação
Páginas html!
xml!rdf!
microformatos!
nem todos os dados podem ser encontrados por meio dos mecanismos de busca não é possível especificar consultas complexas sobre os dados assim como no tempo dos arquivos, os dados na Web ainda vivem isolados uns dos outros :-(
10
motivação
Porém…
11
motivação
Dados podem ser combinados por meio das Web APIs e dos mashups
Web API!
mashup!
Web API! Web API!
Onde encontrar Web APIs? http://www.programmableweb.com
as APIs oferecem interfaces proprietárias mashups são baseados em um conjunto fixo de fontes de dados não se pode “linkar” dados de APIs diferentes 12
motivação
Porém…
O que fazer para transformar a Web em um verdadeiro espaço global de dados?
13
motivação
aumentar a estrutura do conteúdo da Web? prover significado para os dados? estabelecer padrões para a publicação de dados e criação de links entre eles?
Então, mais uma vez, Tim Berners Lee teve outra ideia revolucionária: a Web Semântica!
14
web semântica
“The Semantic Web is the extension of the World Wide Web that enables people to share content beyond the boundaries of applications and websites. It has been
described in rather different ways: as a utopic vision, as a web of data, or merely as a natural paradigm shift in our
daily use of the Web.”
semanticweb.org
Na Web Semântica, os dados estão mais ricos, são associados a vocabulários e possuem um
significado.
15
web semântica
Assim, os dados não precisam mais viver isolados e podem ser compartilhados por diversas
aplicações :-)
Os dados, agora chamados de recursos, são únicos e possuem a sua própria identificação na Web!
16
web semântica
A Web Semântica é uma ideia muito interessante, mas como os recursos são representados?
17
web semântica
Como representar os dados dos bds ou das páginas html para que eles possam ser compartilhados na
Web?
id! title! author!Mar Morto!01! Jorge Amado!
year!
02!03!04!05!
A Estrada do Mar!1936! romance!
genre!
Jorge Amado! 1938! poem!O mundo da Paz! Jorge Amado! trips!1951!
Rachel de Queiroz! 1930! romance!Tieta do Agreste! Jorge Amado! 1977! romance!O Quinze!
Literatura brasileira
rdf – resource description framework
Mar Morto!01! Jorge Amado!04!
1936! romance!Rachel de Queiroz!1930! romance!O Quinze!
02!03!
A Estrada do Mar!Jorge Amado! 1938! poem!O mundo da Paz! Jorge Amado! trips!1951!
05! Tieta do Agreste! Jorge Amado! 1977! romance!
1!2!3!
Distribuição por linha
rdf – resource description framework
eita... Cadê o esquema? Quem é o quê?
Mar Morto!01! Jorge Amado!04!
1936! romance!O Quinze! Rachel de Queiroz! 1930! romance!
02!03!
A Estrada do Mar! Jorge Amado! 1938! poem!O mundo da Paz! Jorge Amado! trips!1951!
05! Tieta do Agreste! Jorge Amado! 1977! romance!
1!2!
3!title!
rdf – resource description framework
year!1936! romance!
genre!
1938! poem!trips!1951!
1930! romance!1977! romance!
author!Jorge Amado!Jorge Amado!Jorge Amado!Rachel de Queiroz!
Jorge Amado!
title!Mar Morto!A Estrada do Mar!O mundo da Paz!
Tieta do Agreste!O Quinze!
1! 2!
3!
Distribuição por coluna
rdf – resource description framework
... e agora??? Quem é quem?
year!1936! romance!
genre!
1938! poem!trips!1951!
1930! romance!1977! romance!
author !Jorge Amado!Jorge Amado!Jorge Amado!Rachel de Queiroz!Jorge Amado!
title!Mar Morto!A Estrada do Mar!O mundo da Paz!
Tieta do Agreste!O Quinze!
Id!1!
2!
3!
rdf – resource description framework
O mundo da Paz!title!
row 3!Jorge Amado!author!
row 1!
1977!year!
row 5!genre!romance!row 1!
genre!poem!row 2!
1!
2!
3!
Distribuição por célula
rdf – resource description framework
poxa... Complicou mais ainda :-( Como eu vou saber “quem é o quê” e
“quem é quem” ?
rdf – resource description framework
Quer dizer então que eu preciso ter uma maneira global para referenciar
As linhas
As colunas
E os valores
sujeito !
predicado!
objeto!
rdf – resource description framework
28
http://www.w3.org/RDF/
“RDF is a standard model for data interchange on the Web. RDF has features that facilitate data merging even if the underlying schemas differ, and it specifically supports the evolution of schemas over time without requiring all the
data consumers to be changed.”
rdf – resource description framework
subject! predicate!Row 5!
object!
Row 2!romance!
title! A Estrada do Mar!Row 2! year! 1938!
author! Rachel de Queiroz!
Row 3! genre! trips!Row 4!
genre!
Nós precisamos de triplas!
rdf – resource description framework
subject! predicate!Jorge Amado!
object!
Zelia Gattai!Mar Morto!
Married! Jorge Amado!Jorge Amado! Lived in! Salvador!
Is in! Bahia!Bahia! Part of! Brazil !Salvador!
Wrote!
Ceará! Part of! Brazil !Jorge Amado! Tieta do Agreste!Wrote!
Várias triplas podem fazer referência a uma mesma entidade!
rdf – resource description framework
Triplas podem ser representadas por meio de grafos
Zelia Gattai!
Mar Morto!
married!
Jorge Amado!livedIn !
Salvador!isIn!
Bahia!partOf!
Brazil!wrote!
Ceará!partOf!
Tieta do Agreste!
wrote!
rdf – resource description framework
E tem mais... Triplas de fontes diferentes podem ser
combinadas em um mesmo grafo!
rdf – resource description framework
Zelia Gattai!
Mar Morto!
married!
Jorge Amado!livedIn!
Salvador!isIn!
Bahia!partOf!
Brazil !wrote!
Ceará!partOf!
Tieta do Agreste!
wrote!
fonte 1!
rdf – resource description framework
Mar Morto!
Jorge Amado!
wrote!
Tieta do Agreste!
O Mundo da Paz!
A Estrela do Mar!
Seara Vermelha!
Tocaia Grande!
Capitães da Areia!
wrote!wrote!
wrote!
fonte 2!
rdf – resource description framework
Bahia!
Brazil !
partOf!Paraíba!
Pernambuco!
Alagoas!
Maranhão!
Ceará!
Piauí!
partOf!partOf!
partOf!
Rio Grande do Norte!
partOf!
fonte 3!
rdf – resource description framework
Zelia Gattai!
married!
Jorge Amado! livedIn!
Salvador!isIn!
partOf!
wrote!
Mar Morto!
Bahia!
Brazil !partOf!
Tieta do Agreste!
O Mundo da Paz!
A Estrela do Mar!Seara Vermelha!
Tocaia Grande!Capitães da Areia! Paraíba!
Pernambuco!
Alagoas!
Maranhão!
Ceará!
Piauí!
Rio Grande do Norte!
wrote!
wrote!
wrote !partOf!
partOf!
partOf!
partOf!
Grafo combinado!
rdf – resource description framework
blz :-) Mas como os grafos são combinados?
Como saber que os nós em conjuntos de dados diferentes são correspondentes?
Jorge Amado! Jorge Amado!
fonte 1 ! fonte 2!?!=!
rdf – resource description framework
URIs (Uniform Resource Identifiers) podem ser usados para identificação única de
recursos.
URI é qualquer identificador único (ex: cpf, isbn, URL).
rdf – resource description framework
Por meio das URIs cada recurso pode ter um identificador global e único na Web!
Assim uma coisa é uma coisa e outra coisa é outra coisa ;-)
www.websemantica.com.br/exemplosLit#JorgeAmado!www.websemantica.com.br/exemplosFound#JorgeAmado!
rdf – resource description framework
Finalmente aplicações Web podem fazer referência a mesma “coisa”!
Basta referenciar o mesmo URI!
www.websemantica.com.br/exemplosLit#JorgeAmado!
Aplicação 1!
Aplicação 2!
Aplicação n !
web semântica
hmmmmm.... mas esse URI é muito grande... pode ficar difícil de manipular :-( Será que tem como simplificar?
Sim! Por meio dos namespaces!
namespace: identifier!
rdf – resource description framework
subject! predicate!lit : Jorge Amado!
object!lit : wrote!
lit : Jorge Amado! lit : wrote!
lit : Jorge Amado! lit : wrote!
lit : Jorge Amado! lit : wrote!lit : Jorge Amado! lit : wrote!
lit : Mar Morto!lit : Tieta do Agreste!
lit : Capitães da Areia!
lit :O Mundo da Paz!
lit : Seara Vermelha!
Livros de Jorge Amado com qnames
www.websemantica.com.br/exemplosLit#!
rdf – resource description framework
subject! predicate!geo: Bahia!
object!geo: Brazil!
geo: Piauí!
geo: Ceará!
geo: Maranhão!
geo: Paraíba!
geo: partOf!
geo: partOf!
geo: partOf!
geo: partOf!
geo: partOf!
geo: Brazil!
geo: Brazil!
geo: Brazil!
geo: Brazil!
Informações geográficas com qnames
www.websemanticaUFC.com.br/exemplosGeo#!
rdf – resource description framework
subject ! predicate! object!lit : Jorge Amado! lit : wrote!lit : Jorge Amado! lit : wrote!
lit : Mar Morto!lit : Tieta do Agreste!
bio : Zélia Gattai! bio : married! lit : Jorge Amado!
bio : Zélia Gattai! bio : livedWith! lit : Jorge Amado!lit : Jorge Amado! bio : livedIn! geo: Slavador!geo : Salvador! geo : isIn! geo: Bahia!geo: Bahia! geo: Brazil!geo: partOf!
geo: Ceará! geo: partOf! geo: Brazil!
triplas com namespaces variados
rdf – resource description framework
Conjunto de melhores práticas para a publicação de dados estruturados na Web.
48
linked data
“Linked Data is about using the Web to connect related data that wasn't previously linked, or
using the Web to lower the barriers to linking data currently linked using other methods.”
linkeddata.org
”A term used to describe a recommended best practice for exposing, sharing, and connecting pieces of data, information, and knowledge on the Semantic
Web using URIs and RDF.” wikipedia
49
Link RDF!
linked data
RDF! RDF! RDF!
RDF!RDF!RDF!
RDF! RDF!Link RDF! Link RDF!
Link RDF!
Link RDF!
Usar URIs como nomes para recursos Usar URIs HTTP para que as pessoas possam encontrar esses nomes Quando alguém procurar por uma URI, através dessa, providenciar informações úteis, por meio de RDFs Incluir sentenças RDF que ligam para outras URIs de forma que eles possam descobrir mais recursos.
50
princípios do linked data
1!2!
3!
4!
51
linked data
pd:cygr! foaf:Person!
Richard Cyganiak !
dbpedia:Berlin!
rdf: type!
foaf: name !
foaf: based_near !
dbpedia:Berlin = http://dbpedia.org/resource/Berlin!
dados linkados
52
linked data
pd:cygr!foaf:Person!
Richard Cyganiak !
3.405.259!dbpedia:Berlin!
dp:Cities_in_Germany!
rdf: type!
foaf: name !
foaf: based_near ! dp:population!
skos:subject!
dados linkados
53
linked data
pd:cygr!foaf:Person!
Richard Cyganiak !
3.405.259!dbpedia:Berlin!
dp:Cities_in_Germany!
rdf: type!
foaf: name !
foaf: based_near ! dp:population!
skos:subject!dbpedia:Hamburg!
dbpedia:Muenchen!
skos:subject!
skos:subject!
dados linkados
Finalmente, chegamos ao espaço global de dados, a Web de Dados, onde:
54
web de dados
qualquer pessoa pode publicar seus dados na Web de Dados itens de dados são conectados por links aplicações podem descobrir novas fontes navegando pelos links os dados são auto descritivos
56
linking open data
“The goal of the W3C SWEO Linking Open Data community project is to extend the Web
with a data commons by publishing various open data sets as RDF on the Web and by setting RDF
links between data items from different data sources.”
http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
É importante saber que...
58
os nós são conjuntos de dados publicados em formato Linked Data. o tamanho dos círculos corresponde ao número de triplas em cada conjunto de dados. as setas indicam a existência de pelo menos 50 ligações entre dois conjuntos de dados. uma ligação (link) é uma tripla RDF, onde sujeito e objeto estão em namespaces de conjuntos de dados diferentes.
linking open data
Dicas importantes: Usar URIs HTTP para tudo. Defina seus URIs em um namespace HTTP que fique sob seu controle. Usar URIs curtos e que possam ser facilmente lembrados
59
Existem várias outras regras para a escolha de uma boa URI em http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/
publicando dados na nuvem do LOP
Dicas importantes:
Dê preferência aos vocabulários conhecidos. Friend-of-a-Friend (FOAF): para descrever pessoas. Semantically-Interlinked Online Communities (SIOC): vocabulários para representar comunidades online. Description of a Project (DOAP): vocabulários para descrever projetos. Music Ontology: providencia termos para descrever artistas, albuns e trilhas sonoras. Creative Commons (CC): descrever termos de licença.
60
publicando dados na nuvem do LOP
61
“DBpedia is a community effort to extract structured information from Wikipedia and to make this information
available on the Web. DBpedia allows you to ask sophisticated queries against Wikipedia, and to link other
data sets on the Web to Wikipedia data.”
http://dbpedia.org
publicando dados na nuvem do LOP
72
A Web de Dados é mais um passo na evolução da Web e no gerenciamento de dados.
Soluções existentes podem ser adaptadas e novas
soluções precisam ser desenvolvidas.
O que será que vai acontecer daqui pra frente? Ideias? Sugestões?
considerações finais
BIZER, C., HEATH, T., LEE, T. B., Linked data - the story so far. International Journal on Semantic Web and Information Systems (IJSWIS), 2009.
BRIN, S., PAGE, L., The Anatomy of a Large-Scale Hypertextual Web Search Engine, 1998. Computer Networks and ISDN Systems, 30(1-7):107-117.
CAMPOS M. L. (2010): GT-LinkedDataBR – Exposição, compartilhamento e conexão de recursos de dados abertos na Web (Linked Open Data). Disponível em http://www.rnp.br/pd/gts2010-2011/gt_linkeddatabr.html
HEATH, T., BIZER, C., Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool, 2011.
74
referências
JACOBS, I., WALSH, N., Architecture of the World Wide Web, Volume One, 2004. http://www.w3.org/TR/webarch/.
KLYNE, G., CARROL, J. J., Resource Description Framework (RDF): Concepts and Abstract Syntax - W3C Recommendation, 2004. http://www.w3.org/TR/rdf-concepts/.
LEE, T. B., Linked Data - Design Issues, 2006. http://www.w3.org/DesignIssues/LinkedData.html
NOWACK, B., PAGGR: Linked Data widgets and dashboards, Web Semantics: Science, Services and Agents on the World Wide Web, Volume 7, Issue 4, Semantic Web challenge 2008, December 2009, Pages 272-277, ISSN 1570-8268
http://racionalp2p.wordpress.com/2011/04/06/tim-berners-lee-a-web-esta-sendo-ameacada-de-varias-formas/
75
referências
Top Related