Resumo Artigo Victor Buzahr

download Resumo Artigo Victor Buzahr

of 4

description

sasfisaodhf0oedffçkjsafn

Transcript of Resumo Artigo Victor Buzahr

  • Universidade Federal do Mato Grosso

    Especializao em Engenharia Web e Governo Eletrnico

    Resumo do artigo Tecnologias de

    dados abertos para interligar

    bibliotecas, arquivos e museus: um

    caso Machadiano.

    Trabalho da Disciplina Dados Aberto e Big Data do aluno:

    Victor Buzahr Nunes Machado

    Junho de 2015

  • Tecnologias de dados abertos para interligar bibliotecas, arquivos e museus: um caso

    Machadiano.

    http://www.scielo.br/pdf/tinf/v25n1/a08v25n1

    Arquivos, bibliotecas e museus disponibilizam seus catlogos e/ou colees digitais na

    Internet, tornando-os acessveis a qualquer usurio, em qualquer lugar, a qualquer momento.

    H, no entanto, grande dificuldade em tornar interoperveis acervos hospedados em

    diferentes instituies, uma vez que esses acervos so dependentes de softwares especficos

    para publicar seus registros na Web.

    O objetivo deste trabalho foi elaborar um caso fictcio que servisse de exemplo para a

    interligao de dados provenientes de arquivos, bibliotecas e museus, por meio da

    identificao de vocabulrios j existentes para ampliar a semntica dos contedos publicados

    e da descrio dos contedos em RDF, mostrando, dessa forma, que a interligao dos dados

    possvel e til.

    Pela importncia que Machado de Assis ocupa no cenrio da literatura, ele foi escolhido para o

    caso fictcio de interligao de dados de arquivos, bibliotecas e museus. O exemplo

    desenvolvido um caso restrito e ilustrativo, no exaustivo, constituindo-se como uma

    possvel soluo para a disperso de informaes sobre sua obra literria e suas adaptaes,

    assim como informaes bibliogrficas que se encontram dispersas na Internet, hospedadas

    em servidores de diferentes instituies.

    A interoperabilidade utilizada para a juno dessas informaes que esto espalhadas pela

    internet.

    Os que se preocupam com a questo da interoperabilidade podem contar hoje com os

    recursos da chamada Web Semnticos, uma extenso da Web que tem, como projeto, a

    implantao de padres, com destaque para o Resource Description Framework (RDF) e

    modelos, alm do estabelecimento de uma linguagem comum, visando organizao e

    inteligibilidade de contedo por meio dos computadores. Como parte do desenvolvimento da

    Web Semntica, surgiu o conceito de dados abertos interligados - linked open data -, definido

    como um conjunto de boas prticas para publicar, de forma aberta, e interconectar conjuntos

    de dados estruturados na Web, com o intuito de criar uma Web de dados.

    Existem quatro princpios bsicos para a publicao de dados abertos estruturados na Web

    O primeiro deles a utilizao de Uniform Resource Identifier (URI), [...] como um meio mais

    genrico para identificar qualquer entidade que exista no mundo [...] Esse conceito expande o

    de Uniform Resource Locator (URL), que funciona como endereo de documentos na Web. Os

    URI no so endereos na hierarquia de pastas e arquivos, sujeitos a mudanas dessa

    hierarquia, no servidor que abriga o recurso; mas, sim, identificadores persistentes de

    recursos.

    O segundo princpio de Linked Data especifico o de que os URIS devem utilizar o protocolo

    Hypertext Transfer Protocol (HTTP) para facilitar sua localizao. [...] o protocolo HTTP

    fornece um mecanismo simples e universal para recuperar recursos que podem ser

    serializados como um fluxo de bytes [...], como, por exemplo, a imagem da casa de Machado

  • de Assis, ou descries da recuperao de entidades que no podem elas prprias ser enviadas

    atravs da rede dessa forma, tal como a casa em si.

    O terceiro princpio estabelece que quando algum consulta uma URI deve obter informao

    til por meio dela, e que suas informaes devem ser representadas no formato RDF. Esse

    modelo usado para publicao de dados estruturados na Web. Ele usa URI para codificar

    informaes em um documento, assegurando que cada conceito est vinculado a uma nica

    definio que cada um pode encontrar na Web.

    O quarto princpio afirma que a descrio deve incluir links para outras URI, de modo que os

    usurios possam localizar mais informaes sobre o tema ou o objeto em questo. So

    utilizados hiperlinks para conectar no apenas os documentos da Web, mas qualquer tipo de

    recurso em diversos locais.

    Na primeira etapa do trabalho, definiram-se as URI principais, que identificam o livro e seu

    escritor. Para o autor Machado de Assis, utilizou-se seu registro no Virtual International

    Authority File (VIAF), Catlogo Virtual Internacional de Autoridades. J para a obra Dom

    Casmurro, recorreu-se aos permalinks (links permanentes ou URI) da Biblioteca do Congresso

    dos EUA - Library of Congress (LC). Selecionou-se o endereo, que corresponde ao registro de

    uma edio do livro Dom Casmurro.

    Outra etapa metodolgica foi a identificao de instituies, acervos e materiais que

    pudessem ser associados aos dados principais, nesse caso, Machado de Assis e sua obra

    literria Dom Casmurro. Assim, buscaram- -se contedo ou representaes de contedos em

    pginas de instituies governamentais, bibliotecas e portais de contedo, entre outras.

    Destacaram-se as seguintes:

    - Academia Brasileira de Letras: Machado de Assis foi um de seus idealizadores e fundador.

    Disponibiliza um portal sobre Machado com contedo diversos.

    - Ministrio da Educao e Cultura (MEC): disponibiliza a Coleo Digital Machado de Assis,

    criada em 2008, para homenagear os 100 anos de falecimento do escritor.

    - Wikipdia: a enciclopdia colaborativa contm verbetes sobre Machado de Assis, sua esposa

    Catarina, Dom Casmurro, e sobre a personagem Capitu.

    - YouTube: aqui encontram-se vdeos sobre a minissrie Capitu, baseada em Dom Casmurro, e

    reportagens sobre Machado de Assis e sua obra.

    Para expandir os URI do livro e do escritor, interligando-os aos contedos encontrados nas

    pginas citadas, realizou-se uma pesquisa para identificao de vocabulrios que oferecessem

    termos para relaes sobre pessoas, autores, obras e contedo dessas obras. Por fim, os dados

    hospedados em servidores de diversas instituies foram convertidos para o formato RDF.

    O Linked Data aparece como uma possibilidade de facilitar a interligao de dados que, por sua

    vez, possam ser ligados a outros dados, criando uma rede de dados estruturados e com

    representao semntica legvel por homens e mquinas.

    O caso machadiano, aqui apresentado, um exemplo de aplicao do Linked Data,

    objetivando a integrao de dados de arquivos, bibliotecas e museus. Essas instituies

    possuem seus cdigos prprios e maneiras particulares de representar a informao, tornando

  • esses acervos isolados. Observa-se, entretanto, no decorrer deste trabalho, que possvel a

    integrao dos dados utilizando os princpios do Linked Data.