Repositórios confiáveis

55
REPOSITÓRIOS DIGITAIS CONFIÁVEIS Brasília, 29 de Março de 2011

description

Repositórios confiáveis - Preservação digital

Transcript of Repositórios confiáveis

Page 1: Repositórios confiáveis

REPOSITÓRIOS DIGITAIS CONFIÁVEIS

Brasília, 29 de Março de 2011

[email protected]

Page 2: Repositórios confiáveis

RESUMO

Os repositórios para preservação de objetos digitais são apresentados como aqueles que estariam localizados em instituições confiáveis e capazes de armazenar, migrar e dar acesso a coleções digitais. Esse tipo de repositórios integra ferramentas de preservação digital, ou aquelas que sejam equivalentes nessa funcionalidade.

Apresentar-se alguns exemplos de sistemas e soluções tecnológicas que estão sendo testados e que já estão sendo considerados padrões de preservação digital pela comunidade científica. São discutidas as propriedades de preservação digital mínimas para garantir a confiança nos repositórios digitais.

Page 3: Repositórios confiáveis

A Era dos repositórios

2009 OCLC anunciou que passava a hospedar e administrar o serviço OAIster de coleta de registros via OAI-PMH e incluí-os no seu catálogo WorldCom. Em 2010 os registros já passavam dos 23 milhões procedentes de 1100 repositórios.

Repositórios Confiáveis número do slide 3/5529 de março de 2012

Page 4: Repositórios confiáveis
Page 5: Repositórios confiáveis

Repositório institucional

Page 6: Repositórios confiáveis
Page 7: Repositórios confiáveis
Page 8: Repositórios confiáveis

Biblioteca Digital

Page 9: Repositórios confiáveis

Biblioteca Institucional Temático

Page 10: Repositórios confiáveis

O que é um repositório digital?

Aplicações provedoras de dados destinadas ao gerenciamento de informação.

Os repositórios são em parte softwares de gestão de informação. Sua estrutura, formatos, registros e preservação estão condicionados pelo software utilizado.

O tipo de repositório digital é determinado pela aplicação e os objetivos ao qual se destina, além da ferramenta tecnológica que será adotada.

Repositórios Confiáveis número do slide 10/5529 de março de 2012

Page 11: Repositórios confiáveis

O que caracteriza um repositório digital?1. Num repositório o conteúdo é depositado pelo autor,

pelo editor ou por terceiros.2. A arquitetura de repositório gerencia tanto o

conteúdo quanto os metadados.3. O repositório oferece um conjunto mínimo de

serviços, ex.: inserção, obtenção, pesquisa, controle do acesso, etc.

Repositórios Confiáveis número do slide 11/5529 de março de 2012

Page 12: Repositórios confiáveis

O que caracteriza um repositório digital?5. O uso de padrões abertos para garantir que o conteúdo

estará acessível e que ele poderá ser pesquisado e recuperado para seu uso a longo prazo.

6. As funcionalidades do software escolhido.7. Uma decisão política feita por uma instituição ou uma

administração.8. O uso de padrões compartilhados internacionalmente

que permite que os mecanismos estejam ajustados para a importação, exportação, identificação, armazenamento e recuperação do conteúdo digital no repositório.

Repositórios Confiáveis número do slide 12/5529 de março de 2012

Page 13: Repositórios confiáveis

O que é um repositório institucional?

Conjunto de serviços prestados pelas universidades, para recuperar, administrar, difundir e preservar a produção digital gerada na instituição, qualquer que seja a tipologia , através da criação de uma coleção digital organizada, aberta e interoperável via o protocolo OAI-PMH (para recuperação de metadados) para garantir o aumento da visibilidade e do impacto dessa produção.

Repositórios Confiáveis número do slide 13/5529 de março de 2012

Page 14: Repositórios confiáveis

O que caracteriza um repositório institucional?1. Espelha a produção institucional, 2. O lugar onde podem ser adicionadas teses,

dissertações e conjuntos de dados de pesquisa dos membros de uma instituição.

3. As funções de acesso livre relacionadas com depósito de resultados de pesquisas.

4. O gerenciamento, a preservação e o acréscimo de valor por parte de bibliotecários e instituições.

5. O cumprimento da missão da universidade de produzir, incentivar e disseminar a produção acadêmica.

Repositórios Confiáveis número do slide 14/5529 de março de 2012

Page 15: Repositórios confiáveis

O que envolve um repositório institucional?1. Mais do que um conjunto de softwares e hardwares.2. Um conjunto de compromissos, decisões e

atividades para administrar os materiais digitais.3. Organização, acesso e distribuição de documentos

digitais.4. Gerenciamento de mudanças tecnológicas e a

migração de conteúdos digitais de um conjunto de tecnologias para outra.

5. A preservação de longo prazo.

Repositórios Confiáveis número do slide 15/5529 de março de 2012

Page 16: Repositórios confiáveis

O que preservação digital?

Segundo o Trusted Digital Repositories (2002) a preservação digital são as atividades administrativas necessárias para garantir a manutenção a longo prazo da sequência de bits e a acessibilidade contínua ao conteúdo.

Seriam as ações necessárias para garantir o acesso contínuo e pertinente à informação digital durante o tempo que seja requerido e para qualquer finalidade legítima.

Repositórios Confiáveis número do slide 16/5529 de março de 2012

Page 17: Repositórios confiáveis

O que é um repositório digital confiável?

É o resultado da associação de repositórios institucionais, serviços de preservação e arquivos por área de conhecimento; tem como missão prover acesso de longo prazo confiável a recursos digitais gerenciados para suas comunidades alvo, hoje e no futuro.

Repositórios Confiáveis número do slide 17/5529 de março de 2012

Page 18: Repositórios confiáveis

O que é um repositório digital confiável?

Aqueles que possuem atributos para dar suporte a sistemas de informação e considerem os seguintes aspectos:

• responsabilidade administrativa;• viabilidade organizacional;• sustentabilidade financeira;• adequabilidade tecnológica e procedimental;• sistema de segurança;• responsabilidade de procedimentos (certificação).

http://wiki.digitalrepositoryauditandcertification.org/bin/view/Main/WebHome

Repositórios Confiáveis número do slide 18/5529 de março de 2012

Page 19: Repositórios confiáveis

Em um repositório digital confiável também...1. As informações sobre a origem fica encapsulada com

os dados.2. Existe uma distinção e relação clara entre as versões

dos documentos.3. Inclusão de todos os arquivos dos dados e a

documentação.4. Os dados são descritos para seu uso.

Repositórios Confiáveis número do slide 19/5529 de março de 2012

Page 20: Repositórios confiáveis

Como criar um repositório digital confiável?

Elaborando um plano eficaz que contenha e aplique protocolos, padrões e normas internacionais, em concordância com as políticas da instituição, assegurando a sua sustentabilidade a longo prazo.

Verificando se o software que se está utilizando na gestão do repositório digital atende as normas e protocolos de preservação básicos.

Repositórios Confiáveis número do slide 20/5529 de março de 2012

Page 21: Repositórios confiáveis

Como criar um repositório digital confiável?

Utilizando metadatos na identificação dos objetos digitais nos repositórios, permitindo:

- o acesso aos documentos depositados e,- sua gestão e preservação a longo prazo.

Todo repositório de preservação normalizado precisa utilizar metadados de preservação.

Repositórios Confiáveis número do slide 21/5529 de março de 2012

Page 22: Repositórios confiáveis

Condições para criação de um repositório digital confiável

I. Usar um guia para a digitalização de coleçõesII. Usar software de repositório digitalIII. Estruturar o repositório em conformidade com o Modelo

OAISIV. Usar o Dicionário de Metadados PREMISV. Usar um formato padrão de metadadosVI. Usar um extrator automático de metadadosVII. Aplicar uma norma de segurança da informaçãoVIII.Passar por uma auditoria para certificaçãoIX. Participar de uma rede distribuída de preservação digitalX. Contratar arquivistas especializados em curadoria

digital. Repositórios Confiáveis número do slide 22/5529 de março de 2012

Page 23: Repositórios confiáveis

I. Usar um guia para a digitalização de coleções

Page 24: Repositórios confiáveis

I. Usar um guia para a digitalização de coleções

Una fuente de información para el desarrollo de los requisitos de un proyecto de digitalización es Llevando la teoría a la práctica: Tutorial de digitalización de imágenes de la biblioteca de la Cornell University. En este tutorial se puede encontrar una explicación detallada de todos los conceptos sobre esta área, así como su influencia en la construcción de una colección digital de calidad, y una recopilación de fuentes de información complementarias sobre los requisitos de algunos de los grandes proyectos de digitalización. Otra obra de referencia básica es la 3ª edición (2007) de la NISO Recommended Practice, A Framework of Guidance for Building Good Digital Collections (ya citada anteriormente en este trabajo) destinada a servir de guía a instituciones de memoria para la planificación de proyectos de creación de colecciones digitales y a entidades

Os guias e tutoriais de digitalização explicam detalhadamente todos os conceitos da área, assim como, a sua influenza na construção de uma coleção digital de qualidade. Algumas delas são a copilação de fontes de informação sobre os requisitos que alguns grandes projetos de digitalização observaram.

Uma fonte de informação para o desenvolvimento dos requisitos de um projeto de digitalização é o tutorial «Levando a teoría à prática: Tutorial de digitalização de imagens» daBiblioteca da Cornell University.

Outra obra de referência é a 3ª edição (2007) da NISO Recommended Practice, A Framework of Guidance for Building Good Digital Collections, destinada a servir de guía para instituições de memória no planejamento de projetos de criação de coleções digitais.

Uma obra Brasileira é o «Manual de digitalização de Acervos» do professor Rubens Ribeiro Gonçalves da Silva, da UFBA>

Page 25: Repositórios confiáveis

II. Usar software de repositório digital

Repositórios Confiáveis número do slide 7/1029 de março de 2012

Institucionais Temáticos Centrais Preservação

Archimede Greenstone Greenstone LOCKSS

ARNO DAITSS

CDSware

DSpace DSpace DSpace DSpace

Driver

Eprints Eprints Eprints

Fedora Fedora Fedora

i-Tor

MyCoRe

OPUS

Page 26: Repositórios confiáveis

Qual software de repositório escolher?

1. Programas que possuam características parecidas com relação aos espaços para o depósito e submissão de documentos digitais com informações científicas.

2. Uma solução que aumente a competição e reduza o monopólio dos periódicos, diminuindo custos das assinaturas e destacando a relevância da própria instituição e das bibliotecas.

3. Um Software que adote o protocolo de arquivos abertos, gratuito e que permita a criação de redes nas instituições.

Repositórios Confiáveis número do slide 26/5529 de março de 2012

Page 27: Repositórios confiáveis

III. Estruturar o repositório em conformidade com o Modelo OAIS

Page 28: Repositórios confiáveis

O que é o Open Archive Information System – OAIS?

A norma OAIS (ISO 14721:2003) é uma recomendação para o desenvolvimento de um consenso sobre os requisitos a serem cumpridos pelos arquivos para preservar a longo prazo a informação digital. O modelo OAIS não especifica nenhum método de implantação, mas, indica a organização de equipes e sistemas que têm a responsabilidade de preservar a informação e torna-la disponível para uma comunidade específica.

Repositórios Confiáveis número do slide 28/5529 de março de 2012

Page 29: Repositórios confiáveis

IV. Usar o Dicionário de Metadados PREMIS

Page 30: Repositórios confiáveis

O que é o PREMIS?

E um dicionário de dados para metadados de preservação. Em 2005 foi publicada a versão 1.0. Ele consiste um estudo que define os tipos de informação que devem ser associados a um objeto digital para sua preservação.

O dicionário traduz o modelo OAIS na forma de esquema de metadados específicos para preservação em sistemas de repositórios de preservação. Ele também não define nenhuma estratégia o método de implementação.

Repositórios Confiáveis número do slide 30/5529 de março de 2012

Page 31: Repositórios confiáveis

PREMIS Data Dictionary for Preservation Metadata

Cada sistema de repositório pode ter definidas as informações que devem ser registradas como parte permanente da estória de um objeto. O PREMIS recomenda que sejam registradas sempre as ações que modificam o objeto. Um repositório deve designar um identificador único para o agente que realizou a modificação do objeto e outorgar-lhe direitos e permissões que são relevantes para a preservação do objeto no repositório.

Repositórios Confiáveis número do slide 31/5529 de março de 2012

Page 32: Repositórios confiáveis

PREMIS Data Dictionary for Preservation Metadata

O Dicionário de Dados PREMIS define os metadados de preservação como a informação que um repositório utiliza para realizar o proceso de preservação digtal. São metados destinados à viabilidade, disponibilidade, clareza, autenticidade e identidade no contexto da preservação.

Todo repositório de preservação normalizado precisa utilizar metadados de preservação e especificamente os do PREMIS.

Repositórios Confiáveis número do slide 32/5529 de março de 2012

Page 33: Repositórios confiáveis

Para que serve o Dicionário PREMIS?

• Para descrever os metadados de preservação.• Definir o conjunto central de metadados de

preservação que devem ser implementados.• Identificar e avaliar as estratégias para codificação,

armazenamento e gerenciamento ou melhoria dos metadados de preservação nos sistemas de arquivamento digital.

Repositórios Confiáveis número do slide 33/5529 de março de 2012

Page 34: Repositórios confiáveis

V. Usar um formato padrão de metadados

Page 35: Repositórios confiáveis

O que é o METS?

Formato padrão para codificação e transmisão de metadados.Utiliza a estrutura de etiquetas tipo XML. Qualquer repositório que receba informação procedente de um processo de digitalização deve estabelecer requisitos mínimos e obrigatórios, ou fazer referência a algum dos perfis existentes no METS. A publicação do PREMIS in METS Toolbox (http://pim.fcla.edu/) facilitou essa tarefa, já que ela é uma ferramenta de código aberto.

Repositórios Confiáveis número do slide 35/5529 de março de 2012

Page 36: Repositórios confiáveis

METS e NISO Z39.87

São padrões decodificação e transmissão de metadados(METS) desenvolvido pela comunidade bibliotecária, provê uma

estrutura de dados para intercambio, visualização e arquivamento de objetos digitais.

NISO Z39.87 Metadados técnicos para Imagens digitais fixas, descreve os campos necessários para que uma base de dados preserve imagens digitais.

Repositórios Confiáveis número do slide 36/5529 de março de 2012

Page 37: Repositórios confiáveis

METS e MODS e MIX

METS (Metadata Encoding and Transmission Standard) é um esquema XML para codificar objetos digitais; reúne os metadados descritivos, os arquivos digitais e os metadados administrativo usados para transferir, preservar ou mostrar tais objetos.

MODS (Metadata Object Description Schema) esquema para reunir metadados descritivos.

MIX (Metadata For Images in XML) baseado em NISO Z39.87 Technical Metadata for Digital Still Images – descreve que campos são necessários em uma base de dados para preservar imagens fixas.

Repositórios Confiáveis número do slide 37/5529 de março de 2012

Page 38: Repositórios confiáveis

VI. Usar um extrator automático de metadados

Page 39: Repositórios confiáveis

O que é o JHOVE?

Ferramenta para extração automática de metadatos (http://hul.harvard.edu/jhove/), desenvolvida pela Harvard University, ela permite a identificação automática, validação e caracterização de um conjunto de tipos de objetos digitais.

O DSpace oferece um add-ons com uma versão abreviada do JHOVE, proporcionando controle do formato, da extensão do arquivo/bistream e a verificação de virus.

Repositórios Confiáveis número do slide 39/5529 de março de 2012

Page 40: Repositórios confiáveis

VII. Aplicar uma norma de segurança da informação

Para garantir a segurança da informação é necessário aplicar a norma ISO/IEC 207002:2005 Information technology -- Security techniques -- Code of practice for information security management, que comprende as normas ISO/IEC 17799:2005 e ISO/IEC 17799:2005/Cor.1:2007.

A segurança da informação é definida nessa norma como a preservação da confidencialidade para garantir que a informação está acessível apenas a aqueles autorizados para ter esse acesso. A integridade como uma garantia da exatidão e integridade da informação e dos métodos do seu processamento. Y a disponibilidade para asegurar o acesso aos usuários autorizados quando eles requerem acesso à informação.

Page 41: Repositórios confiáveis

VIII.Passar por uma auditoria para certificação

Page 42: Repositórios confiáveis

Por que passar por auditoria/certificação?

Um processo de auditoria serve para atribuir/certificar que o repositório digital está em concordância com o modelo OAIS. Ela verifica a infraestrutura organizacional, a gestão dos objetos digitais e a segurança. A certificação é um elemento essencial para confiabilidade dos repositórios digitais.Processos de certificação podem criar maior padronização e credibilidade dos arquivos digitais.Processos de certificação podem criar maior padronização e credibilidade dos arquivos digitais.

Repositórios Confiáveis número do slide 42/5529 de março de 2012

Page 43: Repositórios confiáveis

Os pilares da certificação de Repositórios Digitais

Repositórios Confiáveis número do slide 43/5529 de março de 2012

THOMAZ (2007)

Page 44: Repositórios confiáveis

Repositórios Confiáveis29 de março de 2012

IX. Participar de uma rede distribuída de preservação digital

Page 45: Repositórios confiáveis

Rede de repositórios digitais

Por ser difícil para instituições pequenas, ele deve ser gerenciado em parcerias ou consórcios (museus, arquivos, bibliotecas).

Pertencer a iniciativas de arquivamento com base em um sistema distribuído, chegando a serviços de ação de serviços de curadoria digital.

A preservação dos dados digitais estariam baseados nos repositórios institucionais, que proveriam o suporte para as atividades de preservação e curadoria.

Repositórios Confiáveis número do slide 45/5529 de março de 2012

Page 46: Repositórios confiáveis

Os profissionais envolvidos

Os desenvolvedores de repositórios digitais serão reconhecidos como responsáveis pela aplicação dos padrões internacionais para sistemas de preservação digital, assim como pela inclusão de atributos que suportem a segurança do sistema, os procedimentos apropriados, unidos às responsabilidades da custódia.

Repositórios Confiáveis número do slide 46/5529 de março de 2012

X. Contratar arquivistas especializados em curadoria digital.

Page 47: Repositórios confiáveis

UMA PÉSSIMA NOTÍCIA...

Não há no Brasil cursos para formar especialistas em curadoria digital, preservação em repositórios digitais e nem para a gestão de repositórios confiáveis.

Repositórios Confiáveis número do slide 47/5529 de março de 2012

X. Contratar arquivistas especializados em curadoria digital.

Page 48: Repositórios confiáveis
Page 49: Repositórios confiáveis
Page 50: Repositórios confiáveis
Page 51: Repositórios confiáveis

Os graus de confiabilidade

Fazer que os documentos digitais consigam permanecer no tempo e que seus conteúdos estejam em lugares com algum tipo de garantia de acesso de longo prazo.

Esta baseada na relação entre os objetivos da política de preservação com a definição dos papeis, ações e expectativas da instituição.

Repositórios Confiáveis número do slide 51/5529 de março de 2012

Page 52: Repositórios confiáveis

A desconfiança é a mãe da segurança.

Aristófanes

Page 53: Repositórios confiáveis

Leituras recomendadasTHOMAZ, Katia. Repositórios digitais confiáveis e certificação. Arquivistica.net, Brasília, DF, 3.1, 11 12 2007.

Disponível em: <http://www.arquivistica.net/ojs/viewarticle.php?id=118>.

MARDERO ARELLANO, Miguel Angel . Critérios para a preservação digital da informação científica. 2008. 354 f. : Tese (doutorado) - Universidade de Brasília, Departamento de Ciência da Informação, 2008 . Disponível em: <http://eprints.rclis.org/15412/1/Tese_Miguel_%C3%81ngel_M%C3%A1rdero_Arellano.pdf> .

SAYÃO, Luis Fernando; MARCONDES, Carlos Henrique. Software livres para repositórios institucionais: alguns subsídios para a seleção. In: SAYÃO, Luis Fernando et al (Orgs). Implantação e gestão de repositórios institucionais: políticas, memória, livre acesso e preservação. Salvador:EDUFBA, 2009. p. 23 – 54.

ANGEVAARE, Inge. Take care of digital collection and data: “curation” and organizational choices for research libraries. Liber Quarterly, v.19, n. 1, April 2009. Disponível em: <http://liber.library.uu.nl/publish/articles/000278/article.pdf>.

ALTMAN, M., ADAMS, M., CRABTREE, J., DONAKOWSKI, D., MAYNARD, M., PIENTA, A., YOUNG, C. (2009). "Digital preservation through archival collaboration: The Data Preservation Alliance for the Social Sciences." The American Archivist. 72(1): 169-182

Repositórios Confiáveis número do slide 53/5529 de março de 2012

Page 54: Repositórios confiáveis

Leituras recomendadas

NESTOR WORKING GROUP ON TRUSTED REPOSITIORIES CERTIFICATION. Catalogue of Criteria for Trusted Digital Repositories. Dec. 2006. Disponível em: <http://edoc.huberlin.de/series/nestor-materialien/8en/PDF/8en.pdf>.

RLG/NARA.Trustworthy repositories audit & certification. RLG, OCLC, Feb. 2007. Disponível em <http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf>.

RLG/NARA. An audit checklist for the certification of trusted digital repositories: draft for public comment. Mountain View, CA. : RLG, OCLC, 2005. Disponível em: <http://www.rebiun.org/opencms/opencms/handle404?exporturi=/export/docReb/audit_cheklist.pdf&%5d >.

RLG/OCLC. Trusted digital repositories: attributes and responsibilities. Mountain View, CA. : RLG, OCLC, 2002. Disponível em <http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf>.

Repositórios Confiáveis número do slide 54/5529 de março de 2012

Page 55: Repositórios confiáveis

REPOSITÓRIOS DIGITAIS CONFIÁVEIS

Miguel Ángel Márdero ArellanoMCTI – Ibict

[email protected]://slideshare.net/gemireki

[email protected]