08/01/2017
1
ESTRATÉGIASPreservação digital
Introdução
� Ao longo dos últimos anos, foram propostas inúmeras estratégias no sentido de solucionar o problema da preservação digital.◦ É necessário definir se o objeto de preservação deve ser o
objeto físico original ou a conservação do conteúdo embutido nesse objeto.
08/01/2017
2
Documento Digital
• Nível Conceitual– Aquilo com que lidamos no mundo real; o
que reconhecemos como uma unidade significativa de informação
– Exemplo: jornal, livro, mapa, fotografia
• Nível Lógico– Codificação da informação – Tarefa realizada pelo software– Trata-se do formato do objecto
• Nível Físico– Sinais inscritos em suporte físico – e.g. disco rígido, CD, Pen-drive
Documento digital
Se um dos níveis se tornar obsoleto o objeto conceitual deixa de estar acessível
08/01/2017
3
Estratégias
• No seu extremo esquerdo as estratégias centradas na preservação do objeto físico/lógico (tecnologia) e no extremo oposto as estratégias centradas na preservação do objeto conceitual.
• No eixo vertical as diversas estratégias são dispostas mediante o seu grau de especificidade, isto é, se são estratégias apenas aplicáveis a uma dada classe de objetos digitais ou se tratam de estratégias genéricas, passíveis de ser administradas a qualquer classe de objetos digitais.
Ap
licab
ilid
ade
Objetivo
Estratégias
� Foco no objeto físico/lógico◦ Preocupação em preservar a informação nos seus
formatos lógicos ou físicos originais;
◦ Utilização da tecnologia originalmente associada a estes objetos para garantir o acesso aos mesmos;
◦ Preservação de tecnologia.
� Foco no objeto conceptual◦ Preocupação em preservar as características essenciais
dos objetos digitais de uma forma independente do hardware e do software;
◦ Preservação de objetos conceituais.
08/01/2017
4
Preservação do objetofísico/lógico
Preservação da Tecnologia
� Uma das primeiras estratégias de preservação◦ conservação do contexto tecnológico utilizado
originalmente na concepção dos objetos digitais que se procura preservar;
� Consiste na conservação e manutenção de todo o hardware e software necessários à correta apresentação dos objetos digitais;
� Trata-se sobretudo da criação de museus de tecnologia;
� Alguns autores consideram a única forma suficientemente eficaz para assegurar que os objetos digitais sejam preservados de forma fidedigna;
08/01/2017
5
Preservação da Tecnologia
� A história da computação demonstra que qualquer plataforma tecnológica, mesmo a mais popular, acaba inevitavelmente se tornando obsoleta e frequentemente desaparecendo;
� Este tipo de estratégias introduz dificuldades na gestão do espaço físico, manutenção e custo de operação, tornando-as inadequadas para aplicação a longo-prazo;
� O acesso à informação ficar restrito a apenas alguns locais físicos.
Refrescamento
� Um objeto digital torna-se persistente no momento em que é inscrito num suporte físico de armazenamento.
� Garantir a integridade do suporte é fundamental para que a informação nele armazenada possa ser corretamente interpretada;
� O suporte físico pode se deteriorar ou se tornar obsoleto a ponto de deixarem de existir periféricos capazes de extrair a informação nele armazenada;
� O refrescamento de suporte consiste na transferência de informação de um determinado suporte físico de armazenamento para outro mais atual antes que o primeiro se deteriore ou se torne irremediavelmente obsoleto.
� A frequente verificação da integridade dos suportes físicos, assim como o seu refrescamento periódico, são consideradas atividades vitais num contexto de preservação digital.
� O refrescamento de suporte não constitui uma estratégia de preservação.
� É pré-requisito para qualquer estratégia de preservação.
08/01/2017
6
Emulação
� Baseiam-se na utilização de um software, chamado “emulador”, capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software, numa outra;
� Como interpretar no futuro cada bit/byte de um objeto digital?◦ Deve-se ter informações detalhada sobre o objeto digital e
sobre o ambiente de hardware onde ele operava;
� Pressuposto: é tecnicamente viável substituir as plataformas de hardware obsoletas necessárias para executar no futuro os aplicativos originais em máquinas virtuais (emuladores);
Emulação
� Existem essencialmente dois tipos de emuladores: emuladores de sistemas operacionais (1) e de emuladores de hardware(2).1. Reprodução de um sistema operacional completo permitindo a
execução de diversas aplicações no contexto de um único emulador.
2. Imitar o comportamento de uma plataforma de hardware, possibilitando que vários sistemas operacionais e correspondentes aplicações possam ser executados no contexto de um único emulador.
� Existem vários exemplos de emuladores de plataformas consideradas obsoletas◦ ZX Spectrum, Nintendo NES, entre outras.
08/01/2017
7
Emulação
� Rothenberg defende um modelo teórico capaz de emular plataformas atuais em computadores futuros.
◦ Conservação do objeto digital juntamente com todo o software necessário à sua execução/apresentação (incluindo o sistema operacional) e na criação de uma especificação da plataforma de hardware que suporta a execução desse software.
◦ Essa especificação deverá ser escrita numa linguagem independente da plataforma e ser suficientemente rica para que um emulador possa ser construído em qualquer computador do futuro.
� Hendley considera que a emulação apenas deveria ser utilizada em contextos em que a comunidade de interesse valoriza a preservação do ambiente tecnológico original ou ainda em situações em que os objetos digitais não são passíveis de ser convertidos para formatos contemporâneos.
Emulação
� Vantagens◦ Não é necessário preservar o hardware original, pois o
software emulador é criado para ser utilizado em plataformas atuais.
◦ Capacidade de preservar, com um elevado grau de fidelidade, as características e as funcionalidades do objeto digital original.
� Críticas◦ Complexidade técnica de desenvolver emuladores;
� Requer especificação detalhada do hardware e do software.� Alto custo
◦ Os próprios emuladores estão sujeitos a obsolescência;
◦ Os usuários são obrigados a operar sistemas obsoletos;
◦ Preservar um sistema operacional inteiro apenas para visualizar um documento parece uma tarefa exageradamente pesada;
08/01/2017
8
Encapsulamento
� Não é fácil determinar o valor intrínseco de determinados objetos digitais. Poderão passar-se vários anos até que a comunidade revele um interesse particular por uma determinada coleção de objetos.
� Neste tipo de cenário, as estratégias de preservação que carecem de uma diligência contínua poderão ser muito caras;
� As soluções baseadas em encapsulamento procuram resolver esse problema mantendo os objetos digitais inalterados até ao momento em que se tornam efetivamente necessários.
� Preservação do objeto digital original juntamente com informações capazes de garantir a sua futura interpretação;
◦ Criar “containers” ou “embrulhos” contendo o objeto digital e toda a informação (descrição formal) necessária do objeto para permitir o futuro desenvolvimento de conversores, visualizadores ou emuladores.
Encapsulamento
� Vantagens
◦ Permite adiar as responsabilidades de preservação;
◦ Orientado a objetos que apenas serão utilizados num futuro longínquo
◦ Desenvolvimento de visualizadores, migradores ou emuladores apenas no futuro;
� Desvantagens
◦ Objetos complexos possuem especificações complexas
◦ Possibilidade de especificações incompletas;
08/01/2017
9
Pedra de Roseta Digital
� Pedra de Roseta◦ Bloco de pedra com estranhos glifos cunhados separados em três partes distintas
com o mesmo texto: a parte superior está na forma hieroglífica do egípcio antigo, o trecho do meio em demótico, e o inferior em grego antigo
◦ Foi crucial para a compreensão moderna dos hieróglifos egípcios. Sua inscrição registra um decreto promulgado em 196 a.C., em nome do rei Ptolomeu V.
◦ Ela foi descoberta em 1799, numa expedição militar do então general Napoleão -mais tarde ela foi capturada pelos ingleses.
� Sua tradução ainda causa conflitos entre nações e, até os dias de hoje, estudiosos debatem sobre quem deveria levar crédito por decifrar o código dos hieróglifos. Até mesmo a atual localização da pedra é assunto para debate. O objeto sempre foi considerado de grande importância histórica e política.
� A realização da tradução em 1822 pertence ao estudante francês Jean-François Champollion, que desta forma iniciou a ciência de estudo de assuntos referentes ao Egito, a Egiptologia.
Pedra de Roseta Digital
� Como estratégia de preservação digital, propõe preservar não as regras que permitam decodificar o objeto, mas amostras representativas desse objeto que permitam sua recuperação;
� Existem também propostas de criação de diretórios centralizados de informação técnica sobre os formatos digitais, com o objetivo de registrar informações sobre os formatos: especificações técnicas, grau de obsolescência, entre outros.◦ Essas informações serão importantes como apoio às
atividades de preservação digital, além de possibilitar o desenvolvimento de ferramentas para identificação do formato de um objeto digital.
08/01/2017
10
Preservação do objeto conceitual
Normalização
� Tem como objetivo simplificar o processo de preservação através da redução do número de formatos distintos que se encontram no repositório de objetos digitais;
� Havendo um número controlado de formatos, uma mesma estratégia de preservação poderá ser aplicada a um maior número de objetos digitais, o que poderá rediz os custos de preservação.
� Exemplo◦ Existem vários formatos para representação de imagens (BMP, GIF,
JPEG, PNG). Se todas as imagens digitais forem convertidas para um único formato, a preservação desse tipo de objeto poderia ser realizadas de forma mais simples e mais econômica.
� A escolha do formato de normalização é um fator determinante no sucesso desta estratégia.◦ Sempre que possível, deverão ser escolhidos formatos conhecidos
pela comunidade de interesse e baseados em normas internacionais abertas.
08/01/2017
11
Normalização
� O formato de normalização deverá ser suficientemente rico para que as características fundamentais dos vários formatos possam ser devidamente incorporadas.
� Ao serem utilizados formatos abertos e independentes da plataforma, diferentes configurações de hardware e software serão capazes de os interpretar.
� A normalização de formatos pode ser implementada de diversas formas.◦ Determinados repositórios procedem à conversão
automática dos objetos recebidos para um formato padrão.◦ Definir políticas de arquivo que limitam os formatos em que
aceitam informação. Assim, cabe aos produtores da informação converter os seus objetos digitais para os formatos estipulados.
Migração
� “(…) transferência periódica de material digital de uma dada configuração de hardware/software para uma outra, ou de uma geração de tecnologia para outra subsequente”.
� Conjunto de atividades que devem ser repetidas periodicamente◦ Copiar, converter ou transferir a informação digital do patamar
tecnológico que a sustenta (mídias, softwares, formatos e hardware) para um outro mais atualizado e de uso corrente;
� Tem como objetivo manter os objetos digitais compatíveis com tecnologias atuais de modo que um usuário comum seja capaz de utilizá-lo sem necessidade de recorrer a artefatos menos convencionais, como por exemplo, emuladores.
08/01/2017
12
Migração
� Migração para suportes analógicos◦ A migração para suportes analógicos consiste na
conversão de objetos para suportes não digitais com o intuito de aumentar a sua longevidade.
◦ Reprodução de um objeto digital em papel, microfilme ou qualquer outro suporte analógico de longa duração e concentrar os esforços de preservação em torno do novo suporte.
◦ Esta estratégia, no entanto, apenas pode ser aplicada a objetos digitais que possuam uma representação aproximada em suportes analógicos, como por exemplo, documentos de texto ou imagens.
◦ Objetos interativos e/ou dinâmicos ficam assim automaticamente excluídos deste tipo de estratégias.
Migração
� Atualização de versões◦ É bastante comum encontrar aplicações de software
capazes de abrir ou importar objetos digitais produzidos por versões anteriores dessa mesma aplicação.
◦ Essas aplicações permitem geralmente gravar os objetos importados no formato mais atual produzido pela mesma.
◦ Esta operação designa-se por atualização da versã o do formato.
◦ É possivelmente a estratégia de preservação mais vulgarmente utilizada pelos generalidade dos utilizadores.
◦ Essencialmente, consiste em atualizar os materiais digitais produzidos por um determinado software a uma versão mais atual do mesmo
08/01/2017
13
Migração
� Conversão para formatos concorrentes◦ O processo e atualização de versões é geralmente
controlado pela empresa que desenvolveu o software. ◦ Independentemente do sucesso económico de um
fabricante ou produto de software, os formatos estão constantemente sujeitos a descontinuidade.◦ Uma forma de garantir que os objetos digitais sobrevivem
a este tipo de rupturas tecnológicas consiste em convertê-los para formatos de uma linha de produtos concorrente.◦ Existem formatos que não são dependentes de qualquer
aplicação de software. Tal, acontece com grande parte dos formatos de imagem (ex: JPEG, TIFF, PNG). Isto possibilita que os objetos sejam convertidos entre formatos semelhantes, independentemente da aplicação utilizada na sua criação.
Migração
� Migração a pedido◦ O sucesso de uma migração depende, fundamentalmente, da
qualidade dos conversores utilizados e da capacidade que o formato de destino possui para acomodar o conjunto de propriedades do formato de partida.
◦ Poder-se assumir que sempre que é efetuada uma migração, os objetos digitais resultantes serão de alguma forma diferentes dos objetos de partida.
◦ Ao fim de algumas iterações, os objetos preservados poderão ser substancialmente diferentes dos objetos originais.
◦ Para combater este fenômeno de degradação surgiu uma estratégia designada por migração a pedido.
◦ Neste tipo de migração, ao invés de as conversões serem aplicadas ao objeto mais atual, estas são sempre aplicadas ao objeto original.
◦ Se em uma conversão resultar um objeto substancialmente diferente do original, numa futura conversão, o problema poderá ser resolvido recorrendo a um conversor de melhor qualidade ou a um formato de destino mais adequado.
08/01/2017
14
Migração
� Migração a pedido
Migração
� Migração a pedido◦ A principal vantagem é que, uma vez construído o módulo
de descodificação do conversor (módulo capaz de ler as propriedades do formato de origem), apenas será necessário desenvolver os codificadores específicos para cada formato de saída.
◦ Ao longo do tempo haverá um conjunto grande de conversores de modo a garantir a capacidade de transformar os objetos armazenados nos seus formatos originais para formatos que sirvam adequadamente as necessidades dos seus consumidores
08/01/2017
15
Migração
� Migração distribuída◦ Existe um conjunto de serviços de conversão que se encontram
acessíveis através da Internet e que podem ser utilizados remotamente.
◦ Existem várias iniciativas que visam o desenvolvimento deste tipo de conversores.� Typed Objects Model (TOM) - sistema distribuído de conversores, que
recorre a agentes mediadores para descobrir e executar conversões entre formatos.
� Lister Hill National Center for Biomedical Communications - Serviço Web que converte ojetos digitais de cinquenta formatos distintos para PDF.
◦ Hunter e Choudhury propõem uma rede de serviços de conversão que possibilita a sua descoberta e invocação automática por agentes de software.
◦ Na Universidade do Minho está atualmente a ser desenvolvida uma Arquitetura Orientada ao Serviço (SOA) que disponibiliza várias centenas de serviços de conversão, avaliação e recomendação.
Migração
� Migração distribuída◦ Este tipo de migração apresenta algumas vantagens face às
estratégias de migração mais convencionais:� A utilização de serviços de conversão permite esconder as
especificidades de cada conversor e da plataforma que o suporta;� A criação de serviços redundantes assegura a confiabilidade do
sistema perante situações de ruptura parcial;
◦ Este tipo de abordagem é compatível com uma série de variantes de migração, como por exemplo, normalização e migração a pedido;
◦ A criação de uma rede global de conversores poderá conduzir a uma redução generalizada dos custos de preservação.
◦ Qualquer organização poderá rentabilizar os seus investimentos no desenvolvimento de conversores, publicando-os na rede de serviços e cobrando uma pequena taxa pela sua utilização.
08/01/2017
16
Migração
� Migração distribuída◦ Apesar das vantagens apresentadas, a migração
distribuída poderá não será adequada a todos os contextos.� Um repositório de informação digital pode facilmente conter
milhares de itens, atingindo níveis de armazenamento na ordem dos múltiplos terabytes.
� Transferir através da Internet um volume de informação desta natureza acarreta custos que poderão ser impeditivos para muitas organizações.
◦ Requisitos em termos de largura de banda, segurança dos dados e tempo de transferência poderão ser fatores determinantes no sucesso deste tipo de estratégias.
Migração
� Vantagens◦ Disseminação dos materiais em formatos atualizados;
◦ Sem necessidade de preservar o software original;
◦ Possui um conjunto de procedimentos mais bem organizados e consolidadas;
� Desvantagens◦ Possível perda de informação durante a conversão
◦ Necessidade de diligência continua
◦ Dispendiosa a longo-prazo
08/01/2017
17
Finalizando...
� A migração é a estratégia que mais evolui e que mais está sendo utilizada;
� Emulação torna-se uma estratégia muito cara, necessitando da criação de um ambiente de software e hardware exatamente igual ao original.
� O refrescamento é uma estratégia que deve ser aplicada principalmente em função da obsolescência dos suportes e do hardware.
� É necessário que as instituições adotem estratégias de preservação digital em suas políticas, para cada tipo de objeto digital, avaliando-as periodicamente para determinar qual a melhor estratégia a ser implementada de acordo com as tecnologias existentes naquele momento.
� Necessidade do desenvolvimento de elementos de descrição que possam descrever todo o histórico das estratégias aplicadas aos objetos digitais, para que o mesmo possa ser entendido no futuro pelos novos ambientes tecnológicos.
� Nesse sentido, a criação de metadados específicos de preservação e que registrem todas as estratégias aplicadas é apontada como a melhor solução.
Bibliografia
08/01/2017
18
Bibliografia
Top Related