1
Bibliotecas Digitais
Centro de Informática
Universidade Federal de Pernambuco
Almir MouraGlauber AraújoMarcos CardosoMarcos Silva
2
Roteiro Introdução Desenvolvimento de coleções Descrição de conteúdos Consulta e acesso Preservação Aspectos econômicos Conclusões Material de Consulta
3
Introdução
Sociedade da informação marcada pela importância crescente de documentos digitais– Artigos eletrônicos, hipertextos, imagens,…
Grande volume de informação digital:– Computadores pessoais– Avanço da Internet
Ferramentas para atender as necessidades de informação dos usuários– Bibliotecas Digitais
4
Introdução
A biblioteca foi uma das primeiras instituições que fizeram uso de tecnologias da informação e comunicação– Bancos de dados e as redes de computadores– Sistemas de gerenciamento de bibliotecas – Bases de dados catalográficos– OPACs - On-line Public Access Catalogs
Com o barateamento de recursos de memória, versões digitais (eletrônicas) dos próprios conteúdos de informação são disponibilizadas
5
Bibliotecas Digitais
Biblioteca sem um ambiente físico e informação não mais atrelada ao suporte de papel impresso
Interesse impulsionado com o surgimento da Internet na década de 90
Conteúdos de informação estão contidos em formatos digitais diversos – Textos, vídeo, áudio, imagens, hipertextos...
Acessadas pelos usuários a qualquer hora e local
6
Bibliotecas Digitais
Um conjunto de serviços integrados para capturar, catalogar, armazenar, buscar, proteger e recuperar informação;
Em uma biblioteca digital qualquer recurso online pode ser gerenciado e compartilhado, tornando-o muito mais acessível do que antes;
A internet possibilitou o surgimento de bibliotecas com acervos imensos.
7
Bibliotecas Digitais
Desenvolvimento do acervo Descrição dos
conteúdos
Consulta e acesso
PreservaçãoDigital
8
Desenvolvimento do Acervo
Documentos pode ser produzidos originalmente em formatos digitais – Uso de editores de texto, imagens,…– Biblioteca Digital da ACM– Liber com dissertações e teses da UFPE
Documentos podem ser cópias digitalizadas dos documentos originais– Uso de scanner e reconhecimento ótico de
caracteres
9
Biblioteca do Vaticano: com 150 mil manuscritos e 100 mil gravuras e miniaturas
Bibliotecas de Documentos Digitalizados
10
Bibliotecas de Documentos Digitalizados
Projeto Making of America (MoA): cerca de 8500 livros do século 19
11
Internet Archive–Localizada no presidio de São
Francisco, foi fundada por Brewster Kahle, em 1996
–A coleção inclui filmes, audio (em especial de concertos ao vivo), livros e softwares;
–Em 2004 a quantidade de dados chegou a 1 petabyte com média de crescimento mensal de 20 terabytes.
Bibliotecas de destaque na Web
12
Bibliotecas de destaque na Web
Ibiblio– Projeto da Universidade da Carolina do
Norte;– Fundada em 1992 como SunSITE ;– Faz parte do Centro de Domínio Publico
e hospeda o desenvolvimento de projetos open source;
13
Bibliotecas de destaque na Web Library of Congress (LoC)
– É uma das quatro bibliotecas nacionais oficiais dos Estados Unidos;
– A biblioteca física contem cerca de 128 milhões de itens;
– O processo de digitalização já criou 20 terabytes de informação;
– Realiza muitas pesquisas sobre bibliotecas digitais e intercambio de dados.
14
Google Prints Usa o esquema de busca do Google para
encontrar livros, a maioria de domínio publico;
Projeto prevê a digitalização de 16 milhões de livros;
Parcerias com grandes bibliotecas digitais e editoras pode tornar o projeto a maior biblioteca digital do mundo;
Ainda em fase beta.
15
Integração/importação de recursos digitais disponíveis em fontes eletrônicas externas – Outras bibliotecas digitais ou a Internet.
Redes de computadores que permitem transmissão de informação de forma rápida e confiável
Diversos autores apontam uma tendência para a integração de recursos
Desenvolvimento do Acervo
16
As bibliotecas digitais geram novos desafios para descrição de documentos– Formatos digitais heterogêneos– Formatos complexos como hipertextos e arquivos
multimídia
Existem padrões de metadados aceitos internacionalmente– Padrão MARC (Machine Readable Cataloging)– Padrão Dublin-Core
Descrição dos Documentos
17
O registro MARC é dividido em campos identificados por um código de três dígitos numéricos– Código 020: ISBN– Código 100: autor– Código 245: título– Código 260: publicação
Ao todo são cerca de 800 campos com códigos associados
Padrão MARC
18
Padrão MARC – Exemplo de Registro 090
$a 308 $c R484p $8 1 / $8 13 / $8 5 $a 301.2 $c R484p $8 9
100 1 $a Ribeiro, Darcy, 1922- 245 1 2 $a O povo brasileiro : $b a formacao e o
sentido do Brasil / $c Darcy Ribeiro. - 250 $a 2.ed. -
260 # $a Sao Paulo : $b Companhia das Letras, $c 1995. $a 476p. : $b il.
650 0 3 $a Antropologia - Brasil. $a Cultura - Brasil. $a Etnologia - Brasil.
901 $a Livro 910 $a BC $a CAC $a FCH $a CE
300
19
O significado dos códigos é universal e o conteúdo dos campos segue padrões internacionais como AACR2
Duas bibliotecas usando o formato MARC podem trocar registros entre si
Programas usam códigos e conteúdo dos registros conforme a necessidade– Fazer pesquisa por palavra-chave– Visualizar o registro na tela do computador
Padrão MARC
20
Padrão MARCNúmero de Chamada
308 R484p Biblioteca Central / Bib. Filosofia e C. Humanas / Bib. Artes e Comunicacao 301.2 R484p Bib. Educação
Autor Principal Ribeiro, Darcy, 1922- T¡tulo Principal
O povo brasileiro : a formacao e o sentido do Brasil
Edição 2.ed. - Descrição Física
Sao Paulo : Companhia das Letras, 1995.
476p. : il. Antropologia - Brasil. Cultura - Brasil. Etnologia - Brasil.
Assuntos
Publicação
21
Padrão MARC que contem mais de 800 elementos de metadados (alguns bastante específicos)
A proposta do padrão DC é definir um conjunto de metadados simples e intuitivo capaz de descrever diferentes documentos digitais
O DC oferece 15 elementos de metadados definidos em cooperação internacional
Padrão Dublin-Core (DC)
22
Descrição de conteúdo (7 elementos)– Título, assunto, descrição, fonte, linguagem,
relacionamentos, cobertura
Propriedade intelectual (4 elementos) – Autor, publicador, colaborador, direitos
Instanciação do documento (4 elementos)– Tipo (texto, imagem, vídeo,...), data, formato,
identificador único
Padrão Dublin-Core (DC)
23
Conjunto mínimo de elementos de metadados compreendidos por qualquer comunidade
Extensões do padrão DC são encorajadas para atender a necessidades específicas– Ex.: elemento “contato” (nome e e-mail da pessoa
ou instituição ao qual o recurso está vinculado)
Conjunto mínimo de elementos devem ser mantido nas extensões
Padrão Dublin-Core (DC)
24
Documentos como hipertexto e multimídia são difíceis de serem descritos– Páginas com inúmeros relacionamentos, com
vídeos, arquivos para download... – Metadados para descrever contexto de
arquivos multimídia
Soluções têm sido propostas, usando normalmente estruturas em hipertexto– XML (eXtensible Markup Language)– RDF (Resource Description Framework)
Descrição dos Documentos
25
Diferentes tipos de ferramentas para recuperação de informação– Pesquisa por palavra-chave, booleana, pesquisa em
linguagem natural, navegação em estruturas hierárquicas, navegação em hipertexto
Catálogos On-Line: OPACs (On-line Public Access Catalogs)
Acesso aos conteúdos de informação:– Download, leitura da tela do computador, pay-per-
view,...
Consulta e Acesso
26
Definição das ferramentas devem levar em conta as especificidades dos usuários– Idade, contexto social, diferentes habilidades no uso de
computadores,... Melhorar o desempenho das ferramentas de
acesso envolve: – Pesquisa nos aspectos cognitivos dos usuários– Modelos individualizados de perfil do usuário– Técnicas de inteligência artificial
Consulta e Acesso
27
Preservação Digital O que seria Preservação?
– Preservar o que não pode ser manuseado
– Tentar garantir a integridade da informação
– Evitar a perda de informação
28
Preservação Digital - Objetivos Auxiliar a preservação dos documentos originais
Tentar garantir que a informação digital esteja disponível para acesso pelas gerações futuras
2225?
29
Preservação Digital Dificuldades:
– Vida útil dos meios físicos de armazenamento
– Obsolescência dos dispositivos computacionais usados
para armazenar e visualizar documentos• Meios físicos• Software
– Mudança de versão, perda de informação
30
Preservação Digital - Estratégias Migração para formatos mais seguros
Migração para meios físicos de armazenamentos mais seguros
31
Preservação Digital - Estratégias Construção de infra-estrutura para preservação
– Software para preservação, dispositivos para armazenamento, pessoal qualificado,...
32
Aspectos Econômicos Gastos com infra-estrutura
– Acesso a internet, softwares de edição, reconhecimento óptico…
33
Aspectos Econômicos
Gastos com pessoal qualificado– Administradores, profissionais da informação,
programadores,…
34
Aspectos Econômicos Custos relacionados ao desenvolvimento das
coleções– processo de digitalização.
Custos relacionados ao acesso às fontes de informação. – Gastos com direitos de acesso
35
Aspectos Econômicos Custos relacionados ao acesso às fontes de
informação. – Gastos com direitos autorais
36
Aspectos Econômicos Preservação dos documentos
– Custos da preservação digital são difíceis de serem estimados a longo prazo
– Como estimar o preço de uma coisa que tem valor• Cultural• Histórico
37
Conclusões
Tendências – Buscar mais informações
• Biblioteca híbrida– Sistema de busca
• Integração de fontes de informações
38
Conclusões
Tendências – Buscar adoção de padrões
• W e b
• Padrões para descrição de documentos para a internet
39
Conclusões
Exigências para o profissional da informação– Lidar com as novas tecnologias de informação e
comunicação
– Lidar com equipes de profissionais de formações heterogêneas
– Constante atualização de seus próprios conhecimentos e competências
40
Conclusões
Interesse crescente nas bibliotecas digitais– Educação, entretenimento, negócios,…
41
Material de Consulta
E. Fox e O. Sornil, “Digital Libraries”, Modern Information Retrieval, Baeza-Yates e Ribeiro-Neto (Eds), 1999
Revista Ciência da Informação– M. B. da Cunha, “Desafios para a construção de uma
biblioteca digital”, Vol. 28(3), 1999– P. Z. Marchiori, “Ciberteca ou biblioteca virtual”,
Vol. 26(2), 1997– M. Levacov, “Bibliotecas virtuais: (r)evolução”,
Vol.26(2), 1997
42
Material de Consulta
E. Fox, R. Akscyn, M., R. Furuta e J. Leggett, “Digital Libraries”, Communications of the ACM, Vol. 38(4), 1995
Universidade de Michigan, Making of America, Humanities Text Initiative, www.hti.umich.edu
ACM Digital Library, www.acm.org
43
Bibliotecas Digitais
Centro de Informática
Universidade Federal de Pernambuco
Almir MouraGlauber AraújoMarcos CardosoMarcos Silva