A conversão de registros na implantação de repositórios institucionais: o caso do Repositório...
-
Upload
fabricio-assumpcao -
Category
Technology
-
view
306 -
download
5
Transcript of A conversão de registros na implantação de repositórios institucionais: o caso do Repositório...
A conversão de registros na implantação de repositórios institucionais: o caso do Repositório Institucional UNESP
Fabrício Silva Assumpção; Renata Eleuterio da SilvaJaider Andrade Ferreira; Flávia Maria Bastos
Coordenadoria Geral de Bibliotecas da UNESP (CGB)
SNBU 2014, Belo Horizonte – MG, 16 a 21 de novembro
Repositório da Produção Científica do CRUESP
Lançamento em outubro de 2013
Portaria UNESP 88, de 28 fev. 2013, que instituiu o Grupo Gestor da Política do Repositório Institucional UNESP
repositorio.unesp.br
Introdução
Primo
repositorio.unesp.br
Interface de busca
DSpace
base.repositorio.unesp.br
Aspectos tecnológicos
Perfil de Aplicação de Metadados (Dublin Core).
DSpace: importação em XML (“pacotes”) e em CSV (“planilha”).
Aspectos tecnológicos
Meta para a implantação do Repositório:
Incluir o máximo possível da produção científica da Universidade.
Web of Science, SciELO e ScopusWeb of Science (2008-2012)
Para alcançar essa meta de maneira eficiente foram utilizados processos de coleta, de conversão e de importação automática dos registros.
Meta inicial
Web of Science: web service
SciELO: programa desenvolvido pelo analista
Coleta do registro e do arquivo PDF
Scopus: compra de um pacote de registros
Coleta dos registros em XML
Coleta
A XML e as tecnologias relacionadas a ela.
XSLT (Extensible Stylesheet Language for
Transformation)
Linguagem Extensível para Folhas de Estilo de Transformação
Transformar (converter) documentos XML para atender propósitos específicos
XML e XSLT
Percurso da conversão
Registros da Web of Science em XML
Registrosem Dublin Core/XML
Folha de estilo XSLT
Web of Science Dublin Core
Folha de estilo XSLT
Dublin Core/XML Dublin Core/CSV
Registros em CSV
<titles count="6"><title type="source">NANOTECHNOLOGY</title><title type="source_abbrev">NANOTECHNOLOGY</title><title type="abbrev_iso">Nanotechnology</title><title type="abbrev_11">NANOTECHNOL</title><title type="abbrev_29">NANOTECHNOL</title><title type="item">Graphene to fluorographene and fluorographane: a theoretical study</title>
</titles><names count="6">
<name dais_id="16326329" reprint="Y" role="author“ seq_no="1"addr_no="1">
<display_name>Paupitz, R.</display_name><full_name>Paupitz, R.</full_name><wos_standard>Paupitz, R</wos_standard><first_name>R.</first_name><last_name>Paupitz</last_name><email_addr>[email protected]</email_addr>
</name>
Registro da Web of Science em XML
<dublin_core schema="dc"><dcvalue element="contributor" qualifier="author">Paupitz, R. [UNESP] </dcvalue><dcvalue element="contributor" qualifier="author">Autreto, P. A. S.</dcvalue><dcvalue element="contributor" qualifier="institution">Universidade Estadual Paulista (UNESP)</dcvalue><dcvalue element="contributor" qualifier="institution">Universidade Estadual de Campinas (UNICAMP)</dcvalue><dcvalue element="date" qualifier="issued">2013-01-25</dcvalue><dcvalue element="description" qualifier="sponsorship">Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)</dcvalue><dcvalue element="identifier" qualifier="issn">0957-4484</dcvalue><dcvalue element="language" qualifier="iso">en</dcvalue><dcvalue element="relation"qualifier="isPartOf">Nanotechnology</dcvalue><dcvalue element="title" language="en">Graphene to fluorographene andfluorographane: a theoretical study</dcvalue>
</dublin_core>
Registro em Dublin Core/XML
Registros em CSV
Mapeamento
Web of Science(origem)
Perfil de Aplicação(destino)
Repetível Observações
names/name/last_namenames/name/first_name
dc.contributor.author Sim Unir os dois metadados; separar com vírgula.
pub_info/@sortdatepub_info/@pubyear
dc.date.issued Não Utilizar o @pubyear apenas se o @sortdatenão constar.
abstracts/abstract/abstract_text
dc.description.abstract Sim
fund_ack/grants/grant/grant_agency
dc.description.sponsorship Sim
identifiers/identifier[@type='issn']
dc.identifier.issn Sim
Antes da importação:
Remoção dos registros duplicados
Localização dos documentos e coleta dos links
Verificação das licenças
Coleta dos arquivos PDF
Verificação
Importação da planilha CSV contendo os registros
Inclusão automática do arquivo PDF correspondente a cada registro
Programa criado pelo analista
dc.identifier.wos - WOS:000312672700023
dc.identifier.scielo - S1413-99362012000100006
dc.identifier.scopus - 2-s2.0-0035647910
Importação
Nome do arquivo PDF
Após a importação:
Distribuição entre as coleções
Padronização
Verificação constante
Verificação
Resultados alcançados
Web of Science2008-2012
Quantidade de registros
Resultados alcançados
SciELO1976-2013
Quantidade de registros
Resultados alcançados
Web of Science1976-2007
Quantidade de registros
Quantidade de registros
Resultados alcançados
Scopus1976-2013
Quantidade de registros
Resultados alcançados
Dissertações e teses
Alcance das metas (considerando o tempo e tamanho da equipe)
Apresentar para a comunidade da UNESP os benefícios da existência de um repositório institucional.
Fomentar na comunidade uma cultura de depósito da produção científica que auxilie no desenvolvimento do Repositório enquanto produto e serviço de informação que representa a Universidade.
Diálogo com os gestores.
Benefícios
Parceria com os profissionais de TI
Bibliotecários:
Conhecimentos sobre os dados, produção e comunicação científica.
Transpor o tradicional espaço de atuação.
Atuação do bibliotecário
Autoarquivamento de dissertações e teses.
Ações para o crescimento contínuo do Repositório com o apoio da comunidade da UNESP.
Estabelecimento de políticas.
Ações futuras
ASSUMPÇÃO, F. S. Conversão de registros em XML para MARC 21: um modelo baseado em folhas de estilo XSLT. 135 f. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2013. Disponível em: <http://base.repositorio.unesp.br/handle/11449/93658>. Acesso em: 14 maio 2014.
KEENAN, T. M. Why Purchase When You Can Repurpose? Using Crosswalks to Enhance User Access. Code4Lib Journal, n. 11, 2010. Disponível em: <http://journal.code4lib.org/articles/3604>. Acesso em: 14 maio 2014.
KEITH, C. Using XSLT to manipulate MARC metadata. Library Hi Tech, v. 22, n. 2, p. 122-130, 2004. Disponível em: <http://dx.doi.org/10.1108/07378830410524549>. Acesso em: 14 maio 2014.
KURTH, M.; RUDDY, D.; RUPP, N. Repurposing MARC metadata: using digital project experience to develop a metadata management design. Library Hi Tech, v. 22, n. 2, p. 153-165, 2004. Disponível em: <http://dx.doi.org/10.1108/07378830410524585>. Acesso em: 14 maio 2014.
RUDIĆ, G.; SURLA, D. Conversion of bibliographic records to MARC 21 format. The Electronic Library, v. 27, n. 6, p. 950-967, 2009. Disponível em: <http://dx.doi.org/10.1108/02640470911004057>. Acesso em: 14 maio 2014.
ST. PIERRE, M.; LAPLANT, W. P. Issues in Crosswalking Content Metadata Standards. Baltimore: National Information Standards Organization, 1998. Disponível em: <http://www.niso.org/publications/white_papers/crosswalk>. Acesso em: 14 maio 2014.
UNIVERSIDADE ESTADUAL PAULISTA. Portaria n.º 88, de 28 de fevereiro de 2013. Diário Oficial do Estado de São Paulo, Executivo, São Paulo, 01 mar. 2013. Caderno 1, p. 47.
W3C. XML. Last modified: 2012/01/24. Cambridge, 2012. Disponível em: <http://www.w3.org/XML>.
W3C. XSL Transformations (XSLT) Version 2.0: W3C Recommendation 23 January 2007. Cambridge, 2007. Disponível em: <http://www.w3.org/TR/xslt20>. Acesso em: 14 maio 2014.
WOODLEY, M. S. Crosswalks, Metadata Harvesting, Federated Searching, Metasearching: Using Metadata to Connect Users and Information. In: BACA, Murtha (Org.). Introduction to Metadata. 2nd ed. Los Angeles: Getty Research Institute, 2008. Disponível em: <http://www.getty.edu/research/publications/electronic_publications/intrometadata/path.pdf>. Acesso em: 14 maio 2014.
Referências
Repositório Institucional UNESPrepositorio.unesp.br
SNBU 2014, Belo Horizonte – MG, 16 a 21 de novembro
Fabrício Silva Assumpção - [email protected]ávia Maria Bastos - [email protected] Andrade Ferreira - [email protected]
Renata Eleuterio da Silva - [email protected]