A conversão de registros na implantação de repositórios institucionais: o caso do Repositório...

Post on 23-Jul-2015

306 views 5 download

Transcript of A conversão de registros na implantação de repositórios institucionais: o caso do Repositório...

A conversão de registros na implantação de repositórios institucionais: o caso do Repositório Institucional UNESP

Fabrício Silva Assumpção; Renata Eleuterio da SilvaJaider Andrade Ferreira; Flávia Maria Bastos

Coordenadoria Geral de Bibliotecas da UNESP (CGB)

SNBU 2014, Belo Horizonte – MG, 16 a 21 de novembro

Repositório da Produção Científica do CRUESP

Lançamento em outubro de 2013

Portaria UNESP 88, de 28 fev. 2013, que instituiu o Grupo Gestor da Política do Repositório Institucional UNESP

repositorio.unesp.br

Introdução

Primo

repositorio.unesp.br

Interface de busca

DSpace

base.repositorio.unesp.br

Aspectos tecnológicos

Perfil de Aplicação de Metadados (Dublin Core).

DSpace: importação em XML (“pacotes”) e em CSV (“planilha”).

Aspectos tecnológicos

Meta para a implantação do Repositório:

Incluir o máximo possível da produção científica da Universidade.

Web of Science, SciELO e ScopusWeb of Science (2008-2012)

Para alcançar essa meta de maneira eficiente foram utilizados processos de coleta, de conversão e de importação automática dos registros.

Meta inicial

Web of Science: web service

SciELO: programa desenvolvido pelo analista

Coleta do registro e do arquivo PDF

Scopus: compra de um pacote de registros

Coleta dos registros em XML

Coleta

A XML e as tecnologias relacionadas a ela.

XSLT (Extensible Stylesheet Language for

Transformation)

Linguagem Extensível para Folhas de Estilo de Transformação

Transformar (converter) documentos XML para atender propósitos específicos

XML e XSLT

Percurso da conversão

Registros da Web of Science em XML

Registrosem Dublin Core/XML

Folha de estilo XSLT

Web of Science Dublin Core

Folha de estilo XSLT

Dublin Core/XML Dublin Core/CSV

Registros em CSV

<titles count="6"><title type="source">NANOTECHNOLOGY</title><title type="source_abbrev">NANOTECHNOLOGY</title><title type="abbrev_iso">Nanotechnology</title><title type="abbrev_11">NANOTECHNOL</title><title type="abbrev_29">NANOTECHNOL</title><title type="item">Graphene to fluorographene and fluorographane: a theoretical study</title>

</titles><names count="6">

<name dais_id="16326329" reprint="Y" role="author“ seq_no="1"addr_no="1">

<display_name>Paupitz, R.</display_name><full_name>Paupitz, R.</full_name><wos_standard>Paupitz, R</wos_standard><first_name>R.</first_name><last_name>Paupitz</last_name><email_addr>paupitz@rc.unesp.br</email_addr>

</name>

Registro da Web of Science em XML

<dublin_core schema="dc"><dcvalue element="contributor" qualifier="author">Paupitz, R. [UNESP] </dcvalue><dcvalue element="contributor" qualifier="author">Autreto, P. A. S.</dcvalue><dcvalue element="contributor" qualifier="institution">Universidade Estadual Paulista (UNESP)</dcvalue><dcvalue element="contributor" qualifier="institution">Universidade Estadual de Campinas (UNICAMP)</dcvalue><dcvalue element="date" qualifier="issued">2013-01-25</dcvalue><dcvalue element="description" qualifier="sponsorship">Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)</dcvalue><dcvalue element="identifier" qualifier="issn">0957-4484</dcvalue><dcvalue element="language" qualifier="iso">en</dcvalue><dcvalue element="relation"qualifier="isPartOf">Nanotechnology</dcvalue><dcvalue element="title" language="en">Graphene to fluorographene andfluorographane: a theoretical study</dcvalue>

</dublin_core>

Registro em Dublin Core/XML

Registros em CSV

Mapeamento

Web of Science(origem)

Perfil de Aplicação(destino)

Repetível Observações

names/name/last_namenames/name/first_name

dc.contributor.author Sim Unir os dois metadados; separar com vírgula.

pub_info/@sortdatepub_info/@pubyear

dc.date.issued Não Utilizar o @pubyear apenas se o @sortdatenão constar.

abstracts/abstract/abstract_text

dc.description.abstract Sim

fund_ack/grants/grant/grant_agency

dc.description.sponsorship Sim

identifiers/identifier[@type='issn']

dc.identifier.issn Sim

Antes da importação:

Remoção dos registros duplicados

Localização dos documentos e coleta dos links

Verificação das licenças

Coleta dos arquivos PDF

Verificação

Importação da planilha CSV contendo os registros

Inclusão automática do arquivo PDF correspondente a cada registro

Programa criado pelo analista

dc.identifier.wos - WOS:000312672700023

dc.identifier.scielo - S1413-99362012000100006

dc.identifier.scopus - 2-s2.0-0035647910

Importação

Nome do arquivo PDF

Após a importação:

Distribuição entre as coleções

Padronização

Verificação constante

Verificação

Resultados alcançados

Web of Science2008-2012

Quantidade de registros

Resultados alcançados

SciELO1976-2013

Quantidade de registros

Resultados alcançados

Web of Science1976-2007

Quantidade de registros

Quantidade de registros

Resultados alcançados

Scopus1976-2013

Quantidade de registros

Resultados alcançados

Dissertações e teses

Alcance das metas (considerando o tempo e tamanho da equipe)

Apresentar para a comunidade da UNESP os benefícios da existência de um repositório institucional.

Fomentar na comunidade uma cultura de depósito da produção científica que auxilie no desenvolvimento do Repositório enquanto produto e serviço de informação que representa a Universidade.

Diálogo com os gestores.

Benefícios

Parceria com os profissionais de TI

Bibliotecários:

Conhecimentos sobre os dados, produção e comunicação científica.

Transpor o tradicional espaço de atuação.

Atuação do bibliotecário

Autoarquivamento de dissertações e teses.

Ações para o crescimento contínuo do Repositório com o apoio da comunidade da UNESP.

Estabelecimento de políticas.

Ações futuras

ASSUMPÇÃO, F. S. Conversão de registros em XML para MARC 21: um modelo baseado em folhas de estilo XSLT. 135 f. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2013. Disponível em: <http://base.repositorio.unesp.br/handle/11449/93658>. Acesso em: 14 maio 2014.

KEENAN, T. M. Why Purchase When You Can Repurpose? Using Crosswalks to Enhance User Access. Code4Lib Journal, n. 11, 2010. Disponível em: <http://journal.code4lib.org/articles/3604>. Acesso em: 14 maio 2014.

KEITH, C. Using XSLT to manipulate MARC metadata. Library Hi Tech, v. 22, n. 2, p. 122-130, 2004. Disponível em: <http://dx.doi.org/10.1108/07378830410524549>. Acesso em: 14 maio 2014.

KURTH, M.; RUDDY, D.; RUPP, N. Repurposing MARC metadata: using digital project experience to develop a metadata management design. Library Hi Tech, v. 22, n. 2, p. 153-165, 2004. Disponível em: <http://dx.doi.org/10.1108/07378830410524585>. Acesso em: 14 maio 2014.

RUDIĆ, G.; SURLA, D. Conversion of bibliographic records to MARC 21 format. The Electronic Library, v. 27, n. 6, p. 950-967, 2009. Disponível em: <http://dx.doi.org/10.1108/02640470911004057>. Acesso em: 14 maio 2014.

ST. PIERRE, M.; LAPLANT, W. P. Issues in Crosswalking Content Metadata Standards. Baltimore: National Information Standards Organization, 1998. Disponível em: <http://www.niso.org/publications/white_papers/crosswalk>. Acesso em: 14 maio 2014.

UNIVERSIDADE ESTADUAL PAULISTA. Portaria n.º 88, de 28 de fevereiro de 2013. Diário Oficial do Estado de São Paulo, Executivo, São Paulo, 01 mar. 2013. Caderno 1, p. 47.

W3C. XML. Last modified: 2012/01/24. Cambridge, 2012. Disponível em: <http://www.w3.org/XML>.

W3C. XSL Transformations (XSLT) Version 2.0: W3C Recommendation 23 January 2007. Cambridge, 2007. Disponível em: <http://www.w3.org/TR/xslt20>. Acesso em: 14 maio 2014.

WOODLEY, M. S. Crosswalks, Metadata Harvesting, Federated Searching, Metasearching: Using Metadata to Connect Users and Information. In: BACA, Murtha (Org.). Introduction to Metadata. 2nd ed. Los Angeles: Getty Research Institute, 2008. Disponível em: <http://www.getty.edu/research/publications/electronic_publications/intrometadata/path.pdf>. Acesso em: 14 maio 2014.

Referências

Repositório Institucional UNESPrepositorio.unesp.br

repositoriounesp@reitoria.unesp.br

SNBU 2014, Belo Horizonte – MG, 16 a 21 de novembro

Fabrício Silva Assumpção - fabricio@reitoria.unesp.brFlávia Maria Bastos - fmbastos@reitoria.unesp.brJaider Andrade Ferreira - jaider@marilia.unesp.br

Renata Eleuterio da Silva - renata_silva@marilia.unesp.br