CATÁLOGO DE DADOS DOS TRABALHOS CIENTÍFICOS DE … · representações digitais de materiais...

Click here to load reader

  • date post

    07-Nov-2018
  • Category

    Documents

  • view

    213
  • download

    0

Embed Size (px)

Transcript of CATÁLOGO DE DADOS DOS TRABALHOS CIENTÍFICOS DE … · representações digitais de materiais...

  • CATLOGO DE DADOS DOS TRABALHOS CIENTFICOS DE GESTO

    AMBIENTAL E SADE DA ESCOLA NACIONAL DE SADE PBLICA SRGIO

    AROUCA (ENSP/FIOCRUZ): PROPOSTA

    Por

    Cristiane Rozeno Parangaba

    Cristiane Rozeno Parangaba

    Projeto apresentado ao Instituto de

    Comunicao e Informao Cientfica e

    tecnolgica em Sade da Fundao Oswaldo

    Cruz como requisito parcial para obteno do

    ttulo de Especialista em Informao Cientfica

    e Tecnolgica em Sade.

    Orientador: M.Sc. Paulo Marques e M.Sc. M

    da Conceio R. de Carvalho

    Rio de Janeiro, ano (2015)

  • RESUMO

    Este trabalho tem como proposta a organizao dos trabalhos cientficos da

    linha de pesquisa Gesto Ambiental e Sade do programa Sade Pblica, da

    Escola Nacional de Sade Pblica (ENSP). Para tanto, objetiva-se a criao de

    um catlogo de conjuntos de dados brutos com informaes descritivas sobre os

    dados como, por exemplo, seu contedo, abrangncia temporal e geogrfica, e

    qualidade, que auxiliar os usurios na anlise preliminar sem a necessidade de

    adquiri-los.

    A partir de uma pesquisa de natureza exploratria das publicaes dessa

    linha de pesquisa nos repositrios institucional e temtico, e da anlise semntica

    existentes entre eles, a meta futuramente inserir os conjuntos de dados brutos

    de pesquisa identificados e classificados no catlogo, em um repositrio de dados

    cientficos que utilize um padro de metadados.

    Palavras-chave: Repositrio de dados cientficos, Dados brutos, Catlogo de

    dados.

  • LISTA DE SIGLAS

    ARCA Repositrio Institucional da Fiocruz

    DC Dublin Core

    Ensp Escola de Sade Pblica Sergio Arouca

    Fiocruz Fundao Oswaldo Cruz

    RI Repositrio Institucional

    PCAL

    Publicaes Peridicas de Acesso Livre

    FINEP Financiadora de Estudos e Projetos

    SEER Sistema Eletrnico de Editorao de Revistas, nome conhecido no Brasil. um produto Open Journaling System (OJS) de iniciativa Public Knowledge Project (PKP).

  • SUMARIO

    1. INTRODUO .............................................................................................................................. 4

    1.1. O papel da Fiocruz no movimento do acesso aberto ......................................................... 6

    1.2. A importncia dos Repositrios de dados cientficos para este movimento, para a Fiocruz

    e para ENSP. .................................................................................................................................... 7

    2. JUSTIFICATIVA ............................................................................................................................. 8

    3. REFERENCIAL TERICO................................................................................................................ 9

    4. OBJETIVOS ................................................................................................................................. 18

    5. METODOLOGIA ......................................................................................................................... 19

    6. RESULTADOS ESPERADOS ......................................................................................................... 22

    REFERNCIAS ..................................................................................................................................... 23

    CRONOGRAMA .................................................................................................................................. 26

    ORAMENTO ..................................................................................................................................... 27

  • 4

    1. INTRODUO

    Na ltima dcada do sculo XX, a comunidade cientfica presenciou a

    derrubada de barreiras existentes do acesso informao cientfica. Dessas

    barreiras estavam o avano de Tecnologias da Comunicao e Informao (TICs)

    e a crise das assinaturas dos peridicos.

    O uso das tecnologias de informao para disseminao da pesquisa

    obteve um expressivo crescimento nas interaes das comunidades cientficas. As

    comunidades cientficas espalhadas geograficamente que estudam ou no o

    mesmo assunto, atravs da internet, passaram a trabalhar em conjunto de forma a

    contribuir com o avano da cincia.

    Baptista e colaboradores afirmam que:

    o uso da comunicao eletrnica tem permitido, nas duas ltimas dcadas, que esses pesquisadores tanto realizem pesquisas em colaborao, quanto publiquem em coautoria, mesmo nos casos em que nunca tenham se encontrado pessoalmente (BAPTISTA et al., 2007, p.4) .

    A crise dos peridicos foi causada pelo o aumento abusivo das assinaturas

    dos peridicos e que tornou invivel as bibliotecas renovarem suas revistas. Para

    algumas revistas, houve aumentos de 1 mil por cento entre 1989 e 2001

    (BENCHIMOL et al., 2012).

    Kuramoto afirma que na crise dos peridicos os pesquisadores de diversas

    partes do globo terrestre se reuniram e deram incio a um grande movimento

    global em direo ao acesso aberto1 informao cientfica (Kuramoto, 2009, p.

    7).

    Aps a reunio do Open Society Institute (OSI) em 2001, surge o primeiro

    documento oficial do movimento de acesso livre, o Budapest Open Access

    Iniciative (BOAI)2 que define os princpios e as estratgias para a implantao e

    garantia de acesso livre informao (BENCHIMOL et al., 2012).

    1 Segundo o Open Acess presente no Documento de Budapeste - acesso gratuito e sem barreiras aos resultados de pesquisas cientficas via internet, sem distino entre acesso livre e acesso aberto. 2De BUDAPEST OPEN ACCESS INITIATIVE, 2002.Disponvel em: Acesso em: 07 out. 2015.

    http://hhttp://hhttp://hhttp://hhttp://hhttp://hhttp://www.budapestopenaccessinitiative.org/read
  • 5

    A Budapest Open Acess Iniciative recomendou duas estratgias

    complementares para que a literatura cientfica esteja disponvel e acessvel: a via

    Dourada, em peridicos cientficos, disseminados sem restries de acesso e uso,

    e a via Verde, em repositrios institucionais de acesso livre, atravs do auto

    arquivamento (LEITE, 2009).

    Outros documentos similares, como a Declarao de Bethesda3 e a

    Declarao de Berlim4, tambm so resultados de movimentos em favor do

    acesso livre ao conhecimento cientfico.

    Os pesquisadores e seus trabalhos cientficos ganharam maior visibilidade

    quando resultados de pesquisas foram depositados em repositrios das

    universidades ou dos institutos de pesquisas, resultando em um maior

    reconhecimento destes autores. A publicao em peridicos com a validao dos

    pares no era suficiente para aumentar a visibilidade dos seus trabalhos

    (BENCHIMOL et al., 2007).

    A visibilidade acompanhada do reconhecimento se deu de fato ao serem

    depositados em um ambiente interopervel permitindo seu livre acesso.

    Segundo a Declarao de Berlim, devero constar resultados de pesquisas

    originais, dados de pesquisas no processados, metadados, fontes originais,

    representaes digitais de materiais pictricos, grficos e material acadmico

    multimdia (BERLIM, 2003).

    No cenrio Brasileiro, o acesso aberto se deu atravs dos seguintes

    documentos: Manifesto Brasileiro, Declarao de Salvador sobre acesso aberto,

    Carta de So Paulo e Declarao de Florianpolis.

    O Instituto Brasileiro de Informao em Cincia e Tecnologia (IBICT)5 alm

    de ter lanado o Manifesto Brasileiro, tem comandado vrias aes para implantar

    o acesso livre no Brasil. Entre elas esto: o desenvolvimento de projetos de

    Publicaes Peridicas de Acesso Livre (PCAL) junto Financiadora de Estudos e

    Projetos (FINEP), subscrevendo e reforando toda argumentao em favor do

    3 Disponivel em: Acesso em: 07 out. 2015. 4 Disponvel em: Acesso em: 07 out. 2015. 5 Disponivel em: Acesso em:07 out. 2015.

    ../Library/Containers/com.microsoft.Word/Downloads/Disponivel%20em:%3chttp:/legacy.earlham.edu/~peters/fos/bethesda.htm%3ehttp://openaccess.mpg.de/Berlin-Declarationhttp://hhttp://hhttp://hhttp://h
  • 6

    acesso livre na assinatura da Declarao de Berlim, distribuio de tecnologias;

    como o software para construo e gesto de revistas cientficas, Sistema

    Eletrnica de Editorao de Revistas (SEER) e a construo de repositrios

    institucionais e temticos de acesso livre (KURAMOTO, 2008).

    1.1. O papel da Fiocruz no movimento do acesso aberto

    A Fundao Oswaldo Cruz (FIOCRUZ)6 em 2014, pensando em ampliar

    sua visibilidade cientfica e contribuir com o desenvolvimento da cincia e

    preservar sua produo, aprovou sua poltica de acesso aberto ao conhecimento.

    Em abril de 2011 o Instituto de Comunicao e Informao Cientfica em

    Sade (Icict/Fiocruz) lanou o ARCA7, Repositrio Institucional da Fiocruz.

    Em setembro de 2012, a ENSP lanou o seu repositrio institucional de

    Produo Cientfica em conjunto com a Poltica Institucional de Acesso Livre ao

    Conhecimento (Portaria GDENSP 026/2012), com o propsito de dar visibilidade a

    produo cientfica da escola.

    A Escola Nacional de Sade Pblica - ENSP se dedica formao

    profissional em sade e cincia & tecnologia e atua, de forma protagonista, em

    pesquisa, desenvolvimento tecnolgico, formulao de polticas pblicas e

    prestao de servios de referncia em sade. Alm disso, produz informao e

    tem a responsabilidade de garantir acesso pleno ao conhecimento seja pelo

    sistema de biblioteca multimdias, ou por meio do Repositrio em Sade Pblica,

    dentre outros (http://www.ensp.fiocruz.br/portal-ensp/).

    O Seminrio Internacional Acesso Livre ao Conhecimento (SEMINRIO,

    2011) foi o marco inicial de sua adeso ao Movimento Internacional de Acesso

    Aberto ao Conhecimento. Desde ento, vem incentivando seus pesquisadores a

    abraar de forma plena o depsito de suas publicaes cientficas, atravs do auto

    arquivamento, no repositrio temtico.

    6 Disponvel em: Acesso em:07 de out. 2015. 7 Disponvel em:

    http://www.ensp.fiocruz.br/portal-ensp/http://hhttp://hhttp://hhttp://hhttp://hhttp://h
  • 7

    1.2. A importncia dos Repositrios de dados cientficos para este movimento,

    para a Fiocruz e para ENSP.

    H sculos, a produo dos dados cientficos se tornou importante para a

    pesquisa cientfica. Eles so produzidos e utilizados no contexto da pesquisa

    cientfica e esto evoluindo naturalmente em suas formas e volumes, crescendo

    em dimenso e complexidade, observam Rodrigues et al. (2010).

    A Fiocruz em seu repositrio institucional ARCA possui cerca de quase

    1000010 produes intelectuais, que so: artigos, captulos de livros, dissertaes,

    trabalhos de concluso de cursos, relatrios, manuais e procedimentos tcnicos e

    teses. Parte dessas produes gerou dados de pesquisas que serviram como

    base para os estudos e que podem estar armazenados em lugares desconhecidos

    ou mesmo de forma incorreta. Muitos podero ser perdidos ou esquecidos, e

    daqui alguns anos as formas de armazenamento estaro ultrapassadas pela

    tecnologia.

    Disponibilizar os dados de pesquisas a outros pesquisadores importante

    em vrios aspectos como: minimizar custos, permitir novos estudos utilizando

    esses dados e eliminar tempo gastos em projetos novos.

    O movimento de acesso aberto surgiu tambm para quebrar as barreiras de

    acesso a esses dados e permitir que sejam compartilhados entre os

    pesquisadores para uso e reso. A forma para que esses dados sejam

    armazenados, preservados e acessados hoje e no futuro, aloc-los em

    repositrios de dados.

    Esse trabalho prope a Fiocruz e inicialmente a ENSP organizar todos os

    dados brutos da linha de pesquisa Gesto Ambiental e Sade em para serem

    depositados em um repositrio de dados cientficos com o propsito de preservar

    e disponibilizar comunidade cientfica e a sociedade.

    10 Dados levantados no repositrio institucional ARCA, Fiocruz.em 10/10/2015.

  • 8

    2. JUSTIFICATIVA

    Os dados coletados que do sustentao para os trabalhos cientficos no

    esto disponveis em um nico meio fsico. Muitas vezes, eles ficam armazenados

    em PCs e mdias pessoais dos pesquisadores sem que possamos (i) evitar que

    esse material deixe de ser til tecnologicamente pela fragilidade das mdias, mas,

    sobretudo (ABBOUT, 2008), (ii) por no se pensar na preservao adequada para

    serem reutilizados em novas pesquisas.

    necessrio se pensar que ao longo dos anos se esses dados no

    estiverem sob cuidados especiais iro se perder, poder trazer grande prejuzo

    para a ENSP e para a cincia, uma vez que tero novos investimentos financeiros

    e de tempo, gerando mais custos nas pesquisas.

    A forma para que esses dados sejam armazenados, preservados e

    acessados hoje e no futuro, estarem depositados em repositrios de dados e

    que no haja barreiras de acesso e ainda possam ser compartilhados entre a

    comunidade cientfica e a sociedade para uso e reso.

    Atualmente, o grande desafio da ENSP organizar os dados de projetos de

    pesquisas concludos e em andamentos e public-los em um repositrio de dados

    cientficos. Como projeto piloto, foi escolhida a linha de pesquisa Gesto

    Ambiental e Sade do programa Sade Pblica e Ambiente existente h cerca de

    15 anos na escola e pelo apoio da lder de pesquisa e seus pesquisadores em

    disponibilizar seus dados brutos, objetivando o acesso e o reuso em novas

    pesquisas cientficas.

    Neste estudo, ser apresentada uma proposta de organizao em um

    catlogo das informaes descritivas sobre os dados brutos como, por exemplo,

    seu contedo, abrangncia temporal e geogrfica, e qualidade, das publicaes

    dessa linha de pesquisa. O catlogo, proporcionar a ENSP oferecer

    comunidade cientfica interna e outras instituies, identificar quais dados brutos

    levantados em pesquisas j concludas possam contribuir com o desenvolvimento

    de novas pesquisas que tenham interesse nessa temtica.

  • 9

    3. REFERENCIAL TERICO

    O crescimento intenso das TICS mostra uma variedade de fontes de

    informao que modificam, ampliam e agilizam a habilidade de comunicao da

    informao em todo o universo da sociedade. Com isso, caminhos se abrem para

    favorecer a divulgao de resultados de pesquisas, para o mbito da cincia, das

    universidades e instituies correlatas (TOMAEL; SILVA, 2007). A internet surge

    como uma ponte de circulao de informao, que antes no existia pela

    dificuldade geogrfica, facilitando a divulgao e a recuperao dos trabalhos do

    campo cientfico.

    Sales e Sayo falam da importncia do livre acesso informao pelos

    repositrios institucionais, onde afirmam que os peridicos de acesso livre e os

    repositrios institucionais vm se constituindo uma alternativa vivel para que os

    resultados da pesquisa no pertenam somente ao cientista, e sim toda

    humanidade (SALES; SAYO, 2012, p.121).

    O repositrio institucional uma das vias para ampliar a divulgao do

    conhecimento dos trabalhos cientficos na sua forma de pesquisas consolidadas.

    Entretanto, podemos aumentar suas potencialidades divulgando os dados brutos

    que serviram como fundamentos dessas pesquisas.

    Disponibilizar os dados brutos de pesquisa aumentaria a possibilidade do

    seu reso acarretando em novas pesquisas e acelerando o processo de gerao

    de novos resultados.

    Seguindo esse entendimento, o conceito do acesso livre vai alm das

    publicaes tradicionais acadmicas como os artigos de peridicos e trabalhos

    acadmicos de teses e doutorados - um pilar de importncia crtica para a prtica

    de uma cincia aberta - no est somente nesses contedos, mas alm, na

    disponibilizao dos dados de pesquisas (SAYO; SALES, 2014).

    A ideia de explorar as potencialidades dos dados brutos vem de algumas

    dcadas e mostra que no uma vontade dos dias atuais. Esta iniciativa no

    to recente e ressaltada por Sales e Sayo quando lembram no mbito da

    pesquisa dos primatas, o tratamento dos dados que resultou em um catlogo

    impresso (SALES; SAYO, 2012).

  • 10

    O projeto Genoma, famoso por abrir seus dados comunidade cientfica e

    ao pblico possui um banco de dados chamado Genbank11 que guarda

    sequncias genticas de DNA. Este banco est disponvel no stio do National

    Center for Biotechnology Information.

    O movimento de acesso aberto ampliou as fronteiras e surgiram algumas

    novas bases de dados de trabalhos cientficos, como a PubMed12, a PLOS (Public

    Library of Science)13, a BioMed Central (BMC)14, mas com relevncia em

    publicaes de artigos, teses e dissertaes, sem os dados brutos das pesquisas

    cientficas.

    importante definir o que seriam "dados de pesquisas" ou "dados brutos"

    ou "dados cientficos15" que so citados em vrias bibliografias.

    A Organizao para a Cooperao Econmica e Desenvolvimento (OCDE)

    aponta que:

    [...] dados de pesquisa so definidos como registros factuais (nmeros, registros textuais, imagens e sons) utilizados como fontes primrias para a pesquisa cientfica, e que so geralmente aceitos na comunidade cientfica como necessrios para validar os resultados da pesquisa (OCDE, 2007, p.13).

    No relatrio do estado da arte de repositrios de dados cientficos de

    Portugal, Rodrigues et al. (2010, p. 48), definem dados cientficos como: "dados

    que so produzidos no contexto de investigao cientfica ou que de alguma

    forma so usados em investigao.

    Abbout (2008) define dados brutos como os que servem como fontes de

    pesquisas.

    Junto ao crescimento da cincia devido a investimentos pblicos na

    pesquisa e o avano das tecnologias da informao e sua capacidade de

    processamento e de armazenamento, cresce tambm o volume de dados digitais

    11 GenBank .Disponvel em: [Consultado em: 24 de agosto

    de 2015]

    12 http://www.ncbi.nlm.nih.gov/pubmed 13 https://www.plos.org/ 14 https://www.biomedcentral.com/

    http://h
  • 11

    oriundo dessas pesquisas. Entretanto, dados no esto sendo armazenados e

    disponibilizados para novas pesquisas. H uma imensa riqueza de dados de

    pesquisas que no esto sendo compartilhados. Os dados brutos so muitas

    vezes esquecidos em mdias pessoais e so perdidos pela obsolescncia

    tecnolgica e pela fragilidade inerente das mdias digitais (SALES; SAYO, 2012).

    Na maioria das vezes, estes dados no podem ser coletados novamente e

    por isso so sensveis em relao sua integridade. Caso sejam alterados,

    destrudos ou perdidos no podero ser aproveitados futuramente em novas

    pesquisas. Deve-se considerar que, so muitas as formas e tamanhos dos

    arquivos de dados nas diversas reas das pesquisas cientficas.

    Devemos nos preocupar em mant-los para assegurar que sejam

    novamente utilizados em novas pesquisas sem que o formato digital perca seu

    acesso, pois, alm de gerar novos dados digitais, os pesquisadores e os

    acadmicos, j h algum tempo, comearam a creditar toda a confiana nos

    contedos digitais criados por outros cientistas para dar prosseguimento aos seus

    empreendimentos (SALES; SAYO, 2012).

    Procter, Halfpenny e Voss (2012) alertam que esses dados de pesquisa

    no tero valor at que sejam gerenciados de forma a assegurar sua recuperao,

    acessibilidade e reso.

    Para Rodrigues et al. (2010), os prprios repositrios institucionais podem

    ser a soluo para que esses dados cientficos sejam armazenados e recuperados

    para uso em outras pesquisas.

    Sayo e Sales falam sobre a importncia de se estabelecer metodologias e

    preocupaes de garantir por muito tempo os formatos digitais dos dados de

    pesquisas que esto sendo gerados agora, de serem acessados, interpretados e

    reutilizados com a tecnologia corrente poca do acesso (SAYO; SALES, 2012).

    Rodrigues et al. (2010, p.11) afirmam que para se constiturem como

    verdadeiramente teis, os dados cientficos devem possuir estrutura e

    organizao. Os conjuntos de dados (datasets) so uma das unidades

    essenciais. E definem o que seriam conjuntos de dados: os conjuntos de dados

  • 12

    so colees de informaes ou fatos relacionados entre si e registrados num

    formato comum (RODRIGUES et al., 2010, p.11).

    O arquivamento persistente, a preservao digital, seguido de um modelo

    de preservao para registros cientficos, a grande questo para a rea de

    pesquisa. Sayo e Sales afirmam que:

    os conhecimentos e as prticas acumulados na ltima dcada em preservao digital e acesso resultaram num conjunto de estratgias, abordagens tecnolgicas e atividades que agora so coletivamente conhecidas como curadoria digital (SAYO e SALES, 2012, p.184).

    A curadoria digital cabe a gesto e a preservao dos recursos digitais para

    garantir o acesso s geraes atuais e futuras da comunidade cientfica e

    sociedade, sem perder a integridade e formatos digitais.

    O Digital Curator Centre (DCC)17, um centro de curadoria digital criado

    para resolver os desafios da curadoria digital. A pgina web deste centro descreve

    que a curadoria digital envolve a manuteno, a preservao e a agregao de

    valor a dados de pesquisa durante o seu ciclo de vida. Possui um modelo para o

    ciclo de vida dos dados que possui vrias aes necessrias para o sucesso do

    processo de curadoria e de preservao de dados de pesquisa. O Centro prope

    uma sequncia de aes do modelo de ciclo de vida da curadoria digital:

    conceituar; criar e receber; avaliar e selecionar; capturar; ao de preservao;

    armazenar; acessar, usar e reusar; transformar; eliminar; reavaliar; e migrar.

    Para a implementao de melhoras prticas da curadoria digital, todo

    processo deve ser de responsabilidade dos envolvidos. Muitas das decises

    tomadas desde o ponto de criao e em vrias outras fases do ciclo de vida

    sofrem impacto nos dados sobre a capacidade de utilizao de longa durao de

    objetos digitais. Portanto, vital que todos os que lidam com dados da pesquisa

    compreendam os seus vrios papis e responsabilidades em relao curadoria

    digital e preservao de dados. Na figura 1, tem-se a viso geral das funes e

    responsabilidades dos envolvidos na curadoria digital e preservao.

    17 http://www.dcc.ac.uk/

  • 13

    Figura 1: Habilidades primordiais para gesto de dados

    Traduzido da fonte: http://www.dcc.ac.uk/

    Sayo e Sales (2010, p. 184) reafirmam que "o foco da curadoria digital

    est na gesto por todo o ciclo de vida do material digital, de forma que ela

    permanea continuamente acessvel e possa ser recuperado por quem dele

    precise. No h como serem recuperados e acessados de forma rpida e fcil se

    no possurem os modelos de informaes, expressos por metadados, que so

    ferramentas importantes para que sigam com procedimentos de controle de

    autenticao (HIGGINS, 2011).

    Os usurios esperam que o acesso aos dados cientficos seja feito de

    forma rpida e segura. Barbosa e Sena (2006, p.2) afirmam que, "em geral, a

    necessidade de localizao e acesso rpido a dados especficos, dentro de

    grandes conjuntos de dados, comum, tornando relevante a documentao e a

    organizao dos acervos.

    Algumas instituies j adotam como soluo, o desenvolvimento de

    catlogos de dados, que presta servio de localizao a anlise de dados

    preliminar de conjuntos de dados (CALLAHAN; JONHSON, 1995). Como definio

    de catlogo de dados, Barbosa e Sena (2006, p.2) definem que os "catlogos de

  • 14

    dados so sistemas de armazenamento que contm informaes descritivas sobre

    os dados como, por exemplo, seu contedo, abrangncia temporal e geogrfica, e

    qualidade.

    Com o auxlio da internet, viabilizando a disseminao da informao, a

    tecnologia de banco de dados tem crescido em diversas reas de aplicaes e,

    com a utilizao de recursos especficos, agrega funcionalidades. Mas, para que

    dados cientficos possam estar em bases de dados com a possibilidade do acesso

    mundialmente, instituies tem se preocupado com a padronizao do contedo

    do que ser disponibilizado.

    A utilizao de um padro de metadados18 permite que a definio de uma

    terminologia para um dado, seja descrita de forma nica por diferentes

    instituies.

    Neste sentido, em Londres, no dia 1 de dezembro de 2009, foi fundada a

    DATACITE19, uma organizao sem fins lucrativos e com o objetivo de

    estabelecer um acesso mais fcil aos dados de pesquisa na internet, aumentar a

    aceitao de dados de pesquisa como legtima, contribuies citveis para o

    registro acadmico e arquivamento de dados de apoio que ir permitir resultados

    a serem verificados e propostos para futuros estudos.

    A DATACITE oferece vrios servios e ferramentas. Porm, a ideia

    principal a citao de dados. Acredita-se que livros e artigos de revistas tem se

    beneficiado de uma infraestrutura que torna fcil de citar, possuem elementos-

    chaves no processo de pesquisa, como ttulo e autor. Acreditam que devem citar

    dados da mesma maneira que citam essas fontes de informao.

    A citao de dados pode auxiliar na reutilizao e verificao de dados,

    permitindo maximizar o impacto de dados a serem rastreados e ainda na criao

    de uma estrutura acadmica que reconhece e recompensa os produtores de

    dados.

    18 Metadados, ou Metainformao, so dados sobre outros dados. Disponvel em

    http://pt.wikipedia.org/wiki/Metadados

    19 https://www.datacite.org/

    http://hhttp://h
  • 15

    Alm disso, outro servio importante a localizao de repositrios de

    dados, atravs do reg3data.org20, onde sero depositados os conjuntos de dados.

    O reg3data.org um registro global de repositrios de dados de pesquisa que

    abrange repositrios de dados de pesquisas de diferentes disciplinas acadmicas.

    Ele apresenta repositrios para o armazenamento permanente e ao acesso dos

    conjuntos de dados para pesquisadores, rgos de financiamento, editores e

    instituies acadmicas. A principal ideia desse site promover uma cultura de

    compartilhamento, aumentar o acesso e promover a visibilidade dos dados de

    pesquisa.

    A facilidade da recuperao dos dados atravs dos repositrios de dados

    que se pode encontrar atravs do reg3data.org, est basicamente ligada a

    importncia de um padro de metadados. A comunidade cientfica j aponta a

    utilizao de metadados como soluo adequada para garantir os servios de

    recuperao mais eficiente e preciso sobre a web (MOURA; CAMPOS, 2002),

    proporcionando a troca de informaes entre integrao e fontes digitais

    heterogneas. Alguns padres de metadados foram criados e adaptados para

    atender as necessidades dos usurios em descrever recursos especficos, so

    eles: MARC, EAD, TEI, GIRLS, SOIF, Dublin Core (DC), IAFA dentre outros.

    Barbosa e Sena (2006, p.4) ressaltam que "o padro desenvolvido pelo

    DublinCore Metadata Initiative (DCMI) contm um conjunto especializado de

    expresses para descrio dos recursos eletrnicos a partir da Internet".

    Entretanto para catalogao de metadados especficos, o DCMI no fornece

    elementos suficientes, pois os dados podem possuir caractersticas particulares

    que seus elementos no possuem.

    Para exemplificar que o padro de metadados deva ser especfico,

    ressalta-se que o Government Information Locator Service (GILS) possui a

    finalidade de catalogar especificamente informaes governamentais. Alm desse,

    h o padro utilizado para bibliotecas digitais, Bibliographic-1 (BIB-1), que serve

    para cadastrar informaes de dados bibliogrficos, e o Geographic Data Commite

    20 http://www.re3data.org/

    http://hhttp://h
  • 16

    (FGDC), especfico para dados geo-espaciais, que descreve dados vetoriais e

    pontuais.

    Os dados de pesquisas precisam primeiramente estar bem representados e

    organizados na web por bibliotecas, repositrios e arquivos digitais, garantindo a

    integridade e autenticidade de seus materiais digitais e a informao recuperada.

    Com os catlogos de dados (CD) como sistemas para informar as

    descries dos conjuntos de dados e indicar as suas localizaes (BARBOSA;

    SENA, 2006), tem como fator chave a anlise dos dados e a possibilidade dos

    usurios determinarem, se querem adquiri-los para uso de novas pesquisas

    cientficas.

    A fim de que os catlogos de dados sejam utilizados fortemente preciso

    que as instituies documentem todos os conjuntos de dados de seus acervos. De

    acordo com Callahan e Johnson (1995), seis fatores chaves devem ser

    considerados durante o processo de desenvolvimento desses sistemas (CD): a

    Completude para que as instituies faam a documentao de todos os

    conjuntos de dados de seus acervos; a Facilidade de utilizao a fim de se

    promover treinamentos extensivos para a utilizao de um sistema; a Coerncia

    das informaes para que o contedo dos CD deve ser determinado

    criteriosamente por quem classifica os dados, uma vez que sua utilidade depende

    da relevncia das informaoes que so retornadas pelas consultas; a Preciso

    est relacionada ao fato de que o CD deve ser preciso e evitar descries

    incompletas, que podem acarretar baixa credibilidade; pois muitos usurios

    acessam um CD para teste de veracidade das informaes armazenadas; a

    Disponibilidade a facilidade de acesso a partir das redes de computadores que

    deve permitir que qualquer usuario dentro das instituioes possa ter acesso s

    informaes dos CD; e por fim devem Serem Pblicos, pois as pessoas devem

    saber que estes sistemas existem, entender que devem ser utilizados e aplica-los

    em benefcio do desenvolvimento de seus trabalhos.

    Barbosa e Sena (2006, p.6) explicam que um dos objetivos destes

    sistemas viabilizar o acesso e a localizao dos conjuntos de dados de maneira

  • 17

    rapida e facil. Os conjuntos de dados possuem diferentes tipos de informao e,

    com isso, os CD devem ser flexveis para suportar as variaes.

    Uma mudana de conceitos, reestruturao organizacional, aprendizagem

    e planejamento nas instituies, so itens que incorporam no processo de

    descrio ou catalogao de dados, no apenas uma questo tecnolgica. Esse

    processo, no que diz respeito a dados cientficos, a importncia dada na

    utilizao de metadados para documentar.

    A partir dessas questes, possibilitar disponibilizar e ampliar novos

    estudos cientficos com compartilhamento e acesso livre a toda comunidade

    cientfica.

  • 18

    3. OBJETIVOS

    Objetivo geral

    Organizar os dados brutos dos trabalhos cientficos da linha de pesquisa

    Gesto Ambiental e Sade do programa Sade Pblica e Ambiente produzidos

    pela ENSP de modo a possibilitar o reso dos mesmos.

    Objetivos especficos

    Identificar os tipos de dados dos trabalhos cientficos da linha de

    pesquisa Gesto Ambiental e Sade do programa Sade Pblica e

    Ambiente.

    Definir os metadados necessrios para representar os conjuntos de

    dados brutos da pesquisa.

    Organizar os conjuntos de dados brutos em um catlogo utilizando o

    padro de metadados definidos no item anterior.

  • 19

    4. METODOLOGIA

    Segundo a classificao proposta por Tobar e Yalour (2004) a metodologia

    proposta de cunho qualitativo e consistir na realizao de uma pesquisa de

    natureza exploratria. A escolha por essa metodologia se deve ao fato da

    inexistncia de estudos sobre este tema abordando a instituio escolhida.

    Sendo assim, de sorte a atender ao objetivo de identificar os tipos de

    dados dos trabalhos cientficos da linha de pesquisa Gesto Ambiental e

    Sade do programa Sade Pblica e Ambiente ser necessrio analisar o

    contedo dos trabalhos cientficos, optando-se pela anlise categorial ou temtica,

    na tentativa de identificar e classificar sobre a semntica dos dados coletados.

    A anlise categorial ou temtica descrita pela autora Oliveira (2008)

    como sendo o que permite a explorao do material analisado a partir da

    observao de diferentes elementos presentes no texto, bem como conduzem a

    resultados distintos em termos de compreenso da mensagem.

    Inicialmente ser feito o levantamento dos trabalhos cientficos referentes

    aos pesquisadores da linha de pesquisa Gesto em Sade e Ambiente da Escola

    de Sade Pblica Srgio Arouca. A relao dos pesquisadores dessa linha de

    pesquisa ser capturada atravs do acesso a plataforma Lattes cujo a consulta a

    base ser pela parametrizao do nome da linha de pesquisa e pesquisadores.

    De posse da lista com os nomes dos pesquisadores vinculados referida

    linha de pesquisa, sero identificados, inicialmente, os trabalhos cientficos

    depositados no repositrio institucional (RI) da Fiocruz (ARCA).

    A escolha do RI ARCA se d ao fato da instituio possuir uma poltica

    mandatria de depsito em bases de acesso aberto das pesquisas de

    pesquisadores da Fiocruz cujo o investimento recebido para o desenvolvimento

    das mesmas originado de fontes pblicas de financiamento.

    Outra base utilizada ser o repositrio temtico ENSP, pois esta Unidade

    possui os artigos cientficos publicados por pesquisadores da casa utilizando o

    procedimento de auto arquivamento.

  • 20

    Embora os depsitos cientficos PUBMED, Scielo e BVS abriguem uma

    srie de peridicos de acesso aberto e de grande importncia, por este trabalho

    se tratar de um projeto piloto, estes no sero consultados.

    De posse deste levantamento, sero armazenados os trabalhos cientficos

    em uma planilha Excel, sem duplicidades.

    Em seguida, na lista ser analisada o contexto da pesquisa, de acordo com

    a semntica, e classificados em grupos a partir da leitura dos resumos e palavras

    chaves.

    Aps a classificao dentro dos grupos listados acima, os artigos sero

    lidos integralmente com o objetivo de identificar quais os tipos de dados que

    serviram como instrumentos cientficos.

    Para atingir o segundo objetivo especfico de definir os metadados

    necessrios para representar os dados brutos da pesquisa ser realizado,

    inicialmente, a identificao dos metadados utilizados pelo registro de repositrios

    de dados de pesquisa reg3data21.org, em trs repositrios de dados brutos:

    Harvard Dataverse ,Washington State University Data Center Dataverse e Russia

    Longitudinal Monitoring Survey Dataverse, verificando similaridades semntica

    destes metadados, ou seja, se o significado do metadado em um repositrio

    possui o mesmo significado em outro repositrio. Ser criada uma tabela contendo

    o nome do metadado e seu significado.

    Entretanto, para verificar quais destes metadados so pertinentes para esta

    linha de pesquisa, buscar-se- agrupar os tipos de dados encontrados e relacion-

    los com os metadados descritos na tabela.

    Por fim, organizar os conjuntos de dados com a um catlogo de dados

    utilizando o padro de metadados definidos no item anterior, que ser

    construdo na ferramenta open source WordPess ou Joomla - Gerenciador de

    contedo, por ser software livre e atende requisitos de arquitetura de informao

    organizada por categorias, que facilitar buscas parametrizadas. Os conjuntos de

    dados disponibilizados estaro nos formatos de arquivos: CSV, HTML, TXT,PDF,

    21 http://www.re3data.org/

  • 21

    XLS, entre outros. E ainda, estaro acompanhados com metadados associados e

    acesso de links de URL.

    Para recuperar os conjuntos de dados, o usurio poder optar por filtros de

    pesquisas nos vrios tipos disponveis para buscas, tais como: tpicos, categorias,

    tipo de conjunto de dados, tags, formatos, tipo de organizao e autor. Dessa

    forma, podero consultar os conjuntos de dados com vrias informaes

    agregadas acompanhados com os metadados definidos. Ao acessar, o conjunto

    de dados escolhido, poder ainda, obter informaes da descrio do conjunto de

    dados, acesso e uso da informao, recursos(dados) e download e informaes

    de metadados.

    O sistema de Catlogo de dados estar disponvel no Portal da ENSP a fim

    de divulgar os dados brutos, a localizao para o acesso, uso e reso e servir

    ainda, de estmulo a promoo cientfica dos dados brutos de pesquisas para as

    outras linhas de pesquisas da prpria ENSP, e outras unidades da Fiocruz.

    Essa proposta piloto de catlogo de dados foi inspirado no site A casa de

    dados aberto do Governo EUA22.

    22 http://www.data.gov/

    http://www.data.gov/
  • 22

    5. RESULTADOS ESPERADOS

    Considerando a ENSP uma unidade da Fiocruz que atua em pesquisa cientfica

    na rea de sade pblica e que busca ampliar o acesso pleno de seu

    conhecimento a toda sociedade, espera-se que este projeto (i) amplie as

    possibilidades de anlises em dados j coletados, (ii) diminua o gasto com coletas

    de dados que j tenham sido coletados, (iii) diminua o tempo nas coletas de dados

    para pesquisas complementares s j realizadas.

  • 23

    REFERNCIAS

    ABBOTT, D. "What is Digital Curation?". DCC Briefing Papers: Introduction to Curation.

    Edinburgh: Digital Curation Centre. Handle: 1842/3362. Disponvel em:

    Consultado em: 31 ago.

    2015.

    BAPTISTA, A.A.;COSTA, S. M. de S.;KURAMOTO; H. R., E. Comunicao cientfica : o papel

    da Open Archives Initiative no contexto do acesso livre. Disponvel

    em:http://repositorio.unb.br/handle/10482/635. Consultado em: 07 out. 2015.

    BARBOSA, E.B.M.; SENA, G. J. de. Um Banco de Metadados para Auxiliar a Disseminao

    de Dados Cientficos em Instituies de Pesquisas. Disponvel em:

    Consultado em: 17 set. 2015.

    BENCHIMOL, A.; GUERRA, C.; CHALHUB, T. Acesso Livre Via Repositrios: Politicas De

    Instituies Brasileiras.

    Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities. Berlin; 2003. Disponvel em:< http://openaccess.mpg.de/Berlin-Declaration>. Consultado em: 18 Ago. 2015.

    CALLAHAN, S.D.;JONHSON, B.D., 1995: Scientific Data Set Catalogues. Proceedings of

    Second AGSO Forum on GIS in the Geosciences, Canberra, ACT, 29-31pp. Consultado

    em: 17 set. 2015.

    HIGGINS, S. Digital Curation: the emergence of a new discipline. The International Journal of

    Digital Curation, v.6, n. 2, 2011. Disponvel em:

    Consultado em: 17 set.2015.

    KURAMOTO(2008). Disponivel:http://kuramoto.files.wordpress.com/2008/09/manifesto-sobre-o-

    acesso-livre-a-informacao-cientifica.pdf. Consultado em: 24 ago. 2015 .

    http://hhttp://hhttp://hhttp://hhttp://hhttp://hhttp://hhttp://h
  • 24

    KURAMOTO,H. Acesso livre informao cientfica: novos desafios. Disponvel em

    :. Consultado em: 07 de

    out. de 2015.

    LEITE, F. C. L. et al. Como gerenciar e ampliar a visibilidade da informao cientfica brasileira:

    repositrios institucionais de acesso aberto. Fernando Csar Lima Leite, 2009.

    MOURA, A.M.C.; CAMPOS, M.L.M., 2002: A Metadata Approach to Manage And Organize

    Electronic Documents And Collections On The Web. Journal of the Brazilian Computer

    Society. V.1, N.8, p 16.

    MEDRI, W.2011: Anlise Exploratria De Dados, p.13. Disponvel em:

    OCDE. OECD Principles and Guidelines for Access to Research Data from Public Funding.

    Paris: OCDE, 2007. Disponvel em: < http://www.oecd.org/sti/sci-tech/38500813.pdf>. Consultado

    em: 15 set. 2015.

    OLIVEIRA, DC. Anlise de contedo temtica: uma proposta de operacionalizao. Texto

    didtico e instrumentos. Rio de Janeiro: Universidade do Estado do Rio de Janeiro; 2004

    POLTICA E REPOSITRIO DA ENSP OBTM REGISTRO INTERNACIONAL. Disponvel em:

    . Acesso em: 18 nov.

    2015.

    PROCTER, R.; HALFPENNY, P.VOSS, A.. Research data management: opportunities and

    challenges for HEIs. In: PRYOR, Graham (Org.). Managing research data. Londres: Facet

    Publishing, 2012. Chapter 7, p. 135-150.

    SALES, L. F.; SAYAO, L. F. Curadoria Digital: um novo patamar para preservao de dados

    digitais de pesquisa. Disponvel em:

    Consultado em : 17 set. 2015.

    http://hhttp://www.uel.br/pos/estatisticaquantitativa/textos_didaticos/especializacao_estatistica.pdfhttp://hhttp://h
  • 25

    SALES, L. F.; SAYAO, L. F.. O impacto da curadoria digital dos dados de pesquisa na

    comunicao cientfica. Disponvel em . Consultado em :24 ago. 2015.

    STUMPF,,Ida; Machado, Denise Ramires. Estudo comparativo entre dois diretrios para

    seleo de repositrios de dados de pesquisa:OPENDOAR e DATABIB.

    XIV Encontro Nacional de Pesquisa em Cincia da Informao (ENANCIB 2013) GT 7: Produo e

    Comunicao da Informao em CT&I. Disponvel em

    . Consultado em:

    14 set. 2015.

    YAMAOKA, E. J. Ontologia para mapeamento da dependncia tecnolgica de objetos digitais

    no contexto da curadoria e preservao digital. AtoZ, Curitiba, v. 1, n. 2, p. 65- 78, jan./dez.

    2012.

    SEMINRIO INTERNACIONAL DE ACESSO LIVRE AO CONHECIMENTO: IMPACTOS NA

    PRODUO ACADMICA, DIVULGAO CIENTFICA E INOVAO NO ENSINO, 1., 2011.

    Disponvel em: .

    Acesso em: 18 nov. 2015.

    TOBAR, F.; YALOUR, M.. Como fazer teses em sade pblica. Rio de Janeiro: Fiocruz, 2004.

    TOMA,M. I.;SILVA,T. E. VIII ENANCIB Encontro Nacional de Pesquisa em Cincia da

    Informao 28 a 31 de outubro de 2007 Salvador Bahia Brasil. Disponvel em

    Consultado em: 15 set. 2015.

    http://hhttp://h
  • 26

    CRONOGRAMA

    Etapas \ Quant.Ms 01 02 03 04 05 06 07

    Recuperar das fontes especficas os trabalhos cientficos da linha de pesquisa Gesto de Sade e Ambiente

    x x

    Analisar e Identificar os tipos de dados dos trabalhos cientficos recuperados

    x x

    Classificar em conjuntos de dados os tipos de dados identificados

    x x

    Organizar os conjuntos de dados em um catlogo de dados

    x x

  • 27

    ORAMENTO

    O clculo oramentrio no se aplica a este projeto, visto que as aes

    executadas sero inseridas no processo de trabalho dos envolvidos. Este projeto

    est em conformidade com as diretrizes que a ENSP tem como ampliar a

    disseminao das informaes em sade pblica atravs de poltica de divulgao

    cientfica em consonncia com o paradigma do acesso livre informao, que

    fomente o compartilhamento do conhecimento entre alunos e pesquisadores,

    comunidade cientfica e a sociedade;