Michelli costa. slides a visibilidade no gs dos rd. 2014

Post on 25-Jul-2015

109 views 2 download

Transcript of Michelli costa. slides a visibilidade no gs dos rd. 2014

A VISIBILIDADE NO GOOGLE SCHOLAR DOS REPOSITÓRIOS DIGITAIS DE ACESSO ABERTO

BRASILEIROS E PORTUGUESES

Michelli Costa Universidade de Brasília

michellicosta11@gmail.com

Introdução

BOAI (2002)

• Propõem como estratégico o depósito, pelos próprios acadêmicos, dos artigos publicados por revistas arbitradas, em arquivos abertos e eletrônicos, que mais tarde foram nomeados de repositório digitais.

• Orienta para que os repositórios estejam em conformidade com as recomendações Open Archives Initiative (OAI), de modo que possam ter seu conteúdo localizado por motores de busca na Internet.

2

Michelli Costa

Introdução

Estudo de Arlitsch e O’Brien (2012)

• Pesquisa sobre a visibilidade dos repositórios dos Estados Unidos da América

• Identificou que eles possuíam baixas taxas de indexação no Google Scholar.

3

Michelli Costa

Introdução

Orduña-Malea e López-Cózar (2014)

• Destacam a importância dos repositórios para o acesso aberto e citam o trabalho de Archambault no qual constatou que 75% dos artigos disponíveis em acesso aberto na Internet estão nessa condição por meio dos repositórios e não pelas próprias revistas.

• Realizaram um estudo para determinar a visibilidade e o impacto no Google e no Google Scholar dos repositórios institucionais da América Latina listados no Ranking Web of Repositories.

• Como um dos resultados, identificaram uma baixa quantidade de arquivos PDF coletados pelo Google Scholar.

4

Michelli Costa

Problema da pesquisa

Qual a taxa de visibilidade no Google Scholar dos repositórios

brasileiros e portugueses listados pelo Ranking Web of Repositories?

5

Michelli Costa

Metodologia

1º Passo

• Seleção do universo de análise, que utilizou como fonte de informação o Ranking Web of Repositories.

• O Ranking Web of Repositories é o instrumento de avaliação de impacto na web com maior alcance para o contexto dos repositórios (López-Cózar e Robinson-Garcia, 2012).

• Além do impacto o Ranking também avalia a indexação de documentos por motores de busca e a quantidade de links externos (Aguillo et al, 2010).

6

Michelli Costa

Metodologia

2º Passo

• Levantamento da quantidade total de documentos disponíveis em cada repositório.

• As informações foram identificadas nos índices de “Títulos” disponíveis nos sistemas, quando aplicável.

• Nos sistemas que não dispunham desta funcionalidade foram pesquisadas as estatísticas sobre a quantidade de documentos informada pelos próprios sistemas.

7

Michelli Costa

Metodologia

3º Passo

• Identificação da quantidade total dos documentos nos repositórios recuperados pelo Google Scholar.

• Busca simples no Google Scholar.

[site:urldorepositório]

8

Michelli Costa

Metodologia

4º Passo

• Cálculo da taxa de visibilidade (TI) no Google Scholar dos repositórios selecionados.

9

Michelli Costa

Metodologia

5º Passo

• Elaboração dos rankings sobre os três aspectos analisados.

• O conjunto destes resultados permitiu uma análise descritiva e estatística dos resultados.

10

Michelli Costa

Repositórios digitais brasileiros e portugueses

Ranking Web of Repositories • Levantamentos nos dois principais diretórios internacionais de

repositórios: OpenDOAR e Registry for Open Access Repositories (ROAR).

• Exclusão dos repositórios sem conteúdo acadêmico, portais de periódicos e repositórios que não possuem domínio ou subdomínios próprios.

• Uso de indicadores gerados a partir de motores de busca para sua avaliação

• Tamanho – número de páginas recuperadas no Google;

• Visibilidade – número de links externos recebidos;

• Arquivos ricos – quantidade de arquivos nos formatos .pdf, .doc, .docx, .ppt, .pptx, .ps, .eps recuperados no Google;

• Google Scholar – número de artigos publicados entre 2007 e 2011.

11

Michelli Costa

Repositórios digitais brasileiros e portugueses • Na lista dos repositórios brasileiros foram apresentados 45

sistemas, mas três foram excluídos da análise.

• Na lista portuguesa identificou-se 41 repositórios e foram excluídos quatro.

12

Michelli Costa

Repositórios digitais brasileiros e portugueses • Os repositórios foram brevemente caracterizados segundo a

natureza dos seus documentos e o software utilizado.

Natureza dos documentos

• Três categorias de classificação:

• “repositório institucional” - sistemas que apresentavam exclusivamente a produção científica de sua instituição;

• “repositório digital” - sistemas que armazenavam, além da produção científica, documentação administrativas e de outras naturezas não-acadêmicas;

• “repositório de teses e dissertações” - sistemas que se limitavam ao tratamento deste tipo de documento. 13

Michelli Costa

Repositórios digitais brasileiros e portugueses • Caracterização dos repositórios brasileiros segundo a natureza

dos documentos.

14

53% 33%

14%

repositório institucional (22)

repositório digital (14)

repositório de teses e dissertações (6)

Total: 42 repositórios

Michelli Costa

Repositórios digitais brasileiros e portugueses • Caracterização dos repositórios portugueses segundo a

natureza dos documentos.

15

89%

11%

repositório institucional (33) repositório digital (4)

Total: 37 repositórios

Michelli Costa

Repositórios digitais brasileiros e portugueses • Caracterização dos repositórios brasileiros segundo o software

utilizado.

16

Total: 42 repositórios

76%

7%

12% 5%

DSpace (32) TEDE (3) Nou-Raw (5) Outro (2)

Michelli Costa

Repositórios digitais brasileiros e portugueses • Caracterização dos repositórios portugueses segundo o

software utilizado.

17

Total: 42 repositórios

97%

3%

DSpace (36) Digitool (1)

Michelli Costa

Indexação dos repositórios brasileiros e portugueses

18

Michelli Costa

Quantidade de documentos disponíveis nos repositórios Brasil

19

Total: 603.694 documentos

17%

11%

9%

9% 8%

46%

Repositório Digital Universidade Federal do Rio Grande do Sul LUME (99.632)

Repositório Institucional UNESP Universidade Estadual Paulista Júlio de Mesquita Filho (69.382)

Biblioteca Digital da UNICAMP Universidade de Campinas (56.257)

Alice Repository Open Access to Scientific Information Embrapa (51.981)

Repositório Institucional Universidade Federal de Santa Catarina (50.340)

Outros repositórios (276.102)

Michelli Costa

Quantidade de documentos disponíveis nos repositórios Portugal

20

Total: 212.422 documentos

16%

13%

8%

6% 6%

51%

Repositório Aberto Universidade do Porto (33.504)

Universidade do Minho Repositorium (28.201)

Estudo Geral Repositório Digital da Universidade de Coimbra (16.915)

Repositório Institucional Universidade Católica Portuguesa Veritati (12.372)

Repositorio Biblioteca da Faculdade de Engenharia da Universidade do Porto (12.177)

Outros repositórios (109.253)

Michelli Costa

Quantidade de documentos recuperados pelo Google Scholar Brasil

21

27%

16%

15%

11%

8%

23%

Repositório Digital Universidade Federal do Rio Grande do Sul LUME (75.600)

Universidade de São Paulo Biblioteca Digital de Teses e Dissertações (44.000)

Repositório Institucional Universidade Federal de Santa Catarina (43.600)

Alice Repository Open Access to Scientific Information Embrapa (30.100)

Biblioteca Digital da UNICAMP Universidade de Campinas (22.500)

Outros repositórios (66.429)

Total: 282.229 documentos

Michelli Costa

Quantidade de documentos recuperados pelo Google Scholar Portugal

22

Total: 144.281 documentos

20%

14%

7% 7% 6%

46%

Repositório Aberto Universidade do Porto (28.100)

Universidade do Minho Repositorium (20.400)

Repositório Institucional Universidade Católica Portuguesa Veritati (10.200)

Repositório Institucional da Universidade de Aveiro RIA (9.390)

Repositório Universidade de Lisboa (9.190)

Outros repositórios (67.001)

Michelli Costa

Taxa de indexação dos repositórios no Google Scholar

23

Michelli Costa

Taxa de indexação dos repositórios no Google Scholar

24

Michelli Costa

Discussão e considerações finais • Confirmaram do problema apontado por Arlitsch e O’Brien

(2012) e por Orduña-Malea e López-Cózar (2014).

• A maioria dos repositórios brasileiros e portugueses obtiveram taxa de indexação superior a 50%.

• Portugal teve, relativamente, mais repositórios (21%) com nota superior a 50% de taxa de indexação.

• Em Portugal, 90% dos repositórios tratavam exclusivamente da produção científica de suas instituições, enquanto que no Brasil esta proporção é de apenas 65%.

25

Michelli Costa

Discussão e considerações finais Outros fatores

• Problemas de configuração do sistema - Arlitsch e O’Brien (2012).

• Uso do padrão do metadado Dublin Core por pelo menos 86% dos repositórios – repositórios que utilizam o software DSpace.

• Resultados contraditórios apresentados pelos próprios buscadores - Orduña-Malea e López-Cózar (2014).

26

Michelli Costa

Discussão e considerações finais Taxa de indexação foi superior a 100%

• Hipóteses sobre este problema:

1. Exclusão de documentos do repositório, que pode se manter na base, dependendo do método utilizado;

2. Período necessário para o Google Scholar atualizar sua própria base com a situação real dos repositórios.

3. Buscador indexa não só os documentos depositados, mas qualquer página do repositório, conforme apontado por Ordunã-Malea e López-Cózar.

• A questão extrapola a discussão proposta por este estudo e por isso não foi explorada.

27

Michelli Costa

Discussão e considerações finais Tendência de 5 x 50

• Tendência de distribuição dos documentos por países.

• Os cinco repositórios com as maiores quantidades reúnem 50% do total de documentos.

• Tanto em Brasil quanto em Portugal.

• A tendência foi observada nos dois aspectos observados:

• Quantidade total de documentos no repositório;

• Quantidade de documentos recuperados pelo Google Scholar.

28

Michelli Costa

Discussão e considerações finais • Os resultados desse estudo demonstraram que a maioria dos

repositórios brasileiros e portugueses apresenta boa taxa de indexação no Google Scholar.

• Alguns dos repositórios mais expressivos em quantidade de documentos podem aumentar consideravelmente a quantidade de documentos indexados pelo Google Scholar, ampliando ainda mais sua visibilidade na Internet.

• “Repositório Digital Universidade Federal do Rio Grande do Sul LUME”;

• “Repositório Aberto Universidade do Porto”. 29

Michelli Costa

Referências AGUILLO, I. F., ORTEGA, J. L., FERNÁNDEZ, M., & UTRILLA, A. M. (2010) - Indicators for a webometric ranking of open access repositories. Scientometrics, Vol 82, Nº 3. [Consult. 1 Set. 2014]. Disponível na Internet: doi:10.1007/s11192-010-0183-y.

ARLITSCH, K.; O’BRIEN, P. (2012) - Invisible institutional repositories: addressing the low indexing ratios of IRs in Google. Library Hi Tech, Vol 30, Nº 1, p. 60-81.

BOAI (2002) - Budapest Open Access Initiative. Budapeste. [Consult. 1 Set. 2014]. Disponível na Internet: http://www.opensocietyfoundations.org/openaccess/read

LÓPEZ-CÓZAR, E. D, & ROBINSON-GARCÍA, N. (2012) - Repositories in google scholar metrics or what is this document type doing in a place as such? Cybermetrics, Vol 16, Nº 1. [Consult. 1 Set. 2014]. Disponível na Internet: http://hdl.handle.net/10481/22019.

ORDUÑA-MALEA, E., & LÓPEZ-CÓZAR, E. D. (2014) - The dark side of open access in Google and Google Scholar: the case of Latin-American repositories. Scientometrics, Vol 1, Nº 18. [Consult. 1 Jul. 2014]. Disponível na Internet: doi:10.1007/s11192-014-1369-5.

RUSSEL, I. (2011) - La visibilidad de los recursos académicos. Una revisión crítica del papel de los repositorios institucionales y el acceso abierto. Investigación Bibliotecológica, Vol 25, Nº 53. [Consult. 1 Jul. 2014]. Disponível na Internet: http://www.scielo.org.mx/pdf/ib/v25n53/v25n53a7.pdf

30

Michelli Costa

Obrigada!

31

Michelli Costa Universidade de Brasília

michellicosta11@gmail.com

Michelli Costa