Michelli costa. slides a visibilidade no gs dos rd. 2014

31
A VISIBILIDADE NO GOOGLE SCHOLAR DOS REPOSITÓRIOS DIGITAIS DE ACESSO ABERTO BRASILEIROS E PORTUGUESES Michelli Costa Universidade de Brasília [email protected]

Transcript of Michelli costa. slides a visibilidade no gs dos rd. 2014

Page 1: Michelli costa. slides  a visibilidade no gs dos rd. 2014

A VISIBILIDADE NO GOOGLE SCHOLAR DOS REPOSITÓRIOS DIGITAIS DE ACESSO ABERTO

BRASILEIROS E PORTUGUESES

Michelli Costa Universidade de Brasília

[email protected]

Page 2: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Introdução

BOAI (2002)

• Propõem como estratégico o depósito, pelos próprios acadêmicos, dos artigos publicados por revistas arbitradas, em arquivos abertos e eletrônicos, que mais tarde foram nomeados de repositório digitais.

• Orienta para que os repositórios estejam em conformidade com as recomendações Open Archives Initiative (OAI), de modo que possam ter seu conteúdo localizado por motores de busca na Internet.

2

Michelli Costa

Page 3: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Introdução

Estudo de Arlitsch e O’Brien (2012)

• Pesquisa sobre a visibilidade dos repositórios dos Estados Unidos da América

• Identificou que eles possuíam baixas taxas de indexação no Google Scholar.

3

Michelli Costa

Page 4: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Introdução

Orduña-Malea e López-Cózar (2014)

• Destacam a importância dos repositórios para o acesso aberto e citam o trabalho de Archambault no qual constatou que 75% dos artigos disponíveis em acesso aberto na Internet estão nessa condição por meio dos repositórios e não pelas próprias revistas.

• Realizaram um estudo para determinar a visibilidade e o impacto no Google e no Google Scholar dos repositórios institucionais da América Latina listados no Ranking Web of Repositories.

• Como um dos resultados, identificaram uma baixa quantidade de arquivos PDF coletados pelo Google Scholar.

4

Michelli Costa

Page 5: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Problema da pesquisa

Qual a taxa de visibilidade no Google Scholar dos repositórios

brasileiros e portugueses listados pelo Ranking Web of Repositories?

5

Michelli Costa

Page 6: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Metodologia

1º Passo

• Seleção do universo de análise, que utilizou como fonte de informação o Ranking Web of Repositories.

• O Ranking Web of Repositories é o instrumento de avaliação de impacto na web com maior alcance para o contexto dos repositórios (López-Cózar e Robinson-Garcia, 2012).

• Além do impacto o Ranking também avalia a indexação de documentos por motores de busca e a quantidade de links externos (Aguillo et al, 2010).

6

Michelli Costa

Page 7: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Metodologia

2º Passo

• Levantamento da quantidade total de documentos disponíveis em cada repositório.

• As informações foram identificadas nos índices de “Títulos” disponíveis nos sistemas, quando aplicável.

• Nos sistemas que não dispunham desta funcionalidade foram pesquisadas as estatísticas sobre a quantidade de documentos informada pelos próprios sistemas.

7

Michelli Costa

Page 8: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Metodologia

3º Passo

• Identificação da quantidade total dos documentos nos repositórios recuperados pelo Google Scholar.

• Busca simples no Google Scholar.

[site:urldorepositório]

8

Michelli Costa

Page 9: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Metodologia

4º Passo

• Cálculo da taxa de visibilidade (TI) no Google Scholar dos repositórios selecionados.

9

Michelli Costa

Page 10: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Metodologia

5º Passo

• Elaboração dos rankings sobre os três aspectos analisados.

• O conjunto destes resultados permitiu uma análise descritiva e estatística dos resultados.

10

Michelli Costa

Page 11: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Repositórios digitais brasileiros e portugueses

Ranking Web of Repositories • Levantamentos nos dois principais diretórios internacionais de

repositórios: OpenDOAR e Registry for Open Access Repositories (ROAR).

• Exclusão dos repositórios sem conteúdo acadêmico, portais de periódicos e repositórios que não possuem domínio ou subdomínios próprios.

• Uso de indicadores gerados a partir de motores de busca para sua avaliação

• Tamanho – número de páginas recuperadas no Google;

• Visibilidade – número de links externos recebidos;

• Arquivos ricos – quantidade de arquivos nos formatos .pdf, .doc, .docx, .ppt, .pptx, .ps, .eps recuperados no Google;

• Google Scholar – número de artigos publicados entre 2007 e 2011.

11

Michelli Costa

Page 12: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Repositórios digitais brasileiros e portugueses • Na lista dos repositórios brasileiros foram apresentados 45

sistemas, mas três foram excluídos da análise.

• Na lista portuguesa identificou-se 41 repositórios e foram excluídos quatro.

12

Michelli Costa

Page 13: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Repositórios digitais brasileiros e portugueses • Os repositórios foram brevemente caracterizados segundo a

natureza dos seus documentos e o software utilizado.

Natureza dos documentos

• Três categorias de classificação:

• “repositório institucional” - sistemas que apresentavam exclusivamente a produção científica de sua instituição;

• “repositório digital” - sistemas que armazenavam, além da produção científica, documentação administrativas e de outras naturezas não-acadêmicas;

• “repositório de teses e dissertações” - sistemas que se limitavam ao tratamento deste tipo de documento. 13

Michelli Costa

Page 14: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Repositórios digitais brasileiros e portugueses • Caracterização dos repositórios brasileiros segundo a natureza

dos documentos.

14

53% 33%

14%

repositório institucional (22)

repositório digital (14)

repositório de teses e dissertações (6)

Total: 42 repositórios

Michelli Costa

Page 15: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Repositórios digitais brasileiros e portugueses • Caracterização dos repositórios portugueses segundo a

natureza dos documentos.

15

89%

11%

repositório institucional (33) repositório digital (4)

Total: 37 repositórios

Michelli Costa

Page 16: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Repositórios digitais brasileiros e portugueses • Caracterização dos repositórios brasileiros segundo o software

utilizado.

16

Total: 42 repositórios

76%

7%

12% 5%

DSpace (32) TEDE (3) Nou-Raw (5) Outro (2)

Michelli Costa

Page 17: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Repositórios digitais brasileiros e portugueses • Caracterização dos repositórios portugueses segundo o

software utilizado.

17

Total: 42 repositórios

97%

3%

DSpace (36) Digitool (1)

Michelli Costa

Page 18: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Indexação dos repositórios brasileiros e portugueses

18

Michelli Costa

Page 19: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Quantidade de documentos disponíveis nos repositórios Brasil

19

Total: 603.694 documentos

17%

11%

9%

9% 8%

46%

Repositório Digital Universidade Federal do Rio Grande do Sul LUME (99.632)

Repositório Institucional UNESP Universidade Estadual Paulista Júlio de Mesquita Filho (69.382)

Biblioteca Digital da UNICAMP Universidade de Campinas (56.257)

Alice Repository Open Access to Scientific Information Embrapa (51.981)

Repositório Institucional Universidade Federal de Santa Catarina (50.340)

Outros repositórios (276.102)

Michelli Costa

Page 20: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Quantidade de documentos disponíveis nos repositórios Portugal

20

Total: 212.422 documentos

16%

13%

8%

6% 6%

51%

Repositório Aberto Universidade do Porto (33.504)

Universidade do Minho Repositorium (28.201)

Estudo Geral Repositório Digital da Universidade de Coimbra (16.915)

Repositório Institucional Universidade Católica Portuguesa Veritati (12.372)

Repositorio Biblioteca da Faculdade de Engenharia da Universidade do Porto (12.177)

Outros repositórios (109.253)

Michelli Costa

Page 21: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Quantidade de documentos recuperados pelo Google Scholar Brasil

21

27%

16%

15%

11%

8%

23%

Repositório Digital Universidade Federal do Rio Grande do Sul LUME (75.600)

Universidade de São Paulo Biblioteca Digital de Teses e Dissertações (44.000)

Repositório Institucional Universidade Federal de Santa Catarina (43.600)

Alice Repository Open Access to Scientific Information Embrapa (30.100)

Biblioteca Digital da UNICAMP Universidade de Campinas (22.500)

Outros repositórios (66.429)

Total: 282.229 documentos

Michelli Costa

Page 22: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Quantidade de documentos recuperados pelo Google Scholar Portugal

22

Total: 144.281 documentos

20%

14%

7% 7% 6%

46%

Repositório Aberto Universidade do Porto (28.100)

Universidade do Minho Repositorium (20.400)

Repositório Institucional Universidade Católica Portuguesa Veritati (10.200)

Repositório Institucional da Universidade de Aveiro RIA (9.390)

Repositório Universidade de Lisboa (9.190)

Outros repositórios (67.001)

Michelli Costa

Page 23: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Taxa de indexação dos repositórios no Google Scholar

23

Michelli Costa

Page 24: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Taxa de indexação dos repositórios no Google Scholar

24

Michelli Costa

Page 25: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Discussão e considerações finais • Confirmaram do problema apontado por Arlitsch e O’Brien

(2012) e por Orduña-Malea e López-Cózar (2014).

• A maioria dos repositórios brasileiros e portugueses obtiveram taxa de indexação superior a 50%.

• Portugal teve, relativamente, mais repositórios (21%) com nota superior a 50% de taxa de indexação.

• Em Portugal, 90% dos repositórios tratavam exclusivamente da produção científica de suas instituições, enquanto que no Brasil esta proporção é de apenas 65%.

25

Michelli Costa

Page 26: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Discussão e considerações finais Outros fatores

• Problemas de configuração do sistema - Arlitsch e O’Brien (2012).

• Uso do padrão do metadado Dublin Core por pelo menos 86% dos repositórios – repositórios que utilizam o software DSpace.

• Resultados contraditórios apresentados pelos próprios buscadores - Orduña-Malea e López-Cózar (2014).

26

Michelli Costa

Page 27: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Discussão e considerações finais Taxa de indexação foi superior a 100%

• Hipóteses sobre este problema:

1. Exclusão de documentos do repositório, que pode se manter na base, dependendo do método utilizado;

2. Período necessário para o Google Scholar atualizar sua própria base com a situação real dos repositórios.

3. Buscador indexa não só os documentos depositados, mas qualquer página do repositório, conforme apontado por Ordunã-Malea e López-Cózar.

• A questão extrapola a discussão proposta por este estudo e por isso não foi explorada.

27

Michelli Costa

Page 28: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Discussão e considerações finais Tendência de 5 x 50

• Tendência de distribuição dos documentos por países.

• Os cinco repositórios com as maiores quantidades reúnem 50% do total de documentos.

• Tanto em Brasil quanto em Portugal.

• A tendência foi observada nos dois aspectos observados:

• Quantidade total de documentos no repositório;

• Quantidade de documentos recuperados pelo Google Scholar.

28

Michelli Costa

Page 29: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Discussão e considerações finais • Os resultados desse estudo demonstraram que a maioria dos

repositórios brasileiros e portugueses apresenta boa taxa de indexação no Google Scholar.

• Alguns dos repositórios mais expressivos em quantidade de documentos podem aumentar consideravelmente a quantidade de documentos indexados pelo Google Scholar, ampliando ainda mais sua visibilidade na Internet.

• “Repositório Digital Universidade Federal do Rio Grande do Sul LUME”;

• “Repositório Aberto Universidade do Porto”. 29

Michelli Costa

Page 30: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Referências AGUILLO, I. F., ORTEGA, J. L., FERNÁNDEZ, M., & UTRILLA, A. M. (2010) - Indicators for a webometric ranking of open access repositories. Scientometrics, Vol 82, Nº 3. [Consult. 1 Set. 2014]. Disponível na Internet: doi:10.1007/s11192-010-0183-y.

ARLITSCH, K.; O’BRIEN, P. (2012) - Invisible institutional repositories: addressing the low indexing ratios of IRs in Google. Library Hi Tech, Vol 30, Nº 1, p. 60-81.

BOAI (2002) - Budapest Open Access Initiative. Budapeste. [Consult. 1 Set. 2014]. Disponível na Internet: http://www.opensocietyfoundations.org/openaccess/read

LÓPEZ-CÓZAR, E. D, & ROBINSON-GARCÍA, N. (2012) - Repositories in google scholar metrics or what is this document type doing in a place as such? Cybermetrics, Vol 16, Nº 1. [Consult. 1 Set. 2014]. Disponível na Internet: http://hdl.handle.net/10481/22019.

ORDUÑA-MALEA, E., & LÓPEZ-CÓZAR, E. D. (2014) - The dark side of open access in Google and Google Scholar: the case of Latin-American repositories. Scientometrics, Vol 1, Nº 18. [Consult. 1 Jul. 2014]. Disponível na Internet: doi:10.1007/s11192-014-1369-5.

RUSSEL, I. (2011) - La visibilidad de los recursos académicos. Una revisión crítica del papel de los repositorios institucionales y el acceso abierto. Investigación Bibliotecológica, Vol 25, Nº 53. [Consult. 1 Jul. 2014]. Disponível na Internet: http://www.scielo.org.mx/pdf/ib/v25n53/v25n53a7.pdf

30

Michelli Costa

Page 31: Michelli costa. slides  a visibilidade no gs dos rd. 2014

Obrigada!

31

Michelli Costa Universidade de Brasília

[email protected]

Michelli Costa