Novos paradigamas da descoberta da informação bibliográfica

Post on 01-Jul-2015

1.001 views 0 download

description

Catálogos de nova geração, Next Generation Catalogs, Web Scale Discovery Services

Transcript of Novos paradigamas da descoberta da informação bibliográfica

NOVOS PARADIGMAS DA DESCOBERTA DA INFORMAÇÃO BIBLIOGRÁFICA

Paulo Leitão I FCG-Biblioteca de Arte I CIDHEUS (UÉ) I FCSH (UNL)

Workshop BAD I Biblioteca Nacional de Portugal I 27 Junho 2012

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

1. Catálogos em linha: críticas, críticas e mais críticas

1.1. 1ª geração de catálogos (final dos anos 70/ princípio dos anos 80)Catálogos construídos sem ter em conta o comportamento depesquisa dos utilizadores

1.2. 2ª Geração de Catálogos (anos 80)Alguns desenvolvimentos significativos, MAS duas áreas fundamentaisproblemáticas:- Pesquisa por assunto- Operadores booleanos

2

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

1.3. 3ª geração de catálogos (finais dos anos 80/princípios dos anos 90)

Uma operação de cosmética.

“Library catalogs still offered mostly only second

generation functionality and that the changes had been

made merely on the surface and not in the core

functionality where they where most needed”

(MERCUN, 2008, p. 244).

3

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

E, no entanto, até meio dos anos 90 oscatálogos eram valorizados pelos utilizadores,até porque eram dos poucos interfaces emlinha disponíveis.

4

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

2. O Problema ganha novos contornos e complexidade

2.1. Aumento e diversidade dos recursos em linha disponíveis nas bibliotecas

Bases de dados de referência e em texto integral

Recursos eletrónicos de vário tipo / Bibliotecas Digitais

RESULTADO: multiplicidade de sistemas de pesquisa, ausência de integração.

5

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

2.2. A Web

Novo modelo de pesquisa de informação

Facilitação das tarefas do utilizador no acesso à informação

Desenvolvimento de mecanismos de produção e gestão de resultados que resolvem (em parte!) os problemas:

CÁLCULO DA RELEVÂNCIA DOS RESULTOS

PESQUISA/NAVEGAÇÃO FACETADA

6

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

2.3. O fenómeno 2.0

Interação e participação dos utilizadores nos sistemas de informação

Serviços com base na interação / participação

O “modelo” Amazon

7

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

3. Tentativas (infrutíferas!) de mudança

O caso das propostas inovadoras de Hildred (1988):

- Cálculo da relevância dos resultados

- Navegação

- Alargamento da cobertura em termos de recursos de informação

- Integração do comportamento dos utilizadores

8

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

4. Resultado

Drástica dimuição da utilização dos catálogos pelos utilizadores emtodos os tipos de biblioteca.

“We asked information consumers in 2005 where they

were most likely to start their search for information.

Eighty-two percent (82%) reported that they began their

information search on a search engine. One percent (1%)

indicated that they started their search for information ona library Web site.

9

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

4. Resultado

When we surveyed information consumers in 2010, they

were just as strongly tied to search engines as the starting

point for information, with 84% beginning on a search

engine. Not a single survey respondent began their

information search on a library Web site.”

(OCLC – Perceptions of Libraries, 2010, p.32)

10

I- Um problema antigo

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

5. Encontar uma explicação

“Two traditions of information organization at work—one

from librarianship and the other from the Web. Librarians’

perspectives about data quality remain highly influenced

by their profession’s classical principles of information

organization, while end users’ expectations of data quality

arise largely from their experiences of how information is

organized on popular Web sites”

(CALHOUN - Online catalogs: what users and librarians want. 2009, p. V)

11

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

1. Os Catálogos de Nova Geração (NGC) ou o Catálogo 2.0: características

a) Ponto de acesso centralizado a todo o tipo de recursos de informação disponibilizados pela biblioteca;

b) Preponderância da pesquisa simples sobre a pesquisa avançada;

c) Cáculo da relevância dos resultados;

d) Pesquisa/Navegação facetada;

12

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

e) Sugestão de termos alternativos (“did you mean”)

f) Sistemas de recomendação

g) RSS

h) Enriquecimento do conteúdo do registo bibliográfico

13

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

i) Participação dos utilizadores: os aspetos sociais do catálogo

Palavras-Chave (“tag’s”) – Folksonomias

Comentários

“Rating’s”

14

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

2. As características (mais relevantes) dos NGC’s passo a passo

2.1. PONTO DE ACESSO CENTRALIZADO

a) A solução Pesquisa Federada: vantagens e inconvenientes

b) A solução motor de pesquisa sobre índice centralizado:

- Vantagens e questões

- A solução preferencialmente implementada

15

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

2.2. RELEVÂNCIA DOS RESULTADOS

Critérios possíveis para o cálculo da relevância(origem: ambiente de pesquisa na WWW):

- Correspondência textual

- Proximidade entre os termos

- Popularidade

- Atualidade

- Localização

16

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

2.2. RELEVÂNCIA DOS RESULTADOS

No entanto, algoritmos tradicionalmente utilizados para o cálculo dacorrespondência textual e proximidade entre os termos não podemser aplicados diretamente.

Ter em linha de conta as características da informação bibliográfica

17

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

EXEMPLO de um caso desenvolvido pela Biblioteca Nacional daAustrália:

“1. Matches in the title, author and subject fields, and

those fields which describe the format, nature of the item

or form of the item, are more important than general

matches within the record;

2. Matches in multiples of the above fields are more

important than matches in just one of those fields. ”

(DELLIT, 2007, p. 6)

18

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

A questão da popularidade:

Comportamentos explícitos : palavras-chave, rating’s

Comportamentos implícitos: empréstimo

UTILIZADORES

19

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

PESQUISA/NAVEGAÇÃO FACETADA

Combinação da pesquisa por palavra com a navegação facetada

As potencialidades da informação bibliográfica, para além da estritarepresentação do assunto

O problema da utilização de linguagens de indexação: acomplexidade dos cabeçalhos

Um exemplo de aplicação no sentido da simplificação: FAST (FacetedApplication of Subject Terminology)

20

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

RSS (Really Simple Sindication ou Rich Site Summary ou ainda RDF Site Summary)

um formato, baseado em XML , para subscrição e sindicação deconteúdos na Web

O formato permite dividir a informação de um sítio Web em partesdistintas e entregá-las automaticamente em outros sistemas deinformação, desde sítios Web (por exemplo, AGREGADORES de RSS)até mensagens de correio electrónico.

21

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

Funcionamento de um “serviço” de RSS

22

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

PROPOSTA DE ATIVIDADE EM GRUPO

Subscrição de canais de RSS e criação de um serviço de acesso com base num agregador

NETVIBES - http://www.netvibes.com/

24

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

SISTEMAS DE RECOMENDAÇÃO

Os sistemas de recomendação constituem uma forma de, baseando-se no comportamentos dos utilizadores num dado sistema de informação, sugerir alternativas para um determinado resultado.A sua eficiência depende da capacidade em distinguir informação relevante no imenso número de clicks que um utilizador produz num dado sistema e numa sessão.

NO CASO DAS BIBLIOTECAS

Que Comportamentos utilizar? Empréstimos, Visualizações25

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

SUGESTÃO DE TERMOS ALTERNATIVOS

“A good recommendation system will use spelling

corrections, phonetic indexing, related terms from

authority records and many other techniques to help

guide the user into formulating a query that matches

their intent”

(BREEDING, 2010, p. 21).

26

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

ENRIQUECIMENTO DO CONTÉUDO DOS REGISTOS BIBLIOGRÁFICOS

- Capas

- Sumários

- “Reviews”

- Outros conteúdos

27

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

PARTICIPAÇÃO DOS UTILIZADORES

Palavras-Chave Geração (ou não!) de uma Folksonomia

- Complemento à indexação tradicional

- Vantagens (do ponto de vista do utilizador): organização de um espaço informativo pessoal, socialização, recuperação da informação, sentimento de pertença

- Desvantagens (do ponto de vista do utilizador): exige esforço

28

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

- Vantagens (do ponto de vista da Biblioteca): aumento dadiversidade de informação bibliográfica disponível, enriquecimentodo processo de aprendizagem sobre e com os utilizadores

- Desvantagens (do ponto de vista da Biblioteca): exigências degestão

29

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

Questões de implementação não resolvidas:

- Relação com a indexação tradicional

- Utilização no contexto da recuperção

- Utilização na “relação” entre utilizadores

30

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

3. Formas de implementação

I N T E R F A C E S I D E I D E S C O B E R T A

Uma nova camada aplicacional sobre os sistemas existentes

31

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

CATÁLOGOOUTROS

CONTEÚDOSBIBLIOTECA

DIGITAL

INTERFACE DE DESCOBERTARecolha de metados

(re) Indexação – Índice CentralInterface de Descoberta e Acesso

Disponibilização de metadados

32

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

PRINCIPAIS PRODUTOS DISPONÍVEIS

- AQUABROWSER (Serials Solution)

- PRIMO (Ex-Libris)

- VUFIND (Villanova University)

- BIBLIOCOMMONS (BiblioCommons)

33

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

4. Outras soluções dentro do mesmo “conceito”:

- Evolução dos SGB’s – Novos OPAC’s

“The ILS OPAC still has a long way to go toward the next-

generation catalog”

(Yang, 2010, 149)

34

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

-Utilização de conteúdos e serviços com origem em plataformas da Web Social

O caso exemplar do serviço LTFL (LibraryThing for Libraries) (http://www.librarything.com/forlibraries)

Exemplo: http://library.wofford.edu/search/i?SEARCH=0151327653&searchscope=1&searchscope=1#

Ou soluções comerciais

35

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

5. Os Catálogos de nova geração do ponto de vista dos utilizadores

5.1. Perspetiva geral

Poucas evidências, mas parece existir uma boa recetividade

Impactos positivos sobre a circulação e a utilização dos catálogos

36

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

5.2. O catálogo social

Poucos estudos / Poucas evidências

Reduzida participação? (a confirmar!)

Distinguir participação ativa de passiva, mas

“While both types of use are valid and important, unless

people contribute to content the level of social

engagement will be limited and a critical mass of

tags, ratings and reviews may not be achieved”(SPITERI, 2001, p. 28).

37

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

Tentativas de explicação:

- A questão das motivações para a participação: transferência das plataformas da web social para os catálogos?

- Produtos exploram pouco o resultado da participação

- A desmotivação de sistemas que obrigam ao registo

38

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

- A tradição

- Comunidades das bibliotecas são reduzidas

Necessidade de ter em conta as dinâmicascomportamentais demonstradas pelos indivíduos nasplataformas de participação para melhor compreendereste caso.

39

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

A participação vista pelos próprios:

- Maior valorização pelos utilizadores mais novos.

- Utilizadores mais velhos valorizam mais os conteúdos profissionais e o CGU com informação sobre a autoria

(CALHOUN, 2009)

40

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

5.2. Aspetos valorizados pelos utilizadores

- Pesquisa simples por palavra

- Enriquecimento dos registos bibliográficos, como forma de avaliar a adequabilidade de um item às necessidades

- Cálculo da relevância nos resultados

41

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

- Facilitar o percurso da descoberta ao acesso ao conteúdo

“This is the reality that the end users expect from

libraries: the links that connect them from the metadata

describing online content to the content itself”

(CALHOUN, 2009, p. 13).

42

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

- Pesquisa Facetada

a) As facetas são úteis para criar estruturas de navegação;

b) A categorização por facetas facilita a recuperação eficiente em bases de dados;

c) Os utilizadores encontram mais resultados num sistema com facetas;

43

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

d) Os utilizadores parecem gostar de facetas, embora nem sempre tenham, inicialmente pelo menos, uma resposta positiva;

e) Os utilizadores preferem os resultados organizados em hierarquias previsíveis e multidimensionais;

f) A satisfação dos participantes nas experiências é maior com sistemas que disponibilizam facetas.

(FAGAN, 2010).

44

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

- A questão das facetas temáticas

“Given that facets in general are often used, but subject

facets in particular see less use, there needs to be more

consideration given to normalizing subject headings in a

way that works better with a faceted navigation scheme”

(BAUER e PETERSON-HART, 2011)

45

II – Soluções: modelo catálogos de nova geração

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

6. Limitações das soluções que implementam o conceito de NGC

Principal limitação:

Dificuldade em integrar conteúdos diversificados vindos de sistemas de informação diferentes;

Utilização da solução pesquisa federada para tentar assegurar a integração;

Reduzida granularidade da indexação de recursos eletrónicos : “thearticle level retrieval problem” 46

III– Soluções: Web Scale Discovery Services

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

1. Características

a) Conteúdos

- Diferentes fontes

- Indexado ao nível do artigo

- Índice centralizado

- “Esquema” descritivo normalizado

- Indexação de metadados e/ou texto completo

47

III– Soluções: Web Scale Discovery Services

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

b) Descoberta

Pesquisa Simples

Pesquisa Avançada

c) Resultados

Relevância

Pesquisa facetada

d) Flexibilidade

48

III– Soluções: Web Scale Discovery Services

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

2. Principais produtos /soluções

WORLD CAT LOCAL (OCLC)

SUMMON (Serials Solutions)

EBSCO DISCOVERY SERVICES (EBSCO)

PRIMO CENTRAL (Ex-Libris)

49

III– Soluções: Web Scale Discovery Services

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

3. Aspetos diferenciadores das soluções

- Conteúdos

- Metadados e relevância

- Interfaces de pesquisa muito similares

- Nível de integração com os SGB: os problemas da disponibilidade dos itens e das reservas por exemplo.

50

CONLUSÕES

Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012

“In the early half of the 2000

decade, federated search was the next big

thing; in 2006, the NGC came to the library

market with a slow but steady adoption

rate: in 2009, web-scale discovery explode

as the solution to discovery in the library.

But it is safe to say that we will see

something bigger and better in the coming

years”

NAGGY, 201151