1ª aula indexacao 2013

47
Relembrando fundamentos da representação temática Universidade Federal do Rio Grande (FURG) Disciplina Indexação: T & P (2013) Profa. Gisele Dziekaniak [email protected] http://indexacaoteoriaepraticafurg.blogspot .com.br/

description

1ª Aula para o curso de Biblioteconomia da Universidade Federal do Rio Grande (FURG), Rio Grande, RS, Brasil.

Transcript of 1ª aula indexacao 2013

Page 1: 1ª aula indexacao 2013

Relembrando fundamentos da representação temática

Universidade Federal do Rio Grande (FURG) Disciplina Indexação: T & P (2013)Profa. Gisele Dziekaniak

[email protected] http://indexacaoteoriaepraticafurg.blogspot.com.br/

Page 2: 1ª aula indexacao 2013

Classificação

Para James Duff Brown a classificação é umPara James Duff Brown a classificação é um “processo mental” constantemente executado de “processo mental” constantemente executado de forma consciente e inconsciente por qualquer ser forma consciente e inconsciente por qualquer ser humano, ainda que não reconhecido como tal.humano, ainda que não reconhecido como tal.

Para Piedade (1983, p. 16) “Classificar é dividir em grupos ou classes, segundo as semelhanças e diferenças.”

Para Ranganathan classificar era traduzir o nome dos assuntos dos documentos da linguagem natural para a linguagem artificial adotada pelos sistemas de classificação bibliográfica. (PIEDADE, 1983)

Page 3: 1ª aula indexacao 2013

Característica, classe e categoria

Característica Qualidade ou atributo escolhido para servir de base à

classificação ou à divisão. Pode-se classificar adotando características distintas

para o mesmo objeto. Exemplos: Livros

- Tamanho- Cor- Língua- Assunto

“Há tantas possibilidades de classificar quantas forem as semelhanças e diferenças existentes entre os objetos ou ideias a classificar.” (PIEDADE, 1983, p. 17)

■ Literatura

- Lugar

- Língua

- Período

Page 4: 1ª aula indexacao 2013

Classificação cruzada

Pode-se classificar adotando várias características, mas empregando uma de cada vez e aplicando-a a todos os membros da classe. Ex.: característica Sexo para dividir animais racionais, não poderemos empregar, ao mesmo tempo, a característica faixa etária.

O emprego simultâneo de mais de uma característica se chama Classificação cruzada, quando as classes não são mutuamente excludentes, gerando confusão.

Page 5: 1ª aula indexacao 2013

Classificação cruzada

Exemplo correto:

Animais Racionais

_________________________

Homens Mulheres

____________ _____________

Crianças Adolescentes Adultos Crianças Adolescentes Adultos

Page 6: 1ª aula indexacao 2013

Classificação cruzada

Exemplo incorreto: Se empregássemos, ao mesmo tempo duas características (Língua e lugar)

Literatura

____________________________________

Em língua Do Brasil De Portugal Em língua Do Chile Do Peru etc.

portuguesa espanhola

Page 7: 1ª aula indexacao 2013

Característica, classe, categoria

ClasseÉ o conjunto de coisas ou ideias que possuem

um ou vários atributos, predicados ou qualidades em comum. Ex.: Mamíferos, Vertebrados, Canários, Animais.

Categoria São as maiores classes de fenômenos, as

classes mais gerais que podem ser formadas.São as grandes classes. Ex: na categoria Lugar,

pode-se distinguir as facetas: Lugar físico, Lugar político, Orientação (norte, sul etc.).

Page 8: 1ª aula indexacao 2013

Aristóteles e a classificação

Aristóteles dividiu o conhecimento com base em três critérios (NUNES, 2007): Critério de ausência ou presença do homem

nos seres investigados; critério de imutabilidade e critério de modalidade prática.

Trata-se de uma hierarquização conceitual que divide um tema geral em espécies a partir de uma característica classificatória.

Page 9: 1ª aula indexacao 2013

Aristóteles e a classificação

Aristóteles desenvolveu um sistema filosófico baseado em uma concepção rigorosa do Universo. Em seus tratados biológicos, apresentou o sistema de classificação dos animais que não se encontrava completo e que, originariamente em número de quatro, foram os seguintes:

Gênero Espécie Diferença Propriedade, e Acidente.

Page 10: 1ª aula indexacao 2013

Aristóteles e a classificação

Metafísica

Page 11: 1ª aula indexacao 2013

Porfírio e a classificação

A partir de Aristóteles, Porfírio descreve como as qualidades atribuídas às coisas

podem ser classificadas,

quebrando o conceito filosófico

da substância como um

genus/espécie do

relacionamento:

Page 12: 1ª aula indexacao 2013

Bacon e a classificação

Na classificação baconiana, apesar de algumas de suas classes e divisões se tornarem imbricadas, este sistema foi considerado um dos mais influentes nas diversas tentativas feitas para classificar o conhecimento. A classificação de Bacon está baseada na figura abaixo:

Page 13: 1ª aula indexacao 2013

Bacon e sua classificação

MIR (Memória, Imaginação e Razão)

Foi a base para a criação da CDD

Page 14: 1ª aula indexacao 2013

Indexação - conceito

Page 15: 1ª aula indexacao 2013

Etapas do tratamento temático

Análise de assunto Processo de ler um documento para extrair

conceitos que traduzam a essência do seu conteúdo. (DIAS, NAVES, 2007, p. 9)

Envolve cultura do indexador, experiência, conhecimento linguístico, cognitivo e lógico.

Também chamada de análise conceitual, análise documentária, análise da informação e subject analysis.

Page 16: 1ª aula indexacao 2013

Etapas do tratamento temático

1) Fases da Análise de assunto Leitura técnica do documento (leitura

documental) Extração de conceitos que representam a obra Atinência - termos em LN (do que trata a obra?)

Sugestão de leitura: Dias e Naves (2007)

Page 17: 1ª aula indexacao 2013

Etapas do tratamento temático

2) Tradução Passagem dos termos de linguagem natural

(LN) para linguagem artificial/documentária (LA/LD).

Eleição descritores autorizados pela LD (cabeçalhos de assunto, palavras-chave, termos de indexação).

Sugestão de leitura: Lancaster (2004)

Page 18: 1ª aula indexacao 2013

Análise documentária

“A análise documentária é definida como um conjunto de procedimentos efetuados com o fim de expressar o conteúdo dos documentos, sob formas destinadas a facilitar a recuperação da informação.” (DIAS, NAVES, 2007, p. 11)

Metainformação (informação da informação)

Page 19: 1ª aula indexacao 2013

Leitura do bibliotecário (LUCAS, 2000)

Questões ideológicas Equívoco da neutralidade Ilusão da completude Sujeitos leitores

Organizam arquivos Autorizados a ler, escrever e interpretar

Tipos de leitura Como apreensão do documento (literal) Como leitura interpretativa

Dica de leitura: Lucas (2000)

Page 20: 1ª aula indexacao 2013
Page 21: 1ª aula indexacao 2013

Subordinação, superordenação e coordenação

Meio de transporte

Aéreo AquáticoTerrestre

Carro Moto

Superordenação Subordinação

Coordenação

Page 22: 1ª aula indexacao 2013

Recuperação da Informação - RI

Information Retrieval: Termo cunhado por Calvin Mooers (década de 1950) que engloba aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.

É a responsável pela criação e desenvolvimento da Ciência da Informação. (SARACEVIC, 1996)

O objetivo é recuperar informações através da busca por alguma entrada catalogada a priori.

Page 23: 1ª aula indexacao 2013

Sistema de Recuperação da Informação - SRI Um sistema de informação coleta, processa,

armazena, analisa e dissemina informações e é constituído por um conjunto de componentes relacionados entre si. (GROSSI, 2008).

São sistemas de operações interligadas para identificar dentre um grande conjunto de informações, aquelas que sejam úteis, de acordo com a demanda expressa pelo usuário. (LOPES, 2002)

Objetivo de um SRI é permitir que um usuário recupere documentos através de características como: autor, título, assunto ou qualquer combinação desses elementos.

Page 24: 1ª aula indexacao 2013

Atividades em um SRI

Representação das informações contidas nos documentos;

Armazenamento; Gestão física e/ou lógica desses documentos

e de suas representações; Recuperação da informação representada e

dos próprios documentos armazenados (links).

Disseminação da informação.

Page 25: 1ª aula indexacao 2013

Sistema de Recuperação da Informação - SRI “Localização de documentos e itens de

informação que tenham sido objeto de armazenamento.” (ROWLEY, 2002, p. 114)

Para Cendón (2006) catálogos de bibliotecas, bases de dados bibliográficas, e motores de busca na internet são exemplos de SRI. (GROSSI, 2008)

Page 26: 1ª aula indexacao 2013

Subsistemas dos SRIs

Subsistemas de entrada: Seleção/aquisição, descrição, representação, organização de arquivos, armazenamento.

Subsistemas de saída: Análise e negociação de questões, estratégia de busca/recuperação, disseminação/acesso ao documento.

Subsistema de avaliação:Não se refere especificamente nem à entrada, nem à saída, mas a ambos, ao sistema como um todo.

Page 27: 1ª aula indexacao 2013

Avaliação dos SRI

Cobertura:Representa quanto o sistema contém informações

relevantes.

Exaustividade:Este conceito relaciona-se ao grau de profundidade com que os assuntos dos documentos são representados.

Precisão: Relaciona-se com a proporção de itens recuperados que são relevantes.

Page 28: 1ª aula indexacao 2013

Avaliação dos SRI

Tempo de resposta: É o intervalo médio entre o momento da consulta e a apresentação do resultado.

Esforço do usuário:É o esforço despendido para obter resultados na busca.

Formato: como os resultados são apresentados. São várias as características e tipologias comuns aos diversos sistemas de recuperação da informação, porém um módulo que todos devem possuir, por ser fundamental, é o módulo de interface com o usuário. (ARAUJO, 1994).

Page 29: 1ª aula indexacao 2013
Page 30: 1ª aula indexacao 2013

Estratégias de busca em um SRI

Estratégia de busca é o conjunto de decisões tomadas e de procedimentos adotados durante uma busca.

É a técnica ou conjunto de regras para tornar possível o encontro entre uma pergunta formulada e a informação armazenada em uma base de dados. (LOPES, 2002).

É a técnica ou conjunto de regras para tornar possível o encontro entre uma pergunta formulada e a informação armazenada em uma base de dados.

Uma boa estratégia de busca implica em conhecer a base de dados, as fórmulas de busca, o assunto que se busca e/ou a bibliografia que é objeto de busca.

Identificar a Necessidade de Informação (NI).

Page 31: 1ª aula indexacao 2013

NI fórmula de busca = resultado SRI

Estratégia de busca

Resposta insatisfatória = RUÍDO = Usuário insatisfeito = Nova estratégia de busca Resposta satisfatória = NI satisfeita= Item recuperado = usuário satisfeito

Page 32: 1ª aula indexacao 2013

Objetivos da estratégia de busca

Recuperar um número suficiente de registros relevantes e evitar que: Sejam recuperados itens irrelevantes; Sejam recuperados um número excessivo de

itens; Sejam recuperados um número insignificante

de registros.

Page 33: 1ª aula indexacao 2013

Problemas em recuperação da informação Os autores nem sempre usam as mesmas

palavras que os usuários para descrever o mesmo conceito.

Má formulação da consulta.

Page 34: 1ª aula indexacao 2013

Lógica de busca: Operadores booleanos

AND E

OR OU

NOT NÃO

Os operadores booleanos tem por objetivo definir como será a combinação feita entre os termos ou expressões de uma pesquisa.

Page 35: 1ª aula indexacao 2013

Lógica de busca: Operadores booleanos OR/OU Amplia a pesquisa e tem a

intenção de buscar ou esse ou aquele termo. Ou seja, qualquer uma das palavras.

Exemplo:A or B

A B

Page 36: 1ª aula indexacao 2013

Lógica de busca: Operadores booleanos AND/E Restringe a pesquisa e

significa a expressão que tenha todas as palavras. O resultado da busca deve recuperar ambos os termos.

Exemplo:A and B

Page 37: 1ª aula indexacao 2013

Lógica de busca: Operadores booleanos NOT/NÃO Exclui um dos termos da

pesquisa. Equivale dizer: sem a seguinte palavra.

Exemplo:

A not B

Page 38: 1ª aula indexacao 2013

Lógica de busca: Operadores booleanos Podem ser usados em expressões mais

complexas, onde se adotam os parênteses. Ex: (A or B) and CA pesquisa será feita 1º combinando a OR b e o

resultado se combina com AND

Page 39: 1ª aula indexacao 2013

Exercícios Operadores booleanos

Crie buscas usando assuntos que representem os seguintes conjuntos:

1. 3.

2. 4.

Page 40: 1ª aula indexacao 2013

Linguagem de indexação e de busca

Linguagem de indexação: Termos ou códigos usados como pontos de acesso em

um índice. Geralmente adota linguagem controlada (LC)

Linguagem de busca: Termos que são usados por um consulente ao

especificar uma necessidade de busca. Podem ser Linguagem natural (LN) ou LC, desde que o

usuário tenha acesso à linguagem documentária adotada pelo sistema de recuperação da informação.

Page 41: 1ª aula indexacao 2013

Linguagem natural e linguagem artificial ou controlada (LOPES, 2002)

CONCEITUE LINGUAGEM NATURALÉ a linguagem usada habitualmente na fala e na escrita representadas na base de dados pelos termos do título e resumo.

CONCEITUE A LINGUAGEM CONTROLADA É o conjunto de termos organizados de forma

hierarquizadas e/ou alfabética, com o objetivo de possibilitar a recuperação de informação temáticas, reduzindo substancialmente a diversidade de terminologia.

Tarefa: Pesquisar conceitos de LN e LA/LC/LD em outras fontes de informação da área. Entrega: Próxima aula. (não esquecer de referenciar as fontes adotadas).

Page 42: 1ª aula indexacao 2013

Diferenças entre Linguagem natural (LN) e linguagem controlada (LC, LC)

Linguagem natural ou livre (LN)

Linguagem controlada (LC, LA, LD)

Busca direta no texto Depende de uma LD

Usa linguagem comum do usuário

Distancia-se da linguagem do usuário

Oferece mais pontos de acesso

Os pontos de acesso são limitados pelo indexador

Oferece maior revocação Oferece menor revocação

Oferece menos precisão Oferece maior precisão

Tarefa: Ler o texto LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002 e CRIAR QUADRO COMPARATIVO ENTRE LN E LC Entrega: próxima aula.

Page 43: 1ª aula indexacao 2013

Revocação e Relevância (Lancaster, 2004)

Revocação (recall) Capacidade de um SRI em recuperar itens

existentes na base de dados. Precisão mede quantos documentos

relevantes foram recuperados

Relevância (Precisão) Capacidade de um SRI em recuperar itens

úteis ao usuário e minimizar a recuperação de documentos inúteis.

Page 44: 1ª aula indexacao 2013

Fórmulas para avaliar um SRI (Revocação e Relevância)

Itens não recuperados Relevantes (D)

Itens não recuperados Relevantes (D)

Itens não recuperados não Relevantes (C)

Itens recuperados Relevantes (A)

Itens recuperados não Relevantes (B)

Revocação = relevantes recuperados/ total de itens relevantes que existem no sistema

Precisão = relevantes recuperados/ total de itens recuperados

Revocação R= A / (A+D)

Relevância P = A / (A+B)

Page 45: 1ª aula indexacao 2013

Revocação e Relevância

Esses dois parâmetros são inversamente relacionados, significando que a melhoria de um implica na piora do outro.

Tradicionalmente, existem dois fatores muito importantes que governam a eficiência da indexação de um documento e consequentemente, influenciam na revocação e na precisão: Exaustividade: Define o número de diferentes

conceitos (tópicos) que estão indexados. Especificidade: Define o grau de precisão da

linguagem de indexação em descrever um dado documento.

Page 46: 1ª aula indexacao 2013

Referências

ARAUJO JUNIOR, R. H. Precisão no processo de busca e recuperação da informação. Brasília: Thesaurus, 2004.

DIAS, M. M. L.; DIAS, E. W. Análise de assunto: teoria e prática. Brasília: Briquet de Lemos, 2007.

GROSSI, M.G. R. Estudo das características de software e implantação de um software livre para gerenciamento de bibliotecas universitárias federais brasileiras. 2008. Tese (Doutorado em Ciência da Informação) – UFMG, Belo Horizonte, 2008.

LANCASTER, F. W. Indexação e resumos: teoria e prática. 2.ed. Brasília: Briquet de Lemos, 2004.

LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002.

Page 47: 1ª aula indexacao 2013

Referências

NUNES, L. Da Classificação das Ciências à classificação da Informação: uma análise do acesso ao conhecimento. 2007. Dissertação (Mestrado em Ciência da Informação) - PUC de Campinas, 2007. Disponível em <http://www.bibliotecadigital.puc-campinas.edu.br/tde_busca/arquivo.php?codArquivo=340 > Acesso em 22 nov. 2009

PIEDADE, M. A. R. Introdução à teoria da classificação. Rio de Janeiro: Interciência, 1977.

ROWLEY, J. A biblioteca eletrônica. 2.ed. Brasília: Briquet de Lemos, 2002.

SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n.1, p.41-62, jan./jun. 1996.