Principios tecnicas de_indexacao[1].pdf

33
Página Inicial Explorar Pesquisar Você Claudinei Assis Sair slideshare Carregar Carregar Publish Back Claudinei Assis My Clipboards Meus carregamentos Analytics Configurações da Conta Suporte Sair Pesquisar Página Inicial Liderança Tecnologia Educação Marketing Design Mais tópicos My Clipboards Pesquisar Você está atualmente cadastrado no SlideShare com a sua identidade LinkedIn. Não está? Clique aqui. Configurações Seu SlideShare está baixando. ×

Transcript of Principios tecnicas de_indexacao[1].pdf

Page 1: Principios tecnicas de_indexacao[1].pdf

Página Inicial Explorar Pesquisar Você

Claudinei Assis

Sair

slideshare

Carregar CarregarPublish

Back

Claudinei Assis

My Clipboards

Meus carregamentos

Analytics

Configurações da Conta

Suporte

Sair

Pesquisar

Página InicialLiderançaTecnologiaEducaçãoMarketingDesignMais tópicos

My Clipboards

Pesquisar Você está atualmente cadastrado no SlideShare com a sua identidade LinkedIn. Não está? Clique aqui. Configurações

Seu SlideShare está baixando. ×

Page 2: Principios tecnicas de_indexacao[1].pdf
Page 3: Principios tecnicas de_indexacao[1].pdf
Page 4: Principios tecnicas de_indexacao[1].pdf
Page 5: Principios tecnicas de_indexacao[1].pdf
Page 6: Principios tecnicas de_indexacao[1].pdf
Page 7: Principios tecnicas de_indexacao[1].pdf
Page 8: Principios tecnicas de_indexacao[1].pdf
Page 9: Principios tecnicas de_indexacao[1].pdf
Page 10: Principios tecnicas de_indexacao[1].pdf
Page 11: Principios tecnicas de_indexacao[1].pdf
Page 12: Principios tecnicas de_indexacao[1].pdf
Page 13: Principios tecnicas de_indexacao[1].pdf
Page 14: Principios tecnicas de_indexacao[1].pdf
Page 15: Principios tecnicas de_indexacao[1].pdf
Page 16: Principios tecnicas de_indexacao[1].pdf
Page 17: Principios tecnicas de_indexacao[1].pdf
Page 18: Principios tecnicas de_indexacao[1].pdf
Page 19: Principios tecnicas de_indexacao[1].pdf
Page 20: Principios tecnicas de_indexacao[1].pdf
Page 21: Principios tecnicas de_indexacao[1].pdf

Principios tecnicas de_indexacao[1]

Page 22: Principios tecnicas de_indexacao[1].pdf

Principios tecnicas de_indexacao[1]

Principios tecnicas de_indexacao[1]

Page 23: Principios tecnicas de_indexacao[1].pdf

Principios tecnicas de_indexacao[1]

Page 24: Principios tecnicas de_indexacao[1].pdf

+1

Próximos SlideShare

Carregando em...5×

PornografiaConteúdo difamatórioIlegal/IlícitoSpamOther Violations

Thanks for flagging this SlideShare!

Oops! An error has occurred.

15 of 24

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere,anytime – even offline.

Text the download link to your phoneSeu telefone

Send LinkStandard text messaging rates apply

Principios tecnicas de_indexacao[1]8,605

CompartilharCurtirDownload

UNIVERSIDADE FEDERAL DO PARÁ (2 SlideShares)Follow Following0 8 0 3

Published on 27 de setembro de 2011

Para ser utilizado na Disciplina Linguagens de indexação.

Para ser utilizado na Disciplina Linguagens de indexação.

2 Comentários8 pessoas curtiram issoEstatísticasNotas

Page 25: Principios tecnicas de_indexacao[1].pdf

Full NameComment goes here.12 horas atrás Delete Reply Spam BlockTem certeza que quer? Sim NãoSua mensagem vai aqui

Compartilhe suas ideias...Post

Ruth Nascimento at Universidade de BrasíliaExcelente texto, me esclareceu muitas dúvidas a respeito de indexação pré e pós coordenada!11 meses atrás Responder Tem certeza que quer? Sim NãoSua mensagem vai aqui

Avelino Zimila at Eduardo Mondlane Universityya ya isso ta mal2 anos atrás Responder Tem certeza que quer? Sim NãoSua mensagem vai aqui

Natallie Alcantara , Resenhista at Carpe Libri1 month ago

Claudiane Weber , Bibliotecária e Fotógrafa at Federal University of Santa Maria2 months ago

Biatrice Pinnola at Sieve2 months ago

Aline Ribeiro at Prefeitura Municipal de Goiânia3 months ago

lcasimiro3 months ago

Show MoreSem downloadsVisualizaçõesVisualizações totais8,605No Slideshare0A partir de incorporações0Número de incorporações0AçõesCompartilhamentos11Downloads572Comentários2

Page 26: Principios tecnicas de_indexacao[1].pdf

Curtidas8Incorporar 0No embeds

Conteúdo do relatórioSinalizar como impróprioReclamações de direitos autoraisNo notes for slide

Transcript

1. 1 UNIVERSIDADE FEDERAL DE MINAS GERAIS BIBLIOTECA UNIVERSITÁRIA CURSO DE INDEXAÇÃOPrincípios e técnicasde indexação, com vistas à recuperação da informação Belo Horizonte 20042. 2 Sumário1 A RECUPERAÇÃO DA INFORMAÇÃO E SISTEMAS DERECUPERAÇÃO DAINFORMAÇÃO............................................................22 O INDEXADOR.............................................................................................33 OPROCESSO DE INDEXAÇÃO..................................................................33.1 Análise deassunto........................................................................................53.1.1 A leitura do texto peloindexador..............................................................53.1.2 Extração de conceitos................................................................................63.1.3Determinação da atinência........................................................................93.2 Tradução da frase de indexação para linguagens deindexação...................93.3 Linguagens deindexação...........................................................................103.3.1Objetivos..................................................................................................113.3.2Funções...................................................................................................113.3.3 Construção de linguagens deindexação.................................................113.3.4 Componentes da linguagem de indexação..............................................123.3.4.1Vocabulário..........................................................................................123.3.4.2Sintaxe..................................................................................................133.3.5 Linguagensverbais..................................................................................143.3.6 Linguagenssimbólicas............................................................................143.3.6.1 Sistemas declassificação.....................................................................143.3.6.2 Comoclassificar...................................................................................153.3.7 Linguagens précoordenadas...................................................................153.3.7.1 Características da précoordenação......................................................163.3.7.2 Vantagens.............................................................................................163.3.7.3Desvantagens........................................................................................163.3.7.4 Ordem decitação..................................................................................173.3.8 Linguagens póscoordenadas.................................................................183.3.8.1 Características da póscoordenação.....................................................183.3.8.2Vantagens............................................................................................193.3.8.3Desvantagens.......................................................................................193.3.9 Avaliação das linguagens deindexação.................................................193.4 Consistência da indexação.........................................................................203.5 Indexaçãoautomática versusautomatizada...............................................21Referências......................................................................................................223. 3 PRINCÍPIOS E TÉCNICAS DE INDEXAÇÃO, COM VISTAS À RECUPERAÇÃO DA INFORMAÇÃO Profa. Madalena MartinsLopes Naves [email protected] A RECUPERAÇÃO DA INFORMAÇÃO E OS SISTEMAS DE RECUPERAÇÃODAINFORMAÇÃO – SRIA recuperação da informação consiste numa multiplicidade de operações consecutivas,executadas para localizaruma informação necessária ou documentos que a contenham, coma recuperação subseqüente desses documentos.A recuperação dainformação afeta o bibliotecário, como profissional que pretendesatisfazer a necessidade social do homem: ter acesso a diversos tipos deinformação. Oproblema da recuperação da informação pode ser visto, por um lado, como umaacumulação constante de um volume semprecrescente da informação e, por outro lado, ocrescimento e a complexidade , cada vez maior, das necessidades de informação.A RI é efetuadapor meio de Sistemas de Recuperação da Informação, e um SRI é umaorganização para armazenar e tornar disponível a informação, podendoser um catálogo,uma base dados, etc., e deve ter os seguintes componentes: Seleção e Aquisição – O início de um SRI se dá pela formaçãode um conjunto de documentos previamente selecionados e adquiridos dentro dos critérios estabelecidos pela instituição que o mantém e deacordo com os objetivos a que ele se propõe atingir. No estabelecimento de uma política de seleção das informações que alimentarão osistema, é fundamental que o usuário possa se manifestar e seja ouvido. Indexação considerada a parte mais importante para a eficácia deum SRIEm qualquer SRI, os documentos podem ser analisados de duas maneiras:a) bibliográfica ou objetivamente – tratase do tratamentodescritivo dos documentos, em que são identificados dados físicos do documento, como autor, título, edição, local de publicação, editora,data da publicação. São dados objetivos, pois estão explícitos, geralmente, na capa e folha de rosto. Existem regras para este tipo de análise.4. 4b) intelectual ou subjetivamente – tratase do tratamento temático dos documentos, em que são definidos os termos do seu conteúdo,ocorrendo aí o processo de indexação de assuntos. Para este tipo de análise, não existem regras fixas que a padronizem.Esta apostila trata,exclusivamente, da segunda análise citada acima, e se aprofunda noprocesso de indexação de assuntos, com vistas à recuperação dainformação. É importante,se conhecer, inicialmente, um pouco das características do profissional que executa aindexação, o indexador.2 OINDEXADORO profissional da informação que desenvolve a atividade de indexar assuntos dedocumentos é chamado de indexador,catalogador de assuntos ou classificador. A maioriadesses profissionais é graduado em Biblioteconomia, e deve conhecer osfundamentosteóricos e técnicos do tratamento temático da informação.Um dos fatores que interferem no trabalho do indexador é asubjetividade, inerente ao serhumano e difícil de ser controlada. Vários outros fatores são verificados, ainda, comointerferentes no processode indexar, como o conhecimento prévio (conhecimento demundo, conhecimento tácito) adquirido ao longo da vida, a sua formação e aexperiência notrabalho de indexação. No entanto, o conhecimento da área de atuação é um fatorimportante a ser considerado, já que odomínio da terminologia e o conhecimento dataxonomia das classes de assuntos da área em que está atuando, auxiliam muito o trabalhode seextrair o conteúdo de documentos.Observase, ainda, a interferência de fatores lingüísticos, (como o conhecimento da língua,do vocabulárioe da sintaxe, além da identificação de tipos de estruturas textuais), fatorescognitivos (capacidade de abstração, percepção e interpretação deinformações contidas nostextos analisados) e fatores lógicos (elementos de dedução, indução, inferência, silogismo eoutros), o que torna oestudo do processo de indexação altamente interdisciplinar.3 O PROCESSO DE INDEXAÇÃONo campo do tratamento da informação, otermo indexação apresenta dois sentidos: ummais amplo, quando se refere à atividade de criar índices, seja de autor, de título, deassunto,tanto de publicações (livros, periódicos), quanto de catálogos ou de banco de5. 5dados, em bibliotecas ou centros de informação. O outro sentido, mais restrito, referese àindexação, classificação ou catalogação deassuntos das informações contidas emdocumentos.Os índices podem ser encabeçados e ordenados por autores, títulos, lugares depublicações,etc. mas, freqüentemente, a idéia de RI está ligada à recuperação de documentos pelosassuntos que tratam.Índice tem sido

Page 27: Principios tecnicas de_indexacao[1].pdf

descrito como a chave para o acesso ao conteúdo dos documentos, ou comouma ponte ou elo entre o conteúdo de um arquivo e seususuários.Um índice é o instrumento mais importante num SRI. Indexar é o ato de incluir o registrode um documento num arquivo deinformações.Na literatura é feita essa distinção: a indexação backofbook (primeiro sentido citado)permite ao leitor localizar informaçãosobre um tópico dentro do livro, sendo a tarefa doindexador ler o texto, distinguir entre informação relevante e periférica e empregar ostiposde processamento de informação presentes na leitura. Por sua vez, a indexação acadêmica(segundo sentido citado) fornece um termo útilestabelecido pela indexação praticada embases de dados de resumos e em catálogos de bibliotecas.Esta apostila concentrase nos aspectos daindexação acadêmica, que compreende duasetapas distintas: a análise de assunto, quando ocorre a extração de conceitos quepossamrepresentar o conteúdo de um documento, expresso em linguagem natural, e a traduçãodesses conceitos para termos de instrumentosde indexação, que são as chamadaslinguagens de indexação, linguagens artificiais ou linguagens documentárias.Indexação é o processo dediscernir a essência de um documento e representar essa essêncianum modo de expressão em linguagem de indexação. Alguns autoresdenominam esseprocesso de análise documentária, que é definida como um conjunto de procedimentosefetuados com o fim de expressar oconteúdo de documentos, sob formas destinadas afacilitar a recuperação da informação. Essa passagem de um texto original para um tipoderepresentação é uma operação semântica, mesmo que não obedeça a nenhuma regra precisae varie em função de cada organismo e doanalista, que seleciona as palavraschave,normalmente de forma intuitiva, em função de sua ocorrência e do seu interesse para ainstituição.6. 63.1 Análise de assuntoEsta é a primeira etapa da indexação, considerada por muitos como a etapa intelectual dotrabalho do indexador. Oprocesso de ler um documento para extrair conceitos quetraduzam a sua essência é conhecido como análise de assunto para alguns, análisetemáticapara outros, ou, ainda, análise documentária, análise conceitual ou, mesmo, análise deconteúdo. Como se pode ver, tratase de umprocesso em que há uma certa confusãoconceitual e para o qual aparecem diferentes concepções.A análise de assunto feita pelo indexadorhumano se dá em dois momentos: quando ele vaianalisar um documento para inserilo num SRI, e quando recebe um pedido deinformaçãodo usuário.O processo de análise de assunto compreende três fases:3.1.1 A leitura do texto pelo indexadorO texto é o ponto departida para operações analíticodocumentárias, sendo constante apresença dos elementos conteúdo e forma, como partes essenciais domesmo. Para ter umacompetência textual é preciso que, além de conhecer o texto que tem em mãos para análisesob todos os aspectos, oindexador faça dele uma leitura adequada, e sabese que um textopode gerar muitas leituras, interessando mais, neste estudo, a leitura parafinsdocumentários.Para que os conteúdos dos textos sejam assimilados e compreendidos, é preciso que asinformações sejam processadas namente do leitor e, atualmente, parece ser consenso entreos especialistas em leitura que o processamento do ato de ler se dáinterativamente,dependendo dessa interação a não compreensão ou a compreensão de um texto. Durante acompreensão do texto peloindexador, ocorrem dois tipos de processamento mental dainformação: o topdown e o bottomup, que parecem ocorrer simultaneamente namentehumana ao fazer a leitura de um texto. São inversos e complementares, e chamados poralguns autores de modelos de leitura: é o tipoascendente, guiado por dados, indutivo,bottomup, no qual a leitura é linear, das partes para o todo textual, e o tipo descendente,dedutivo,topdown, no qual se move na forma inversa, obtendo vantagem da base deconhecimento do leitor. Tratase de uma dupla ação: percepção ecompreensão.A interferência de vários fatores subjetivos/cognitivos torna a leitura um ato subjetivo eindividual, posto que o sentido dado aotexto lido sempre vai variar de leitor para leitor.7. 7Diante disso, o que poderia ser afirmado com relação à leitura para fins documentários?Existe algum modelo a ser seguido? E comrelação ao leitor/indexador?Um documento, inserido num SRI, antes de ser lido pelo leitor, usuário final do sistema, élido por um leitortécnico, o indexador, aquele que faz a leitura para fins documentários.Esse tipo de leitura, conhecido como leitura documentária ou leituratécnica, tem certascaracterísticas, não sendo realizada para lazer ou aprendizagem, nem é prazerosa, muitopelo contrário. O alto grau deincerteza , ansiedade e responsabilidade contido na atividadejá mostra que a mesma traz pouca satisfação. É um tipo de leitura bem racional erápido,em que o leitor técnico não tem chances de aproveitar a leitura, já que seu propósito é o deextrair o conteúdo informativo do texto,tendo em vista a sua posterior recuperação por umleitor interessado.Outro aspecto que merece ser ressaltado é que o autor do texto, aoescrevêlo, tem emmente um determinado leitor alvo para o qual direciona suas idéias; suas intenções não sãodirigidas para oleitor/indexador e não lhe interessa se esse vai ter capacidade parainterpretar as informações que aquele texto está veiculando.São várias astentativas de se estabelecerem alguns critérios e de sistematizar o processo deleitura do indexador, mas não há um consenso quanto à formamais adequada de se fazeressa leitura, visando à extração e ao posterior tratamento das informações contidas no texto.3.1.2 Extração deconceitosPara definir em termos adequados o assunto de um texto, é necessário que primeiro seextraiam os conceitos que nele estão contidos.Se, para fazer uma análise conceitual,devemse extrair conceitos, perguntase: o que é um conceito?Conceitos são unidades do conhecimentoidentificadas através de enunciados verdadeirossobre um item de referência, representados por um termo ou palavra. É uma idéia,umarepresentação mental que nos permite categorizar objetos. Existem tipos de conceitos,como os individuais (representados por nomes decoisas individuais, em linguagemsimples) os gerais (representados por nomes de classes de coisas e podem ser expressos emumamultiplicidade de expressões lexicais e não lexicais) os científicos (podem seraprendidos na vida acadêmica, e, depois, são estabelecidasconexões entre eles e os eventosda vida diária) os cotidianos (são objetos usados normalmente, como roupas, carros).8. 8A formação de conceitos é um processo que envolve discriminação e agrupamento. Osfatores que afetam o processo são experiênciaprévia, tempo, fatores sociais, etc.Conceitos, palavras e significados: Não há uma correspondência exata entre palavras econceitos; há pelomenos dois conceitos que se apresentam quando vemos a palavravolume. Não somente as palavras estimulam diferentes conceitos paraindivíduosdiferentes, como, para o mesmo indivíduo, de acordo com as circunstâncias. Uma dasrazões para os diferentes significados quediferentes palavras têm, para diferentes pessoas, éque há duas espécies de significado: denotação e conotação. Denotação de uma palavra éacoisa que ela representa ou a que se refere. Apontando para um gato, eu posso dizer: “Isto éum gato”. Já a conotação de uma palavra éaltamente individual e pessoal. Se eu gosto degatos, minha conotação de “gato” inclui a noção de amizade, calor, etc. Se não, incluimaucheiro e grito à noite.Tipos de relações entre conceitos (estabelece a sintaxe, abordada no item 3.3.4.2)a) Relação de eqüivalência•Sinônimos: Meio ambiente X Ecologia• Quase sinônimos: Datiloscopia X Impressão Digital• Grafias diferentes: Contato X Contacto•Abreviaturas e Acrônimos: ONU X Organização das Nações Unidas• Traduções: Recall X Revocaçãob) Relação hierárquica• Gênero/espécieQuase genérica: (Gato X Animal de estimação) Verdadeiramente genérica: (Gato X Mamífero)• Todo/parte (Sistema respiratório XPulmão)c) Relação associativa (afinidade ou de coordenação)• Coordenação: Terra X Marte• Genética: Pais X Filhos• Instrumental: EscritaX Lápis• Concorrente: Ensino X Aprendizagem• Material: Livro X Papel9. 9• Similaridade de processo: Catalogação X ClassificaçãoDuas variáveis interferem na escolha de conceitos: a exaustividade e aespecificidade.Ambas dependem da política de indexação adotada no SRI, que deve seguir critérios préestabelecidos, tendo em vista osobjetivos do sistema, os recursos disponíveis e o tipo deusuário.A exaustividade relacionase à capacidade do sistema de indexar odocumento emprofundidade, ou seja, além do assunto principal, são indexados também os assuntossecundários.A especificidade é acapacidade do sistema de nos permitir ser precisos ao especificarmos oassunto de um documento.Os s fatores de especificidade eexaustividade têm influência em todo o processo derecuperação da informação, havendo ligação desses com as medidas de revocaçãoeprecisão. (conceitos abordados no item 2.2.2)A análise conceitual tem, como produto, um assunto, que representa o conteúdoinformacionalde um texto. A noção de assunto de um texto é indeterminada, pois há casosem que é impossível, em princípio, decidir qual de duasdiferentes e igualmente precisasdescrições, é a descrição do assunto, ou se o texto tem dois assuntos ao invés de um.Tipos de assuntos: Sãoidentificados três tipos de assuntos: assunto simples (formado porum único conceito). Ex: Indexação; assunto composto (formado por maisde um conceitopertencentes a uma mesma área do conhecimento) Ex: Indexação de materiais especiais(são dois conceitos daBiblioteconomia); e assunto complexo (formado por conceitos deáreas diferentes) Ex: A arte como terapia para idosos (conceitos da Arte e

Page 28: Principios tecnicas de_indexacao[1].pdf

da Psicologia).A atividade de identificar a(s) idéia(s) principal(ais) do texto exige a capacidade decompreensão de seu conteúdo, o que estáligado a processos cognitivos.Na determinação do assunto, é preciso que se verifique o contexto no qual o documento éproduzido e para oqual ele existe, em determinado momento.Conceito, assunto e contexto são aspectos interdependentes que ocorrem durante todo oprocessode análise de assunto, até o momento de se afirmar sobre o que trata o documento,próxima fase.10. 13.1.3 Determinação da atinênciaTerminada a fase de extração de conceitos, é necessário que se faça uma seleção daquelesque realmentesintetizem o assunto do texto, partindose, assim, para a terceira fase doprocesso de análise de assunto, que é a determinação da chamadaatinência, termotraduzido do inglês aboutness.(outras traduções: concernência, sobrecidade, temacidade)Nesta fase da determinação daatinência para representar os conceitos extraídos do texto,iniciase um processo lingüístico e o problema de descrever documentos pararecuperaçãoé, principalmente, o problema de como a linguagem é usada. Há uma forte relação entre aatinência do documento e seu(s)significado(s) identificado(s) pelos indivíduos. Um textotem uma atinência relativamente permanente, mas um número variado designificados.O produto final da atinência é uma frase de indexação, elaborada pelo indexador emlinguagem natural. Após todo o processointelectual de leitura do texto, de extração eseleção de conceitos, é o momento em que ele afirma: Este documento trata de..........Das etapasde indexação, a análise de assunto é a que sofre mais influência da subjetividadedo indexador, sendo, por isso, considerada muito complexa.Por todos os aspectosconsiderados neste item, podese concluir que essa não é uma atividade possível de serensinada, não havendo umareceita, ou uma rotina a ser seguida no desenvolvimento damesma.Tentativas de automatizar a análise de assunto já vêm sendoimplementadas em pesquisasde cursos de pósgraduação, mas podese verificar que, por enquanto, o limite da máquinaainda é a capacidadehumana de percepção e abstração.3.2 Tradução da frase de indexação para linguagens de indexaçãoQuando termina a primeira etapa daindexação, com o(s) assunto(s) já definidos emlinguagem natural, chega o momento de inserilo(s) no SRI. Para isso, é feita a traduçãodafrase de indexação para os termos da linguagem de indexação, o que significa transformaros conceitos selecionados em termos ousímbolos autorizados para representálos nosistema.11. 1Quando indexamos um documento por assunto, nós o colocamos em uma ou mais classes, ecada classe deve ter um número ou rótulo,que são chamados termos indexadores. Oconjunto desses forma a linguagem de indexação.Há dois métodos fundamentais de indexar oassunto de documentos:a) Indexação por palavras – utiliza termos empregados pelo autor na apresentação das suas idéias, isto é, as palavrasencontradas nos títulos ou nos textos dos documentosEx: A palavra mandioca traduz uma determinada idéia, um dado conceito, quetambémpode ser expresso pelas palavras aipim, macaxera.Uma indexação por palavras registrará os documentos pelos termos utilizadospelosautores, ou seja, na linguagem natural. O sistema indexará um documento sobre mandiocae outro sobre aipim ( linguagem natural). Umexemplo típico de indexação por palavra é oíndice KWIC (Key Word in the Context), que utiliza títulos dos documentos. O queacontece narecuperação de um documento cujo título é “Feijão, angu e couve”? Arecuperação só pode ser feita através dessas palavras, mas o assunto dodocumento é“Costumes mineiros”. O que acontecerá com a recuperação deste documento?b) Indexação por conceitos – a indexação porconceitos pressupõe a análise de assunto do documento, a decisão sobre conceitos presentes no texto e a tradução destes em linguagemapropriada. Na indexação por conceitos, determinamse os cabeçalhos a empregar, distinguemse homônimos, controlamse sinônimos,prevêemse relações de eqüivalência, hierárquica e associativa.É importante ressaltar que o indexador deve estar familiarizado com alinguagem utilizadano SRI, embora esta linguagem não deva influenciar a análise de assunto dos documentos.3.3 Linguagens de indexaçãoAlinguagem de indexação é aquela cujo objetivo é representar o contéudo temático dosdocumentos. Alguns sistemas utilizam a linguagemnatural (escrita e falada, pouco usadapor apresentar grande inconsistência) como linguagem de indexação e, nesses casos,adotam comotermos indexadores os termos na forma como aparecem nos documentos, semmodificações. Isso traz alguns problemas, como diferentesautores usando palavras diversaspara expressarem o mesmo conceito (dispersão terminológica) ou o caso do uso dediferentes estruturas paraexpressarem a mesma idéia (dispersão sintática).12. 1No entanto, comumente, são utilizadas linguagens artificiais. Essas refletirão umvocabulário controlado, para o qual foram tomadasdecisões cuidadosas sobre os termos aserem usados, o significado de cada um, e os relacionamentos que apresentam.Uma linguagem deindexação deve procurar indicar os relacionamentos entre os termos noseu vocabulário. Por exemplo, se um sistema inclui os termosENSINO MÉDIO eESCOLAS PROFISSIONALIZANTES, podese indicar a relação entre esses dois termos,pois um usuário, procurandoinformação sobre ensino médio, poderá encontrar documentosrelevantes sob o termo escolas profissionalizantes que, usualmente, se ocupamtambém doensino médio. Uma linguagem de indexação que tem um vocabulário controlado e que tentaindicar as relações entre os termos noseu vocabulário é chamada estruturada.3.3.1 Objetivos: possibilitar que o indexador represente os assuntos dos documentos de formaconsistente; compatibilizar o vocabulário usado pelo usuário com o vocabulário usado pelo indexador; permitir ao usuário moldar aestratégia de busca de forma a obter alta revocação ou alta precisão, conforme o exigirem as circunstâncias.3.3.2 Funções das linguagens deindexação: substituir a grande variedade de expressões da linguagem natural por uma linguagem formal; estabelecer um ponto comumentre linguagem do autor, linguagem do indexador e linguagem do usuário; estabelecer um vocabulário que mostre as relações entre termose conceitos: relações semânticas (equivalência, hierarquia e associativa) e relações sintáticas (coordenação de dois ou mais elementos paraformar assuntos compostos) economizar espaço de arquivo;13. 1 ajudar na recuperação de conceitos específicos.3.3.3 Construção de linguagens de indexaçãoA geração de um vocabulário controladonão é uma tarefa simples, e têmse verificadovárias iniciativas nesse sentido, pela necessidade de se tratarem, cada vez mais, deassuntoscomplexos que exigem uma análise mais aprofundada e com alto grau de especificidade.Alguns aspectos são levantados para acriação das linguagens controladas, como: gerar umvocabulário com base nos termos de indexação de um conjunto de documentos;modificarum vocabulário já existente ou extrair o vocabulário de outro já existente; reunir termos dediferentes fontes: especialistas da área,dicionários, glossários, índices, etc.Um vocabulário controlado deve ser capaz de representar conceitos que realmente ocorremna literaturado assunto. Este é o princípio da garantia literária. É importante ressaltar,ainda, dois pontos que não podem ser ignorados na construção deuma linguagem, comoas questões formuladas pelos usuários, que devem ser levadas em consideração nadefinição dos termos da linguagem,pois refletem suas necessidades de informação, e aconsulta a especialistas da área especializada da linguagem.Depois do levantamento dostermos, partese para o estabelecimento das relações entre osconceitos, podendose utilizar, para isso, a análise facetada, que consiste nadivisão doassunto em facetas (categorias de assuntos). Passase a optar pelo melhor termo pararepresentar um conceito (geral ou específico),e estabelecer as hierarquias necessárias.3.3.4 Componentes da linguagem de indexação:As linguagens de indexação são formadas por doiscomponentes básicos: vocabulário esintaxe.3.3.4.1 Vocabulário é o conjunto de termos de indexação utilizáveis para representar oconteúdotemático dos documentos, que podem ser cabeçalhos de assuntos (listas decabeçalhos de assunto), descritores (tesauros) ou símbolos declassificação (sistemas declassificação bibliográfica). O vocabulário é sempre menor do que os vocabulários dosusuários, dos documentosindexados e do próprio indexador, por causa do controle dovocabulário. Diante disso, é necessário fornecer, além do vocabulário deindexação (termos14. 1usados no índice), um vocabulário de abordagem, que consiste de termos que não sãousados no sistema para representar os conceitos,mas que podem ser usados pelos autoresdos textos, pelos indexadores, e pelos usuários ao consultar o índice. Por exemplo, ovocabulário dosistema usa o termo TESTE DE INTELIGÊNCIA.Porém, o assunto pode ser procurado por:TESTES MENTAIS – termo sinônimoTESTESPSICOLÓGICOS – termo mais geral (abrangente)TESDE DE APTIDÃO – termo mais especificoDESENVOLVIMENTO MENTAL –termo relacionadoEstes termos constituem o vocabulário de abordagem.3.3.4.2 Sintaxe é o conjunto de artifícios empregados para revelar asrelações entre osconceitos e as regras para estabelecer os descritores e determinar a ordem em que devemser citados. Ocorrem da necessidadede se poder recuperar a interseção entre duas ou maisclasses de conceitos, e o reconhecimento das relações entre os conceitos (item 3.1.2)

Page 29: Principios tecnicas de_indexacao[1].pdf

éproduto de uma análise de assunto cuidadosa, que é básica para todas as linguagens deindexação estruturadas.São evidenciadas, as relaçõessemânticas (ou de significado) e as relações sintáticas queexistem entre os termos indexadores.As relações semânticas devem ser controladasou mostradas nas linguagens de indexaçãocom o objetivo de se indicarem os termos alternativos ou substitutivos de indexação ebusca. Asrelações semânticas podem ser de 3 tipos : equivalência, hierárquicas eassociativas. Dependendo da estrutura da linguagem de indexação(verbal ou simbólica), oestabelecimento das relações semânticas pode ser mais complexo ou mais simples,utilizadas em tesauros e listas decabeçalhos de assuntos)• Relações de equivalência (ver, see, use, x) UP (usado para = Used For UF)• Relações hierárquicas TG (TermoGeral = Broader Term BT), TE(Termo Específico = Narrowed Term NT).• Relações associativas (ver também, see also, xx) TR (TermoRelacionado = Related Term RT)15. 1As relações sintáticas entre os termos de uma linguagem de indexação originamse danecessidade de se poder recuperar a interseçãoentre duas ou mais classes de conceitosdistintos. Ex. pode existir interesse pelo assunto “fundição do alumínio” e não por“fundição” e“alumínio”. Essas relações constituemse da associação de termos pararepresentar assuntos compostos. São temporárias, ao contrário dasrelações semânticas, quesão permanentes.As linguagens controladas são mais eficientes no SRI, embora apresentem maiordificuldade para ousuário. Quanto maior a diferença entre a linguagem natural e alinguagem controlada, maiores as dificuldades dos usuários no momento dabusca.O vocabulário de uma linguagem de indexação pode ser verbal ou simbólico (codificado),que constituem as linguagens verbais e aslinguagens simbólicas.3.3.5 Linguagens verbaisNas linguagens verbais, os assuntos são representados por palavras, como por exemplo,umdocumento que trate da História da França, será representado por FRANÇA – História.São linguagens verbais as listas de cabeçalhos deassunto, os tesauros.As LCA são arranjadas em ordem alfabética de cabeçalhos de assunto, e têm abrangênciageral de todas as áreas doconhecimento. Apresentam pouca flexibilidade, pois são précoordenadas (ver item 3.3.7), havendo o estabelecimento de uma ordem decitação entre ostermos.Os tesauros, por sua vez, são especializados numa determinada área do conhecimento, emais flexíveis, apresentandouma ordem alfabética e sistemática entre os termos deassuntos, chamados descritores. Utiliza termos simples, não havendo ordem decitaçãoentre os termos, constituindo uma linguagem póscoordenada. (ver item 3.3.8)3.3.6 Linguagens simbólicasNas linguagens simbólicas,os assuntos são representados por códigos ou símbolos, naforma da notação de um sistema de classificação bibliográfica. Assim, o exemplodeHistória da França, o assunto será representado por 944 (CDD)16. 1Uma das linguagens simbólicas mais usadas em bibliotecas é a classificação bibliográfica.Um mapa completo de qualquer área doconhecimento, mostrando todos os seus conceitos esuas relações é chamado de tabela, esquema ou sistema de classificação.3.3.6.1 Sistemasde classificaçãoSe dividem em:a) de acordo com a apresentação dos assuntos: enumerativos procuram indicar todos os assuntos e todas ascombinações possíveis entre eles e apresentar os símbolos que os representam prontos para ser usados. Ex: .Classificação Decimal de Dewey(CDD); e os analíticosintéticos – ou facetados apresentam listas de assuntos – facetas – acompanhados de símbolos e deixam aoclassificador a tarefa de combinar os símbolos para apresentar os assuntos compostos. Ex: Colon Classification (Classificação de DoisPontos) e Bliss Classification.b) de acordo com a abrangência: gerais – todas as classes do conhecimento. Ex:Dewey, CDU, Colon, LC; eespeciais classes especiais de assunto – Ex: Coates (Música)Elementos de um sistema de classificação:1) Apresentação ou introdução –Origem e evolução do sistema. Atualização. Ordem de citação. Ordem de arquivamento. Instruções para a construção de números declassificação.2) Tabelas Auxiliares, classe geral, assuntos3) Notação4) Índice alfabético3.3.6.2 Como classificarRanganathan enfatizou quehá três estágios diferentes na indexação, e denominouos dePlano Idéia (análise de assunto em nossas próprias palavras; decisão sobre aclasseprincipal apropriada; decisão sobre a ordem de citação para a classe; rearranjo da análisede assunto na ordem apropriada), PlanoVerbal (exame do índice e das tabelas do esquema17. 1para encontrar os conceitos necessários) e Plano Notacional (construção da notação para osconceitos, de acordo com as regrasestabelecidas).Em todo SRI, é necessário o controle de terminologia para assegurar a coincidência dasperguntas e respostas, fazendo com quedeterminado assunto pesquisado seja recuperado.Este controle pode ser feito através de coordenação de conceitos no ato da indexação ounomomento da recuperação. São as chamadas linguagens pré e pós coordenadas.3.3.7 Linguagens précoordenadasOs sistemas précoordenados estabelecem a coordenação dos vários tópicos referentes a umassunto composto no momento da indexação, e, com grandesubjetividade, determinamuma prioridade na citação desses elementos. Essa ordem é determinada a partir daimportância que os conceitosrepresentam para os usuários.3.3.7.1 Características da précoordenação: subjetividade (conceitos compostos); entradas múltiplas(remissivas + referências); autonomia do indexador; fáceis de serem usadas.3.3.7.2 Vantagens: um único lugar para um assuntocomposto: prover apenas um lugar inequívoco para qualquer assunto composto; personalização da busca: fazer com que os usuários possamfamiliarizarse com o sistema e, com o tempo, passem a formular questões de acordo com a linguagem do sistema; limitação do tamanho: aentrada única ajuda a evitar o crescimento desmesurado do catálogo, tornando mais simples o seu uso e menos dispendiosa a suamanutenção;18. 1 flexibilidade na estratégia de busca: podem ocorrer mudanças na estratégia da pesquisa, podendo seguir um assunto mais restrito, maisgenérico ou correlato, sem ter que se começar pela estaca zero; busca seqüencial manual rápida: as linguagens précoordenadas funcionammelhor nesses sistemas tradicionais de registro de documentos. Elas geram arquivos maiores, mas a busca manual, quando realizadaseqüencialmente, é mais rápida. evita falsas associações e relações incorretas; é mais precisa.3.3.7.3 Desvantagens: dificuldade narepresentação dos diferentes sentidos do termo, e das relações entre os termos; ordem fixa: os termos somente podem ser listados numadeterminada seqüência; pouca flexibilidade na busca: é quase impossível fazer a combinação entre os termos no momento da busca;tamanho e custo: o uso da “entrada múltipla” encarece o sistema e aumenta o tamanho do índiceExemplos de linguagens précoordenadas:listas de cabeçalhos de assunto (Library ofCongress, Rovira, Wanda Ferraz), os índices permutados, os índices em cadeia e asclassificaçõesbibliográficas. (Classificação Decimal de Dewey, Classificação DecimalUniversal).3.3.7.4 Ordem de citaçãoO problema das linguagens précoordenadas é a necessidade de se estabelecer uma ordemde prioridade para os diversos conceitos. É a chamada ordem de citação, a serdeterminadaa partir da importância que os conceitos têm para os usuários e, nesse caso, somente o19. 1primeiro elemento citado é recuperado, ficando os outros ocultos. Existem algumas regrasbásicas tentando estabelecer a ordem decitação dos assuntos complexos, como: o assunto antes da forma bibliográfica : Geologia – Enciclopédia o assunto antes do lugar (com apreposição em): A fome no Brasil, FomeBrasil o assunto depois do lugar (com a preposição de): Montanhas do Brasil, seria BrasilMontanhas todoparte: Índices de Periódicos, seria Periódicos ÍndicesOpções de ordem de citação são dadas por teóricos da área, comoKaiser (1911) – “oconcreto, depois o processo” – Indexação de livros, seria Livros Indexação; por Coates(1960) – Coisa – Parte – Material– Ação. Uma das opções, é a utilização das CincoCategorias Fundamentais, estabelecidas por Ranganathan: PMEST Personalidade(núcleodo assunto), Matéria, Energia (processo), Espaço e Tempo)Ex: Plantação de soja no Paraná em 2003A ordem dos termos será: SOJAPlantaçãoParaná2003Como se pode verificar, apenas o termo soja poderá ser recuperado na ordem alfabética.Uma solução para isso, é aadoção de “entradas múltiplas”, ou a utilização de uma “redesindética” (uso de remissivas e referências) bem elaborada.3.3.8 LinguagenspóscoordenadasOs sistemas póscoordenados adotam conceitos simples usados na indexação, que sãocombinados pelo usuário no momentoda busca. Os termos são combinados de qualquermaneira, conforme a necessidade mais geral ou mais específica do usuário.Os sistemas maismodernos de recuperação da informação, principalmente os sistemasautomatizados, passaram a usar as linguagens póscoordenadas. Nestetipo de sistema, nãoexiste a preocupação com a importância dos elementos de um assunto composto, e,consequentemente, com a ordem decitação desses elementos (ordem de prioridade definidanas linguagens précoordenadas).20. 2Uma linguagem póscoordenada consiste de entradas que normalmente são conceitosúnicos, podendose dar a entrada de todos ostermos no sistema, sem a necessidade dedecisões a respeito da prioridade dos itens. Criase uma entrada única para cada assuntoconsiderado

Page 30: Principios tecnicas de_indexacao[1].pdf

relevante. Como recurso que auxilia a busca em sistemas póscoordenados eautomatizados, é utilizada a lógica booleana, com os elementosand, or, nor.3.3.8.1 Características da póscoordenação: conceitos únicos: são indexados os conceitos simples; comparação das entradas deassunto: permite determinar coincidências que revelam documentos pertinentes ao assunto pesquisado; objetividade: dáse a entrada a todosos termos relevantes, sem a necessidade de decisões a respeito dos itens; flexibilidade na busca: os termos podem ser combinados entre si,de qualquer forma, no momento da busca; pesos iguais para os termos: todo termo atribuído a um documento tem peso igual, nenhum sendomais importante que o outro.3.3.8.2 Vantagens: independência da ordem de citação; permissão de uma maior revocação; mais eficiência,melhorando a qualidade e diminuindo o custo nas buscas automatizadas.3.3.8.3 Desvantagens: eficiência ligada à automação: as linguagensde indexação póscoordenadas são consideradas mais eficientes apenas quando usadas em sistemas automatizados; combinação dos termossomente na saída, podendose obter associações falsas e incorretas;21. 2 oferecimento de baixa precisão.Exemplos de linguagens póscoordenadas: Tesauros (descritores), o Sistema Unitermo3.3.9 Avaliaçãodas linguagens de indexaçãoA escolha de uma determinada linguagem de indexação para um SRI é uma tarefacomplexa e que exige muitoconhecimento da área do conhecimento em que o sistema estáinserido, os objetivos da instituição à qual está subordinado e, principalmente,os interessesdos usuários da informação.Alguns aspectos gerais devem ser observados para avaliação das LI pelo indexador: qualquer LIdeve estar permanentemente sendo avaliada (em comparação com a evolução da área e a conseqüente mutação do vocabulário, tanto dosautores como dos leitores) e atualizada (eliminação de termos obsoletos e introdução de termos novos). A criação de uma linguagem deindexação nova é um processo lento, caro e que exige recursos humanos qualitativa e quantitativamente preparados e disponíveis para isso, ,e a adaptação de uma linguagem já existente pode ser racional, eficiente e mais barata; Se a biblioteca ou centro de informação participar deuma rede ou de um sistema cooperativo, as decisões devem ser comuns, e apresentadas ao sistema para que possam ser incorporadas portodos os membros participantes. Se a instituição é isolada, a possibilidade de soluções individuais que melhor se adaptem ao SRI sãomaiores, devendose considerar as características da biblioteca. Caso sejam detectadas falhas na recuperação da informação, devesepesquisar as causas: Problemas na análise de assunto? Inadequações do vocabulário controlado? Falta de treinamento do usuário? Falta deremissivas e referências? Qual a providência tomar no caso de não existirem, na LI adotada no sistema, conceitos que não estãorepresentados? Em alguns sistemas, a admissão de novos termos é aceita mas, em outros casos, o indexador deverá usar descritores maisgenéricos.Nesse contexto, surgem dois conceitos que possibilitam também a avaliação de uma LI: arevocação e a precisão. Revocação é ocoeficiente entre o número de documentos inseridos22. 2no sistema versus o número de documentos relevantes recuperados pelo usuário, e aprecisão é o coeficiente entre o número dedocumentos inseridos no sistema e a precisão dabusca. Ex. Para a busca de documentos sobre Escultura, se o termo de busca for Artes,haveráalta revocação e baixa precisão, pois serão recuperados documentos que falam deescultura, mas não só sobre este assunto. Ao passo que, se abusca for feita pelo própriotermo Escultura, a revocação será baixa e haverá uma alta precisão, pois só serãorecuperados documentos sobreEscultura.Pesquisas mostram que um maior grau de especificidade eleva a taxa de precisão e baixa ade revocação; ao contrário, um aumentode exaustividade, eleva a taxa de revocação,baixando a de precisão.3.4 Consistência da indexaçãoUm aspecto importante a ser considerado éa consistência da indexação, que também serámuito afetada pela qualidade da linguagem adotada. O estabelecimento da linguagemdeindexação deverá ser feito tendo em vista a sua adequação ao sistema a que irá servir. Umfator importante é a qualidade de atualizaçãodessas linguagens, com a inclusão dos novostermos que surgem nos diversos campos das ciências, adequandose as linguagenscontroladas àsterminologias dessas áreas.A consistência da indexação está ligada a dois elementos básicos: ao desempenho doindexador e à qualidade dosinstrumentos de indexação. É importante que essa consistênciaseja regular, considerandose o fator tempo na operação de um determinadosistema, sendonecessário ao indexador um alto grau de imparcialidade e uma submissão às diretrizes daindexação adotadas pelo sistema.Devese procurar controlar a subjetividade, inerente aqualquer trabalho humano, e presente na atividade de indexação. A consistência édifícil deser obtida quando é grande o grupo de indexadores, ou quando trabalham em diferenteslocais. Nesses casos, é aconselhável que seestabeleça um grupo de controle centralizadopara a verificação das indexações feitas.Para se obter consistência na indexação é preciso, ainda,que se tenha bem estabelecida umapolítica de indexação, que siga critérios como nº de termos indexadores para cadadocumento(exaustividade), uso de singular ou plural, uso de siglas, termos em inglês erede sindética.23. 23.5 Indexação automática versus automatizadaPara a eficácia do controle e da organização das informações contidas em documentos,naatualidade, tornase imprescindível a automação de várias atividades desenvolvidas embibliotecas e centros de informação, e a adoção detecnologias da informação já é umarealidade na maioria desses. A indexação de documentos é uma das atividades em que setem investidomuitos recursos, visando aumentar a rapidez e a precisão na recuperação deinformações relevantes para os usuários.Há uma controvérsiaquanto ao uso das terminologias indexação automática eautomatizada, podendose sintetizar que, na primeira, o trabalho desenvolvido paraindexarassuntos é totalmente feito pelo computador, como indexação por palavras (KWIC), pelafreqüência com que as palavras aparecem notexto, entre outros. Já na indexaçãoautomatizada, a primeira etapa de extrair o conteúdo do documento (análise de assunto) éfeita por umindexador humano, que após seu trabalho intelectual, insere os termos numabase de dados automatizada. No entanto, não há um consensoquanto a essa diferençaapresentada, podendose verificar os dois termos usados, também, como sinônimos.Para finalizar, levantase umaquestão para reflexão dos bibliotecários: até que ponto podese delegar à máquina a tarefa de indexação? Onde poderia se apontar um limitepara asatividades desenvolvidas pela máquina? Seria, essa, já programada para exercer atividadesmentais como abstrair, interpretar,compreender e perceber, características inerentes ao serhumano? REFERÊNCIASBEGHTOL, Clare. Bibliographic classification theory andtext linguistics: aboutness,intertextuality and the cognitive act of classifying documents. Journal of Documentatin,v.42, n.2, p.84113,Jun.1986.CESARINO, Maria Augusta N., PINTO, Maria Cristina M.F. Análise de assunto. Revistade Biblioteconomia de Brasília, v.8, n.11,p.3343, 1980.24. 2DAHLBERG, Ingetraut. Teoria do conceito. Ciência da Informação, v.7, n.2, p.101107,1978.FOSKETT, A C. The subject approach toinformation. 5.ed. London: C.Bingley, 1996.FROHMANN, B. Rules of indexing: a critique of mentalism in information retrievaltheory.Journal of Documentation, v.46, n.2, p.81101, Jun.1990.LANCASTER, F.W. Indexação e resumos: teoria e prática. Brasília: BriquetdeLemos/Livros, 1993NAVES, Madalena M. L. Fatores interferentes no processo de análise de assunto: estudode caso de indexadores. BeloHorizonte: ECI/UFMG, 2000. (Tese, doutorado em Ciênciada Informação)PINTO MOLINA, Maria. Interdisciplinarly approaches to theconcept and practice ofWritten Documentary Content Analysis (WTDCA). Journal of Documentation, v.50, n.2,p.1111333,Jun.1994.RAMSDEN, M.J.An introduction to index language construction: a programmed text.London: C.Bingley, 1974. (Trad. e adap. deMaria Cristina M.F.Pinto)

Page 31: Principios tecnicas de_indexacao[1].pdf

RecomendadoMore from this author

Indexação De LivrosCamila Ribeiro3,686

Aula 2 taxonomias giseleGisele Dziekaniak2,413

1ª aula indexacao 2013Gisele Dziekaniak3,515

Diretrizes básicas para indexaçãoAlan Kardec Vilarinho Machado1,132

Política de indexaçãoSuzene Furtado2,751

Sistemas de classificação bibliográfica [perspectivas da biblioteconomia contem…...Daniel Ribeiro dos Santos16,169

Page 32: Principios tecnicas de_indexacao[1].pdf

Elab2010cibeleac6,881

Classificação Decimal Universal 1Raquel Prado5,764

Slides de cduUniversidade Federal do Ceará13,979

Tesauros: Origem, Evolução e RelaçõesIzabel Lima6,157

837 a massacrante felicidade doUNIVERSIDADE FEDERAL DO PARÁ161

PORTUGUÊS (BRASIL)EnglishFrançaisEspañolPortuguês (Brasil)Deutsch

InglêsEspanholPortuguesFrançaisDeutsche

SobreCarreirasDev & APIImprensaBlogTermosPrivacidadeDireitos AutoraisSuporte

LinkedIn Corporation © 2015

Page 33: Principios tecnicas de_indexacao[1].pdf

×Compartilhe este documentoInserir este documentoCurta este documentoVocê curtiu este documentoSalvar este documento