“AS LINGUAGENS DOCUMENTAIS” - ancacid.yolasite.comancacid.yolasite.com/resources/02.002 -...

84
LICENCIATURA EM CIÊNCIAS DA INFORMAÇÃO E DA DOCUMENTAÇÃO ANÁLISE E LINGUAGENS DOCUMENTAIS III AS LINGUAGENS DCUMENTAIS UNIVERSIDADE ABERTA 2011/2012 CADERNO DE APOIO ATIVIDADE 2 “AS LINGUAGENS DOCUMENTAIS”

Transcript of “AS LINGUAGENS DOCUMENTAIS” - ancacid.yolasite.comancacid.yolasite.com/resources/02.002 -...

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    CADERNO DE APOIO

    ATIVIDADE 2

    AS LINGUAGENS DOCUMENTAIS

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    2

    Caderno de apoio atividade 2

    ndice

    I - As linguagens documentais

    Breve apontamento histrico 6

    Tipologia das linguagens documentais 9

    Qual a necessidade de utilizar e desenvolver linguagens documentais? 11

    Controlo do vocabulrio 11 o Sinonmia 12 o Polissemia 12 o Homonmia 12 o Singular e plural 12 o Controlo formal 13 o Controlo semntico 13

    As relaes semnticas 14 o Relaes de equivalncia 14 o Relaes hierrquicas 15 o Relaes associativas 16

    II Os tesauros 17

    Funes do tesauro 19

    Composio do tesauro 19

    Normas de apresentao dos descritores 20

    Formas de apresentao dos descritores 23 o Apresentao alfabtica 23 o Apresentao sistemtica 24

    Domnios 25 Facetas 25 Combinao dos dois tipos 25

    o Apresentao grfica 25 Estrutura arborescente 25 Esquema em flecha 25

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    3

    III EUROVOC 27

    Historial 27

    o Evoluo do EUROVOC 28 o Concluses 28

    Estrutura 29 o Domnios 29 o Microtesauros 30 o Relaes semnticas 30

    Caractersticas quantitativas 31

    Apresentaes impressas 31 o Conselhos de utilizao 32 o Na prtica a indexao realiza-se da seguinte forma 32 o A representao dos conceitos 34 o A seletividade da indexao 35 o A exaustividade condicionada 35 o Taxa de recuperao e de preciso 36 o A especificidade da indexao 36 o Indexao hierrquica 37

    Conselhos para a formulao de questes 38

    Vantagens e limitaes da utilizao do EUROVOC na indexao 40

    Preenchimento do Bloco 6 Assuntos do UNIMARC Bibliogrfico 41

    IV Classificao Decimal Universal 43

    Antecedentes histricos 43 Caractersticas do sistema 44

    o Classificao 44 o Decimal 46 o Universal 46 o Princpios fundamentais 47 o Termos simples e termos compostos 48

    Flexibilidade do sistema 48

    Ordem de citao 49

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    4

    Anlise do tema 54

    Estrutura da CDU 55 o Tabelas auxiliares 56

    Seco I sinais e subdivises auxiliares comuns 57

    Tabela 1 a. Adio. Extenso 57

    Tabela 1 b. Relao. Subagrupamento. Fixao da ordem 58

    Tabela 1 c. Auxiliares comuns de lngua 59

    Tabela 1 d. Auxiliares comuns de forma 60

    Tabela 1 e. Auxiliares comuns de lugar 61

    Tabela 1 f. Auxiliares comuns de raa, grupo tnico e nacionalidade 62

    Tabela 1 g. Auxiliares comuns de tempo 62

    Tabela 1 h. Notaes que no pertencem CDU 63

    Tabela 1 k. Auxiliares comuns de caractersticas gerais (propriedade,

    materiais, pessoas e

    caractersticas pessoais) 65

    Seco II Auxiliares especiais 67 Tabelas principais 67

    Tabela 0 68

    Tabela 1 70

    Tabela 2 70

    Tabela 3 71

    Tabela 4 72

    Tabela 5 72

    Tabela 6 73

    Tabela 7 74

    Tabela 8 75

    Tabela 9 77

    Terminologia da CDU 79

    Vantagens e desvantagens da utilizao da CDU na indexao 80

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    5

    Preenchimento do campo 675 no Bloco 6 Assuntos do UNIMARC Bibliogrfico 81

    Bibliografia 82

    Anexo A 84

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    6

    I - As linguagens documentais

    No tpico 1 demos uma primeira definio de linguagem documental como

    sendo uma linguagem artificial, convencional e controlada, utilizada para

    descrever o contedo dos documentos, possibilitando o arquivamento da

    informao e posterior recuperao. Salientemos agora as trs

    caractersticas dessas linguagens:

    artificiais

    controladas

    convencionais

    1. Artificial porque utiliza signos alfabticos ou numricos para representarem conceitos segundo regras prprias e

    dentro de um contexto restrito.

    2. Controladas porque foram desenvolvidas, precisamente, para permitirem a representao de um conceito de forma

    unvoca, recorrendo sempre ao mesmo termo de indexao,

    de modo a que a ambiguidade seja minimizada ou mesmo

    anulada. A ambiguidade surge quando uma palavra pode

    designar indiferentemente diversos objetos distintos. Por

    exemplo: Seminrio (religioso) e Seminrio (reunio de

    estudo).

    3. Convencionais porque utilizam signos ou cdigos (alfabticos, numricos ou alfanumricos) cuja utilidade

    reside na univocidade de contedo. O que s possvel,

    respeitando as normas e o corpo de regras subjacentes que

    permitem efetivar a cooperao entre bibliotecas, ou seja, a

    troca de dados bibliogrficos.

    Breve apontamento histrico

    As primeiras linguagens documentais a serem desenvolvidas foram as

    classificaes universais de carter enciclopdico (abarcavam todas as

    reas do conhecimento humano) e datam dos finais do sculo XIX.

    Destacamos a Classificao Decimal de Dewey e a Classificao Decimal

    Universal que so, como refere Lusa Santos (2007:50), ainda hoje

    importantes instrumentos de organizao e de representao dos contedos

    temticos existentes e /ou disponibilizados pelas bibliotecas (),

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    7

    adequavam-se no s representao, numa linguagem uniforme, dos

    principais assuntos dos documentos, mas tambm sua organizao fsica

    nas estantes e salas das bibliotecas, de acordo com as vrias temticas. So

    ambas classificaes de tipo hierrquico, que tm subjacente uma

    organizao sistemtica do conhecimento cuja estrutura reflete a poca em

    que foram concebidas. A mesma autora considera ainda que existem

    algumas diferenas fundamentais que distinguem estas duas classificaes,

    entre as quais o facto da CDD ter mantido uma caracterstica

    marcadamente enumerativa e a CDU, trs vezes maior que a CDD, ter

    evoludo como uma classificao sinttica (SLAVIC, 2000:3), com

    evidentes vantagens a nvel de cobertura de assuntos (em nmero ilimitado)

    e da sua combinao. Esta caracterstica confere-lhe tambm um maior

    suporte a nvel das ferramentas da gesto documental (SLAVIC, 2000:7).

    A cadeia notacional que construmos quando classificamos um assunto

    (com base nas tabelas principais, para as classes e subclasses e nas tabelas

    auxiliares, para os auxiliares comuns) corresponde, na realidade, a um

    termo de indexao pr-coordenado, em que cada elemento, tem o mesmo

    significado quer se encontre isolado, quer conste de uma qualquer

    combinao.

    As classificaes podem ser tipificadas quanto abrangncia temtica

    (universais, gerais ou especializadas) e quanto organizao e estrutura

    (enumerativas, hierrquicas, de facetas). Seguem os princpios da pr-

    coordenao.

    As linguagens vocabulares ou terminolgicas, tambm designadas por

    combinatrias (porque combinam os termos de indexao) surgem,

    igualmente, nos finais do sculo XIX, com a utilizao da primeira lista de

    cabealhos de assunto ou lista de encabeamento de matrias. A mais

    conhecida destas linguagens a LCSH Library of Congress Subject

    Headings, que inspirou diretamente outras do mesmo tipo, como a do

    Rpertoire de vedettes-matire (RVM) da Biblioteca de Laval (Qubec,

    Canad) e a linguagem Rameau dela derivada, alm de ter servido tambm

    de base conceptual do SIPORbase Sistema de Indexao em Portugus

    (SANTOS, 2000:54). Seguem os princpios da pr-coordenao, da

    especificidade e da entrada direta.

    Os tesauros (linguagens vocabulares) aparecem apenas no sculo XX

    (1958) e como considera Lusa Santos (2000:52), uma vez que utilizavam

    uma linguagem controlada mais prxima da linguagem natural,

    terminolgica e no notacional ou simblica, pareciam mais prximos de

    satisfazer as necessidades crescentes de informao por permitirem um

    tratamento dos contedos temticos de um modo mais especfico, ao nvel

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    8

    do conceito, sem que se perdesse a rede de relaes semnticas do termo

    correspondente ao conceito por ele representado. Pretendem responder s

    necessidades impostas pela exploso documental verificada e ao advento da

    informatizao documental. A sua aplicao adequava-se a reas

    especializadas, eram mais fceis de utilizar, exigiam menos tempo ao

    indexador na representao dos assuntos, e eram mais rpidos na

    recuperao da informao, j que a informtica respondia bem. Seguem os

    princpios da ps-coordenao.

    Os cabealhos de assunto so linguagens terminolgicas muito

    dispendiosas para os servios, pois exigem muito tempo por parte do

    indexador na representao dos assuntos (mas garantem a integridade e a

    especificidade da informao), possibilitam uma maior preciso na

    descrio dos assuntos complexos e permitem uma perceo mais imediata,

    por parte do utilizador, do contedo temtico dos itens. Estas linguagens

    so adequadas s necessidades de bibliotecas de carter geral, cujos acervos

    refletem uma grande diversidade temtica, mas tambm a bibliotecas

    especializadas (SANTOS 2000:54). Uma vez que os termos so

    combinados entre si por meio de uma estrutura sinttica complexa que

    requer uma maior interveno do indexador, maior domnio de um sistema

    complexo e exige sistemas informticos mais dinmicos, como os atuais,

    mas inexistentes naquela data. A informtica, nos meados do sculo XX,

    no tinha capacidade para potencializar as pesquisas por assunto, utilizando

    as linguagens de cabealhos de assunto. Esta incompatibilidade, asssociada

    aos custos do tratamento da informao, fizeram cair em desuso as

    linguagens que utilizavam cabealhos de assunto. Surge a era do tesauro,

    enquanto linguagem documental.

    Na ltima dcada do sculo XX, com o aumento de recursos digitais

    disponveis e com os desenvolvimentos da Web semntica surgiu A nova

    gerao de sistemas de organizao do conhecimento, (Menon, 2004):

    o As ontologias so formas de representao de um determinado domnio do conhecimento, que permitem o estabelecimento de

    relaes e apresentam suficiente flexibilidade para poderem ser

    partilhadas e reutilizadas. Podem conter termos descritivos variveis

    e, acima de tudo, podem exprimir toda a estrutura semntica e todas

    as relaes numa linguagem compreendida pelo computador

    (SANTOS, 2000:65).

    o Mapas conceptuais os mapas conceptuais so uma tcnica de representao visual do conhecimento na qual a informao, os

    conceitos e as suas relaes aparecem representados sob a forma de

    diagramas ou mapas. Este modelo de organizao do conhecimento

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    9

    tem a vantagem de proporcionar a representao estruturada do

    conhecimento em forma de rede as redes semnticas. Os mapas

    conceptuais ao apresentarem uma representao grfica dos

    conceitos e suas relaes permitem uma melhor apreenso do

    contedo informativo dos documentos e ajudam a apreender novos

    significados e a integrar estes novos conceitos nas relaes j

    existentes, ao permitirem desenvolver novas relaes conceptuais de

    forma dinmica (SIMES, 20008:69-70).

    o Taxonomias constituem um esquema ordenado do conhecimento em vrias reas, segundo determinadas regras ou normas. So

    instrumentos de organizao do conhecimento construdos e

    desenvolvidos em ambientes de tecnologia informtica, tambm so

    aplicados aos mesmos, sendo cada vez mais usados na Internet,

    nomeadamente nos diretrios da Web (SIMES, 2008:73).

    Tipologia das linguagens documentais:

    Como refere Gil Urdician (2004) existem diversos critrios de tipificao

    das linguagens documentais, sendo os mais conhecidos:

    os do controlo;

    os da coordenao dos termos;

    e o estrutural.

    Dependendo do controlo exercido sobre o vocabulrio, as linguagens

    podem organizar-se em duas categorias:

    livres - Por exemplo: Listas de termos, Terminologias, etc;

    controladas Por exemplo: As classificaes e os tesauros. Por controladas entendem-se as linguagens

    que apresentam um vocabulrio previamente

    definido, estabelecem as orientaes para a sua

    utilizao e admitem um nmero limitado de

    alteraes. So vocabulrios construdos a priori.

    O critrio de coordenao dos termos est dependente do momento em que

    se realiza a combinao dos vrios elementos que compem uma

    linguagem documental.

    Se os termos se combinam quando se elabora a linguagem ou no momento da descrio, a

    linguagem diz-se pr-coordenada

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    10

    Se a combinao feita no momento da recuperao, diz-se que a linguagem ps-

    coordenada.

    Exemplificando: as classificaes e os cabealhos de assunto so

    linguagens pr-coordenadas e os tesauros so linguagens ps-coordenadas.

    Nos sistemas pr-coordenados, como no SIPORbase (Sistema de Indexao

    em lngua portuguesa) desenvolvido e aplicado pela BNP, os termos de

    indexao (designados por cabealhos de assunto) combinam-se de acordo

    com regras sintticas estabelecidas pelo prprio sistema, no momento da

    indexao. Os termos de indexao podem j existir na base ou no. No

    caso de ainda no existir um cabealho de assunto adequado, o indexador

    ter de o estabelecer pela primeira vez, cumprindo todas as regras definidas

    no Manual SIPORbase. uma linguagem em construo constante, de

    acordo com as necessidades do indexador e do documento a indexar.

    Nas linguagens ps-coordenados a sintaxe booleana e os termos simples

    ligam-se no momento da pesquisa. So linguagens que sofrem atualizaes

    cclicas, mas que podem no responder de imediato necessidade do

    indexador e do documento a tratar.

    Finalmente, quanto ao critrio da estrutura, podemos identificar dois tipos

    de linguagens:

    as de estrutura hierrquica ou categorial onde encontramos determinadas classificaes, cuja

    estrutura estabelece que o conceito mais genrico ou

    categoria de assunto, representado por um cdigo

    numrico construdo com um menor nmero de

    dgitos e quanto maior for a especificidade do

    conceito maior o nmero de dgitos que compem

    o cdigo, A hierarquia conceptual reflete a

    hierarquia numrica;

    as de estrutura combinatria onde podemos encontrar os tesauros e os cabealhos de assunto

    A NP 4285-4 (2000:4), define linguagem documental como uma

    linguagem formal utilizada para caracterizar os dados ou o contedo de

    documentos e permitir o seu armazenamento e recuperao. Significa isto,

    que quando necessitamos de realizar uma pesquisa temtica ou por assunto,

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    11

    ou seja, responder questo chave: Qual o assunto deste documento?

    Recorremos a estas linguagens designadas, de um modo genrico de

    linguagens documentais. Neste caso, elas intervm na terceira fase do

    processo de indexao (ver tpico 1):

    1. anlise e compreenso do texto e do seu contedo informativo; 2. representao verbal do contedo informativo, identificao e

    seleo dos conceitos;

    3. representao desses conceitos na linguagem documental

    Qual a necessidade de utilizar e desenvolver linguagens

    documentais?

    A necessidade de criar e desenvolver linguagens documentais para

    representarmos os contedos dos documentos, surge para obviar as

    dificuldades levantadas pelo uso da linguagem natural (a linguagem que

    todos ns utilizamos no nosso dia a dia) e da ambiguidade que lhe

    inerente. As dificuldades de comunicao que o recurso linguagem

    natural apresenta e que todos j vivenciamos, por mais de uma vez, tm de

    ser minimizadas, num servio de informao.

    Estes servios podem recorrer a linguagens codificadas onde a informao

    representada por meio de cdigos classificaes bibliogrficas - ou

    podem fazer recurso a linguagens alfabticas, terminolgicas ou

    vocabulares, onde a informao representada atravs de termos retirados

    da linguagem natural mas cujo significado est controlado. O uso de

    qualquer linguagem documental resulta da necessidade de responder de um

    modo rpido, eficaz e sem ambiguidades s necessidades dos utilizadores,

    facilitando o acesso rpido informao procurada. Para que tudo isto seja

    possvel, tornou-se indispensvel recorrer a vocabulrios controlados, de

    modo a realizarmos uma indexao de qualidade.

    O controlo do vocabulrio

    A NP 4036 (1999), define linguagem de indexao como o conjunto

    controlado de termos escolhidos numa linguagem natural e utilizados para

    representar sob forma coordenada o contedo dos documentos.

    Vamos analisar o conjunto de obstculos lingusticos, mais frequentes, que

    a linguagem natural apresenta. A anlise incide, apenas, nos problemas

    mais correntes na prtica do documentalista, quando pretende utilizar e/ou

    desenvolver uma linguagem terminolgica controlada:

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    12

    A sinonmia

    Os sinnimos definem-se como uma equivalncia entre palavras diferentes

    mas cujo significado o mesmo ou muito semelhante, nestes casos falamos

    de quasi-sinnimos. Por exemplo: roubar e furtar

    A polissemia

    A polissemia a propriedade que uma palavra ou item lexical possui ao

    apresentar vrias acees ou significados. A fronteira entre a polissemia e a

    homonmia nem sempre clara.

    A homonmia

    Apresenta as mesmas caractersticas da polissemia, menos o tratamento

    semntico comum. A classe dos homnimos subdivide-se em:

    o Homgrafas So as palavras que tm a propriedade de possuir a mesma grafia, mas

    pronncia e significado diferentes. Exemplo: almoo (refeio) e almoo

    (verbo almoar) e sede (vontade de beber) e sede (residncia).

    o Homfonas So as palavras que se pronunciam de forma igual, mas possuem grafia e

    significados diferentes. Exemplo: Cozer a comida e coser a roupa.

    Singular e plural

    A utilizao da forma singular ou plural uma questo bsica e

    extremamente importante. Todo o vocabulrio controlado deve estabelecer

    os termos aceites e contemplar a forma que foi rejeitada. Por exemplo:

    Alunos (termo aceite);

    Aluno (termo no aceite)

    USE Alunos

    A deciso acerca da forma a adotar para cada termo a estabelecer, depende

    da seguinte questo: Os termos que representam entidades enumerativas,

    como nomes ou objetos aos quais se pode aplicar a pergunta QUANTOS?

    Devem ser expressos no plural. Por exemplo: Quantos documentos?

    Quantos alunos? Quantos ovos?

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    13

    Os termos que representam entidades no contveis como nomes de

    materiais ou de substncias s quais se pode aplicar a pergunta QUANTO?

    Devem ser expressos no singular. Por exemplo:

    Quanto caf? Quanto ferro?

    Devem ser expressas no singular os nomes de entidades abstratas

    como:

    Fenmenos (personalidade, inverno);

    Propriedades (fragilidade, opacidade);

    Religies (Catolicismo, Hindusmo);

    Atividades (corte; emigrao, respirao);

    Disciplinas (Fsica; Psicologia);

    O indexador dever estabelecer o controlo do vocabulrio nas linguagens

    documentais a dois nveis, como refere Graa Simes (2008: 95):

    1. Controlo formal que inclui o controlo morfolgico e o controlo sinttico;

    2. Controlo semntico que abarca as relaes semnticas; as notas explicativas e as definies.

    1. Controlo formal

    Dentro da normalizao formal, e no que concerne em particular ao

    controlo morfolgico, este tem a ver com a normalizao das unidades

    lexicais relativamente a trs aspetos: escolha da lngua, o gnero e o

    nmero em que se devem expressar.

    Continuando a citar a mesma autora, No que concerne ao aspeto sinttico,

    este prende-se com a normalizao da forma dos termos, em particular com

    a estrutura dos termos compostos que se usam no tesauro, sempre que por

    diversos condicionalismos no seja possvel representar um conceito

    atravs de um termo simples, j que o uso do termo simples a forma

    consagrada pela Norma ISO 2788.

    2. Controlo semntico

    Aqui o objetivo principal a normalizao conceptual de modo a evitar a

    ambiguidade semntica que como j vimos uma caracterstica da

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    14

    linguagem natural e que gera rudo e silncio na recuperao da

    informao. De acordo com a autora supra citada (SIMES, 2008:104)

    importante analisar o controlo semntico seguindo duas vias:

    Controlo semntico via significante, onde devemos atender s questes da polissemia, da homonmia, dos qualificadores e

    definies.

    Controlo semntico via significado, onde atendemos aos aspetos da sinonmia (sinnimos e quasi-sinnimos) e s relaes de

    equivalncia

    As relaes semnticas so de ts tipos:

    1. Relaes de equivalncia so estabelecidas com a funo de controlarem a sinonmia.

    Podemos identificar algumas classes de sinnimos. Por

    exemplo:

    Termos de origem lingustica diferente (lanchar e merendar);

    Termos antigos e atuais (aeroplano e avio);

    Termos com grafias diferentes (ouro e oiro)

    Termos equivalentes em lnguas diferentes (abstract e resumos)

    Termos populares e termos cientficos (aspirina e cido acetilsaliclico);

    Termos de uso geral e de uso local (conchas e caos)

    Nomes comuns e nomes de marcas (garrafa isoladora e garrafa de termos)

    Entre siglas, acrnimos e o seu desenvolvimento (UE e Unio Europeia)

    Estas relaes so assimtricas e irreversveis, na medida em que um

    termo preferencial ou aceite est ligado a um termo no preferencial e

    um termo no preferencial dever estar ligado, obrigatoriamente, ao

    termo preferencial. Por exemplo:

    Doentes mentais (termo aceite)

    UP Doentes psiquitricos (termo no aceite)

    Doentes psiquitricos

    USE Doentes mentais

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    15

    2. Relaes hierrquicas baseiam-se em graus ou nveis de superioridade ou de subordinao, nos quais o termo superior

    representa uma classe ou um todo e os termos subordinados

    elementos ou partes. Estas relaes so recprocas e

    assimtricas (na medida em que a um descritor de nvel

    superior corresponder um de nvel inferior e vice versa)

    Existem trs tipos de relaes hierrquicas:

    Relao genrica identifica a posio que os membros de uma classe ou categoria tm dentro dela. O descritor de nvel inferior

    especfico do descritor de nvel superior. Por exemplo:

    TG Pssaros

    TE Papagaios

    Papagaios

    TG Pssaros

    Relao partitiva ou todo/parte - esta relao cobre uma gama limitada de situaes nas quais a parte est implcita no todo, em

    qualquer contexto. Os termos podem ento ser organizados

    hierarquicamente, servindo o todo de termo superior e a parte de

    termo subordinado. Por exemplo:

    TG Sistema cardiovascular

    TE Artrias

    Artrias

    TG Sistema cardiovascular

    Relao de instncia identifica a relao que existe entre uma categoria geral de coisas ou acontecimentos, expressas por um nome

    comum e um espcime individual dessa categoria, que forma uma

    classe de um s elemento e representado por um nome prprio. Por

    exemplo:

    TG Regies montanhosas

    TE Himalaias

    Himalaias

    TG Regies montanhosas

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    16

    3. Relaes associativas incluem relaes entre pares de termos

    que no fazem parte de um mesmo conjunto de equivalncias. Os

    termos associados no fazem parte da mesma cadeia hierrquica,

    mas esto mentalmente associados (existindo entre eles uma

    analogia semntica), de tal forma que a relao entre os termos

    deve ser especificada. No se pode associar um termo genrico a

    um termo especfico, e vice-versa, pois os termos da mesma

    cadeia nunca podem ser associados. Estas relaes so

    recprocas e simtricas, uma vez que quando se associa um termo

    a outro, devemos obrigatoriamente fazer o inverso. Por exemplo:

    Doentes mentais

    TR Hospitais psiquitricos

    Hospitais psiquitricos

    TR Doentes mentais

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    17

    II - Os tesauros

    Referimos, anteriormente, que os tesauros, enquanto linguagens

    documentais vocabulares, so relativamente recentes, uma vez que surgem

    apenas em meados do sculo XX. A sua expanso foi muito rpida, pois

    contribuiram de um modo muito eficaz para o controlo das terminologias

    em reas disciplinares especficas, para o processamento mais rpido da

    informao e para a cooperao e a interoperabilidade dos servios.

    A NP 4285-4 (2000:5) define tesauro (Thesaurus) como o vocabulrio

    controlado de termos com relaes semnticas abrangendo um ou vrios

    domnios particulares do conhecimento.

    A NP 4036 (1992:5) define tesauro: vocabulrio de uma linguagem de

    indexao controlada, organizado formalmente de maneira a explicitar as

    relaes estabelecidas a priori entre os conceitos (por exemplo, relao

    genrica e especfica).

    Os tesauros so construdos segundo o princpio combinatrio, baseado na

    combinao de termos, utilizando os operadores booleanos (AND; OR;

    NOT) quando se realiza a pesquisa.

    O tesauro uma lista normalizada e estruturada de termos aceites para a

    indexao de documentos de uma ou vrias reas do conhecimento. Os

    termos so combinados entre si, de modo a descreverem os assuntos dos

    documentos e a responderem s questes colocadas junto dos diferentes

    servios de informao. Os tesauros so instrumentos muito teis para a

    indexao pois fornecem uma viso estruturada do vocabulrio de uma

    disciplina. Esta uma das suas potencialidades e que seria totalmente

    anulada se pretendessemos criar tesauros generalistas.

    Existem, contudo, alguns tesauros de mbito alargado, de tipo

    enciclopdico, como o Macrothesaurus da OCDE (disponvel em

    http://bibliotecavirtual.clacso.org.ar/ar/oecd-macroth/), concebido para o

    processamento da informao relativa ao desenvolvimento econmico e

    social. Abarca um leque alargado de disciplinas e pode ser visto como uma

    metalinguagem estruturada, controlada, mas que no especifica cada rea

    ou disciplina, como acontece com os tesauros que abarcam apenas um

    dominio do conhecimento.

    http://bibliotecavirtual.clacso.org.ar/ar/oecd-macroth/

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    18

    O EUROVOC (disponvel em http://europa.eu/eurovoc/), tesauro criado

    por e para os servios de informao do Parlamento Europeu, abarca todos

    os assuntos ligados aos dominos polticos e jurdicos na tica dos

    parlamentares.

    Os tesauros so instrumentos de indexao e de pesquisa, comuns ao

    indexador e ao utilizador, permitindo estabelecer a relao entre a pergunta

    e a informao pertinente de uma base de dados acerca do assunto X.

    Um tesauro caracteriza-se pela natureza e o nmero de relaes existentes

    entre os termos. Quando se pretende estabelecer um novo tesauro,

    comeamos por:

    recolher vocabulrio relativo ao assunto em causa, no qual o tesauro ser utilizado;

    reunimos uma lista de termos, apelidados de candidatos a descritores;

    com base nessa lista, passamos a selecionar os descritores e no descritores, nesta operao de

    depurao, os termos so examinados um a um,

    utilizando diversos crivos, partindo do princpio que

    os tesauros s devem autorizar os descritores

    necessrios e suficientes para cobrir aquele domnio

    concreto. Esta fase extremamente importante e o

    ponto de partida para a normalizao e o controlo do

    vocabulrio coligido;

    a cada conceito corresponde um nico descritor

    Na elaborao dos thesauri ou tesauros, o controlo semntico reveste-se de

    grande importncia, pois permite restringir o significado das palavras

    extradas da linguagem natural e por sua vez evitar a ambiguidade

    semntica que pode provocar rudo ou silncio no ato da pesquisa de

    documentos. O controlo semntico, atravs de vrias estratgias, como a

    utilizao de qualificadores, de notas explicativas e o recurso s relaes

    semnticas (relaes de equivalncia, relaes hierrquicas e relaes

    associativas), faz o controlo da polissemia (homnimos e homgrafos) e o

    controlo da sinonmia (sinnimos e quasi-sinnimos), com o objetivo de

    assegurar que cada termo tem um nico significado.

    http://europa.eu/eurovoc/

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    19

    Seguindo a sistematizao de Gil Urdician (2004:185) acerca dos tesauros

    destacamos:

    Funes do tesauro

    1. Normalizao do vocabulrio; 2. Induo; 3. Representao

    A normalizao do vocabulrio tem como objetivo unificar todo o lxico

    do tesauro de modo a controlar todas as possveis entradas. J vimos como

    importante estabelecer o controlo formal e semntico dos termos.

    A induo serve para que o tesauro indique sistematicamente todas as

    alternativas possveis de entradas que permitam recuperar informao

    pertinente, para uma dada pesquisa.

    A representao a funo decorrente de qualquer linguagem

    documental, ao estabelecer a correspondncia entre os descritores (termos

    de indexao de um tesauro) e os conceitos presentes nos documentos.

    Composio do tesauro

    Os tesauros compem-se de:

    unidades lexicais:

    descritores;

    no-descritores ou termos equivalentes;

    relaes semnticas:

    relaes de equivalncia;

    relaes hierrquicas;

    relaes associativas

    Os descritores podem ser tipificados do seguinte modo:

    Quanto sua carga informativa podem ser:

    primrios quando representam um conceito de maneira unvoca, utilizando um nico termo;

    secundrios quando a representao feita com recurso a termos compostos)

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    20

    Quanto ao seu contedo podem ser:

    onomsticos (representam o nome de uma pessoa individual ou coletividade;

    geogrficos (representam conceitos de mbito geogrfico);

    materiais ou temticos (representam conceitos muito diferentes e por isso so os mais dificeis de

    controlar. Cobrem entidades concretas e

    abstratas);

    cronolgicos (representam um espao temporal, sejam datas, perodos , etc.)

    Quanto composio podem ser:

    descritores simples (representam os conceitos mediante uma nica palavra);

    descritores compostos (representam o conceito utilizando:

    um sintagma nominal [nome + adjetivo] ou

    preposicional [conjunto de termos unidos por

    nexos gramaticais].

    Normas de apresentao dos descritores

    A NP 4036 (1992) estabelece algumas consideraes essenciais sobre a

    morfologia dos descritores:

    Os descritores devem ser impressos em maisculas;

    Os no descritores devem ser impressos em minsculas;

    Nomes e expresses nominais os termos de indexao devem ser expressos na

    forma de nome (substantivo) ou expresso

    nominal. As expresses nominais pertencem

    categoria de termos compostos e apresentam-se

    sob duas formas:

    Expresses adjetivas [nome+adjetivo]

    Expresses prepositivas [nome+ preposio+nome]

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    21

    Adjetivos utilizados isoladamente podem ocorrer numa

    linguagem de indexao em situaes excecionais;

    Advrbios como mais ou muito nunca devem ser

    utilizados como termos de indexao;

    Verbos verbos no infinito ou no participio no devem ser

    utilizados isoladamente como termos de indexao.

    As atividades devem ser representadas por nomes

    ou expresses verbais;

    Abreviaturas ou acrnimos no devem ser utilizadas como descritores, exceto

    se estiverem largamente divulgadas e forem

    facilmente reconhecidas no domnio/rea do

    conhecimento coberto pelo tesauro.

    Escolha da forma singular ou plural nas lnguas em que existe uma distino entre

    singular e plural, a deciso de adotar uma ou outra

    forma para termos de indexao pode ser

    determinada pelos seguintes fatores:

    a) indexao pr-coordenada ou ps-coordenada;

    b) fatores culturais

    Nos organismos onde se pode adotar

    indiferentemente a forma singular ou plural para

    um termo, a escolha entre as duas formas depende,

    em geral, do tipo de noo que ele exprime.

    Quando a forma singular e plural de um termo se

    reportam a noes diferentes, ambas podem

    constar no tesauro, ou seja, ambas so termos

    descritores. Se necessrio, a distino deve ser

    indicada atravs de um qualificador. Por exemplo:

    MEMRIA (processo mental)

    MEMRIAS (gnero literrio)

    De notar que o qualificador faz parte integrante do

    termo de indexao.

    Nomes de lugar

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    22

    Nomes de pases ou regies geogrficas variam

    muitas vezes de uma para a outra lngua e, por

    vezes existem variantes na mesma comunidade

    lingustica, pelas razes seguintes:

    a) Um nome oficial e uma variante corrente so

    empregues indiferentemente. Por exemplo:

    HOLANDA

    PASES BAIXOS

    b) Coexistem a forma original e traduo

    LEGHORNO

    LIVORNO

    Regra geral, opta-se pelo nome mais familiar aos

    utilizadores do tesauro e ser designado como

    descritor. No havendo diferenas, a preferncia

    dever ser dada forma oficial e no forma

    corrente. Devero ser estabelecidas, neste caso,

    remissivas recprocas. Por exemplo:

    PASES BAIXOS

    UP Holanda

    Holanda

    USE PASES BAIXOS

    Nomes prprios de instituies ou de pessoas Estes nomes so frequentemente excludos de um

    tesauro. Quando includos, a sua forma deve

    obedecer s regras de catalogao do pas.

    Notas explicativas e definies Podem acompanhar o termo para limitar e precisar

    o sentido em que este deve ser utilizado e assim

    excluir outros significados possveis. Outro tipo de

    informao pode igualmente ser fornecido numa

    nota explicativa:

    a) data de adoo de um termo;

    b) fonte do termo;

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    23

    c) instrues de aplicao do termo para os

    indexadores: A nota explicativa no faz parte do

    termo e registada num campo especfico do

    registo de autoridade;

    Apresentao dos termos e suas relaes, existem vrias formas de apresentar os termos e

    as suas relaes num tesauro. Esta Norma no

    pretende esgotar todas as formas possveis de

    apresentao, limitando-se descrio de trs

    mtodos bsicos, de uso corrente:

    a) apresentao alfabtica; contendo as notas

    explicativas e indicao das relaes entre os

    termos;

    b) apresentao sistemtica, acompanhada de um

    ndice alfabtico;

    c) apresentao grfica, acompanhada de um

    ndice alfabtico.

    Alguns tesauros utilizam, como forma de

    apresentao, apenas um destes tipos bsicos, no

    entanto, outros h que utilizam mais do que um.

    Por exemplo, um tesauro cuja parte principal se

    apresente sob a forma sistemtica, pode ser

    apoiado num ndice alfabtico contendo as

    relaes semnticas entre os termos. Nos tesauros

    que so constitudos por vrias partes (sistemtica

    e grfica) toda a informao relativa a cada termo

    dever estar reunida numa das partes.

    Formas de apresentao dos descritores

    Vamos analisar, resumidamente, cada uma das formas de apresentao dos

    termos e suas relaes, continuando a citar as orientaes da NP 4036

    (1999):

    I) Apresentao alfabtica

    Nesta forma de apresentao todos os termos, descritores e no-descritores,

    esto organizados numa sequncia alfabtica nica. Os no descritores so

    essencialmente acompanhados pela referncia USE que os remete para o

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    24

    termo preferencial. As informaes relativas a um descritor devero ser

    enunciadas pela seguinte ordem:

    1) NE ou (SN) notas explicativas ou definies

    2) UP ou (UF) indicao de no-descritor

    3) TT indicao do termo de topo, se necessrio

    4) TG ou (BT) indicao dos termos genricos

    5) TE ou (NT) indicao dos termos especficos

    6) TR ou (RT) indicao dos termos relacionados

    (...)

    II) Apresentao sistemtica

    Um tesauro em que os termos estejam organizados sistemticamente deve

    conter duas partes:

    a) categorias ou hierarquias de termos dispostos segundo o seu significado e as relaes lgicas;

    b) um ndice alfabtico que remete o utilizador para o local apropriado da apresentao sistemtica.

    A ligao entre essas duas partes feita por um sistema de endereos.

    atribudo, a cada um dos descritores da parte sistemtica, um cdigo que

    funciona como uma referncia no ndice alfabtico. Esses cdigos devem

    ter valores de classificao evidentes. Podem consistir simplesmente numa

    sequncia de nmeros, ou ento, apresentar-se sob a forma de uma notao

    hierrquica.

    Com este tipo de apresentao, a parte sistemtica, muitas vezes

    considerada como a parte principal do tesauro, isto , a que contm a maior

    quantidade de informao definidora e relacional. Neste caso, o ndice

    alfabtico tem o papel de um componente complementar mas secundario.

    Contudo, nem sempre isto se verifica (...)

    Organizao primria de um tesauro sistemtico

    Quando se organizam termos em hierarquias ou categorias na parte

    sistemtica, necessrio atender no apenas s relaes entre os termos,

    mas tambm s relaes entre as hierarquias ou categorias em si. , com

    efeito, necessrio impor uma estrutura chapu ou uma macroclassificao

    parte sistemtica para nos assegurarmos que as noes similares esto

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    25

    reunidas e as noes sem relao esto separadas, em benefcio do

    utilizador. A organizao primria de um tesauro sistemtico pode

    obedecer a duas formas:

    a) organizao em domnios ou disciplinas; b) organizao em facetas; c) combinao dos dois tipos de organizao

    a) Organizao em domnios

    Esta tcnica , no essencial, idntica adotada para o estabelecimento de

    uma classificao numa biblioteca. Comea-se por organizar o universo

    dos conhecimentos em classes principais ou disciplinas. Quando aplicada a

    um tesauro, as categorias de noes so agrupadas partida de forma a

    refletir os diferentes domnios de interesse dos utilizadores. (...)

    Nota; A ttulo exemplificativo consultar:

    http://eurovoc.europa.eu/drupal/?q=pt/download/subject_oriented&cl=pt

    b) Organizao por facetas

    A noo de faceta mais abstrata do que a de domnio e a organizao por

    facetas implica uma disciplina mental mais rigorosa da parte de quem

    elabora o tesauro.

    Utilizando esta tcnica, os termos so organizados em classes ou conjuntos,

    segundo os tipos de noes representadas por esses termos, sem ter em

    conta o ou os domnios com o qual ou os quais a noo habitualmente

    associada. (...)

    c) Combinao dos dois tipos de organizao

    Na prtica, os dois tipos de organizao descritos acima so

    frequentemente combinados, como no caso de um teasuro cuja organizao

    primria por domnios e em seguida subdividido segundo as facetas. (...)

    Nota: A ttulo exemplificativo consultar:

    http://www.motbis.cndindexp.fr/.php/liste-des-microthesaurus.html http://www.motbis.cndp.fr/index.php/indexe-avec-motbis/32-notion-de-facettes.html

    http://eurovoc.europa.eu/drupal/?q=pt/download/subject_oriented&cl=pthttp://www.motbis.cndp.fr/index.php/liste-des-microthesaurus.htmlhttp://www.motbis.cndp.fr/index.php/indexe-avec-motbis/32-notion-de-facettes.html

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    26

    III) Apresentao grfica

    Neste tipo de apresentao, os termos de indexao e as suas relaes so

    dispostas numa figura a duas dimenses que permite ao indexador ou

    utilizador dispor de toda uma gama de termos e suas relaes. Existem

    vrias formas de apresentao grfica nos tesauros publicados, mas podem

    identificar-se dois tipos principais:

    a) estrutura arborescente (NP 4036, 1992:43) ; b) esquema em flecha (NP 4036, 1992:45)

    Um tesauro que inclua uma apresentao grfica deve comportar duas

    partes:

    1) A apresentao grfica

    A apresentao grfica propriamente dita , por norma, limitada

    unicamente aos descritores, uma vez que este formato no se adapta

    facilmente s notas explicativas, sinnimos, etc. Esta forma de

    apresentao identificada por um smbolo, por exemplo um nmero ou

    um elemento de notao hierarquicamente significativo. (...)

    2) ndice alfabtico O ndice alfabtico contm as notas explicativas e as relaes de

    equivalncia e pode tambm incluir as relaes hierrquicas e associativas.

    O ndice da estrutura arborescente no indica relaes hierrquicas. O

    ndice do esquema em flecha inclui no s notas explicativas, etc., mas

    tambm as relaes hierrquicas.

    Quando a parte alfabtica contm, em proporo, maior nmero de

    informaes (definidoras e relacionais), funciona como a parte principal do

    tesauro. (...)

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    27

    III - Tesauro EUROVOC

    A razo de ser do Tesauro EUROVOC (EUROVOC 1995:3,4)

    Todos os anos, a documentao resultante das atividades das

    Comunidades Europeias e da Unio sofre um aumento de alguns milhares,

    ou mesmo de vrias dezenas de milhar, de unidades.

    (...)

    Perante esta massa crescente de informao, os servios de biblioteca e

    documentao das instituies comunitrias procuraram dotar-se de um

    instrumento para a indexao do contedo dos documentos.

    (...)

    Depois de examinarem os instrumentos disponveis o Servio das

    Publicaes Oficiais das Comunidades Europeias (EUR-OP) e o

    Parlamento Europeu optaram pela elaborao de um tesauro multilingue

    que abrangesse todos os domnios de atividade das Comunidades

    Europeias: o Tesauro EUROVOC.

    Este tesauro, linguagem documental estruturada e controlada, foi criado

    segundo as normas internacionais.

    Historial

    O trabalho de seleo dos descritores e de estruturao do tesauro foi

    empreendido, a partir de 1982, por uma equipa de documentalistas e

    bibliotecrios provenientes dos servios do Parlamento Europeu (Direo-

    Geral de Estudos), da Comisso das Comunidades Europeias e do Servio

    das Publicaes Oficiais das Comunidades Europeias. Este trabalho teve o

    apoio da Direo-Geral Telecomunicaes, mercado da informao e

    valorizao da investigao (DGXIII) da Comisso, no mbito da sua

    poltica de apoio elaborao de tesauros multilingues.

    A primeira edio do Tesauro EUROVOC foi publicada em 1984, em dois

    volumes (apresentao alfabtica e temtica) e em sete lnguas, tendo sido

    utilizada pelo Parlamento Europeu e pelo EUR-OP. A experincia

    resultante dessa utilizaopermitiu uma reviso profunda do tesauro, do

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    28

    qual foi publicada, em 1987, uma segunda edio, disponvel em nove

    lnguas.

    Esta edio do EUROVOC foi alvo de crescente interesse fora das

    instituies comunitrias, em especial junto dos centros de documentao

    de organismos pblicos e privados responsveis pela recolha e anlise da

    informao existente sobre as atividades comunitrias.

    Evoluo do EUROVOC

    Estes centros de documentao reconheceram as qualidades do EUROVOC

    para o tratamento da documentao comunitria e parlamentar. Alm disso,

    ao adotarem o EUROVOC como base de anlise da documentao

    comunitria, podiam dispor desta ltima j indexada.

    (...)

    O Centro Europeu de Investigao e Documentao Parlamentares

    (CERDP) estabelece o contacto entre os servios de documentao de

    todos os parlamentos memebros do Conselho da Europa. Um dos seus

    objetivos consiste em facilitar o intercmbio de informao entre os

    parlamentos, tendo esta rede de cooperao multilingue sido outro fator de

    desenvolvimento do uso do EUROVOC. Foi neste contexto que a

    Assembleia da Repblica portuguesa, o Parlamento espanhol e o

    Parlamento belga decidiram utilizar o EUROVOC. O primeiro parlamento

    membro do conselho da Europa a traduzir o EUROVOC para a sua lngua

    foi o da Turquia.

    (...)

    Concluses

    Um tesauro matria viva, que evolui em funo das necessidades

    expressas pelos indexadores e utilizadores de fundos documentais e de

    bases de dados cada vez mais numerosas. Facto tanto mais real quanto se

    trata do tesauro EUROVOC, que deve traduzir os conceitos de uma Unio

    em desenvolvimento e alargamento. Por este motivo, o Comit Diretor do

    EUROVOC e a respetiva Unidade de Manuteno recolhero, com

    interesse, todas as sugestes que lhes queira enviar, no sentido de

    desenvolver e melhorar a qualidade do tesauros.

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    29

    O nosso trabalho com o EUROVOC basear-se- na verso online

    disponvel em http://europa.eu/eurovoc/

    Antes de se iniciar a indexao com o tesauro aconselhamos a explorao

    do stio e a leitura atenta do documento de modo a poderem utiliz-lo

    convenientemente. Este manual no vai disponibilizar toda a informao do

    stio, reproduzimos, apenas, alguns excertos da Apresentao e Manual

    do Utilizador da edio impressa do EUROVOC de 1995, que explica,

    mais detalhadamente, o modo de utilizao desta linguagem documental.

    Como refere o stio, o EUROVOC 4.2 a verso mais atual e existe em 21

    das lnguas oficiais da Unio Europeia (blgaro, espanhol, checo,

    dinamarqus, alemo, estnio, grego, ingls, francs, hngaro, italiano,

    leto, lituano, neerlands, polaco, portugus, romeno, eslovaco, esloveno,

    finlands e sueco) e outra lngua (croata). Alm destas verses, o Eurovoc

    foi traduzido pelos parlamentos nacionais de vrios pases (Albnia,

    Rssia, e Ucrnia).

    Estrutura

    O EUROVOC encontra-se estruturado de modo genrico, segundo uma

    classificao em dois nveis:

    Domnios, identificados por um nmero de dois algarismos e impressos em maisculas. Por

    exemplo:

    10 COMUNIDADES EUROPEIAS

    O tesauro EUROVOC abrange todos os domnios relacionados com as

    atividades das instituies europeias:

    04 ATIVIDADE POLTICA,

    08 RELAES INTERNACIONAIS,

    10 COMUNIDADES EUROPEIAS,

    12 DIREITO,

    16 ATIVIDADE ECONMICA,

    20 INTERCMBIOS ECONMICOS E COMERCIAIS,

    24 FINANAS,

    http://europa.eu/eurovoc/http://wbase.duma.gov.ru/scriptsWebIrbis3/DSearch1.dll?C21COM=Enter&I21DBN=OFP_Internet

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    30

    28 QUESTES SOCIAIS,

    32 EDUCAO E COMUNICAO,

    36 CINCIAS,

    40 EMPRESAS E CONCORRNCIA,

    44 EMPREGO E TRABALHO,

    48 TRANSPORTES,

    52 MEIO AMBIENTE,

    56 AGRICULTURA, SILVICULTURA E PESCAS,

    60 AGROALIMENTAR,

    64 PRODUO, TECNOLOGIA E INVESTIGAO,

    66 ENERGIA,

    68 INDSTRIA,

    72 GEOGRAFIA,

    76 ORGANIZAES INTERNACIONAIS.

    Microtesauros, identificados por um nmero de quatro algarismos, dos quais os dois primeiros

    so os do domnio a que pertence o microtesauro,

    e por um enunciado; so impressos em

    minsculas. Por exemplo:

    1011 direito da Unio Europeia

    A numerao dos domnios e dos microtesauros idntica em todas as

    verses lingusticas.

    O Tesauro EUROVOC encontra-se estruturado, ao nvel especfico dos

    descritores e no descritores, por relaes semnticas:

    Relaes semnticas;

    Relaes de pertena ao microtesauro (MT);

    Relao de equivalncia (UF) ou usado por (UP);

    Relao hierrquica: (BT) ou termo genrico (TG) e (NT) ou termo especfico

    (TE);

    Relao associativa (RT) e

    Notas de aplicao ou de definio (SN)

    http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#42#42http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#422#422http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#423#423http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#424#424http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#425#425http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#421#421

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    31

    Os descritores so impressos a negrito.

    Os no-descritores so impressos sem recurso ao negrito.

    Caractersticas quantitativas

    Todas as verses lingusticas do Tesauro EUROVOC incluem:

    21 domnios,

    127 microtesauros,

    6645 descritores (dos quais 519 top terms),

    6669 relaes hierrquicas recprocas (BT/NT),

    3636 relaes associativas recprocas.

    Os domnios, os microtesauros, os descritores, as relaes hierrquicas e as

    relaes de associao so rigorosamente equivalentes em todas as lnguas.

    Em contrapartida, cada verso lingustica inclui um nmero varivel de no

    -descritores e notas.

    Apresentaes impressas

    O Tesauro EUROVOC apresentado, em cada uma das verses

    lingusticas, em trs volumes:

    Volume 1: Apresentao alfabtica permutada.

    Volume 2: Apresentao temtica ou por domnio.

    Volume 3: Apresentao multilingue

    Conselhos de utilizao:

    A indexao a operao que consiste em reconhecer e selecionar os

    conceitos de que trata um documento e em represent-los por descritores do

    tesauro.

    A sua finalidade possibilitar a extrao, de entre uma coleo de

    referncias bibliogrficas registadas numa base de dados documentais,

    aquelas que respondero s questes colocadas; esta extrao s possvel

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    32

    se os conceitos da questo estiverem formulados na mesma linguagem: a

    dos descritores do tesauro.

    Na prtica a indexao realiza-se da seguinte forma:

    Rpida tomada de conhecimento do contedo do documento a indexar;

    Seleo dos conceitos a utilizar para a indexao do documento, seguindo as duas das seguintes

    regras:

    a seletividade: s escolher os conceitos em relao aos quais o documento fornece uma

    informao suscetvel de interessar aos

    utilizadores;

    a exaustividade: devem ser escolhidos todos os conceitos teis que figuram no texto, quer

    apaream de forma explcita, quer de forma

    implcita;

    Representao dos conceitos selecionados por descritores do tesauro:

    se o documento estiver em lngua estrangeira, traduo dos conceitos na verso

    lingustica do tesauro utilizado pelo

    indexador;

    procura na apresentao alfabtica permutada, de termos que correspondam

    expresso dos conceitos no documento.

    Existem trs possibilidades:

    1. a expresso do conceito corresponde a um descritor que o designa: este transcrito no formulrio de indexao ou na mscara de entrada

    (exemplo: poltica de indexao),

    2. a expresso do conceito corresponde a um no descritor que o designa: este ltimo remete para o descritor a utilizar (exemplo: subsdio

    escolar, que nos envia para subsdios de estudo),

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    33

    3. no existe uma entrada correspondente expresso do conceito. Neste caso, podem ser usados quatro mtodos:

    Consultar a apresentao alfabtica permutada sobre cada uma das palavras do conceito composto procurado, a encontrando o

    descritor adequado (exemplo: competncia oramental no

    um descritor do tesauro; mas encontraremos o descritor a utilizar:

    poder oramental, explorando a entrada alfabtica oramental

    da apresentao alfabtica permutada), ou o no-descritor

    adequado que remete para o descritor a utilizar;

    conceber uma outra formulao do conceito em linguagem natural e verificar se a mesma corresponde a uma entrada da

    apresentao alfabtica permutada (exemplo: hooliganismo no

    figura no tesauro, mas evoca a ideia de violncia; assim, deve

    utilizar-se o descritor EUROVOC violncia;

    definir a ou as classes gerais (microtesauros) que incluem o conceito recalcitrante, consultar a apresentao temtica e

    procurar, dentre os descritores disponveis, os que melhor

    representam o conceito (exemplo: consequncia ambiental, no

    figura no tesauro, mas claramente do mbito do microtesauro

    5206 poltica ambiental; ao analisar este microtesauro,

    encontramos o descritor impacto do ambiente, que pode ser

    utilizado);

    combinar dois ou mais descritores da apresentao alfabtica permutada para expressar, por uma perfrase, o conceito a

    representar (exemplo: Conveno de Washington no existe no

    tesauro, mas pode ser representado pelos descritores conveno

    internacional, fauna, e flora).

    A ideia do descritor, ou do no-descritor, que significa um conceito, atrs

    evocada, deve frequentemente conduzir a uma anlise do contexto dos

    conceitos recenseados no documento, de forma a ter em conta o respetivo

    sentido real, e no o sentido literal. Por exemplo, o conceito candidato pode

    significar, por um lado, o candidato num ato eleitoral, caso em que deve ser

    indexado como candidato (cujo sentido precisado pelo facto deste

    descritor se encontrar no microtesauro processo eleitoral) ou, por outro, o

    candidato a um emprego, e nessa situao o descritor a utilizar ser

    procura de emprego, que faz parte do microtesauro mercado de

    trabalho. Existe, alis, um no-descritor candidato a um emprego que

    remete para a utilizao do descritor procura de emprego.

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    34

    A representao dos conceitos

    A representao dos conceitos por descritores do tesauro efetua-se

    mediante a aplicao de duas outras regras:

    A especificidade vertical: o descritor deve situar-se no mesmo nvel de especificidade do conceito ou, no caso de aquele no existir, no

    nvel imediatamente superior no tesauro.

    Exemplos:

    Um documento que trate do conceito de provncia deve ser indexado pelo

    descritor provncia, e no pelo descritor genrico comunidade

    territorial.

    Em contrapartida, um documento que trate de mdico anestesista, conceito

    que no figura no Tesauro EUROVOC, deve ser indexado com base no

    conceito mais genrico de mdico, que um descritor deste tesauro.

    Um documento que estude determinada situao em todos os pases do

    Benelux, com pormenores relativos a cada pas, deve ser indexado

    Blgica, Luxemburgo e Pases Baixos, e no pases Benelux

    A especificidade horizontal: se para um conceito composto existe no tesauro um descritor composto, este deve ser utilizado em vez de

    uma combinao de descritores.

    Exemplo:

    Um documento que trate da poltica de investigao da Comunidade deve

    ser indexado pelo descritor poltica comunitria da investigao, e no

    pela combinao dos descritores poltica comunitria e investigao.

    A correta aplicao das regras de seletividade, exaustividade e

    especificidade constitui um fator essencial da qualidade de um sistema de

    armazenamento e pesquisa de informao documental.

    A seletividade da indexao:

    independente da qualidade do tesauro,

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    35

    depende da poltica de indexao aplicada por cada sistema documental e, nomeadamente, da profundidade da indexao,

    depende do conhecimento que o documentalista indexador possui dos utilizadores do sistema documental, bem como daquilo que lhes

    interessa.

    A exaustividade condicionada:

    pela riqueza do tesauro: s podem indexar-se, obviamente, os conceitos presentes na linguagem documental,

    pela poltica de indexao, que fixa a profundidade da mesma,

    pelo comportamento do documentalista e respetiva meticulosidade.

    Um aumento da exaustividade da indexao origina, na fase da pesquisa

    documental:

    uma melhoria da taxa de recuperao, isto , da proporo de documentos pertinentes efetivamente extrada do fundo como

    resposta a uma questo,

    mas uma diminuio da preciso, isto , da proporo de documentos efetivamente pertinentes extrada como resposta a uma questo.

    Com efeito se forem indexados todos os conceitos presentes nos

    documentos, mesmo os muito acessrios, aumentam-se as possibilidades de

    recuperar todos, ou quase todos, os documentos que respondem s questes

    colocadas, mas em contrapartida, as bibliografias obtidas contero uma

    grande percentagem de documentos pouco ou nada pertinentes.

    Taxa de recuperao e de preciso

    Para explicar as noes de taxa de recuperao e de preciso,

    consideremos uma coleo com os documentos A, B, C, D, E, e F.

    Em resposta a uma questo, obtemos os documentos A, C, D e E.

    Uma anlise destes ltimos revela que s os documentos C e E so

    pertinentes, ou seja, respondem bem questo.

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    36

    Uma anlise aprofundada da coleo revela que o documento F, apesar de

    pertinente, no foi encontrado.

    A taxa de recuperao ser igual a 2 (os documentos C e E) a dividir por 3 (os documentos C, E e F) ou seja, 0,66: 66% dos

    documentos pertinentes foram encontrados.

    A preciso ser igual a 2 (os mesmos documentos Ce E) a dividir por 4 (os documentos A, C, D e E), ou seja, 0,5: 50% dos

    documentos encontrados so pertinentes.

    A especificidade da indexao depende, igualmente:

    do tesauro, que pode ou no incluir um nmero importante de descritores especficos,

    da poltica de indexao,

    dos documentalistas.

    Ao contrrio do que acontece com a exaustividade, o aumento da

    especificidade provoca:

    uma diminuio da taxa de recuperao,

    mas uma melhoria da preciso.

    Com efeito, se os documentos forem indexados mediante a utilizao de

    descritores com o mesmo nvel de especificidade dos conceitos que os

    mesmos incluem. Exemplo: assembleia nacional, sempre que se

    colocarem questes relativas a estes descritores obter-se- uma bibliografia

    que no incluir os documentos indexados com um nvel mais genrico

    assembleia, embora alguns contenham informaes pertinentes; porm,

    em compensao, a lista conter poucos documentos no pertinentes.

    Observe-se, no entanto, que os documentos indexados com um nvel mais

    genrico podem ser encontrados, precisamente atravs de uma pesquisa

    baseada nesses descritores. Infelizmente, o inverso no se verifica, ou seja,

    se a indexao for pouco especfica, obter-se-:

    melhor taxa de recuperao,

    mas menor preciso.

    por este motivo que convm ser especfico quando se procede

    indexao dos documentos.

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    37

    Por exemplo, num servio que pratique sistematicamente indexao

    hierrquica (isto , a juno sistemtica, a cada descritor, dos seus

    descritores genricos), encontraremos, por exemplo, a seguinte situao:

    os documentos que tratem, de forma geral, de todos os pases da Unio Europeia, sem considerar nenhum ou alguns deles em

    especial, sero indexados pases da CE,

    os documentos que tratem especificamente da Blgica sero indexados Blgica e pases da CE,

    os documentos que tratem especificamente de Itlia sero indexados Itlia e pases da CE,

    uma questo relativa aos pases da Unio Europeia, considerados no seu conjunto, e portanto, formulada por pases da CE, permitir

    encontrar os trs tipos de documentos acima referidos, embora

    apenas o primeiro seja pertinente.

    Em determinados sistemas documentais, a indexao ao nvel mais

    especfico permite, escolha do utilizador, encontrar documentos que

    podem ser, especficos (sobre a Blgica ou a Itlia, no nosso exemplo) ou,

    por outro, simultaneamente especficos ou genricos, fazendo funcionar

    automaticamente as relaes hierrquicas do tesauro (sobre a Blgica, a

    Itlia e o conjunto dos pases da CE, no exemplo); se os documentos

    tivessem sido indexados simultaneamente de forma especfica e genrica,

    como indexao hierrquica, esta escolha, e portanto esta liberdade para o

    utilizador, no seria possvel.

    Para alm da indexao por descritores extrados do Tesauro EUROVOC,

    pode revelar-se til a utilizao de descritores livres para representar

    conceitos que surjam em documentos mas no includos no EUROVOC:

    nesse caso, cria-se uma lista de autoridade desses descritores, a qual

    poder, eventualmente, ligar-se por relaes hierrquicas e de associao, a

    descritores EUROVOC. Se for conveniente integrar no EUROVOC alguns

    desses descritores, o servio de documentao utilizador dever enviar uma

    ficha de manuteno Unidade de Manuteno EUROVOC.

    Em geral, tambm interessante prever uma indexao a dois nveis:

    os descritores principais, num campo descritores principais,

    os descritores secundrios, num campo descritores secundrios.

    No primeiro campo sero colocados os descritores que representam os

    conceitos correspondentes ao (s) assunto (s) principal (ais) do documento.

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    38

    No segundo campo sero colocados os descritores que representam

    conceitos a propsito dos quais o documento fornece informaes teis,

    apesar de no corresponderem ao assunto principal.

    Obviamente, isto no significa que o Tesauro EUROVOC contenha duas

    categorias de descritores: os principais e os secundrios; com efeito, o

    mesmo descritor pode, conforme o documento, ser principal ou secundrio.

    O interesse deste mtodo consiste em possibilitar um melhor ajustamento

    da interrogao:

    sempre que um utilizador deseje encontrar um nmero limitado de documentos muito pertinentes, a investigao basear-se- apenas nos

    descritores principais;

    sempre que, pelo contrrio, o utilizador deseje uma bibliografia muito completa, a investigao incidir sobre os descritores

    principais e sobre os descritores secundrios.

    Este mtodo permite, igualmente, limitar o nmero de entradas num ndice

    ou boletim bibliogrfico, utilizando apenas os descritores principais.

    Conselhos para a formulao de questes

    A formulao de uma questo a operao simtrica da indexao de um

    documento: esta ltima consistia em recensear os conceitos tratados pelo

    documento e em relao aos quais o mesmo fornecia informaes

    suscetveis de interessar aos utilizadores; depois, estes conceitos eram

    identificados por descritores. A formulao de uma questo, por sua vez,

    consiste em recensear os conceitos suscetveis de existir nos documentos

    que respondem questo, em traduzir esses conceitos em descritores e, em

    seguida, em procurar na base de dados documentais os documentos

    indexados, com a ajuda desses descritores.

    O recenseamento dos conceitos de uma questo exige uma abordagem

    muito diferente da que seguida para o recenseamento dos conceitos de um

    documento: a indexao de um documento uma operao que origina

    uma forte condensao (um documento de 5 a 10 pginas representado,

    em geral, por 5 a 15 descritores, ou seja, uma taxa de condensao de 1% a

    1%0), enquanto a formulao de uma questo conduz a maior parte das

    vezes, a um enriquecimento do enunciado inicial.

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    39

    A formulao da questo comea por tornar explcita, da forma mais

    completa e precisa possvel, a necessidade de informao sentida do

    utilizador, expressa em linguagem natural; em seguida, o utilizador

    recenseia os conceitos que, constituem o enunciado da questo, assim

    ampliada.

    O utilizador deve, depois, representar estes conceitos atravs de descritores

    do tesauro, havendo a distinguir trs casos:

    1. a questo precisa e os conceitos que a compem encontram-se no tesauro: o utilizador usar, de preferncia, a apresentao alfabtica

    permutada, na qual encontrar:

    os descritores ou os no-descritores (e, destes, os descritores) que correspondem ao enunciado dos conceitos da questo,

    os descritores em relao hierrquica e de associao que podero contribuir para melhor precisar a questo;

    2. a questo precisa, mas todos (ou alguns) conceitos que a compem no figuram no tesauro: depois de os ter procurado, em vo, na

    apresentao alfabtica permutada, o utilizador explorar, na

    apresentao temtica, os microtesauros que correspondem ao (s)

    domnio (s) da questo colocada, neles procurando os descritores

    existentes que designam os conceitos mais prximos da questo

    colocada;

    3. a questo no precisa, o que acontece frequentemente: o utilizador usar de preferncia a apresentao temtica, explorando o (s)

    microtesauro (s) que corresponde (m) ao (s) domnio (s) de interesse

    da questo; a encontrar a coleo ordenada dos descritores que

    abrangem esse (s) domnio (s) e poder escolher os descritores mais

    adequados.

    Alguns utilizadores finais realizam, eles prprios, as pesquisas documentais

    que pretendem, a partir do seu terminal ligado ao computador onde se

    encontra instalada a base de dados. Outros utilizadores preferem dirigir-se a

    um documentalista, a fim de efetuar o que chamamos uma pesquisa

    delegada: nestes casos, fundamental o estabelecimento de contacto

    direto entre o utilizador e o documentalista, para que o primeiro possa

    comunicar ao segundo, com o mximo de preciso, a natureza das suas

    necessidades de informao. S assim a investigao delegada poder

    revelar-se frutuosa.

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    40

    Vantagens e limitaes da utilizao do EUROVOC na indexao por

    assuntos

    Vantagens:

    normalizao terminolgica dos vocabulrios de indexao dos documentos, a introduzir numa base de dados documentais, e de

    formulao das questes aquando da interrogao dessa mesma

    base, permitindo uma grande eficcia da pesquisa documental;

    multilinguismo, permitindo indexar documentos na lngua do documentalista e procur-los na lngua do utilizador;

    possibilidade de estabelecer redes de cooperao entre servios documentais que utilizam o EUROVOC, evitando, assim, a

    repetio de trabalho.

    Limitaes:

    O EUROVOC foi construdo para satisfazer as necessidades de sistemas documentais gerais no que se refere s atividades

    comunitrias, no sendo adequado para documentos

    especializados [nem para bibliotecas generalistas, uma vez que os

    fundos documentais abarcam todas as reas do conhecimento];

    por outro lado, embora se desenvolvam esforos no sentido de ter em conta as necessidades dos utilizadores no pertencentes s

    instituies comunitrias, o EUROVOC no pode ter a pretenso

    de abranger as diferentes realidades nacionais com suficiente

    especificidade.

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    41

    Preenchimento do Bloco 6 Assuntos do UNIMARC

    Bibliogrfico

    O preenchimento dos descritores atribudos a cada documento realiza-se no

    registo bibliogrfico correspondente e efetua-se, de acordo com o

    UNIMARC BIBLIOGRFICO, no Bloco 6 - ASSUNTOS.

    Cada descritor representa um assunto especfico que deve ser preenchido

    no campo adequado. Vejamos alguns exemplos:

    Nome de instituio/coletividade

    601 $aOIT

    Nome comum como assunto

    606 $aNomadismo

    Nome geogrfico

    607 $aNigria

    Termos de indexao no controlados

    610 $a . Qualquer descritor livre

    Os exemplos referidos anteriormente, no dispensam a consulta do Manual

    UNIMARC BIBLIOGRFICO, disponvel em

    http://www.unimarc.info/bibliographic/1/pt/summary

    http://www.unimarc.info/bibliographic/1/pt/summary

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    42

    Parte IV A Classificao Decimal Universal

    Este texto tem por base uma traduo e adaptao livre do livo de MCLLWAINE, I.C.

    Gua para el uso de la CDU. Trad. De Rosa San Segundo Manuel. Madrid: AENOR,

    2003. 297 p. ISBN 90-806152-1-8

    Antecedentes histricos da classificao

    No sculo XIX o fsico Andr Marie Ampre props pela primeira vez o

    emprego da notao decimal, como um cdigo para expressar os conceitos

    na classificao dos documentos.

    Em 1876 Melvil Dewey desenvolveu um sistema classificatrio decimal

    para aplicar na biblioteca universitria onde trabalhava que acabou por se

    consagrar como Classificao Decimal de Dewey.

    Em 1895 Paul Otlet e Henry La Fontaine so chamados para trabalhar no

    Repertrio Bibliogrfico Universal, cujo objetivo era criar a primeira

    listagem de todos os documentos impressos no mundo desde a descoberta

    da imprensa. Este objetivo prximo do que a IFLA se prope, atualmente,

    mediante o seu programa de Controlo Bibliogrfico Universal. Os dois

    advogados belgas comeam a compilar este repertrio ou catlogo em

    fichas e decidem organiz-lo de uma forma sistemtica. Tal tarefa exigia

    uma classificao bibliogrfica adequada e selecionaram a Classificao

    Decimal de Dewey, que nesse momento j se encontrava na sua 5 edio.

    A classificao possua apenas alguns milhares de subdivises, mas a sua

    notao apresentava a possibilidade de utilizao universal j que abarcava

    todo o universo do conhecimento e empregava os nmeros arbicos.

    Otlet e La Fontaine chegam a acordo com Dewey que os autoriza a

    introduzir algumas modificaes e ampliaes classificao de modo a

    adapt-la s suas necessidades, acrescentaram, ainda, uns quantos

    instrumentos de sntese e tabelas auxiliares que a tornaram mais flexvel e

    detalhada. Estes elementos vieram a alterar a estrutura inicial da

    Classificao de Dewey, totalmente enumerativa, para uma estrutura

    hbrida. A estrutura da Classificao Decimal Universal possui,

    simultaneamente, caractersticas enumerativas, sintticas e facetadas.

    Verifica-se ao longo das ltimas alteraes realizadas pelo UDCC e

    publicadas nas Extensions and Corrections to the UDC que o carter

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    43

    enumerativo est a ser eliminado aos poucos e a caracterstica sinttica

    prevalece cada vez mais.

    A primeira edio completa desta nova classificao foi publicada entre

    1905 e 1907com o ttulo de Manual de Repertrio Bibliogrfico Universal

    e contava com cerca de 35000 subdivises, tinha, ainda, um ndice

    alfabtico com 38000 entradas. A ideia de constituio do Repertrio

    Bibliogrfico acaba por cair e em 1927-1933 sai a segunda edio da

    classificao, agora com a designao de Classificao Decimal Universal.

    O tamanho desta nova edio o dobro da 1 e vai sofrendo correes e

    adies sucessivas ao longo de vrios anos.

    As lnguas de trabalho da CDU so historicamente o francs, o alemo e o

    ingls. A utilizao de vrias lnguas foi sempre importante para manter a

    universalidade do sistema e at hoje continua a ser um objetivo a

    prosseguir. Atualmente o ingls a nica lngua utilizada para fins

    editoriais do consrcio CDU. Este rgo gestor da CDU autoriza, mediante

    o pagamento de licenas, a edio das vrias verses (mdia, especializada,

    abreviada ou eletrnica) em qualquer lngua. Atualmente esto publicadas

    mltiplas edies em vrios idiomas, sendo que a maioria delas tem por

    base o Ficheiro Bsico de Referncia (Master Reference File) que desde

    1992 a verso eletrnica da CDU. O Master Reference File possui cerca de

    61000 entradas, enquanto que a verso mdia impressa tem

    aproximadamente 40000, as edies abreviadas contam com cerca de

    10000 a 15000 e as edies de bolso contam com cerca de 4000 entradas. O

    Ficheiro Bsico de Referncia a norma, qualquer ampliao que supere o

    seu nvel de detalhe no est autorizada pelo consrcio.

    A organizao criada por Otlet e La Fontaine, originalmente para assumir

    a responsabilidade de gerir o repertrio bibliogrfico e posteriormente

    como editora do sistema de classificao da resultante, recebeu o nome de

    Instituto Internacional de Bibliografia e situava-se em Bruxelas. Em 1937,

    muda-se para Haia e adota o nome de Federao Internacional de

    Documentao (FID). Em 1992, estabelece-se um consrcio de editores e a

    responsabilidade de gerir e atualizar a CDU passa para o Consrcio da

    Classificao Decimal Universal (disponvel na http://www.udcc.org/ Esta

    organizao controla todas as edies e tradues da classificao e uma

    das suas primeiras atividades, foi a criao de uma base de dados que

    constituiu a verso autorizada do sistema, ou seja, o Master Reference File

    (MRF). Esta base atualizada todos os anos, aps a publicao da lista

    anual de correes autorizadas que se designa por Extensions and

    Corrections to the UDC.

    http://www.udcc.org/

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    44

    Nota: Aconselhamos a consulta do sumrio da CDU disponvel na

    http://www.udcc.org/udcsummary/php/index.php

    Caractersticas do sistema

    Classificao Decimal Universal

    Vamos analisar cada um dos termos de modo a caracterizar o sistema:

    Classificao

    Desde sempre o Homem teve necessidade de classificar e ordenar tudo o

    que o rodeia. Classificar um mtodo de organizao em categorias ou

    classes e pode ser empregue em mltiplas tarefas quotidianas, desde a

    disposio dos artigos num supermercado, at ordenao do

    conhecimento. Uma aplicao bvia da classificao encontra-se nas

    Cincias Biolgicas, onde os organismos so organizados segundo os

    gneros e espcies em taxionomias. Tambm as classificaes

    bibliogrficas so utilizadas h sculos para organizar os livros nas

    bibliotecas de acordo com a informao contida nos documentos.

    A classificao tem por base o princpio da ordenao de conceitos de

    acordo com o seu grau de semelhana. Os elementos compartilhados

    descrevem-se como caractersticas de diviso. Resulta, por conseguinte,

    essencial certificar-se de que uma caracterstica de diviso se aplica sempre

    e que todas as subdivises derivadas da sua aplicao tenham sido

    esgotadas antes de se proceder aplicao de uma nova. Por exemplo, se

    fossemos criar uma classificao correspondente a Biblioteconomia,

    identificaramos em primeiro lugar, os diferentes tipos de biblioteca, antes

    de consideramos as diferentes atividades que fazem parte da

    biblioteconomia.

    Biblioteconomia:

    Tipos de bibliotecas:

    - Segundo o organismo que a financia (nacional, pblica,

    universitria, especializada)

    http://www.udcc.org/udcsummary/php/index.php

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    45

    - Segundo o tipo de leitores (crianas, estudantes, pblico em geral)

    - Segundo as necessidades especiais dos seus utilizadores (cegos,

    falantes de uma determinada lngua)

    - Segundo o tema (Direito, Msica, Arte)

    Materiais:

    - Mapas, fotografias, pelculas

    Atividades:

    - Direo de pessoal, gesto de colees, catalogao, indexao

    Agentes (Instrumentos)

    - OPACS, leitores de microfilmes, fotocopiadoras

    Esta perspetiva analtica da classificao essencial, se queremos que o

    sistema seja coerente. A soma total dos termos derivados da aplicao de

    uma nica caracterstica de diviso designa-se como faceta.

    As classificaes bibliogrficas tiveram por base, tradicionalmente, a

    organizao do conhecimento em disciplinas. Uma disciplina pode ser

    definida como um campo de estudo fundamental ou reas do

    conhecimento, como a Filosofia, as Cincias Sociais e a Religio. Estas

    disciplinas podem subdividir-se em sub disciplinas, que coletivamente,

    formam as primeiras, como o caso da Economia e da Cincia Poltica em

    relao s Cincias Sociais. Nas classificaes bibliogrficas muito til

    identificar campos do conhecimento geralmente reconhecidos, compostos

    por caractersticas como um objeto de estudo distinto, mtodos distintos de

    investigao, formao especializada de profissionais, departamentos nas

    universidades, etc. Esta aproximao organizao do conhecimento

    atravs da forma pela qual os termos so selecionados e estudados, fornece

    um conjunto familiar de pontos de referncia a partir do qual se vai

    construir a estrutura bsica.

    As classificaes sistematizaram-se tendo por base as classes. Podemos

    definir classes como um conjunto cujos membros tm algo em comum.

    Pode ser simples ou composta. Por exemplo na classe Botnica, as plantas

    individuais seriam classes simples. Uma classe composta constituda pela

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    46

    interceo de dois ou mais tipos diferentes de conceito (ou faceta) dentro

    da mesma classe, tais como fisiologia vegetal, patologia vegetal, ecologia

    vegetal, etc. Numa classificao geral como a CDU, as classes pelas quais

    feita a diviso do conhecimento, antes de ser efetuada qualquer anlise

    facetada e que no possuam nenhuma classe mais extensa dentro da qual se

    insiram, so normalmente denominadas por classes principais. Este facto

    frequentemente relacionado com a distribuio da numerao na CDU, por

    exemplo: classe 1- Filosofia, classe 2- Religio, classe 3 - Cincias Sociais,

    etc. Pode ser muito til, mas tambm enganador, pois, muitas dessas

    classes principais numeradas com um nico dgito contm mais de uma

    disciplina que merece o estatuto de classe principal. A Classe 1 Filosofia

    e Psicologia, a Classe 6 Tecnologia, Medicina e Engenharia, etc. Quando

    existe a interceo de duas classes, como por exemplo num ttulo como

    Matemtica para engenheiros, utiliza-se por vezes a denominao de

    classe complexa. Na CDU estas combinaes so frequentemente expressas

    atravs da utilizao de dois pontos.

    Decimal

    O nmero da classe o cdigo utilizado para representar a classe/conceito

    e determina a disposio dessa classe no sistema. Pode ser formado por um

    nico algarismo rabe (ao nvel mais elevado) ou por uma sequncia de

    algarismos rabes ou ainda por uma sequncia que combine algarismos

    rabes e smbolos autorizados na CDU (exemplo da classe 630).

    A numerao CDU baseada em algarismos rabes ordenados de acordo

    com o sistema decimal. Isto significa que o universo do conhecimento

    visto como a unidade e cada rea temtica/disciplina/classe uma frao

    desse todo.

    A numerao aumenta por fraes decimais e a extenso reflete o nvel

    hierrquico. Conceitos de categoria equivalente dentro de uma classe ou

    seco especfica so normalmente constitudos pela mesma extenso

    numrica.

    Universal

    A universalidade da CDU verifica-se duplamente:

  • LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO

    ANLISE E LINGUAGENS DOCUMENTAIS III

    AS LINGUAGENS DOCUMENTAIS

    UNIVERSIDADE ABERTA

    2011/2012

    47

    universal porque abarca todos os domnios do conhecimento num nico

    sist