Introdução Aos Arquivos Invertidos

2
7. Introdução aos Arquivos Invertidos Esta organização é baseada em uma mudança nos papeis de registro e atributos, de tal forma que, em vez de serem coletados os valores dos atributos para cada registro, são identificados os registros que possuem cada um dos particulares valores da chave de acesso considerada. A cada um dos valores da chave de acesso, presentes no arquivo, é associada uma lista de identificações de registros, chamada lista invertidas. As técnicas usuais na organização de índices são válidas também para este caso, devendo ser tomado o devido cuidado com o fato de que, em um arquivo invertido, a cada valor da chave de acesso está associado não apenas um endereço do registro, mas sim um conjunto de endereços dos registros que possuem aquele valor da chave. O conjunto de listas invertidas associado a uma chave de acesso é chamado inversão, sendo que um arquivo invertido pode assumir uma ou mais inversões. Na figura abaixo, é representado um arquivo invertido com duas inversões associadas à chave secundária IDADE, uma contendo os ENDEREÇOS e outra NÚMEROS. IDADE ENDEREÇOS 20 2 8 9 22 1 5 23 4 25 6 10 27 3 7 NÚMERO NOME IDADE 1 350 PEDRO 22 2 200 GISA 20 3 150 MAX 27 4 250 SANDRA 23 5 400 PAULO 22 6 600 CARLA 25 7 450 ROBSON 27 8 300 CELSO 20 9 100 RENATA 20 10 550 LEANDRO 25 IDADE NÚMEROS 20 200 300 100 22 350 400 23 250 25 600 550 27 150 450 Na primeira inversão, os registros são identificados por seus endereços físicos. Esta modalidade apresenta a vantagem de permitir o acesso direto ao registro, mas acarreta o problema de que as listas são válidas apenas para aquela disposição física dos registros, sendo que, caso o arquivo venha a sofrer uma reorganização que envolva mudança nos endereços dos registros, todas as inversões deverão ser novamente geradas. Uma alternativa para este problema consiste na identificação dos registros por meio de uma de suas chaves primárias, como na segunda inversão. Com isto as listas invertidas passam a ser independentes da localização física dos registros, havendo, no entanto, perda de eficiência no acesso, em virtude da necessidade de determinar o endereço do registro uma vez obtida a sua chave primária na lista. << topo 8. Quadro Comparativo entre as Organização de Arquivos Eis um quadro comparativo, que lista as vantagens e desvantagens das várias organizações de arquivos.

description

Esta organização é baseada em uma mudança nos papeis de registro e atributos, de tal forma que, em vez de serem coletados os valores dos atributos para cada registro, são identificados os registros que possuem cada um dos particulares valores da chave de acesso considerada. A cada um dos valores da chave de acesso, presentes no arquivo, é associada uma lista de identificações de registros, chamada lista invertidas

Transcript of Introdução Aos Arquivos Invertidos

  • 7. Introduo aos Arquivos Invertidos

    Esta organizao baseada em uma mudana nos papeis de registro e atributos, de tal

    forma que, em vez de serem coletados os valores dos atributos para cada registro, so

    identificados os registros que possuem cada um dos particulares valores da chave de

    acesso considerada. A cada um dos valores da chave de acesso, presentes no arquivo,

    associada uma lista de identificaes de registros, chamada lista invertidas.

    As tcnicas usuais na organizao de ndices so vlidas tambm para este caso,

    devendo ser tomado o devido cuidado com o fato de que, em um arquivo invertido, a

    cada valor da chave de acesso est associado no apenas um endereo do registro, mas

    sim um conjunto de endereos dos registros que possuem aquele valor da chave.

    O conjunto de listas invertidas associado a uma chave de acesso chamado inverso,

    sendo que um arquivo invertido pode assumir uma ou mais inverses. Na figura abaixo,

    representado um arquivo invertido com duas inverses associadas chave secundria

    IDADE, uma contendo os ENDEREOS e outra NMEROS.

    IDADE ENDEREOS

    20 2 8 9

    22 1 5

    23 4

    25 6 10

    27 3 7

    NMERO NOME IDADE

    1 350 PEDRO 22

    2 200 GISA 20

    3 150 MAX 27

    4 250 SANDRA 23

    5 400 PAULO 22

    6 600 CARLA 25

    7 450 ROBSON 27

    8 300 CELSO 20

    9 100 RENATA 20

    10 550 LEANDRO 25

    IDADE NMEROS

    20 200 300 100

    22 350 400

    23 250

    25 600 550

    27 150 450

    Na primeira inverso, os registros so identificados por seus endereos fsicos. Esta

    modalidade apresenta a vantagem de permitir o acesso direto ao registro, mas acarreta o

    problema de que as listas so vlidas apenas para aquela disposio fsica dos registros,

    sendo que, caso o arquivo venha a sofrer uma reorganizao que envolva mudana nos

    endereos dos registros, todas as inverses devero ser novamente geradas.

    Uma alternativa para este problema consiste na identificao dos registros por meio de

    uma de suas chaves primrias, como na segunda inverso. Com isto as listas invertidas

    passam a ser independentes da localizao fsica dos registros, havendo, no entanto,

    perda de eficincia no acesso, em virtude da necessidade de determinar o endereo do

    registro uma vez obtida a sua chave primria na lista.

  • Arquivo Vantagens Desvantagens

    Seqencial - Acessos seqenciais mais

    eficientes.

    - Operaes de modificaes

    no so simples.

    Seqencial Indexado

    -Utilizam ndices, que

    agilizam a consulta por

    estarem na RAM.

    - Necessidades de reas de

    extenso, que precisam ser

    reorganizadas.

    Indexado

    -No existem reas de

    extenso

    - Registros sem compromisso

    com armazenamento fsico.

    - Atualizao do ndice quando

    da insero de um registro.

    Direto -Acesso direto, sem

    necessidade do ndice.

    - Determinar funes que gerem

    menor nmero de colises

    Invertido

    - Acesso direto ao registro

    aps localizao da lista

    invertida.

    - As listas invertidas valem

    apenas para aquela disposio

    fsica do arquivo.