Como Se Faz Um Banco de Dados Em Histori

download Como Se Faz Um Banco de Dados Em Histori

of 128

description

banco de dados

Transcript of Como Se Faz Um Banco de Dados Em Histori

  • Ladeira Livros

    Como se faz um banco de dados (em Histria)

    Tiago Gil Laboratrio de Histria Social

    Universidade de Braslia

    2015

  • Copyright Tiago Lus Gil Capa: Durval de Souza Filho Preparao dos originais: Manoel Rendeiro Neto Editorao Eletrnica: David da Silva Carvalho Ladeira Livros Rua General Cmara, 385 Centro Porto Alegre

    ISBN: 978-85-69621-00-3 Conselho Editorial Joo Luis Ribeiro Fragoso (UFRJ) Martha Hameister (UFPR) Tiago Bernardon de Oliveira (UFPB) Luis Augusto E. Farinatti (UFSM) Helen Osrio (UFRGS)

    Dados Internacionais de Catalogao na Publicao (CIP) Ficha catalogrfica elaborada pelo bibliotecrio Miguel ngelo Bueno Portela, CRB1

    2756

    G463c Gil, Tiago. Como se faz um banco de dados (em histria) [recurso

    eletrnico] / Tiago Gil. Porto Alegre : Ladeira Livros, 2015. 127 p. : il. Documento em PDF. Inclui bibliografia. ISBN 978-85-69621-00-3. 1. Histria - Metodologia. 2. Banco de dados. 3. Informtica. I. Ttulo.

    CDU 930:004.652

  • Contedo

    PREFCIO ............................................................................................................... 5

    INTRODUO ........................................................................................................ 7

    ALGUMAS QUESTES TERICAS E METODOLGICAS .......................................... 11

    UM ARTESANATO, UMA OPERAO ..................................................................................14

    DESMONTANDO AS COISAS EM ORDEM ..........................................................................21

    EM OMBROS DE GIGANTES .............................................................................................31

    ALGUMAS QUESTES PRPRIAS DA INFORMTICA ............................................ 50

    ESTRUTURA DE DADOS ...................................................................................................50

    MODELOS CONCEITUAIS, LGICOS E FSICOS .......................................................................58

    ASPECTOS VISUAIS SOBRE AS BASES ..................................................................................63

    ENTRE A TCNICA E A TEORIA: PROBLEMAS COTIDIANOS E DECISES PRTICAS ...........................71

    ENGENHARIA DE PESQUISA ................................................................................. 83

    LEVANTAMENTO INICIAL .................................................................................................83

    COLETANDO OS DADOS E ABASTECENDO A BASE ..................................................................87

    ADMINISTRAO DA BASE ..............................................................................................95

    MONTANDO BASES: ALGUNS EXEMPLOS CONCRETOS......................................... 98

    BASES CENTRADAS NA FONTE ....................................................................................... 100

    BASES CENTRADAS NO MTODO ................................................................................... 112

    CONCLUSO ...................................................................................................... 122

    BIBLIOGRAFIA .................................................................................................... 123

  • Prefcio

    Este livro foi fruto de um ps-doutorado realizado na

    cole des Hautes tudes en Sciences Sociales (EHESS) entre

    agosto de 2013 e janeiro de 2014, dentro do projeto "O Bom

    Governo das Gentes: hierarquias sociais e representao

    segundo a poltica catlica do sculo XVI ao XVIII". Para tanto, li

    centenas de artigos, livros e captulos sobre o tema, alm de

    dezenas de manuais de informtica. Os resultados dessa

    pesquisa tambm foram aproveitados em cursos presenciais

    sobre bancos de dados, realizados na UFRJ em outubro de 2014

    e na UFRGS em dezembro do mesmo ano, quando as ideias aqui

    apresentadas foram alvo de debates. Os dados obtidos foram

    utilizados em outras publicaes, a saber: Storici e informatica:

    luso dei database (1968-2013), publicado na revista Memoria e

    ricerca (Itlia, 2015) e "Our own in-house software: una

    historia de historiadores programadores na obra Historiografa,

    giro digital y globalizacin. Reflexiones tericas y prcticas

    investigativas de Juan Andrs Bresciano (Uruguay, 2015).

    Agradeo aos colegas do Departamento de Histria da UnB,

    Marcelo Balaban, Neuma Brilhante, Teresa Marques, Luiz

    Noguerl e Marcos Pereira pela leitura atenta, assim como aos

    estudantes do Laboratrio de Histria Social da UnB, que

    discutiram animadamente seu contedo. No poderia deixar de

    agradecer aos professores Joo Fragoso, Jonas Moreira Vargas,

    Roberto Guedes Ferreira, Antonio Carlos Juc de Sampaio,

    Thiago Krause, Hlida Conceio, Helen Osrio e Lus Augusto

    Farinatti, que igualmente leram e comentaram o original. O

    material tambm foi avaliado pelo mestre em computao Cssio

    Couto, que fez diversas sugestes.

    A pesquisa contou com financiamento da CAPES

    (Programa Capes/Cofecub) e do CNPq.

  • CLIQUE AQUI

    PARA ADQUIRIR

    A VERSO

    IMPRESSA DESSE

    LIVRO

  • [7]

    Introduo

    Este um livro voltado para estudantes de Histria

    e para quem quer informatizar sua pesquisa desde o comeo.

    Por informatizar quero dizer criar uma base de dados, ou, como

    se diria em ingls to database something. Seu objetivo de

    ajudar o leitor a incrementar sua pesquisa em Histria, com

    algumas aplicaes possveis para as cincias sociais em geral.

    No se trata de um manual tcnico. A proposta aqui contribuir

    para o leitor pensar como alguns recursos prprios do universo

    das bases de dados e da informtica podem melhorar a

    investigao, desde a proposio do problema at a escrita do

    trabalho, passando pela coleta e anlise das informaes que

    daro suporte s concluses. A ateno, contudo, ficar nas

    formas de organizar os materiais.

    temerrio escrever um livro como este. Tratando-

    se de informtica, ele estar datado em poucos anos. Todavia,

    tentei escrev-lo pensando em questes clssicas, de longo

    prazo, inclusive tomando auxlio de debates entre Histria e

    Informtica que existem desde os anos 1960. Estes debates

    apresentam alguns problemas estruturais na organizao das

    informaes que prpria do trabalho do historiador, com a

    chegada cada vez mais avassaladora das mquinas. E como

    defensor do planejamento, tentei pensar o texto para alm do

    seu consumo imediato, de modo a prolongar seu uso no tempo,

    no tema e no espao. Veremos que conveniente fazer a

    mesma coisa com as bases de dados.

    O perigo da rpida obsolescncia desse tipo de

    publicao se agrava devido necessidade quase direta de

    referncia ao uso de certos programas. Amanh os programas

    deixaro de existir e outros (melhores ou no) sero lanados.

    Para tentar amenizar isso, o texto todo foi escrito levando em

  • [8] conta aspectos mais gerais dos programas, sem referncia a um

    pacote especfico. Fiz isso no apenas pelo problema da

    obsolescncia: geralmente as pessoas acham que construir

    bancos de dados ou fazer anlise de redes sociais, para dar um

    exemplo, resume-se a usar um programa, minimizando a mo do

    historiador em seu trabalho. Aqui quero o trabalho humano, para

    o bem e para o mal, mostrando as opes por trs desse

    personagem que faz pesquisa usando (ou no) bases de dados.

    Muitas vezes, utilizarei metforas relacionadas ao

    universo da cozinha, no apenas por uma questo didtica, mas

    tambm por acreditar que de fato so campos que tm alguma

    semelhana. E vou comear com um exemplo claro. A proposta

    aqui no de criar sistemas que faam todo o trabalho, com

    uma completa mecanizao. No quero propor uma mquina

    onde voc coloca todos os produtos, como leite, batatas,

    manteiga, alho e sal, para na ponta dela sair um belo pur.

    preciso conhecer as engrenagens da base de dados. Nesse

    caso, a ideia de um meio termo entre o artesanato simples,

    amassando as batatas com a mo, e aquela nefasta mquina

    que faz tudo sozinha. Garfos, facas, descascadores e

    multiprocessadores podem ser teis. Proponho, assim, um

    artesanato automatizado, com o uso pontual e deliberado de

    recursos informticos. E como artesanato que , convm ao

    historiador saber construir suas prprias ferramentas ou saber

    adapt-las para usos inusitados, como quase tudo em Histria.

    Ao leitor ctico ou desconfiado das bases de dados

    ou das possibilidades que a informtica oferece na produo do

    conhecimento histrico, j aviso que este ser um livro de

    Histria. Vamos falar de alguns problemas prprios do universo

    da pesquisa, desde a proposio do problema at a redao

    final. Ao leitor que acredita que as bases de dados so um

    problema exclusivamente tcnico, lembro que existem milhares

    de bases de dados tecnicamente perfeitas, mas que se tornaram

  • [9] obsoletas e inutilizveis diante de problema prprios do universo

    do historiador. H bases que foram feitas para um tipo de uso e,

    por opes mal feitas na sua origem, no permitem nada alm. E

    h aquelas que sequer conseguiram responder pergunta

    original. Sim, porque as bases tm relao direta com nossas

    perguntas, ou deveriam ter. E preciso planejar para tirar

    proveito delas. Quanto mais planejadas, por mais tempo sero

    teis.

    Um banco de dados pode servir para escancarar

    nossas posies tericas mais ocultas e at algumas indesejadas.

    Quando somos obrigados a racionalizar nosso objeto a ponto de

    faz-lo caber em registros de uma tabela, precisamos expor mais

    as nossas posies. No h espao para um pensamento como

    nosso tema muito complexo (como se alguns temas fossem

    simples). preciso saber como dar vazo a essa complexidade e

    precisamos fazer isso de modo claro, de tal maneira que at um

    computador entenda. S tiramos da mquina aquilo que

    colocamos l dentro.1

    Em 1996, um livro interessante, do qual pretendi

    tirar bastante proveito, foi lanado na Inglaterra. Databases in

    historical research, de Harvey e Press, tinha tudo para ser uma

    obra de referncia entre os historiadores. Pensava a histria no

    meio da evidente encruzilhada a que a humanidade estava

    chegando, representada pela informtica. O livro parece antever

    que, no futuro prximo, cada vez mais os historiadores

    utilizariam as bases de dados para incrementar suas pesquisas.

    Mas no foi assim e nem Harvey e Press foram os primeiros a

    errar com essa mesma previso. Contudo, o caso deles

    especial. Quando escreveram sua obra, as databases estavam se

    1 CHARLE, Christophe, Problemes de traitement informatique dune enquete

    sur trois lites en 1901, in: MILLET, Hlne (Org.), Informatique et prosopographie, [s.l.]: CNRS, 1985.

  • [10] consolidando na informtica, em todos os campos do

    conhecimento e pareciam mesmo estar se tornando um tema

    hegemnico na relao entre histria e informtica.2

    Este livro no pretende rememorar os velhos

    tempos em que as bases de dados podiam ser vistas como o

    futuro da histria. Entendo que desde meados dos anos 1990 os

    historiadores que dialogavam com a tecnologia da informao j

    no so os mesmos que constroem bancos de dados para suas

    pesquisas. Esses ltimos me parecem o pblico mais direto

    dessas linhas. Se no a maioria dos historiadores, este l

    outro problema. O nosso, aqui, consiste em discutir sobre boas

    formas de fazer pesquisa histrica centrada em bancos de dados,

    como diziam Harvey e Press em meados dos 1990. Ento,

    convido o leitor a uma breve aventura pela tecnologia, mas sem

    sair do nosso cho de historiador.

    2 HARVEY, Charles; PRESS, Jon, Databases in Historical Research. Theory,

    Methods and Applications, London: Macmillan Press, 1996.

  • [11]

    Algumas questes tericas e

    metodolgicas

    Um banco de dados quase uma forma de narrativa

    histrica.3 Ele obedece, perfeita ou imperfeitamente, aos

    preceitos e s concepes de mundo (e, dentro desses, das

    opinies sobre o problema de pesquisa) do pesquisador. A

    primeira posio terica acreditar que seja possvel reduzir a

    complexidade do social a ponto de faz-la caber na forma de

    registros de uma tabela, tal como os historiadores acreditam ser

    possvel fazer nas linhas de um texto. Mas essa no a nica

    posio terica possvel no trabalho com bases de dados. No

    quero dizer que marxistas vo produzir bases de um tipo e que

    os liberais produziro, necessariamente, de outro, ainda que isso

    seja perceptvel e bastante provvel. Nossas posies tericas

    podem ser variadas, heterogneas, eclticas, mas esto l, no

    cantinho delas, esperando a hora de aparecer para organizar o

    mundo dentro dos nossos produtos. No caso da pesquisa em

    Histria, isso inclui a escolha de objetos, de conjuntos de fontes,

    de metodologias e de interlocutores. E na montagem da base de

    dados no diferente.

    Para ser mais claro, apresentarei aqui diversas

    formas de abordar o problema. Posso dizer que existem dois

    tipos de bases, as analticas (orientadas pelo mtodo, como

    3 No vou discutir o significado terico de narrativa histrica, j

    exaustivamente abordado por centenas de historiadores ao longo dos ltimos 40 anos. Apenas para tomar um referencial, apresentarei aqui uma definio retirada de Lawrence Stone, que ao apontar a volta narrativa, destaca algumas de suas caractersticas no discurso histrico: ser descritiva, focada mais ao homem do que s circunstncias, atenta mais ao particular e ao especfico que aos conjuntos e marcada pela retrica. STONE, Lawrence, The revival of narrative: reflections on a new old history, Past and Present, n. 85, p. 324, 1979.

  • [12] preferem alguns autores), voltadas para um problema de

    pesquisa, e as empricas (orientadas pela fonte) que procuram

    dar conta de um corpus documental, como uma base de

    registros paroquiais, de batismos, por exemplo. Isso tem relao

    com uma concepo de histria que prev o trabalho do

    historiador como um passo importante para o acesso ao

    conhecimento do passado, uma vez que as bases analticas

    estariam orientadas por um problema de pesquisa. As bases

    empricas, por seu turno, organizariam o material de trabalho,

    sem um acesso direto ao passado, porquanto foram organizadas

    por um historiador de modo diverso ao estado original da fonte.

    Tambm poderia dizer que h dois tipos de bases

    de dados: as annimas e as com referncia nominal. Existem as

    pesquisa que demandam ateno s histrias pessoais e aquelas

    para as quais isso no afeta o resultado. Poderia colocar, de um

    lado, as bases de dados dos micro-historiadores, dos demgrafos

    historiadores de Cambridge e de algumas cepas de demgrafos

    franceses. No outro extremo, colocaramos os cliometristas e

    dezenas de demgrafos franceses to tributrios de Louis Henry

    como os primeiros, mais interessados, contudo, em calcular o

    intervalo intergensico dos camponeses do Sculo XVII do que

    mapear as opes de casamento de um ncleo familiar

    especfico ao longo do mesmo sculo.

    Entre aqueles que fazem bases no annimas,

    dando nfase aos agentes histricos e aos seus nomes, podemos

    apontar outra diviso: os que fazem bases individuais

    (biogrficas), os que fazem bases ao-por-ao e aqueles que

    criam sistemas para recolher, em outras bases, informaes

    sobre os agentes. No h aqui uma hierarquia de qualidade de

    base nem o melhor jeito de fazer o trabalho. H trs ideias de

    como deve ser feito o trabalho do historiador.

    A primeira enfatiza as trajetrias individuais,

  • [13] atomizando os personagens e dando pouco espao para

    dinmicas sociais e situaes inusitadas. Por exemplo, se criamos

    um campo para profisso, teremos que colocar ali toda a

    informao de uma vida de atividades ou escolher uma mais

    importante, varrendo debaixo do tapete outras informaes que

    poderiam se revelar fundamentais no andamento da pesquisa.

    Mas podemos inserir vrios campos de profisso: profisso1,

    profisso2, etc. Quantos seriam necessrios? Depende do

    personagem. E qual seria a profisso1 quando nosso heri

    mantm duas paralelas? Estamos sempre fazendo opes,

    orientados por nossos problemas de pesquisa. At a, tudo

    epistemologicamente timo, ajuda em um estudo

    prosopogrfico. A questo que nossas perguntas mudam ao

    longo da pesquisa.

    A segunda opo, registrar em tabelas ao-por-

    ao parece muito melhor nesse sentido. Ao invs de

    registrarmos "pessoas", registraramos "atos". Ela elimina os

    problemas apresentados acima, mas no nada neutra. Faz

    parte de uma concepo de histria muito em voga no atual

    estgio dos estudos, que enfatiza a interao social e as redes

    de relacionamento. Talvez no seja indicada para outros temas

    de pesquisa. Por outro lado, o que so aes ou atos? Um

    espirro e um homicdio tm o mesmo significado? Uma conversa

    tem semelhante estatuto e deve ser desmembrada no mesmo

    formulrio de um arranjo matrimonial? Esse arranjo matrimonial

    significaria apenas um registro na tabela ou dezenas deles

    (considerando a cerimnia oficial, as testemunhas, a festa)?

    A terceira alternativa pode ser tomada em

    diferentes contextos. Pode ter sido uma opo segura, devido

    incerteza sobre qual procedimento metodolgico seria mais

    adequado para o problema de pesquisa adotado. Mas pode ser

    igualmente uma soluo de convenincia, diante de informaes

    de fontes diversas e desorganizadas. De modo geral, todas

  • [14] envolvem aspectos tericos, metodolgicos e tcnicos e fazem

    isso ao mesmo tempo, de tal maneira que no podemos dissociar

    estes trs elementos durante o trabalho.

    Um artesanato, uma operao

    J vimos que h muito do historiador por trs dessa

    aparente deciso tcnica de construir um banco de dados . Mas

    isso no ocorre por causa dos bancos. O mesmo poderia ser dito

    do trabalho do historiador com seus recortes, suas notas, seus

    instrumentos de organizao dos materiais dirios de trabalho,

    fichas, cadernos, canetas ou laptops. Em texto clssico de 1974,

    Michel de Certeau dizia:

    Em histria, tudo comea com o gesto de selecionar, de reunir, de, dessa forma, transformar em "documentos" determinados objetos distribudos de outra forma. Essa nova repartio cultural o primeiro trabalho. Na realidade ela consiste em produzir tais documentos, pelo fato de recopiar, transcrever ou fotografar esses objetos, mudando, ao mesmo tempo, seu lugar e seu estatuto. Esse gesto consiste em "isolar" um corpo, como se faz em fsica. Forma a "coleo". [...] O material criado por aes combinadas que o repartem no universo do uso,

    que tambm vo procur-lo fora das fronteiras do uso e que fazem com que seja destinado a um reemprego coerente. a marca dos atos que modificam uma ordem recebida e uma viso social. Instauradora de signos oferecidos a tratamentos especficos, essa ruptura no , portanto, nem apenas, nem primeira vista, o efeito de um "olhar". necessria uma operao tcnica.

    4

    A tcnica, geralmente desprezada pelos

    4 DE CERTEAU, Michel, A operao histrica, in: LE GOFF, Jacques; NORA,

    Pierre (Orgs.), Histria: novos problemas, So Paulo: Livraria Francisco Alves Editora, 1978, p. 30.

  • [15] historiadores, assume no texto de Certeau, um lugar

    fundamental: Se verdade que a organizao da histria

    relativa a um lugar e a um tempo, inicialmente o por suas

    tcnicas de produo [...] a histria mediada pela tcnica.5

    Isso significa exatamente aquele conjunto de operaes que

    comea com o gesto de selecionar e de reunir, para em seguida

    criar o material por aes combinadas que vo reparti-lo no

    universo do uso para um reemprego coerente. Graficamente,

    poderamos apresentar o raciocnio da seguinte forma:

    Figura 1 - Esquema ilustrativo de uma afirmao de Michel de Certeau

    Em um texto de 1986, Jean-Phillipe Genet apresenta

    um modelo aproximado do de Certeau, numa tentativa mais

    clara de produzir conhecimento histrico com o uso de bancos

    de dados. Para ele, tudo comea com o Real Passado, um

    abstrato mundo real do qual no temos todos os indcios,

    devido perda ou ao desconhecimento desses traos, ou seja,

    por um dficit positivo. Com um processo de seleo e busca,

    montamos um Real Histrico, composto pelas fontes conhecidas.

    Uma vez coletadas e interpretadas, elas se transformam em uma

    coleo (palavra que tambm utilizada e reforada por

    Certeau) de dados, que Genet denominou de metasoures

    (metafontes). Graficamente, o argumento do autor poderia ser

    expresso da seguinte maneira.

    5 Ibid., p. 28.

  • [16]

    Figura 2 - Esquema ilustrativo de uma afirmao de Jean-Phillipe Genet

    Poderamos antepor um elemento diante desses

    dois modelos: um problema de pesquisa. A seleo das fontes,

    mencionada por Certeau, s faz sentido diante de um

    problema/questo que oriente essa seleo. bem verdade que

    o problema pode se apresentar no contato com alguma

    documentao, e no, apenas, com a leitura de outros estudos

    (muito menos por um crebro genial ou pela intercesso divina).

    No importa de onde surgiu a ideia. Importa que colocado um

    problema, mesmo que frgil, ele demanda o passo seguinte - a

    seleo das fontes. O esquema ficaria um pouco alterado, mas

    coerente com as posies acima apresentadas, comeando com

    um problema, que tem origem na experincia do historiador,

    seja com fontes, com sua vida pessoal, com suas leituras, ele

    seleciona e rene suas fontes para desmont-las com aes

    combinadas, criando um material ou "metafontes" que sero

    reordenadas na anlise e descritas em um texto, mediado pelas

    opes tericas e metodolgicas do autor e pelo problema de

    pesquisa original.

    Figura 3 - Esquema das etapas da produo do conhecimento histrico

  • [17]

    Essa descrio de procedimentos, que enfatiza as

    tcnicas prprias do historiador, , agora, nosso foco no debate

    sobre a informatizao. H dcadas os historiadores buscam

    automatizar seus procedimentos. E como foi dito antes, no h

    como criar um software em que, utilizando as tcnicas do

    conhecimento histrico, coloquemos o problema e obtenhamos a

    resposta. O que possvel (e bastante vivel) automatizar

    alguns procedimentos do historiador em cada uma dessas

    etapas, para que o pesquisador possa fazer tantas aes

    combinadas quanto pretenda de modo eficiente e criar uma

    ferramenta com a qual ele possa reunir os materiais, os dados,

    ou as "metafontes", em um ambiente que permita selees,

    buscas e ordenamentos variados sem a perda da informao

    original. Em suma, trata-se de organizar o trabalho de modo a

    permitir experincias. Como disse o mesmo Certeau:

    A utilizao de tcnicas atuais de informao conduz o historiador a separar o que at agora se encontrava em seu trabalho: a construo dos objetos de pesquisa e, portanto, tambm as unidades de compreenso; a acumulao de "dados" (informao secundria, ou material refinado) e seu arranjo em lugares onde possam ser classificados e deslocados; a explorao tornada possvel pelas diversas operaes a que esse material

    suscetvel.6

    Ressalte-se, contudo que esta tarefa tem suas

    dificuldades. Se for correto que podemos administrar muito

    melhor nossos dados com o uso de uma boa base, igualmente

    certo que uma base mal feita v gerar problemas de toda ordem.

    Criar uma tabela para coletar os dados de uma fonte pode

    parecer muito simples, em alguns casos, mas no . Novamente

    Genet nos apresenta um problema crucial: a necessidade de

    conhecer profundamente as fontes que utilizamos, antes de

    montar um banco de dados com elas. Conforme o autor:

    6 Ibid., p. 34.

  • [18]

    O dado [...] um artefato, no sentido que os arquelogos empregam este termo, um objeto construdo em funo de alguns objetivos bem precisos. De uma mesma fonte dois historiadores extraem dados completamente diferentes. A operao de constituio e de estabelecimento do dado depende, assim, de trs parmetros complementares. O primeiro, que preciso manter no seu devido lugar a crtica das fontes [...] justamente por causa das imensas possibilidades

    oferecidas pelo computador, me parece que a crtica das fontes sobre todas as suas formas se impe com um rigor maior...

    7

    preciso saber o modo como a fonte foi construda,

    seu pblico, seus autores, seus limites, seus objetivos e que

    interesses agiram para que aquele documento chegasse quela

    forma (que finalmente teve mas que diferentes projetos

    desejavam alterar). Alm dessa erudio documental, Genet

    destaca a importncia do conhecimento tcnico sobre as bases e

    seu dilogo com o fazer histrico e com a erudio das fontes.

    Ao escolher campos que acolhero nossos dados , estaremos

    escolhendo que informaes vamos privilegiar e quais as que

    sero consideradas menos importantes ou que sero menos

    desdobradas.

    Podemos criar um campo data, mas tambm

    preparar um para dia, outro para ms e finalmente um para o

    ano. Se a opo for pelo primeiro, importa elaborar um campo

    do tipo data (como veremos adiante). Caso contrrio, podemos

    estabelecer campos numricos para dias, meses e anos. Mas

    interessa fazer esse desdobramento? Nossa pergunta demanda

    padres que envolvam atividades regulares dentro de um ms

    (como o pagamento de aluguis)? Ou dentro de um ano

    7 GENET, Jean-Philippe, Histoire, informatique, mesure, Histoire & Mesure,

    v. 01, n. 01, p. 0718, 1986, p. 10 e 11(Traduo nossa. O original est em francs).

  • [19] (aniversrios ou safras)? E se nossas atividades tiverem uma

    regularidade semestral ou quinquenal? Saber escolher os campos

    certos tecnicamente importante, no somente pela tcnica da

    informtica, mas tambm por nossas tcnicas de historiador.

    O mesmo Certeau que discutia sobre o que faz o

    historiador quando faz Histria falava, naquele ano de 1974, do

    uso do computador em nossa disciplina. No o fazia com a

    maestria do programador, mas com a do estudioso do tempo. E

    ao fazer isso, ressaltava exatamente a mo do pesquisador nesta

    empreitada e seu lugar no tempo. Na pgina 33, ele afirma:

    A especificao de seu papel [da histria] no determinada pelo prprio aparelho (o computador, por exemplo) que coloca a histria no conjunto de opresses e possibilidades nascidas da instituio cientfica presente. A elucidao do prprio da histria descentrada em relao a esse aparelho: reflui no tempo preparatrio de programao que a passagem pelo aparelho torna necessria, e rejeitada [no sentido de um resultado, expelida] no outro extremo, no tempo de explorao aberto pelos resultados obtidos. Elabora-se, em funo dos interditos fixados pela mquina, por objetos de

    pesquisa a serem construdos, e, em funo do que permite essa mquina, por uma maneira de tratar os produtos standart da informtica.8

    Novamente aqui o foco est nas decises do

    historiador, ao planejar a programao sobre os materiais que

    utiliza. Ele tambm enfoca os limites da mquina, que acabam

    entrando no que possvel obter de resposta. Como j dissemos,

    isso pode ser matizado atravs do conhecimento tcnico de

    informtica. Veremos isso mais adiante.

    8 DE CERTEAU, A operao histrica, p. 33. Grifo nosso.

  • [20]

    Nos anos de 1960 e 1970, o desejo pela

    informatizao era justificado pela dificuldade de contar grandes

    sries e de analisar regularidades de longos textos. Na Frana,

    na Inglaterra, na Alemanha e nos Estados Unidos, o foco do uso

    destas mquinas se justificava na contagem de grandes massas

    documentais de fontes homogneas. Era o momento de

    concepo de muitos trabalhos que ficariam prontos nos anos de

    1970 e 1980. Esse interesse profundo pelas sries no foi apenas

    um modismo ou febre, mas fruto de uma mudana de

    concepes que teve consequncias profundas na forma de fazer

    histria. As sries se tornaram importantes diante da crescente

    preocupao com a definio de modelos.

    As sries agora abriam o flanco de um debate at

    ento interdito, devido impossibilidade fsica de observar

    grandes regularidades sociais e, consequentemente, seus limites,

    suas rupturas e seus casos excepcionais. Foi nesse contexto em

    que certos objetos se tornaram possveis, encontrados nas

    margens daquilo que se encaixava nos modelos de muitos

    historiadores. Foi nesse contexto que a incluso do computador

    como uma ferramenta do historiador se tornou relevante. E isso,

    especialmente para a constituio de grandes bancos de dados

    de sries manejveis e no apenas para flutuaes demogrficas

    e econmicas, mas igualmente para o estudo de regularidades

    nos textos, alm das hierarquias sociais, o que visvel na

    preocupao com os estudos das categorias scio-profissionais.

    Se for correto que ns historiadores temos nossa

    forma e nossas tcnicas de organizar a informao, que nos so

    to caras devido s especificidades do conhecimento histrico,

    nada nos impede de dialogar com nossos vizinhos da

    informtica, para observar como organizam as informaes,

    como dispem de meios eficazes e criativos de organizar o

    mundo entre tabelas e registros. Uma das demandas

    fundamentais desse esforo passa pelo desafio de classificar as

  • [21] coisas, no caso da informtica, atribuindo-lhe uma codificao.

    Classificar parte do trabalho do historiador. Pode-se perguntar

    se possvel fazer histria sem classificar. Chamar um ser

    humano de agente histrico j uma classificao, assim como

    cham-lo de ser humano. Do ponto de vista da Qumica, um

    amontoado de tomos, maiormente de carbono. E posso dividir

    esses amontoados de carbono entre os que detm os meios de

    produo e os que vendem sua fora de trabalho; ou entre o

    prncipe e o povo.

    E no se trata apenas de usar de instrumentos de

    comparao, mas de formalizar com a clareza necessria para o

    processamento com os nossos critrios de anlise manifestos na

    escolha dos campos, por exemplo. Se estudo uma obra literria,

    como sei se o gnero que tenho em mos (romance, poesia, etc)

    era comum na poca ou um formato marginal? As coisas s so

    o que so em sua relao com as outras. Digo que uma obra

    de fico pois sei que existem outras disponveis que no o so.

    certo que posso definir o contexto a partir do texto9 e que isso

    me ajuda a compreender diversos aspectos daquela sociedade

    que gerou o texto. Mas sem comparar, classificar ou contar,

    ficarei privado de qualquer afirmao que inclua expresses

    como a maioria, a menor parte, um bom nmero, poucos,

    melhores e piores. Nesse sentido, formalizar nossos critrios

    em um banco de dados facilita a comparao e permite uma

    clareza maior do universo que estamos estudando.

    Desmontando as coisas em ordem

    Colocar a histria dentro de um banco de dados

    uma simplificao, mas nosso trabalho sempre uma

    simplificao. A complexidade da vida social no cabe no texto,

    9 Como querem os contextualistas ingleses.

  • [22] tanto que precisamos de conceitos para nos aproximar dela,

    como tampouco cabe nos campos de uma base. Resta simplificar

    menos, ou, como disse Jean-Philippe Genet, admitir a obrigao

    de consentir um empobrecimento fundamentado que estabelece

    o trabalho cientfico.10

    A criao de base de dados tem como pressuposto a

    possibilidade de tomar um papel velho11

    , que a pesquisa

    transformar em fonte, de modo a produzir um desmonte. Em

    outras palavras, vamos tomar um documento e desfaz-lo em

    pedacinhos. Mas esse procedimento s ter sentido se os

    pedacinhos forem reorganizveis depois, se pudermos

    apresentar diferentes problemas para transformar aquele

    conjunto de pedacinhos em uma narrativa clara. E o mais

    importante: nesse processo todo de desmonte, o historiador

    que deve estar coordenando tudo, decidindo, optando e

    remontando as coisas segundo critrios do nosso mtier. E

    preciso muito planejamento para que as bases sejam teis nesse

    processo.

    H diferentes formas de construir bases de dados,

    como j argumentei, e cada uma delas fruto de uma forma de

    pensar a histria. Da mesma maneira, cada uma dessas opes

    vai envolver formas diferentes de desmontar os materiais,

    tanto os empricos como com os interlocutores (bibliografia).

    Contudo, a construo de bancos de dados no to subjetiva

    como pode parecer. H certos procedimentos que so

    importantes e regulares em qualquer pesquisa. Adiante, veremos

    que as partes integrantes de uma base so as tabelas,

    compostas por campos e registros. Criamos campos como

    10

    GENET, Histoire, informatique, mesure(Grifo nosso. O original est em francs). 11

    Faz referncia aos documentos, que podem ser orais, imagticos ou de qualquer outra natureza.

  • [23] caixinhas onde colocamos certas informaes que nos parecem

    iguais. Essa simplificao, importante dizer, no privilgio de

    quem usa bases de dados. Dizemos que todas as datas so

    datas, tanto o dia de hoje quanto o 14/07/1789, mesmo que

    tenham significados simblicos muito diferentes. Dizemos que

    Joo e Pedro so nomes de pessoas, e no, simples conjuntos de

    letras.

    Faz-se o mesmo em bases de dados. Contudo,

    dependendo do problema de pesquisa e das caractersticas de

    cada fonte, podemos dizer que para fins de criao de bancos de

    dados, h dois tipos de fontes: aquelas para as quais a forma

    muito importante e aquelas em que a forma no to

    importante.12 Por forma, estou entendendo aqui a regularidade

    linear de certos fragmentos dentro de um documento. Na frase

    Eu sou professor de Histria, h uma ordem linear importante,

    sujeito, verbo e complemento. Se eu alterar os fragmentos, o

    sentido ser igualmente alterado. Algo semelhante acontece, por

    exemplo, com registros de batismo. Desde que comearam a ser

    feitos de modo sistemtico (e preservados), na Itlia do Sculo

    XIV,13

    eles seguem um modelo muito particular, como no

    exemplo abaixo:

    Aos quatro do ms de novembro de mil oitocentos e dezoito anos, nessa Igreja Matriz do Patrocnio de So Jos, batizei e pus os santos leos ao inocente Francisco filho de Manoel Roberto, e Maria Izabel, naturais dessa freguesia. Padrinhos o Capito Francisco da Silva, e Leucadia Maria, sua mulher, todos fregueses dessa freguesia. Fiz e assinei. O Vigrio Colado, Theodoro Jos

    12

    Agradeo ao Professor Jean-Pierre Dedieu por chamar a ateno para este ponto. 13

    DE VRIES, Jan, Population, in: BRADY JR., Thomas; OBERMAN, Heiko; TRACY, James (Orgs.), Handbook of European History 1400-1600. Late Middle Ages, Renaissance and Reformation., Leiden / New York / Koln: E. J. Brill, 1994.

  • [24]

    de Freitas Costa14

    A forma importantssima em um registro de

    batismo que, dificilmente, comear com o nome dos padrinhos.

    Esse modelo ser igual, na ordem dos fatores, em milhes de

    registros no mundo todo: data; local; ato (batismo e leos);

    nome do batizando; pais e padrinhos (com as respectivas

    informaes pessoais); assinatura. claro que h muitssimas

    nuances e variaes e j falaremos delas, mas h uma longa e

    constante regularidade para a maior parte dos casos, ou melhor,

    h uma expectativa, da poca e nossa, de que essas

    informaes apaream. Deveriam aparecer.

    O outro tipo de fonte aquela em que a forma, no

    sentido j expresso, de sequncia linear de informaes, no

    importante e nem esperada. Para um texto ficcional, por

    exemplo, no h expectativa de formato, salvo uma ligeira ideia

    de que eles so, geralmente, divididos em captulos, mas nem

    isso to srio. O mesmo ocorre com as correspondncias. Elas

    tm algumas regularidades, como os livros tm suas editoras e

    autores: remetente, destinatrio, data e local. Mas seu contedo

    interno, a carta propriamente dita, no formalizvel. Podemos

    criar campos para destacar as pessoas e os locais mencionados,

    mas essas informaes no so partes necessrias de uma carta

    nem so esperadas pelo leitor ou pelo pesquisador.

    Se for correto que preciso planejar para criar uma

    boa base de dados, igualmente importante ter uma boa

    quantidade de informaes prvias para iniciar o planejamento.

    Saber diferenciar as potencialidades diversas de cada conjunto

    documental fundamental para iniciar os trabalhos. E o carter

    mais ou menos formal dos documentos um bom critrio de

    14

    Livro de Batismos 02, So Jos. 1818. Arquivo da Cria de So Jos dos Pinhais.

  • [25] avaliao. preciso conhecer a fonte para prever problemas.

    Eles sempre estaro presentes, os problemas, mas o

    planejamento nos livrar daqueles mais estpidos, dos quais

    crtico nenhum nos poupar.

    Saber identificar a forma em um documento no

    algo simples. Continuemos planejando a informatizao dos

    nossos registros de batismo. Para eles basta uma tabela que

    tenha poucos campos:

    Figura 4 - Modelo de tabela para batismos

    J temos pronto nosso banco de dados. Vamos

    comear a preench-lo. O prximo registro que vamos incluir

    ser este:

    Aos vinte de maro de mil oitocentos e dezoito anos nesta Igreja Matriz do Patrocnio de So Jos, batizei e pus os santos leos ao inocente Joo, filho legitimo de Joaquim lvares e Maria dos Anjos, naturais dessa freguesia. Padrinhos, Joo de Bastos e Ana lvares, sua mulher, todos fregueses dessa freguesia. Fiz e assinei O Vigrio Colado Theodoro Jos de Freitas Costa

    Vamos preenchendo tudo: data, local, nome do

    batizando, e... filho legtimo? Essa informao no estava no

    registro anterior, que orientou meu modelo, por essa razo a

  • [26] "legitimidade" no foi includa na minha base. Que tipo de campo

    devo criar para dar conta disso? Que variveis posso encontrar

    nesta observao antes do nome dos pais que trata da

    legitimidade da criana? E por que alguns registros simplesmente

    omitem esse dado? Como dizia Certeau, a formalizao da

    pesquisa tem precisamente por objetivo a produo de "erros" -

    insuficincias, faltas - cientificamente utilizveis. No nosso caso,

    a simples tentativa de organizar a informao j nos trouxe

    questes fundamentais para compreender a fonte e o universo

    cultural que estamos observando. Criar um campo pode parecer

    absolutamente tcnico, e , mas muito mais do que isso.

    Segundo Dedieu,15

    ao encontrar o inesperado que produzimos

    conhecimento, e formalizar dados em uma base pode ser um

    meio para isso.

    Poderamos encontrar outros tantos exemplos que

    nos mostrariam que criar uma base de dados para registros de

    batismo no tarefa fcil. E a afirmao inicial de que bastaria

    uma nica tabela tampouco correta ( possvel, mas seria

    melhor desdobrar em vrias). Podemos falar, apenas para dar

    algum exemplo, dos avs sobre os quais frequentemente h

    informao. Tambm podemos lembrar o que normalmente

    aparece sobre cada um dos participantes, dos pais e padrinhos:

    sua origem, residncia, condio social, posio poltica e suas

    relaes sociais. No mesmo livro de onde retirei aqueles

    registros, comum, por exemplo, encontrar que o padrinho

    filho de um capito. Ento devemos inserir um campo posio

    militar do pai do padrinho?

    Em sua tese de doutorado, Martha Hameister16

    nos

    15

    JEAN-PIERRE DEDIEU, Entrevista. 16

    HAMEISTER, Martha Daisson, Para dar calor nova povoao: Estudo sobre estratgias sociais e familiares a partir dos registros batismais da Vila do Rio Grande (1738-1763), UFRJ, Rio de Janeiro, 2006.

  • [27] conta de um registro de batismo singular. No batizado de Felcia,

    filha de escravos alforriada na pia batismal (do que se esperava

    a liberdade sem interferncia do senhor, j que o valor dela fora

    entregue no ato do batismo, segundo o costume da poca),

    havia, alm dos dados do batismo, um longo texto explicativo

    que narrava uma tentativa de interferncia do senhor da me

    sobre a liberdade da menina, que fora inibida pelo proco, que

    justificava, detalhadamente, as motivaes que orientaram sua

    ao. certo que tal documento nico. Mas qual deveria ser o

    tratamento dado para ele? Ignoraramos tal maravilha por falta

    de um campo justificativa da insistncia do padre em alforriar o

    batizando? Certamente no. Tampouco me parece boa a ideia

    de apenas mencion-lo no famoso campo Observaes, onde

    costuma cair tudo aquilo que no fomos capazes de planejar. H

    muitas formas de contar uma histria, assim como h muitas

    formas de montar uma base de dados . Mas a proposta aqui no

    de apresentar uma base voltada para batismos. No nesse

    momento.

    Se bem que os registros de batismo parecem muito

    mais complexos do que o primeiro olhar nos permite supor,

    ainda assim, h uma regularidade em sua produo. No Sculo

    XX, encontraremos at mesmo formulrios previamente prontos,

    feitos em grfica para o registro de batizados pelos padres.

    Outro tipo de fonte bastante regular so os inventrios post-

    mortem, feitos para identificar os bens dos falecidos para

    promover a partilha entre os herdeiros. Difusos por boa parte do

    Ocidente, eles tm uma estrutura bastante semelhante.17

    Embora muitos dos disponveis pelo mundo no correspondam

    ao esperado, h certa lgica da fonte que permite, entre outras

    17

    VAN DER WOUDE, A.M.; SCHUURMAN, A., Probate inventories: a new source for the historical study of wealth, material culture, and agricultural development: papers presented at the Leeuwenborch conference (Wageningen, 5-7 May 1980), [s.l.]: Hes, 1980.

  • [28] coisas, a comparao. E se, algumas vezes, encontraremos

    inventrios completamente fora da curva, que nos traro

    muitas dvidas sobre como devem ser inseridos na base de

    dados, o simples questionamento de suas diferenas em relao

    ao padro de sua feitura (que inclusive regulado por Lei) j nos

    d muitas ideias sobre a sociedade que o criou. A simples

    constatao da diferena j nos ajuda a fazer boa Histria.

    Talvez o mais interessante de trabalhar com

    inventrios seja perceber seu carter plural, digamos assim.

    Eles tm uma sequncia linear para a sua produo: abertura,

    avaliao dos bens, apresentao dos documentos

    comprobatrios e partilha.18

    comum encontrar dados da famlia

    do falecido, assim como informaes sobre o parentesco dos

    escravos que eram propriedade do falecido, quando em

    sociedades escravistas. Contudo, possvel encontrar uma

    diversidade de fontes no previstas, como recibos de compra de

    medicamentos e atendimento mdico (geralmente devido a

    alguma doena que levou morte o inventariado), assim como

    testamentos e comprovantes de pagamento de servios

    fnebres. Esses papis eram includos, pois tudo deveria ser

    pago antes da partilha.

    Eis a sua pluralidade, que se agua quando

    pensamos que a abertura, a avaliao, os documentos e a

    partilha so, igualmente, quatro fontes com estruturas muito

    diversas. Se pensarmos em incluir os testamentos, teremos mais

    elementos para estruturar dentro de uma base de inventrios.

    Isso porque os testamentos, apesar de lembrarem as cartas por

    sua aparncia (narrativa linear e o tamanho), so documentos

    absolutamente estruturados, seguindo um cnone que pouco se

    18

    FRAGOSO, Joo; PITZER, Renato Rocha, Bares, homens livres pobres e escravos - notas sobre uma fonte mltipla. Os Inventrios Post-mortem, Revista Arrabaldes, v. 1, n. 2, p. 2952, 1988.

  • [29] alterou em sculos.

    19 Havia uma frmula, que informava sobre o

    contexto da redao do documento, geralmente uma

    enfermidade aliada a dvidas sobre o que deus guardava para o

    testador. Pedia-se clemncia Santssima Trindade, aos santos e

    s santas da corte dos cus, ao santo do nome da pessoa e

    ao(s) santo(s) de devoo, em especial, e ao seu anjo da

    guarda. Na sequncia, uma lista dos ltimos desejos.

    Todas essas fontes tm uma forma importante, uma

    sequncia de fragmentos esperada tanto por ns quanto por

    seus criadores. Isso no faz delas objetos fceis de informatizar.

    Como vimos, h sempre espao para surpresas e isso muito

    positivo para a produo do conhecimento histrico. Contudo,

    grande parte dessas surpresas no exatamente

    surpreendente. muito normal, nas fontes que tenho, encontrar

    descries sobre a naturalidade dos avs do batizando, mas no

    surpreendente que sejam omitidas em muitos casos. Da

    mesma forma ser comum encontrar informaes as mais

    diversas sobre os padrinhos. O padre no tinha em mente

    apontar a patente militar de todos os padrinhos, mas

    mencionava a de alguns. Ser melhor colocar um campo

    patente militar para os padrinhos ou criar uma tabela associada

    em que colocaremos todas as informaes que surgirem, as mais

    diversas e imprevisveis, sobre os participantes do

    acontecimento?

    A soluo no simples e devemos pensar ainda

    mais longe. Uma vez abastecida a base, devemos ter acesso fcil

    e possibilidade de fazer buscas complexas nos nossos dados.

    Isso ser mais ou menos possvel de acordo com a base que

    montamos, da forma como dispomos os dados uns em relao

    aos outros. O sistema de busca varia de software para software,

    mas ele ser mais ou menos eficaz de acordo com a estrutura de

    19

    VOVELLE, Michel, Ideologias e mentalidades, So Paulo: Brasiliense, 1987.

  • [30] campos que criamos para acolher os dados. Da mesma forma,

    conveniente pensar na longevidade da nossa base. Para alm de

    usar sistemas que sejam fceis de converter para formatos

    futuros, fazendo essa migrao de tempos em tempos, j que a

    rpida obsolescncia algo comum no universo digital,

    precisamos pensar em bases que atendam a mais de uma

    pesquisa ou que estejam preparadas para pesquisas futuras. Os

    debates sobre a reusability, ou reusabilidade, numa

    desaconselhada traduo para o portugus, so bastante

    comuns e ainda no bem resolvidos.20

    Contudo, manter o foco

    na estrutura da fonte ainda a sada mais conveniente. E isso

    requer alguma erudio, tcnica famosa no Sculo XIX e que

    ainda tem sua importncia na programao do Sculo XXI.

    20

    SCHRER, Kevin, Historical demography, social structure and the computer, in: DENLEY, Peter; HOPKIN, Deian (Orgs.), History and Computing, Manchester: Manchester University Press, 1987; THALLER, Manfred, Methods and techniques of historical computation, in: DENLEY, Peter; HOPKIN, Deian (Orgs.), History and Computing, Manchester: Manchester University Press, 1987.

  • [31]

    Em ombros de gigantes

    Fazer bases de dados em histria tem sua prpria

    histria. E ela no pequena. Vamos apresentar um

    levantamento seletivo de experincias com esta perspectiva. Ele

    no apresenta todas as experincias com bases, que foram

    centenas no campo da histria, mas traz algumas que podem

    ajudar a pensar problemas crnicos deste tipo de abordagem.

    Muitas das questes que nos colocamos hoje j foram muito

    discutidas antes, por grandes nomes da historiografia. Vamos

    conhecer suas experincias e aproveitar a viagem para

    apresentar alguns problemas importantes no desenvolvimento

    das bases de dados.

    A experincia do Padre Busa, em 1949

    Quando em 1946 o padre jesuta italiano Roberto

    Busa acabou sua tese sobre o conceito de presena em S.

    Toms de Aquino, ele se deu conta que as expresses

    geralmente tomadas na obra do santo, praesens e

    praesentia, no eram as melhores para o seu estudo. Aquele

    conceito se manifestava melhor na forma da partcula in, que

    nunca fora organizada nos ndices de que dispunha para o

    estudo. Busa no se acovardou e comeou um lento trabalho de

    organizao dos textos tomsticos em fichas de frases e de

    palavras. Neste momento surgiu a ideia de mecanizar o

    trabalho. Anos depois, em 1949, em uma viagem aos Estados

    Unidos, ele investigou as possibilidades existentes em dezenas

    de universidades, encontrando dilogo junto IBM. Como ele

    mesmo conta, a primeira resposta foi negativa: no seria

    possvel fazer um ndice daquele porte com os equipamentos da

    IBM. Diante da negativa, Busa teria invocado o prprio slogan da

    companhia na poca: The difficult we do right away; the

    impossible takes a little longer (O difcil ns fazemos agora; o

  • [32] impossvel demora um pouco mais). Ganhou o apoio da IBM,

    mesmo sem ter dinheiro.21

    Toda a preocupao de Busa, naquele momento,

    estava no processamento da informao e no nas formas de

    estocagem dos dados. A forma de fazer isso j estava definida

    de antemo e seguia os mesmos pressupostos usados por ele na

    confeco de fichas manuais, que continham palavras, frases e

    suas localizaes nos textos tomistas. A palavra database (base

    de dados) no aparece no seu texto, ainda que a expresso data

    bank (banco de dados) seja utilizada uma nica vez, justamente

    quando ele narra as dvidas que surgiram no momento de

    publicar os resultados, se seriam publicados em um livro, na

    forma de um enorme catlogo, ou se somente seria oferecido o

    banco gerado no processo. A opo final foi pela publicao de

    quinhentos exemplares de um grande catlogo.

    A primeira questo que me parece pertinente com

    este caso a forma com Busa criou uma demanda de pesquisa e

    foi em busca da tcnica para solucion-la. E mesmo uma sada

    cara e que levaria anos (neste caso, 30 anos), envolvendo o

    treinamento de dezenas de ajudantes no processamento dos

    cartes perfurados e fitas, foi pacientemente aceita tendo em

    vista o ganho maior ao longo prazo. Esta a segunda concluso

    que podemos tirar desta empreitada: o custo de

    desenvolvimento e abastecimento de bancos de dados parece

    alto, e certamente . Contudo, a capacidade de recuperar os

    registros de forma automtica, rpida e fcil aps a concluso do

    trabalho bastante compensadora. Os materiais organizados por

    Busa ficaram disponveis para os pesquisadores da obra de Santo

    Toms, que poderiam agora, com qualquer problema de

    pesquisa, atingir seus objetivos com grande velocidade.22

    21

    BUSA, Roberto, The Annals of Humanities Computing: The Index Thomisticus, Computers and the Humanities, v. 14, p. 8390, 1980. 22

    Disponvel na web no endereo: Index Thomisticus, disponvel em: , acesso em: 27 set. 2013.

  • [33]

    Por fim, temos o ausente presente, o conceito de

    banco de dados, no apresentado por Busa em seu texto por ser

    demasiado evidente para quem passou dcadas criando um.

    Justamente naquilo que o projeto de Busa tinha de melhor:

    armazenar conhecimento de modo organizado, de modo a

    permitir rpida consulta posterior. Sendo assim, podemos definir

    um banco de dados como um lugar onde podemos estocar a

    integralidade das informaes relativas a um assunto23

    ,

    entendendo que este ltimo pode ser um tema ou um problema

    de pesquisa. Outros acrescentariam que as informaes de um

    database deveriam estar estruturadas e interligadas entre si a

    partir de um modelo lgico especfico. Enfim, podemos resumir

    dizendo tratar-se de uma coleo organizada de dados.24

    Toda

    esta discusso, contudo, passava longe da cabea de Busa e s

    se tornou central a partir dos anos 1970. At ento, a grande

    promessa da informtica no estava no armazenamento, mas no

    seu grande potencial de processamento das informaes. Por

    outro lado, um data bank seria o conjunto dos cartes,

    simplesmente.

    O Colquio da cole Normale Suprieure de Saint-Cloud,

    de 1965

    Em 1965 um grupo de historiadores tambm

    deixava registrado seu debate sobre o uso de mquinas IBM e

    Bull. No se tratava de um debate tcnico, ainda que estas

    questes estivessem sendo discutidas. Foi durante um colquio

    23

    Base de donnes - Wikipdia, disponvel em: , acesso em: 27 set. 2013. 24

    Database - Wikipedia, disponvel em: , acesso em: 27 set. 2013; Database - Wikipedia, the free encyclopedia, disponvel em: , acesso em: 27 set. 2013.

  • [34] realizado na cole Normale Suprieure de Saint-Cloud, em maio

    de 1965. O evento reunia alguns dos nomes mais expressivos da

    historiografia francesa de ento, como Ernest Labrousse e

    Adeline Daumard. Ainda estvamos no tempo do carto

    perfurado e das fitas magnticas, e estes foram alguns dos

    pontos tratados na apresentao de Robert Faure, Machines et

    programmes. Quelques vues sur l'utilisation des machines

    traiter l'information en histoire sociale.25 A interveno de Faure

    indica qual era o pensamento da poca: a automatizao das

    fontes, ou seja, a passagens dos dados dos documentos

    histricos para cartes ou fitas magnticas, que seria possvel

    atravs do uso de codificaes bem feitas, a partir de um

    vocabulrio ou thesaurus.

    Apesar do tom predominantemente tcnico da

    apresentao de Faure, bem como do debate subsequente26

    ,

    entre cartes perfurados e fitas magnticas, ali j estavam

    colocadas algumas questes importantes do ponto de vista do

    historiador e que tem relao direta com a mesma questo

    tcnica. Em primeiro lugar, o uso de um vocabulrio um

    elemento que vai seguir atual para a construo de bancos de

    dados. Hoje os programadores chamam isso de Dicionrio de

    dados. Veremos sobre isso mais adiante, no h pressa.

    Outro ponto, este ainda mais fundamental,

    introduzido na apresentao de Faure e discutido com maior

    profundidade em outra comunicao, de Jacques Dupaquier: o

    problema da classificao e consequente uso de codificaes.

    Faure ingenuamente acreditava na possibilidade de uma

    25

    FAURE, Robert, Machines et programmes. Quelques vues sur lutilisation des machines traiter linformation en histoire sociale, in: Lhistoire sociale: sources et mthodes, Paris: Presses Universitaires de France, 1967; FAURE, Robert, Mquinas e programas. Pontos de vista sobre a utilizao das mquinas destinadas a elaborar a informao em histria social, in: A Histria Social: problemas, fontes e mtodos, Lisboa: Edies Cosmos, 1973. 26

    Os debates e comentrios posteriores s apresentaes foram todos publicados na verso original francesa, bem como na edio lusa de 1973.

  • [35] codificao perfeita, que mantivesse as caractersticas da fonte.

    Contudo, um dos comentaristas, Claude Mazauric, destacava

    que:

    ...a determinao do cdigo a questo mais delicada para o historiador [...] pois de acordo com as datas, de acordo com as pocas, com os tipos de documentos, as

    informaes no so equivalentes.27

    Dupaquier, neste mesmo evento, apresenta o texto

    Problmes de la codification socio-professionelle.28 Sua

    apresentao volta ao tema das classificaes, mas de modo

    sutil. no comentrio de Adeline Daumard que o tema ressurge

    de modo expressivo. Daumard respondia aos crticos de seu

    trabalho sobre as classificaes scio-profissionais, que era

    acusado de estabelecer uma grade a priori . Concordando com

    seus crticos, ela dizia que

    ...estabelecer esta classificao, estabelecer claramente uma hierarquia, quase, no fundo, resolver o problema.

    Tratava-se de um problema clssico em histria. Ao propor uma pergunta, estamos enquadrando agentes e

    processos dentro de certos parmetros que nos parecem certos,

    mas ao chegar ao final da pesquisa, descobrimos os limites de nossos conceitos:

    Se tivssemos um cdigo perfeito seria quase intil de estudar o que quero, a burguesia, pois saberamos de imediato o que ela . Diante deste paradoxo que est o paradoxo da histria: precisamos de uma classificao

    27

    Mazauric, em comentrio ao texto de FAURE, Machines et programmes. Quelques vues sur lutilisation des machines traiter linformation en histoire sociale(Traduo nossa. O original est em francs). 28

    JACQUES DUPAQUIER, Problmes de la codification socio-professionelle, in: Lhistoire sociale: sources et mthodes, Paris: Presses Universitaires de France, 1967.

  • [36]

    para poder trabalhar; mas ao mesmo tempo, precisamos nos resguardar de prejulgar o resultado. Esta a razo pela qual, na minha opinio, a soluo deve ser a busca de modo emprico, a fim de traduzir a realidade.29

    Neste debate, classificao e codificao eram

    sinnimos. E codificar significava transferir as classificaes para

    dentro da lgica da computao da poca. Codificar era a forma

    disponvel de manifestar formalmente as concepes terico-

    metodolgicas do pesquisador, atravs de procedimentos claros

    e transparentes. A partir de um estudo preliminar, foi elaborada

    uma lista de classificaes prprias para as sociedades francesas

    do sculo XVIII, XIX e XX, dividindo as pessoas entre agrupaes

    profissionais, de renda e de hierarquia social.

    Em 1962, Daumard publicou um artigo com seu

    projeto de classificao scio-profissional.30

    Era uma proposta

    de concepo, uma forma de entender a hierarquia social

    naquela sociedade. Podemos dizer que tal texto correspondia ao

    que os programadores chamam hoje de Modelo conceitual.

    Era isso que fazia Daumard ao criar uma lista de

    identificadores possveis para o universo que estudava. E isso

    no era um privilgio do tipo de histria que ela fazia, prprio

    do trabalho do historiador. Estamos sempre escolhendo palavras

    que identificam e caracterizam nossos objetos. Um banco de

    dados exige isso na hora de seu desenvolvimento. A

    complexidade do mundo social ser sempre maior que nossa

    capacidade de compreend-la. Ou melhor, compreender

    demanda simplificao. Resta-nos simplificar com a maior

    29

    Ibid. 30

    ADELINE DAUMARD, Une rfrence pour ltude des socites urbaines en France aux XVIIIe et XIXe sicles projet de code socio-professionnel, Revue dHistoire Moderne et contemporaine, v. X, p. 185210, 1963; ADELINE DAUMARD, Structures sociales et classement socio-professionnel. Lapport des archives notariales au XVIIIe et au XIXe sicle., Revue Historique, v. 86, n. CCXXVII, 1962.

  • [37] complexidade possvel. E, para isso, devemos estar atentos no

    desenvolvimento destes modelos conceituais. A mquina no vai

    entender coisas como meu agentes se comportam de um modo

    difcil de entender. preciso incluir esta complexidade no

    modelo, de modo claro.

    Lawrence Stone, no incio dos anos 1970

    Vejamos agora um diagnstico, feito em 1971, por

    Lawrence Stone, em seu clebre Prosopography, publicado

    naquele inverno na revista Daedalus. Em um texto direto, ele

    apresentava a metodologia que havia consagrado seu clssico

    livro The Crisis of the Aristocracy.31 O uso do computador era

    ainda considerado uma novidade, uma vez que os

    historiadores...

    lenta e timidamente comeam a explorar as potencialidades da nova ferramenta tecnolgica, eles comeam a perceber sua quase ilimitada capacidade de lidar precisamente com o tipo de material que a prosopografia apura.32

    Stone nos apresenta o cenrio do uso destes

    equipamentos no meio acadmico anglo-saxo da poca. Apesar

    de considerar a Inglaterra e os Estados Unidos como o primeiro

    e o segundo centros de pesquisa em histria do mundo, ele

    admite que seus colegas americanos e franceses estavam na

    frente no mundo da informtica:

    ...h fortes traos nacionais para essa diviso de perspectivas - pois os estadunidenses e os franceses tm muito mais acesso a e confiana nos computadores que

    31

    STONE, Lawrence, The Crisis of the Aristocracy, 1558-1641, Oxford: Oxford University Press, 1965. 32

    STONE, Lawrence, Prosopografia, Revista de Sociologia e Poltica, v. 19, n. 39, p. 115137, 2011.

  • [38]

    seus colegas ingleses -, fortes traos culturais - com ameaas de uma nova guerra entre os antigos e os modernos, entre as humanidades e as cincias...33

    Havia motivos para tanto receio. O prprio Stone

    apontava alguns dos problemas advindos com o uso do

    computador. Ao comentar uma possvel tendncia de separao

    entre a prosopografia das massas (foco nos grupos) com a das

    elites (foco nos grandes homens), ele destacava o papel do

    computador neste perigo:

    O perigo foi bastante aumentado pelo advento do computador, que foi adotado pelos pesquisadores mais estatisticamente orientados com todo o entusiasmo indiscriminado dos ninfomanacos e rejeitado pelos menos cientficos, em parte devido a melindres intelectuais, em parte devido a uma complacncia ignorante dos prazeres

    que esto perdendo. 34

    O uso de grandes computadores ainda era privilgio

    dos cientistas polticos, dentro das humanidades. Naquele

    contexto, eram os estudos de eleies uma das principais

    aplicaes das novas tecnologias. Para Stone, o maior trunfo do

    computador era...

    A correlao de numerosas variveis afetando grandes

    massas de dados , reunidas em uma base uniforme, precisamente o que o computador pode fazer melhor; tambm o que h de mais laborioso e, em vrios casos, virtualmente impossvel de trabalhar sem auxlios eletrnicos, mesmo para os historiadores com orientao mais matemtica. doloroso admitir que o advento de um aparato tcnico poderia ditar o tipo de questes histricas formuladas e os mtodos utilizados para

    solucion-los35

    33

    Ibid. 34

    Ibid. 35

    Ibid.

  • [39]

    Mas Stone era otimista ao considerar que:

    A disponibilidade do computador crescentemente seduzir os historiadores a concentrar suas energias nos problemas que podem ser solucionados pela quantificao, problemas que s vezes - mas de maneira nenhuma sempre - so os mais importantes ou interessantes.36

    Tal como para Busa e Faure, era o processamento

    de grandes quantidades de registros que importava. Ainda no

    estava claro o uso de bancos de dados que permitissem

    consultas sistemticas. Mas algo mais fica sugerido no texto de

    Stone. a demanda por materiais uniformes. Tanto Faure

    como Busa esto, o tempo todo, pensando em processar uma

    nica fonte. Para Busa, o texto de Santo Toms, para Faure, as

    fontes devem ser transferidas para fitas magnticas. No caso de

    Stone, parece haver espao para combinar dados de diferentes

    origens dentro de bases uniformes.

    Por outro lado, ele retoma o debate sobre as

    classificaes, reforando aquilo que Daumard e Dupaquier j

    salientavam. Stone falava dos erros frequentes nos estudos

    prosopogrficos, dando nfase aos erros nas classificaes dos

    contedos.

    Classificaes significativas so essenciais para o sucesso de qualquer pesquisa, mas infelizmente para o historiador cada indivduo desempenha muitos papis, alguns dos quais esto em conflito com outros. 37

    Mas o problema no estava na natureza dos

    agentes histricos, mas na mo dos historiadores:

    ...se uma subdiviso que depois se revela de importncia

    36

    Ibid. 37

    Ibid.

  • [40]

    crtica no for notada a tempo, usualmente tarde demais para voltar e realizar todo o trabalho de novo - uma dificuldade que particularmente aguda em pesquisas auxiliadas por computadores, pois os cdigos determinam as questes que podem ser depois formuladas.38

    Com isso tornamos ao problema apresentado por

    Daumard, alguns anos antes. Preciso de uma boa classificao

    para conhecer o passado e preciso conhecer o passado para ter

    uma boa classificao. No entanto, o conhecimento prvio do

    passado pode comprometer os resultados da investigao, uma

    vez que aplico aos dados o pr-conceito que j tinha, sem

    atentar para elementos novos surgidos no andar da pesquisa.

    Para isso, h necessidade de repensar as classificaes todo o

    tempo. E este problema pode ser complexo, como pensava

    Daumard, ou tratar-se de uma escolha estpida, como parece

    prever Stone, que j prope fazer tudo novamente. A

    classificao no apenas uma pr-explicao como ela tambm

    limita as perguntas possveis para os dados processados. Neste

    sentido, o dano causado pelo processamento veloz dos

    computadores pode alertar o historiador para a importncia de

    pensar sobre suas classificaes.

    Por fim, parece interessante notar como Stone, j

    naquela poca identificava uma postura que parece ter sido

    hegemnica entre os historiadores nos ltimos 40 anos, ao tratar

    do advento do computador na pesquisa em histria:

    ...seria adotar a postura do avestruz fingir que isso no est acontecendo agora e que no acontecer em uma escala ainda maior nos anos vindouros39

    E os anos vindouros prometiam muito.

    38

    Ibid. 39

    Ibid.

  • [41] O primeiro Manual de Computao para historiadores

    Em 1971, o historiador Edward Shorter lanava The

    historian and the Computer. A practical guide.40 Era a primeira

    vez que surgia um manual voltado diretamente para o pblico da

    disciplina. Seu foco principal era ensinar os historiadores

    interessados em estudos quantitativos como preparar sua

    pesquisa para um bom processamento com o uso de cartes

    perfurados. A tarefa era fcil: aprender a usar um IBM 360 seria

    to simples quanto entender o funcionamento do motor de um

    automvel! Aps algumas pginas sem conseguir explicar o

    funcionamento do computador, mas decifrando os assustadores

    nomes das partes que o compunham, ele enfim nos fala que no

    fundamental entender o funcionamento completo da mquina:

    bastava o mnimo para perder o medo.

    Shorter foi audaz e pioneiro, mas criou um livro

    absolutamente datado. Apesar de ter servido por

    aproximadamente dez anos, sua obra ficou muito presa

    tecnologia disponvel nos anos 1960 e 70, como os lendrios

    softwares Fortran e Cobol (que ainda so usados hoje, mas no

    por historiadores). Mas no podemos compreender Shorter como

    algum fora de seu tempo. Todo o contrrio. No mesmo ano em

    que era lanado The historian and the computer, surgia a revista

    Computers and medieval data processing uma publicao

    canadense voltada para a informatizao dos estudos sobre

    Idade Mdia. A publicao no trazia artigos, mas notcias sobre

    publicaes, projetos e outras informaes interessantes para o

    medievalista moderno.

    Ao longo de sua existncia (durou entre 1971 e

    1987), Computers trazia em cada edio uma lista dos projetos

    40

    SHORTER, Edward, The historian and the Computer. A practical guide, New Jersey: Prentice-Hall, 1971.

  • [42] sobre histria medieval que lanavam mo da informtica. Ao

    todo, foram mencionados 354 projetos, a grande maioria nos

    Estados Unidos, seguidos de Canad e Frana. Era um pblico

    que compreendia muito bem as palavras de Shorter: os

    equipamentos mais utilizados foram, de longe, os IBM 360 e

    370, rodando, na maioria dos casos, o Fortran IV, alm de

    outros como PL/1 e Snobol.41 O foco temtico de Shorter,

    contudo, era um tanto distante daqueles projetos da Computers

    and medieval data processing. A maior parte daquelas

    empreitadas visava o processamento de textos e sua lematizao

    automtica. Shorter estava dirigido para os estudos

    quantitativos, dentro do mesmo contexto que trazia os

    computadores como ferramentas incontornveis.

    Por outro lado, seu objetivo central domesticar

    aquilo que considerava o aparente mistrio das mquinas.

    Buscando a vulgarizao e a ruptura com a postura do avestruz,

    Shorter ficou mais prximo do entusiasmo indiscriminado dos

    ninfomanacos, como dizia Stone.

    Reconstructing historical Communities: um projeto

    pioneiro

    Em 1979, Alan Marcfarlane publicava, em

    colaborao com Charles Jardine, um breve texto no 7

    Congresso Internacional de Histria Econmica.42

    Apesar de

    breve, o texto continha a essncia das reflexes iniciadas em

    1972, quando se iniciara a aventura de Macfarlane e Sarah

    41

    UNIVERSIT DE MONTRAL INSTITUT DTUDES MDIVALES, Computers and Medieval Data Processing: Informatique Et Etudes Medievales, [s.l.]: Universit de Montreal, Institut dtudes medievales., 1971. 42

    MACFARLANE, Alan, Computer input of Historical Records for multi-source record linkage, in: Proceedings of the Seventh International Economic History Conference, Edinburgh: [s.n.], 1979.

  • [43] Harrison na tentativa de informatizar fontes para o estudo de

    histria local na Inglaterra.43

    O resultado da pesquisa tornou-se

    livro um pouco antes, com o nome de Reconstructing historical

    Communities.44 Destaco isso tudo, pois me parece que esta

    comunicao trazia elementos realmente inovadores para aquele

    momento e que so questes-chave ainda hoje.

    Jardine e Macfarlane pareciam extremamente

    insatisfeitos com o que a tecnologia oferecia naquele momento.

    Os programas no se adequavam s necessidades de pesquisa

    do grupo e por vrias razes. A primeira era conceitual: os

    programas de gerenciamento de bancos de dados disponveis na

    poca eram problem-oriented (orientados a partir de um

    problema, algo que tambm se pode chamar de method-

    oriented, orientado pelo mtodo) e no pela fonte. A

    programao dava conta de tarefas a cumprir e no havia

    condies para, por exemplo, aplicar as proposies

    metodolgicas de Louis Henry e Wrigley, no que diz respeito,

    respectivamente, ao chamado mtodo de reconstituio de

    famlias e aos Record-linkage methods. Isso se dava pelo fato de

    que estas metodologias empregavam o uso de qualidades

    diferentes de dados, a partir de fontes, de modo relacional.

    Para ilustrar o tamanho do problema, ele

    apresentou um exemplo usando o longevo pacote SPSS (ainda

    hoje hegemnico nas Cincias Sociais). Seu argumento era de

    que o programa era adequado para os surveys criados pelos

    socilogos, mas identificou seu limite: se ele dispunha de uma

    tabela com dados sobre a educao infantil e de outra com as

    informaes sobre as famlias e quisesse cruzar os registros, no

    seria possvel por conta do modelo conceitual prprio do pacote.

    43

    MACFARLANE, Alan, The computer revolution and local history. 44

    MACFARLANE, Alan, Reconstructing historical Communities, Cambridge: Cambridge University Press, 1977.

  • [44] Alm disso, os pacotes da poca, incluindo SPSS, no dispunham

    de elementos para incluir documentos inteiros, o que forava a

    perda de dados involuntria, sem falar na incapacidade dos

    aplicativos em processar contedos incertos, imprecisos ou

    confusos, (fuzzy data).

    na constatao dos limites do que era praticado

    na poca por seus colegas que Macfarlane vai explorar dois

    caminhos at ento desconhecidos pelos historiadores (e diria,

    tambm, pelos programadores). O primeiro e mais importante

    elemento a adoo de um modelo de dados sourced-oriented

    (orientado pela fonte). Ao invs de extrair dos documentos os

    dados necessrios para cumprir as exigncias do programa, em

    campos possveis, a fonte seria colocada integralmente dentro do

    programa, sem cortes. Isso seria possvel graas pr-edio

    dos textos, j que no haveria utilidade em simplesmente ter os

    textos integrais no computador. Seria importante cont-los,

    cruz-los e aplicar outras metodologias de acordo com a

    necessidade. Deste modo, se um registro de batismo dizia que

    John, filho de Henry Abbott foi batizado em 5 de maio de 1607,

    o documento seria assim transcrito para o entendimento da

    mquina da seguinte maneira:

    (P (N John) (K the son of (P (N Henry Abbott))) (E was

    baptized. (D 5th May 1607)))

    [explicao: P = person (pessoa); N = name (nome); K = kinship

    (parentesco, indicando o tipo em linguagem natural, no caso, o

    ingls); E = event (evento); D = date (data))]

    Ou seja, uma pessoa chamada John tinha

    parentesco (k), no caso, era filho de outra pessoa chamada

    Henry Abbott e participou de um evento, um batizado, em uma

    data, no caso, no dia 5 de maio de 1607. Com o uso destes

    cdigos e parnteses, um historiador explicaria mquina o

  • [45] significado de cada coisa: datas, nomes, relacionamentos, etc.

    Demandava algo importante e vlido, com debate, at os dias

    atuais: a normatizao de nomes e a atualizao da lngua. No

    caso, inclusive textos em latim foram traduzidos para tornar o

    clculo possvel. O uso do recurso de pr-edio foi adotado,

    pouco tempo depois, no desenvolvimento do kleio, por Manfred

    Thaller, sobre o qual falaremos mais adiante.45

    Recentemente

    esta prtica tornou-se modelo nas linguagens da internet, com a

    chamada web semntica, onde as palavras em um site no so

    mais amontoados de letras organizados pelo formato (texto

    grande ou pequeno, com negrito ou em itlico, etc).

    semelhante ao que se utiliza com a linguagem XML, para dar um

    exemplo disponvel na internet.

    Alm da programao orientada pela fonte histrica

    estruturada de modo legvel pelo computador, Macfarlane e

    Jardine foram pioneiros no uso de uma tecnologia ainda muito

    pouco conhecida na poca: o modelo relacional de dados, hoje

    hegemnico a ponto de ser tomado quase como norma. Na

    poca, utilizaram um manual sobre databases feito por C. J.

    Date, famoso no apenas pela didtica na explicao dos

    recursos tcnicos, mas igualmente por ter pertencido ao grupo

    que criou, dentro da IBM, a linguagem SQL. O uso dessa

    tecnologia tornava possvel cruzar dados de diferentes tabelas,

    que conteriam informaes de fontes diversas, as quais

    permitiriam o emprego de anlises como as de Henry e Wrigley.

    Manfred Thaller e o kleio

    No final dos anos 1970 a equipe de Manfred Thaller,

    no Max Plank Institute ,comeou a desenvolver uma ferramenta

    45

    ROWLAND, Robert, L`informatica e il mestiere dello storico, Quaderni Storici, v. 78, n. 03, p. 693 720, 1991.

  • [46] para o processamento de dados em histria. Chamava-se kleio.

    Os primeiros resultados s comearam a surgir em meados da

    dcada seguinte. O kleio era um programa feito sob medida para

    a pesquisa histrica e orientado pela fonte: implicava na

    transcrio controlada dos documentos para uma linguagem

    compreensvel pelo computador, atribuindo cdigos pr-definidos

    ao texto. Em boa medida, ele seguia de perto as formulaes de

    Macfarlane e h quem associe as duas iniciativas.46

    O sistema de Thaller, influenciado ou no por

    Macfarlane, previa a criao de um programa que poderia ser

    instalado em outras mquinas, coisa que no fora considerada

    em Cambridge. Com o tempo, o kleio passou de uma linguagem

    que tratava dados de fontes para uma historical Workstation, na

    qual qualquer historiador, sem grande conhecimento de

    informtica, poderia trabalhar sem dependncia de um

    programador, o que geraria uma grande economia no de tempo

    na pesquisa. A ferramenta dispunha de conexes com outros

    sistemas de anlise, como o SPSS. Neste sentido, kleio sempre

    foi um organizador de informao, mais do que um software

    completo, prximo de uma base de dados de historiador.

    O trabalho de abastecimento era feito seguindo a

    ordem da documentao e no segundo demandas de

    formulrios pr-definidos. Neste sentido, havia igualmente uma

    economia de trabalho no preenchimento das fontes. O grande

    mrito de kleio era exatamente o fato de ser orientado pela

    fonte, a ponto de no interferir, ou de interferir muito pouco, na

    estrutura original dos documentos. Segundo Thaller:

    Dados so administrados na forma de colees de pedaos de texto, sem qualquer suposio sobre seu significado. Todas as suposies (o status social derivado de uma dada ocupao; o significado cronolgico da data

    46

    Ibid.

  • [47]

    apontada para dias diferentes no calendrio de vrias dioceses; a taxa de cmbio de duas moedas diferentes) so geridos em tabelas completamente independentes

    dos dados originais.47

    Kleio foi um dos primeiros programas (e talvez um

    dos nicos) a criar sistema de identificao de dados incertos e

    imprecisos (fuzzy). Fora desenvolvida uma codificao especial

    para indicar incertezas e imprecises, o que dava uma grande

    vantagem comparativa entre este programa e os softwares

    comerciais da poca, contra os quais Thaller se manifestava

    preocupado, precisamente pela falta deste tipo de recurso.48

    Neste sentido, novamente h uma proximidade com Macfarlane.

    O sistema Fichoz

    Em um artigo de 2004, Jean Pierre Dedieu

    apresentava um banco de dados que j tinha alguns anos de

    existncia: o sistema Fichoz.49

    Trata-se de uma base centrada no

    mtodo, na qual h uma metodologia de trabalho prvia ao

    tratamento dos dados. A ideia principal a de que possvel

    decompor a vida dos agentes histricos em eventos. Neste

    sentido, para cada ato seria criado um registro com informaes

    como a data, o local, a interao com outro agente e um campo

    de detalhamento. A interao e a anlise detalhada de cada ato

    so os pontos fortes desta forma de coletar e organizar os

    dados. Deste modo, seriam possveis buscas por indivduos

    (biografias), por grupos de indivduos (prosopografias), por

    47

    THALLER, Methods and techniques of historical computation. 48

    THOMAS, William, Computing and the Historical Imagination, in: SCHREIBMAN, Susan; SIEMENS, Ray; UNSWORTH, John (Orgs.), A Companion to Digital Humanities, Oxford: Blackwell, 2004. 49

    DEDIEU, Jean Pierre, Les grandes bases de donnes: une nouvelle approche de lhistoire sociale. Le systme Fichoz, Revista da Facultade de Letras- Histria, v. 05, 2004.

  • [48] pessoas conectadas com outras por algum motivo (anlise de

    redes sociais) e por sries, de acordo com a necessidade. Isso

    seria possvel, pois cada registro colocaria dois ou mais agentes

    histricos em relao uns com os outros:

    A nova concepo do trabalho em histria social nos d a soluo. preciso tratar cada dado como um evento dentro da vida de um ator. A documentao deve ser lida

    como um conjunto de sequencias que descrevem as aes efetuadas ou sofridas por um ator individual. Cada uma destas aes deve corresponder a um registro dentro da base de dados contendo todos os elementos necessrios a sua interpretao: natureza e descrio da ao, identificao do ator, data, referncia, elementos de contexto, etc. A converso dos documentos em atos da responsabilidade do pesquisador que o faz a partir de sua

    margem de interpretao.50

    O trao marcante deste sistema sua versatilidade.

    As buscas e cruzamentos de informao seriam feitas no mesmo

    formulrio criado para o abastecimento, permitindo escolher

    muitos campos simultaneamente, inclusive de tabelas

    relacionadas. Isso era relativamente fcil graas ao software

    utilizado, o Filemaker. Porm, o grande mrito da base est na

    sua estrutura: ela ao mesmo tempo robusta e verstil, ao

    utilizar poucos campos e tirar proveito da possibilidade, ilimitada,

    em qualquer sistema, de criar registros. E como cada ato seria

    um registro, bastaria gerar tantos registros quantos fossem

    necessrios para desmontar um processo histrico, reagrupando

    o mesmo por pessoas, datas, localidades ou metodologias. Esta

    estrutura permitia receber dados de qualquer tipo de fonte:

    Tal esquema se prova extraordinariamente robusto e permite de cobrir o conjunto dos casos possveis, qualquer que seja a fonte crnica, arquivos

    50

    Ibid.(Traduo nossa. O original est em francs).

  • [49]

    administrativos ou judicirios, correspondncias, atos notariais, registros paroquiais, literatura de segunda mo ou outro. Isso permite claramente uma contagem extremamente veloz dos instrumentos pblicos registros paroquiais, estado civil, atos notariais que so em ltima anlise instrumentos para criar relaes interindividuais. E posiciona de maneira imediata o assunto dentro do contexto da carreira de cada um dos

    atores.51

    A base Fichoz ainda utilizada por um grupo de

    pesquisadores e para diversas pesquisas.

    * * *

    A proposta neste captulo no foi a de esgotar as

    iniciativas de uso de bancos de dados dentro da produo do

    conhecimento histrico, assunto para o qual seria necessria

    uma enciclopdia. Mas vimos, com a ajuda de algumas

    experincias pontuais, alguns temas relevantes que sero

    retomados ao longo das prximas pginas. E, mais importante,

    vimos que o uso do computador em histria tem uma longa data

    e que no h motivo para reinventar a roda.

    51

    Ibid.

  • [50]

    Algumas questes prprias da

    informtica

    Quando se fala de questes tcnicas os

    historiadores costumam correr para as montanhas. difcil saber

    os motivos da longeva averso de nossos colegas ao universo da

    informtica. Alguns apresentam justificativas epistemolgicas,

    outros optam por expor seu desprezo pela tcnica (a respeito de

    que j discutimos antes) e muitos se consideram incapazes de

    aprender. Mas acredito que quem aprendeu a usar um aparelho

    celular ou o email poder facilmente aprender alguns dos

    elementos bsicos que caracterizam as bases de dados.

    Veremos que no to complicado. O problema

    grande devido falta de didtica ou de pacincia dos

    programadores. Tentaremos ser didticos aqui. Tudo bastante

    lgico. Se formos capazes de discutir sobre as representaes do

    poder no Antigo Regime, seremos capazes de aprender alguns

    procedimentos da informtica.

    Estrutura de dados

    A primeira coisa que importa saber quais so os

    elementos que compem uma base de dados, sua estrutura.

    bem mais simples do que Althusser! Uma base um conjunto de

    TABELAS articuladas. Alguns usam a palavra entidade para

    designar as tabelas, um nome um tanto sobrenatural. Essas

    tabelas podem conter diferentes tipos de informao: sobre

    pessoas, casas, terras, por exemplo, endereos, etc. Podemos

    criar apenas uma tabela, se for o caso. Sobre essa deciso, que

  • [51] envolve predominantemente problemas prprios do

    conhecimento histrico, veremos adiante, quando lermos sobre a

    montagem de bases. Continuemos com as nossas tabelas.

    Figura 5 - Ilustra a estrutura de um banco de dados

    Uma tabela formada por campos e registros

    (tambm conhecidos como "colunas" e "linhas"). Nas colunas,

    indicam-se os campos do banco de dados (tambm chamados

    por alguns de atributos), como geralmente aparece em

    formulrios, por exemplo, nome, endereo e estado civil. As

    linhas correspondem aos registros. No caso de uma tabela feita

    para organizar e gerenciar uma turma escolar, a tabela seria

    composta por campos como nome, matrcula e idade, por

    exemplo. Os registros seriam tantos quantos fossem os alunos

    matriculados na turma.

    Figura 6 - Modelo de tabela

    (conceitual)

    Figura 7 - Modelo de tabela (como em um

    formulrio)

    Como pudemos ver, algo bem mais simples que

    Lvi-Strauss. Agora, que j dominamos essa informao,

  • [52] podemos avanar um pouco mais. Cada um dos campos (ou

    atributos, a mesma coisa) da nossa base deve ter sua prpria

    personalidade, ou seja, devem ser qualificados. Ele pode ser um

    campo de texto (curto ou longo), de nmero, de data, de

    imagem