Reconstrução Filogenética de microorganismos a partir da Via de … · RESUMO A filogenômica...
Transcript of Reconstrução Filogenética de microorganismos a partir da Via de … · RESUMO A filogenômica...
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE BIOCIÊNCIAS
DEPARTAMENTO DE BIOLOGIA CELULAR E GENÉTICA PÓS-GRADUAÇÃO EM GENÉTICA E BIOLOGIA MOLECULAR
Reconstrução Filogenética de microorganismos a partir da Via de Reparo por
Excisão de Nucleotídeo
UASKA BEZERRA E SILVA
NATAL – RN 2008
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE BIOCIÊNCIAS DEPARTAMENTO DE BIOLOGIA CELULAR E GENÉTICA
PÓS-GRADUAÇÃO EM GENÉTICA E BIOLOGIA MOLECULAR
Evolução do Reparo por Excisão de Nucleotídeo
UASKA BEZERRA E SILVA
Dissertação apresentada ao Programa de Pós-graduação em Genética e Biologia Molecular do Centro de Biociências da Universidade Federal do Rio Grande do Norte, como parte dos requisitos para a obtenção do título de Mestre em Genética e Biologia Molecular.
Orientador. Profª. Drª. Lucymara Fassarela Agnez Lima
NATAL-RN 2008
À minha esposa, pois sem ela nunca atingirei a verdadeira felicidade.
AGRADECIMENTOS Ao Criador, por renovar minhas energias a cada manhã. A mim, por ter acreditado que valia a pena tentar, mesmo quando todos me desanimaram. A minha família, pelo carinho e os cuidados recebidos. A família Bezerra, que é, acima de tudo, é uma parte do meu EU. A Drª Lucymara, por me ensinar que a ciência não é apenas a busca pelo
conhecimento, mas também pode ser uma opção de vida.
A Drª Kátia, pela amizade e pelo seu exemplo como pesquisadora. Aos alunos do Laboratório de Biologia Molecular e Genômica (LBMG). Em especial, às minhas amigas e companheiras de trabalho árduo: Fabíola e Thayse. Obrigado. A todos da Pós-Graduação da Genética e Biologia Molecular A quem, direta ou indiretamente, contribuiu para o término deste trabalho. Por último, e não menos importante, aos computadores...
“Bem aventurado o homem que
acha sabedoria, e o homem que
adquire conhecimento.“
Provérbios 3:13
RESUMO
A filogenômica estuda os organismos através de análises comparativas das seqüências conservadas presentes em seus genomas visando encontrar alguma justificativa para a origem ou a evolução dos mesmos. Dentre as seqüências com elevado nível de conservação encontram-se os genes de reparo, pois são importantes para a conservação e manutenção da estabilidade genética. Por isso, variações em genes de reparo, como os da via de excisão de nucleotídeos (REN), podem indicar uma possível transferência gênica entre espécies. O presente trabalho teve o objetivo de analisar a história evolutiva dos componentes do REN. Para isso, seqüências de UVRA, UVRB, UVRC e XPB foram obtidas a partir do GenBank por Blast-p, considerando-se 10-15 como limiar, com o fim de criar um banco de dados. Estudos filogenéticos foram feitos utilizando algoritmos presentes nos programas PAUP, BAYES e no pacote PHYLIP. Foram construídas árvores com seqüências protéicas e com seqüências de RNA ribossômico 16S para análises comparativas através dos métodos de parcimônia, verossimilhança e bayesiano. De acordo com a árvore de XPB, as helicases dos eucariotos são similares as das arqueobactérias e apresentam comportamento semelhante ao longo da evolução, ou seja, compartilham um mesmo ancestral. Nas filogenias feitas para cada proteína do sistema uvrABC, foram encontradas três espécies da classe epsilonproteobacterias, três espécies da classe mollicutes e arqueobacterias das classes Methanobacteria e Methanococci formando um grupo monofilético. Esse dado é fortalecido através de uma árvore obtida com as proteínas, UVRA, UVRB e UVRC concatenadas. Assim, embora existam argumentos, na literatura, defendendo a transferência horizontal do sistema uvrABC de bactérias para arqueobactérias, a análise feita neste estudo sugere que a transferência vertical, tendo arquebacterias como origem, tanto do sistema uvrABC quanto dos genes XP, seja o caminho mais parcimonioso, considerando a ocorrência de grupos monofiléticos, o tempo de divergência das classes e o número de espécies de arqueobactérias portadoras dos genes do sistema uvrABC. Palavras chave: Reparo, transferência horizontal, filogenia e ancestral.
ABSTRACT
The phylogeny is one of the main activities of the modern taxonomists and a way to reconstruct the history of the life through comparative analysis of these sequences stored in their genomes aimed find any justification for the origin or evolution of them. Among the sequences with a high level of conservation are the genes of repair because it is important for the conservation and maintenance of genetic stability. Hence, variations in repair genes, as the genes of the nucleotide excision repair (NER), may indicate a possible gene transfer between species. This study aimed to examine the evolutionary history of the components of the NER. For this, sequences of UVRA, UVRB, UVRC and XPB were obtained from GenBank by Blast-p, considering 10-15 as cutoff to create a database. Phylogenetic studies were done using algorithms in PAUP programs, BAYES and PHYLIP package. Phylogenetic trees were build with protein sequences and with sequences of 16S ribosomal RNA for comparative analysis by the methods of parsimony, likelihood and Bayesian. The XPB tree shows that archaeal´s XPB helicases are similar to eukaryotic helicases. According to this data, we infer that the eukaryote nucleotide excision repair system had appeared in Archaea. At UVRA, UVRB and UVRC trees was found a monophyletic group formed by three species of epsilonproteobacterias class, three species of mollicutes class and archaeabacterias of Methanobacteria and Methanococci classes. This information is supported by a tree obtained with the proteins, UVRA, UVRB and UVRC concatenated. Thus, although there are arguments in the literature defending the horizontal transfer of the system uvrABC of bacteria to archaeabacterias, the analysis made in this study suggests that occurred a vertical transfer, from archaeabacteria, of both the NER genes: uvrABC and XPs. According the parsimony, this is the best way because of the occurrence of monophyletic groups, the time of divergence of classes and number of archaeabacterias species with uvrABC system. Key-words: Repair, horizontal transfer, phylogeny, ancestral.
LISTA DE FIGURAS
Figura 1. Reconhecimento e reparo do dano do DNA pelo complexo uvrABC. 14
Figura 2. Reparo por excisão de nucleotídeos em células humanas. 15
Figura 3. Árvore Filogenética não enraizada. 15
Figura 4. Árvore enraizada. 16
Figura 5. Árvore consenso de RNAr 16S. 29
Figura 6. Árvore consenso de UVRA. 30
Figura 7. Topologia da proteína UVRB. 31
Figura 8. Árvore consenso de UVRC. 32
Figura 9. Árvore filogenética do sistema uvrABC. 33
Figura 10. Árvore filogenética do sistema uvrABC sem Archaea. 34
Figura 11. Árvore filogenética da helicase XPB 35
Figura 12. Modelo para a evolução do sistema uvrABC. 36
Figura 13. Escala de tempo da evolução dos procariotos. 41
Figura 14. Modelo para a história evolutiva da via de reparo por excisão de nucleotídeos onde as arqueobactérias adquirem-no por transferência vertical.
42
LISTA DE TABELAS
Tabela 1 - Abreviações das seqüências do sistema uvrABC e das seqüências de RNAr 16s e seus respectivos números de acesso ao banco de dados GenBank
54
Tabela 2 - Seqüências da helicase XPB selecionadas para análise 57
Tabela 3 -Posicionamento do sistema uvrABC nos genomas dos componentes do “grupo Único”
58
Tabela 4 - Levantamento de dados sobre os genes de reparo da via NER presentes nas arqueobactérias analisadas.
59
LISTA DE ABREVIAÇÕES
rDNA - Seqüências de genes codificantes para RNA ribossomal. 11
LUCA - Ancestral comum e universal dos seres vivos. 11
LISTA DE ABREVIAÇÕES vi
LISTA DE FIGURAS vii
LISTA DE TABELAS viii
RESUMO ix
ABSTRACT x
1 - INTRODUÇÃO 11 1.1 – Danos ao DNA e Sistema de Reparo 11 1.1.2 – Via de Reparo por Excisão de Nucleotídeo 13
1.2 – Filogenia 16
1.3 - Transferência Horizontal 19
2 – OBJETIVOS 19
2.1 – Objetivo Geral 20
2.2 – Objetivos Específicos 20
3 – MATERIAL E MÉTODOS 21
3.1 – Obtenção das Seqüências do Sistema uvrABC e Alinhamento 21
3.2 – Construção das Árvores Filogenéticas 22
3.2.1- Métodos de distância 23
3.2.2 - Método de máxima parcimônia 23
3.2.3 - Teste de confiança da topologia 24
3.2.4 – Método de Máxima Verossimilhança 24
3.3- Análise filogenética a partir da helicase XPB. 24
3.3.1- Construção da árvore filogenética da proteína XPB. 25
4– RESULTADOS 26
5 – DISCUSSÃO 37
6 – CONCLUSÕES 46
7 – REFERÊNCIAS BIBLIOGRÁFICAS 47
8 – ANEXOS 54
Anexo I - Abreviações das seqüências do sistema uvrABC e RNAr
16s. 54
Anexo II - Seqüências da helicase XPB selecionadas para análise. 57 Anexo III - Posicionamento do sistema uvrABC nos genomas 58 Anexo IV - Levantamento de dados sobre os genes de reparo da via
NER presentes nas arqueobactérias analisadas. 59
Anexo V – Artigo em preparação 60
SUMÁRIO
1 – INTRODUÇÃO
A partir do momento em que o homem percebeu a imensidão da variedade das
formas de vida, surgiu a necessidade de classificá-las. Assim, desde a teoria da
evolução de Darwin, os taxonomistas almejam obter uma classificação com a qual
seja possível compreender as relações evolutivas entre as espécies. Isto faz da
construção de filogenias uma das principais atividades dos taxonomistas modernos,
pois é um meio de reconstruir a história da vida. Tradicionalmente, as filogenias
eram obtidas a partir de características fenotípicas, contudo com o advento da
tecnologia de sequenciamento, tornou-se possível a construção de árvores
filogenéticas baseadas em seqüências nucleotídicas ou protéicas. Análises
baseadas em seqüências têm gerado dados importantes a respeito das relações
estabelecidas entre as espécies como, por exemplo, a construção da filogenia de
organismos cujo número de características fenotípicas conhecidas seja muito
reduzido. Devido a alta conservação gênica, o uso de árvores baseadas em
seqüências de genes codificantes para RNA ribossomal (rDNA) se tornaram padrão,
no entanto, alguns autores sugerem outros genes para serem utilizados como
modelo, como: recA, rpoB e gyrB (Eisen, 1995; Richert et al., 2007, Duarte et al.,
2004).
Com base em filogenias geradas recentemente, alguns pesquisadores propõem
a existência de um ancestral comum e universal (LUCA) para todas as divisões onde
estão agrupados os mais diversos tipos de organismos. A busca pelo LUCA ainda
não foi concluída e, ao longo do tempo, algumas teorias surgiram na tentativa de
criar uma árvore filogenética universal. Zilling et al. (1985) defende a idéia de que a
árvore filogenética universal seria enraizada no domínio bacteria, o que também é
defendido por outros estudos comparativos (Gorgaten et al., 1989; Brown & Doolittle,
1995; Lawson et al., 1996; Labedan et al., 1999; Cavalier-Smith, 2002). A hipótese
de que o LUCA seria um organismo similar aos eucariotos foi feita por Reanny
(1974), pois ele afirmou que moléculas típicas de eucariotos seriam importantes para
a caracterização do LUCA. Atualmente, alguns autores apóiam esta hipótese e
sugerem que os introns seriam uma dessas moléculas apontadas por Reanny
(1974), pois a presença deles nos genomas de eucariotos torna-os próximos ao
organismo ancestral uma vez que a perda e o acúmulo de introns ocorreram ao
longo da evolução tendo como ponto de partida um organismo pobre em introns, o
LUCA até o surgimento de organismos ricos em introns, os eucariotos (Darnell,
1978; Doolittle, 1978; Darnell & Doolittle, 1986; Jeffares et al., 1998, 2006).
Contradizendo alguns estudos prévios sobre características do LUCA, Xue et
al. (2003, 2005) analisaram a evolução do código genético a partir de estudos
comparativos de seqüências de RNA transportadores (RNAt) porque a presença de
genes de RNAt parálogos representa um aspecto fundamental na evolução do
código genético (Wong, 2005). Esses trabalhos e Di Giulio (2007) sugerem que a
árvore universal da vida poderia ter surgido no domínio Archaea por causa da
conservação excepcional do código de RNAt de arqueobactérias e do LUCA.
Assim, tendo em vista a discordância entre os pesquisadores, a existência de
estudos que busquem esclarecer a relação entre os três domínios Archaea, Bacteria
e Eucaria com o LUCA ainda é importante, até que a árvore universal da vida esteja
completamente esclarecida.
1.2 – Danos ao DNA e Sistema de Reparo
Qualquer processo muito repetitivo é passível de erro e mesmo o DNA se
duplicando com uma precisão espantosa, com as milhões de divisões celulares que
ocorrem ao longo da vida de um organismo os erros podem acontecer. Além disso, a
molécula de DNA está sujeita a ação de agentes lesivos, seja endógenos ou
exógenos (ambientais), tanto de natureza física quanto química (Lehmann, 2000).
As lesões causadas ao DNA podem ser reparadas por um conjunto de genes
denominados genes de reparo. Os genes de reparo são importantes para garantir a
estabilidade genética, pois servem como moduladores da freqüência e da variação
gênica.
A ação dos mecanismos de reparo do DNA está relacionada a cada tipo de
dano. Portanto, há três principais vias de reparo da lesão do DNA: a via de reversão
direta, o reparo por excisão de base e o reparo por excisão de nucleotídeos. Na
reversão direta da lesão, as ligações químicas anormais entre as bases
nitrogenadas, ou entre um nucleotídeo anormal e um substituto são quebradas. Em
relação ao reparo por excisão de base, normalmente, reconhecem lesões que não
danificam a estrutura da molécula de DNA como uracila, timina glicol e 8-oxo-
guanina as quais são removidas em duas etapas. Primeiro, uma DNA glicosilase
retira a base modificada clivando a ligação glicosídica entre a base e a
desoxirribose. O secundo passo é a retirada do açúcar abásico pela ação
combinada das enzimas AP liase e AP endonucleases (Sancar & Sancar, 1988).
1.1.2 – Via de Reparo por Excisão de Nucleotídeo
O reparo por excisão de nucleotídeos (NER) reconhece um grande número de
lesões de DNA que causam distorções estruturais significativas, incluindo
fotoprodutos induzidos por UV, aductos químicos e ligações internas entre as fitas,
que podem acarretar graves danos à integridade do material genético (Sancar &
Sancar, 1988). Como a via de reparo por excisão de nucleotídeo é importante para
reverter danos causados ao DNA, e conseqüentemente mutações, as seqüências
dos genes que a compõem são muito conservadas. Tamanha conservação qualifica
os genes da via NER a serem candidatos a possíveis modelos de reconstrução
filogenética
Em procariotos, a via de reparo por excisão de nucleotídeos é formada por
quatro enzimas (excisonucleases) codificadas pelos genes uvrA, uvrB, uvrC e uvrD,
as quais formam o denominado sistema uvrABC. A via NER é iniciada com o
reconhecimento da lesão, que é seguido pela excisão do trecho oligonucleotídico
contendo a lesão e posteriormente à síntese de reparo, preenche a lacuna deixada,
restaurando a molécula original (de Laat et al., 1999) (Figura 1).
Em eucariotos, o mecanismo de reparo é bioquimicamente semelhante, mas
envolve um maior número de enzimas, que não são homólogas às que compõem o
sistema uvrABC (Figura 2).
Através dos dados gerados com os sequenciamento de genomas de
organismos do domínio Bactéria, sabe-se que os genes que compõem a via NER
são muito conservados. Quanto à arqueobactérias, sabe-se da existência de genes
responsáveis por essa via que apresentam homologia tanto com genes de
Eucariotos como de bactérias (Eisen & Hanawalt, 1999). Atualmente, com o
aumento da realização de projetos genomas de arqueobactérias, sabe-se da
existência de onze espécies do domínio Archaea que apresentam genes homólogos
aos do sistema uvrABC de bactéria.
Devido ao elevado grau de conservação dos genes de reparo, o estudo
comparativo destes entre as espécies tem se mostrado importante para a
compreensão da evolução do processo de reparo de DNA, que é indispensável à
estabilidade genética.
Figura 1. Reconhecimento e reparo do dano do DNA pelo complexo uvrABC. A UVRA e UVRB formam um heterodímero que reconhece o DNA lesado. Após o reconhecimento da lesão, a UVRA dissocia-se de UVRB. Então, a UVRB associado ao DNA (uvrB:DNA) é reconhecido pelo uvrC formando um complexo enzimático que realiza incisões na porção 3´ e 5´ da região danificada do DNA. A UVRD (DNA helicase II) remove o oligonucleotídeo excisado e a UVRC. Finalmente, a DNA polimerase I preenche o espaço deixado pelo oligo e retira a UVRB. A ligação do novo fragmento é feito pela DNA ligase (Truglio et al., 2006).
Ligação
Reparo
Excisão
RNA Pol parada
Figura 2
do reconhecimlocal do danohidrolisa umauma moléculaa formação doem PIC3 queespaço é preereparo (Reard
Incisão Incisão
Resín
tese
. Reparo por Excisão em células humanas. Os fatores que participam ento do dano ao DNA são, RPA, XPA, e XPC_TFIIH, que se unem no (triângulos pretos) aleatoriamente para formar um complexo. O TFIIH molécula de ATP para gerar o complexo pré-incisão (PIC1). O XPC é marcadora que ajuda a recrutar o XPG para o PIC1. O XPC sae para PIC2. Então, o PIC2 é reconhecido pelo XPF_ERCC1 convertendo-o é capaz de incisar oligonucleotídeos de 24 a 32 nucleotídeos. O nchido por uma polimerase e a ligase atua para completar a reação de on & Sancar, 2006).
1.2 – Filogenia
A filogenia é um ramo da ciência que procura estabelecer as relações
evolutivas ou de parentesco presentes em um grupo de táxons. Os táxons ou as
unidades taxonômicas operacionais (OTU – “Operational Taxonomic Unit”) podem
ser qualquer nível taxonômico onde a história evolutiva é passível de verificação. As
árvores são representações gráficas das relações entre as OTUs. Os nós terminais
das árvores filogenéticas, que se encontram nas extremidades, correspondem aos
táxons, enquanto que os nós mais internos correspondem aos ancestrais comuns. A
conexão de mais de três ramos a um único nó é denominada como uma politomia, e
quando há três ramos conectados a um nó temos a representação de uma
dicotomia. As árvores bifurcadas podem ser enraizadas ou não, ou seja, quando a
árvore aponta para uma espécie ancestral comum a todo o grupo ela é tida como
enraizada (Figura 4). A árvore sem raiz não define o caminho evolutivo, apenas
agrupa as OTUs relacionadas (Figura 3).
Figura 3. Árvogerada a partir dasJoining.
re Filogenética segundo (Eisen, 2000b). Árvore não enraizada seqüências de RNAr com o método de distância Neighbor-
Figura 4.enraizada geraVerossimilhanç
A classific
registros fósse
crescido propo
parâmetros usa
uma revisão do
al., 2006). Esse
filogenéticas atr
independentem
1999) e Philli
considerados:
1. Um
inferência filog
probabilidade d
refletem a histó
2. Os
duplicação, pod
para a reconstru
3. Os
especiação de
Esses genes sã
4. Os
são muito impo
Árvore Filogenética segundo (Battistuzzi et al., 2004). Árvore da a partir das seqüências de 32 proteínas pelos métodos de a e Bayesiano cuja topologia foi testada pelo Bootstrap.
ação taxonômica atual utiliza, além dos dados morfológicos e os
is, os dados bioquímicos, fisiológicos e moleculares os quais têm
rcionais ao desenvolvimento tecnológico. Assim, com aumento de
dos pela taxonomia para conceituar e compreender as espécies,
esquema de classificação taxonômica se fez necessária (Gevers et
s dados moleculares passaram a ser utilizados para realizar análises
avés de programas que avaliam a história evolutiva de alguns genes
ente da história do grupo taxonômico. Segundo (Eisen & Hanawalt
ps et al. (2000), é fundamental que alguns aspectos sejam
a amostra com maior número de grupos taxonômicos utilizada para
enética, é melhor do que uma amostra pequena, pois reduz a
a filogenia estar sendo determinada por substituições raras que não
ria evolutiva;
genes homólogos parálogos, ou seja, originários de uma
em ajudar a identificar a origem dos genes. Eles não são indicados
ção de filogenia das espécies;
genes homólogos ortólogos surgem através de um evento de
maneira que os mesmos passem a ter histórias evolutivas distintas.
o indicados para a construção de filogenia de espécies;
genes homólogos xenólogos que surgem por transferência lateral
rtantes para a compreensão da evolução dos genomas. E os genes
homólogos plerólogos que surgem por conversão gênica são pouco informativos em
análises filogenéticas;
5. O alinhamento das seqüências é um passo fundamental para o estudo
filogenético, porque ele nos permite definir as posições homólogas. Regiões
homólogas neste tipo de análise significam nucleotídeos que ocupam a mesma
posição, pois eles supostamente têm um ancestral comum, porém não são
necessariamente iguais. É a posição na seqüência que determinará se um
nucleotídeo é ou não homólogo a outro. Ou seja, assim como para caracteres
morfológicos, moléculas homólogas não apresentam necessariamente a mesma
função. Não podemos confundir similaridade com homologia, uma vez que
similaridade é uma simples medida de semelhança entre as seqüências. Enquanto
que a homologia considera a ancestralidade;
6. A escolha de um modelo teórico de evolução que reflita o processo
evolutivo para os dados trabalhados é um passo muito importante, pois quando
inferimos uma filogenia, estamos estimando a história evolutiva baseados nas
alterações das características herdadas que refletem na seqüência de DNA. Estas
mudanças podem ser justificadas por um modelo evolutivo que trabalha com
suposições (Vinuesa et al., 2005).
1.3 - Transferência Horizontal
A transferência gênica horizontal ou lateral é a denominação atribuída aos
processos que permitem a troca de material genético entre organismos de espécies
distintas. Antes, a transferência horizontal era analisada somente pela genética
clássica, mas, recentemente ela tem sido reconhecida pelos taxonomistas como um
importante mecanismo para a compreensão da evolução das espécies (Arber, 2000;
de la Cruz & Davies, 2000; Eisen, 2000a).
Existem três mecanismos pelos quais pode haver transferência horizontal:
transformação, conjugação e transdução. A transformação é o processo através do
qual os procariotos adquirem DNA livres no ambiente. A conjugação é caracterizada
pela troca de material genético, em especial plasmídeos, entre bactérias (Jain et al.,
2003). A transferência de DNA por infecção viral é conhecida como transdução, uma
ampla variedade de vírus têm a capacidade de facilitar a transferência de material
genético entre organismos filogeneticamente distantes (Karaolis et al., 1999).
Atualmente, há inúmeros genes que são candidatos a terem sofrido o processo
de transferência horizontal, entre procariotos (Jain et al., 1999), entre bacteria e
eucariotos (Doolittle, 1999), entre bactéria e arqueobactéria (Nelson et al., 1999),
entre animais e bactérias (Wolf et al., 1999; Aravind et al., 1999). Até mesmo o
genoma humano possui cerca de 0,5% de seqüências de origem bacteriana
(Ponting, 2001). Genes “de informação” (responsáveis pela transcrição e tradução)
do Methanocaldococcus jannaschii (arqueobactéria) são homólogos aos de
eucariotos enquanto que os genes basais (responsáveis pelo metabolismo celular e
síntese da parede celular, por exemplo) são mais próximos aos de bactéria (Koonin
et al., 1997), o que indica que cada gene possui sua própria história evolutiva, pois é
submetido a pressões evolutivas específicas. Para solucionar tal impasse, foi
observado que as árvores genômicas, baseadas em toda a informação genômica,
são mais informativas e podem refletir a história evolutiva de um organismo tão bem
ou melhor do que as árvores gênicas baseadas em genes conservados (Snel et al.
2005). Com isso pode-se afirmar que as árvores gênicas não devem ser usadas
para estudar a filogenia de organismos, e sim para esclarecer a história evolutiva de
genes isolados ou de uma via enzimática completa, informação essa que é perdida
na árvore genômica (Jain et al., 1999).
Como a conservação das vias de reparo de DNA é importante para a
manutenção da vida, alguns genes de reparo se tornaram alvos de estudos
filogenéticos como, por exemplo, a proteína RecA que foi apresentada como um
modelo para reconstrução filogenética (Eisen, 1995). Quanto a via de reparo por
excisão de nucleotídeo (NER), esta se encontra ausente ou presente de forma
parcial nos genomas de espécies representantes do domínio Archaea (Cleaver et
al., 2001) o que aponta para a necessidade de mais estudos com o enfoque na
história evolutiva dos três domínios: Archaea, Bacteria e Eucaria. Além disso, várias
questões evolutivas quanto à via NER estão abertas entre elas destacam-se: a
presença do mesmo mecanismo bioquímico de excisão tanto em bactérias quanto
em eucariotos, sem homologia entre as proteínas envolvidas; e em arqueobactéria,
pouco se conhece sobre reparo de DNA e em especial quanto à via NER, visto que
genes homólogos aos de bactéria e de eucariotos podem ser encontrados nesses
organismos, dependendo da espécie de analisada. Nesse contexto, pretendemos
avaliar a história evolutiva da via de reparo por excisão de nucleotídeos buscando
onde ela surgiu e qual seu comportamento ao longo da evolução dos domínios
Archaea, Bacteria e Eucaria.
2 – OBJETIVOS
2.1 – Objetivo Geral
Ø Analisar a história evolutiva da via de reparo por excisão de
nucleotídeos (NER) e relacionar os domínios Bacteria, Eucaria e Archaea dentro
desse processo.
2.2 – Objetivos Específicos
Ø Determinar o melhor método de reconstrução filogenética para os
dados em análise.
Ø Obter árvores filogenéticas consenso para cada enzima da via NER.
Ø Analisar a viabilidade do uso da via de Reparo por Excisão de
Nucleotídeo (NER) como um modelo para a realização de análises filogenéticas.
Ø Verificar a ocorrência de Transferência Horizontal utilizando as
seqüências de genes que compõem a via de Reparo por Excisão de Nucleotídeo de
espécies dos domínios Bacteria, Eucaria e Archaea.
3 – MATERIAL E MÉTODOS
3.1 - Obtenção das Seqüências do Sistema uvrABC e
Alinhamento
As seqüências dos genes da via NER de Escherichia coli (melhor modelo
estudado) foram obtidas a partir do banco de dados público o Genbank
(http://www.ncbi.nlm.nih.gov/) e estas foram submetidas à ferramenta BLAST-p via
NCBI, para que o grau de similaridade com seqüências disponíveis no GenBank
fosse verificado. Considerou-se como resultado positivo às seqüências protéicas
cujo “E-value” encontrado foi menor que 1x10-5. Também foram obtidas seqüências
de rDNA 16S para utilizadas como modelo comparativo. Nos casos em que se
encontrou várias cópias de seqüências de rDNA 16S em uma espécie, estas foram
alinhadas e selecionadas de acordo com o grau de conservação (Anexo I).
A ferramenta BLAST (Basic Local Alignmente Search Tool) é constituída por
um conjunto de programas desenvolvido para alinhar porções de seqüência
nucleotídica e/ou peptídica, representando somente domínios funcionais ou mesmo
seqüências inteiras. Esses programas conseguem alinhar regiões desejadas com o
mínimo de redundância possível (Altschul et al., 1997). As seqüências quando
submetidas ao BLAST via NCBI (http://www.ncbi.nlm.nih.gov/), voltam alinhadas com
genes ou proteínas que apresentam o maior grau de similaridade com a seqüência
submetida. Este maior grau de similaridade é dado pelo “E-value”, que representa a
probabilidade deste alinhamento ter acontecido ao acaso e o valor mínimo, ou o
melhor, é 0,0. Isso significa que quanto menor o valor do “E-value” maior o grau de
similaridades entre as seqüências analisadas.
Após a pré-seleção das 59 seqüências a partir da análise do “E-value”, foram
selecionadas seqüências de organismos representantes de alguns Filos das
Divisões Archaea e Bacteria , para possibilitar a análise filogenética a partir da via
NER. Então, as seqüências foram alinhadas através do programa ClustalW e
editadas por meio Bioedit (Hall, 1999). A classificação taxonômica foi toda baseada
no Bersgey´s Manual of Systematic Bacteriology (Garrity et al., 2002). Uma vez
escolhidas as espécies para estudo, foram obtidas as seqüências dos rDNA 16S. As
árvores obtidas com genes de RNAr 16S, foram usadas como padrão para
comparação com as árvores geradas com as seqüências das proteínas NER.
As seqüências protéicas das enzimas da via NER, depois de selecionadas,
foram concatenadas através de edição manual com o auxílio do software Bioedit
(Bioedit Sequence Alignment editor) e então usadas para análises filogenéticas
relacionadas a esse sistema de reparo como um todo. Para as inferências
filogenéticas de todo sistema uvrABC, construiu-se duas topologias: a primeira foi
construída com seqüências de organismos dos domínios Archaea e Bacteria, já a
segunda árvore contemplou somente representantes do domínio Bacteria. Dessa
maneira, a importância das arqueobactérias quanto ao comportamento da via NER
ao longo da evolução, pode ser mais bem avaliada.
3.2 – Construção das Árvores Filogenéticas
Para a construção de árvores filogenéticas é imprescindível a avaliação dos
métodos de inferência filogenética que podem adotar três caminhos:
1. Os métodos algorítmicos permitem obter a melhor árvore seguindo
uma seqüência de passos, um algoritmo.
2. Os métodos estocásticos comparam possíveis filogenias para
explicação dos dados e escolhe a melhor. Isso ocorre através de dois passos:
definição do critério para se chegar a melhor árvore e depois o cálculo dos valores a
partir de um critério pré-estabelecido.
3. E o método Bayesiano o qual permite a obtenção de árvores
filogenéticas a partir de seqüências de DNA e de dados temporais de fósseis. O
método é capaz de estimar o tempo do processo de especiação a partir de um
ancestral comum e só então calcular as probabilidades que determinarão à topologia
correta da árvore (Yang & Rannala, 1997).
Os dois primeiros utilizam algoritmo, contudo um o usa para a seleção da
melhor árvore e no segundo, o algoritmo seria apenas uma ferramenta para definir o
critério de seleção da melhor árvore. Como os métodos estocásticos analisam várias
árvores eles precisam de um tempo computacional maior do que os métodos
puramente algoritmos, pois esses determinam uma única árvore (Salter & Pearl,
2001). Já o método bayesiano utiliza a cadeia de Markov que é baseada no método
de Monte Carlo o qual, na busca pela topologia mais provável, calcula as
probabilidades para cada topologia independentemente. O que limita o número de
táxons a serem analisados (Yang & Rannala, 1997).
No presente trabalho, foram construídas árvores filogenéticas através dos
métodos citados anteriormente utilizando os programas presentes no pacote
PHYLIP (http://evolution.genetics.washington.edu/phylip.html), no PAUP e no
MRBAYES (http://www.morphbank.ebc.uu.se/mrbayes/info.php.), para possibilitar
uma análise mais abrangente dos dados.
3.2.1- Métodos de distância
Esses métodos são baseados numa matriz de distância evolutiva que é
calculada de acordo com o número de mudanças por sítio que tenha ocorrido entre
duas seqüências desde suas divergência de um ancestral comum (Swofford et al.,
2001).
Neighbor-joining é um algoritmo que gera uma árvore a partir de uma matriz de
distância. Este método é próprio para analisar uma grande amostra de dados e por
isso é muito usado para análises filogenéticas genômicas (Hoyle & Higgs, 2003).
Para análises dos dados obtidos, resolvemos adotar um modelo evolutivo
baseado na matriz de PAM, uma vez que, esse modelo leva em consideração a
freqüência de substituições de aminoácidos. Quanto maior a distância evolutiva
entre as espécies, maior a freqüência de substituições entre elas (Reese & Pearson,
2002).
3.2.2 - Método de máxima parcimônia
A máxima parcimônia não exige nenhum modelo para a mudança evolutiva. O
método se baseia em um modelo de evolução probabilístico onde a probabilidade de
ocorrer uma mudança é superior a de ocorrerem duas. Trata-se de substituições
independentes gerando o mesmo resultado como um evento relativamente raro.
Assim, a árvore mais parcimoniosa é aquela que requer um menor número de
eventos evolutivos para explicar o surgimento de um caráter (Berlocher & Swofford,
1997).
3.2.3 - Teste de confiança da topologia
Um dos testes de confiança em topologia é o bootstrap. Esse teste é muito
utilizado na avaliação de árvores de distância e de parcimônia. O método consiste
numa reamostragem com reposição pseudoaleatória dos dados o que gera a cada
reamostragem uma árvore-réplica e ao final de todas as réplicas, a árvore final é
obtida. Os valores presentes na árvore indicam a topologia de consenso das
árvores-réplicas. A técnica do bootstrap revela a consistência interna dos dados,
pois se a topologia alterar muito de acordo com a reamostragem, o valor do
bootstrap será menor que 50% o que indica uma menor segurança. Portanto,
podemos considerar o valor da probabilidade do bootstrap como uma subestimativa
da probabilidade de um determinado ramo ser verdadeiro (Hillis & Bull, 1993).
3.2.4 – Método de Máxima Verossimilhança
A máxima verossimilhança baseia-se em modelos evolutivos de substituição de
nucleotídeos ou aminoácidos. Esses modelos são avaliados quanto a sua
probabilidade de explicar um conjunto de dados de forma que reflita a história
evolutiva mais verossímil. O modelo que apresentar o melhor valor de
verossimilhança, que, por questões operacionais, é dado em forma logarítmica, será
o escolhido como base para a reconstrução da árvore (Felsenstein, 1992).
Para a escolha do melhor modelo evolutivo, a partir dos dados em análise,
utilizamos o programa MODELTEST (Posada & Crandall, 1998).
3.3- Análise filogenética a partir da helicase XPB.
A Seqüência peptídica da XPB oriunda da espécie Homo sapiens sapiens foi
obtida do Genbank e utilizada como parâmetro comparativo para uso da ferramenta
BLAST-p via NCBI. Desta forma, as seqüências com elevado grau de similaridade à
de humano foram encontradas e selecionadas de acordo com o valor do “E-value”
(Anexo II). Foi considerado resultado positivo as seqüências protéicas cujo “E-value”
encontrado foi menor que 1x10-5. Depois da pré-seleção das seqüências a partir da
análise do “E-value”, foram selecionadas seqüências de organismos representantes
das divisões Archaea e Eucaria, o que possibilitou uma análise filogenética da XPB
que é uma helicase presente no complexo enzimático responsável pela via NER em
eucariotos. Então, as seqüências foram alinhadas através do programa ClustalW e
editadas por meio Bioedit. A classificação taxonômica foi toda baseada no Bersgey´s
Manual of Systematic Bacteriology (Garrity et al., 2002).
3.3.1- Construção da árvore filogenética da proteína XPB.
Para a construção de uma topologia que representasse a história evolutiva da
proteína XPB foram usados softwares dos pacotes PHYLIP, PAUP e do MRBAYES
os quais possibilitaram a utilização dos mesmos métodos citados anteriormente.
4– RESULTADOS
A partir de seqüências de RNAr 16S foi obtida uma topologia consenso por
meio de parcimônia, Neighbor-joining, máxima verossimilhança e inferência
Bayesiana. Através desta topologia, verificou-se que a reconstrução filogenética
estava de acordo com a classificação taxonômica presente no Bersgey´s Manual of
Systematic Bacteriology (Garrity et al., 2002) e que tanto o método de máxima
verossimilhança como o Bayesiano são mais indicados para obter este tipo de
árvore filogenética, pois através deles foram obtidos os melhores valores com o
teste de topologia Bootstrap (Figura 5).
Construímos, através da mesma metodologia, topologias que representassem
a história evolutiva do gene uvrA a partir de seqüências da proteína UVRA. Na
árvore filogenética obtida foi observado algumas diferenças em relação à topologia
de RNAr 16S (Figura 6), como:
I. O filo euriarchaeota esteve presente em ramos distintos onde dois grupos
passam por processos evolutivos específicos. Um grupo apresenta maior
proximidade da classe das Epsilonproteobacterias e é constituído pelas espécies:
Methanosarcina barkeri, Methanococcus maripaludis, Methanosphaera stadtmanae,
Methanospirillum hungatei, Methanococcoides burtonii, Methanosarcina mazei,
Methanosarcina acetivorans e a Methanothermobacter thermautotrophicus. O
segundo grupo é formado por espécies que fazem parte da classe Halobacteria:
Haloarcula marismortui, Natronomonas pharaonis e Halobacterium sp.. Esse grupo
faz parte do mesmo ramo que a Anaeromyxobacter dehalogenans que pertence às
deltaproteobacterias.
II. Os mycoplasmas encontram-se distanciados dos demais representantes da
classe Firmicutes, compartilhando um ancestral comum com as
Epsilonproteobacterias.
III. Na árvore é constatada a presença de um ramo único composto pelas
Epsilonproteobacterias, pelos mycoplasmas e pelas arqueobactérias da classe
Methanococci: M. barkeri, M. maripaludis, M. stadtmanae, M. hungatei, M. burtonii,
M. mazei, M. acetivorans.
A árvore filogenética da UVRB é muito semelhante a da UVRA diferindo
apenas quanto à ausência das Actinobactérias como um grupo conservado. Duas
representantes das Actinobactérias, Thermobifida fusca e Frankia sp, compartilham
um ancestral em comum com as arqueobactérias da classe Haloarca. O grupo
formado pelas Epsilonproteobacterias, pelos mycoplasmas e pelas arqueobactérias
permanece em um mesmo ramo (Figura 7).
A reconstrução filogenética resultante das seqüências de UVRC é semelhante
à árvore de UVRB, devido à presença das actinobactérias como um grupo dividido e
por causa da presença do mesmo grupo com representantes das classes firmicutes,
epsilonproteobacteria e arqueobactérias em um ramo único (Figura 8). Contudo, as
espécies da classe Haloarca, dentre as arqueobactérias, compartilham um ancestral
comum com representantes da classe Firmicutes.
Para ratificar os dados anteriores, construiu-se uma topologia com as
seqüências das proteínas do sistema uvrABC concatenadas de maneira que a
história evolutiva de todo o sistema fosse representada. A árvore filogenética do
sistema uvrABC resumiu as topologias individualizadas de cada proteína, diferindo
apenas quanto ao posicionamento dos representantes da classe Haloarca, pois, de
acordo com a filogenia de toda a via NER, as Halobacterias e as Actinobacterias
seriam evolutivamente próximas no que diz respeito ao reparo de excisão de
nucleotídeos. A filogenia do sistema uvrABC (Figura 9) comprovou a conservação do
ramo formado por organismos de diferentes classes, citado anteriormente. Uma
segunda árvore, representando todo o sistema uvrABC mas sem as
arqueobactérias, foi feita com a finalidade de avaliar a participação do domínio
Archaea no processo evolutivo do reparo por excisão de nucleotídeos (Figura 10).
Essa topologia se apresentou muito próxima à obtida com as seqüências de RNA
ribossômico, ou seja, a disposição das espécies esteve de acordo com a taxonomia
tradicional.
Foi realizada uma análise filogenétoca da proteína XPB, que é uma helicase
que integra o complexo enzimático da via NER dos eucariotos (Figura 11). A árvore
relacionou seqüências de arqueobactérias que apresentavam o sistema uvrABC e
outras onde o sistema está ausente, além de representantes de seis classes do
domínio Eucaria (ver anexo II). De acordo com a filogenia encontrada, tanto as
Archaea como os eucariotos compartilham o mesmo ancestral no que diz respeito à
proteína XPB.
Fizemos um levantamento de dados sobre os genes de reparo da via NER
presentes nas espécies de arqueobactérias usadas nas análises, para que fosse
possível uma melhor compreensão da via nos organismos e para facilitar as análises
filogenéticas (Ver anexo IV).
Como resultado final de nossa pesquisa, foi elaborado um modelo a título de
sugestão para a origem da via NER (Figura 12): o reparo por excisão de nucleotídeo
teria surgido em um ancestral comum que possuiria apenas o complexo formado
pelas proteínas XPs. A partir deste ancestral teria ocorrido uma divergência e
surgido os domínios Archaea e Bacteria. Somente após o surgimento das bactérias,
o sistema uvrABC teria surgido, mas o complexo de XPs não teria sido herdado. Em
um dado momento, devido as condições extremas onde habitam algumas espécies
de arqueobactérias, a aquisição do sistema uvrABC se tornou vantajosa e se fez
necessário a ocorrência de transferência lateral onde todo o operon uvrABC foi
transferido. A transferência do operon ocorreu, contudo foram dois eventos
independentes com origens e em épocas distintas. As halobactérias receberam o
operon a partir das actinobactérias, enquanto que as metanobactérias teriam
recebido o operon das Firmicutes. Aquelas arqueobactérias que mantiveram apenas
o reparo por excisão de nucleotídeos realizado pelas proteínas XPs foram as
precursoras da célula eucariótica ancestral.
Figura 5. Árvore filogenética obtida a partir de seqüências de RNAr 16S. Árvore consenso, após a criação de 100 réplicas através do programa bootstrap. Os valores em cada nó representam os valores de bootstrap em percentagem.
Figura 6. Árvore consenso representando as seqüências da proteína UVRA. Um grupo monofilético e heterogêneo é formado por espécies das classes epsilonproteobacteria, firmicutes and euriarchaeota que estão indicadas pelas linhas em negrito.
Figura 7. Topologia da proteína UVRB. O resultado é similar ao da árvore de UVRA, há um grupo monofilético formado por representantes de diferentes classes como indicado pelas linhas em negrito.
Figura 8. Árvore consenso de UVRC – topologia semelhante à de UVRB, comprovando que o grupo composto por organismos de classes distintas é conservado dentro da filogenia do sistema uvrABC.
Figura 9. Árvore não enraizada, formada pelo método bayesiano, do sistema uvrABC – essa análise está de acordo com as análises filogenéticas de cada enzima do sistema as quais foram feitas de forma isolada.
Figura 11. Árvore da helicase XPB. O método que apresentou os melhores valores de bootstrap foi o da verossimilhança. A árvore relaciona seqüências de arqueobactérias que possuem a via NER tanto de procariotos como a de eucariotos e também outras onde via NER de procariotos está ausente. Além disso, estão presentes seis representantes de classes do domínio Eucaria.
Fig. 12. Modelo para a história evolutiva da via de reparo por excisão de nucleotídeos com origem em um ancestral comum.
5 – DISCUSSÃO
Um ramo conservado e único formado por espécies das classes Firmicutes,
Euriarchaeota e Epsilonproteobacteria foi encontrado em todas as topologias das
proteínas que compõem o sistema uvrABC, o que se caracteriza como um dado no
mínimo intrigante, pois não é esperado de acordo com a classificação taxonômica
atual. A história evolutiva das três divisões Archaea, Eucaria e Bacteria é um ponto
que chama a atenção dos pesquisadores há certo tempo e tem sido alvo de muitos
estudos. Não se encontra muita coerência no que se diz respeito ao assunto na
literatura, pois alguns autores sugerem que as arqueobactérias sejam mais próximas
dos eucariotos do que das bactérias por apresentarem histonas e homólogos à XPF,
RPA, PCNA dentre outras enzimas típicas de eucariotos (White, 2003). Isso poderia
ser justificado pela existência de um ancestral em comum entre as arqueobactérias
e os eucariotos uma vez que quanto mais recente for uma transferência gênica,
maior será a similaridade entre o gene e o seu homólogo ancestral (Doolittle, 2000).
Com a conclusão do sequênciamento do genoma da arqueobactéria
Methanococcus janaschii, foi revelada a existência de dois grandes grupos de
genes: um grupo seria mais similar aos genes de eucariotos do que aos de bactéria,
enquanto que outro grupo seria mais próximo aos homólogos bacterianos (Bult et al.,
1996). Koonin et al. (1997) avaliou as proteínas identificadas nos genomas das
bactérias Haemophilus influenzae, Mycoplasma genitalium e Synechocystis sp. e as
presentes no genoma da arqueobactéria M. janaschii, identificando os motivos
funcionais e quantificando a similaridade entre elas. Com base em suas análises
eles puderam afirmar que os genes da M. janaschii relacionados com tradução,
transcrição, replicação e secreção protéica são mais similares aos de eucariotos.
Enquanto que os genes envolvidos com a divisão celular, produção de energia,
metabolismo celular, transporte de metabólitos e biosíntese da parede celular são
mais próximos aos genes bacterianos.
Assim, como as arqueobactérias encontram-se muito próximas tanto dos
eucariotos quanto das bactérias, será que elas seriam os organismos vivos mais
próximos do que poderia se chamar de “ancestral comum universal”?
A análise filogenética da via de reparo por excisão de nucleotídeos realizada no
presente trabalho veio contribuir para o conhecimento quanto à evolução da via NER
dentro desse polêmico contexto que é a existência ou não de um ancestral comum
aos três domínios.
De acordo com nossos dados, a via NER de organismos das classes de
arqueobactérias Methanobacteria (M. stadtmanae e M. thermautotrophicus) e
Methanococci (Methanosarcina barkeri, Methanococcus maripaludis,
Methanospirillum hungatei, Methanococcoides burtonii, Methanosarcina mazei e
Methanosarcina acetivorans), pode ter surgido por transferência horizontal a partir
de bactérias de genoma reduzido da classe Firmicutes, os Mycoplasmas, ou a partir
das epsilonproteobactérias (Figura 9). Choi & Kim (2007) criaram um método de
encontrar domínios funcionais de proteínas que sofreram transferência horizontal e
assim descobriram que mais de 50% das Archaea possuem um ou mais domínio de
proteína adquirido por transferência horizontal, enquanto que isso só corre com um
pouco mais de 30% das bactérias. Isso sugere que há uma maior probabilidade das
Archaea terem recebido os genes por transferência horizontal. Um dado que
corrobora nossa hipótese é a organização dos genes uvrA, uvrB e uvrC em operon
nas M.barkeri e M.maripaludis (Anexo III) uma vez que um único evento de
transferência lateral garantiria a transferência de todo o sistema, sem falar que a
organização em operon é muito comum nos genomas bacterianos. Aravind et
al.(1999) também sugeriram a transferência do operon uvrABC de bactéria para
arqueobactérias por causa da organização dos genes em operon e devido à
conservação dos domínios funcionais nas três nucleases. Contudo, no genoma dos
Mycoplasmas e das epsilonproteobactérias o sistema uvrABC apresenta-se disperso
ao longo do genoma a exemplo da via NER em E.coli (Anexo III).
O gênero Mycoplasma abrange organismos que apresentam genomas de
tamanho reduzido, apresentando 0,58 a 1,35 Mb. Essa informação genética limitada
obriga estas bactérias a adquirirem nutrientes de seus hospedeiros. Mas, também
devido a essa informação genética reduzida, os Mycoplasmas não apresentam parte
da resposta SOS assim como outras proteínas de reparo comuns na E. coli,
incluindo o sistema MutSLH que participa do reparo por mismatch o qual é
responsável por reduzir a taxa recombinacional entre seqüências divergentes (Razin
et al., 1998). A falta do reparo mismatch pode favorecer a mutagênese e a
recombinação irregular o que pode ter favorecido a perda da organização do sistema
uvrABC em operon nos Mycoplasmas.
A conservação da ordem dos genes ao longo do genoma, que é denominada
sintenia, também está relacionada com a divergência das espécies. A ordem dos
genes tende a se manter conservada entre espécies muito próximas, mas a
conservação reduz rapidamente à medida que ocorre a divergência entre as
espécies (Tamames, 2001). Nakamura et al. (2003), ao analisar a sintenia de genes
ortólogos das espécies dos gêneros Corynebacterium e Mycobacterium, verificaram
que ocorreu uma quebra da sintenia dos genes analisados da Corynebacterium
efficiens e da Mycobacterium tuberculosis somente depois da divergência dessas
espécies a partir de um ancestral comum. Ou seja, caso a transferência lateral entre
os Mycoplasmas e as Methanobacteria seja muito antiga, é esperado que a sintenia
do operon uvrABC tenha sido perdida depois da divergência das espécies de
Mycoplasmas o que justifica a ausência dos genes na forma de operon, atualmente.
Através de comparações de genomas microbianos completos, Lemoine et al.
(2007) detectaram blocos em sintenia conservados. Ao avaliarem a freqüência, o
tamanho e a sintenia dos blocos, os pesquisadores concluíram que o tamanho
destes blocos era inversamente proporcional à proximidade taxonômica dos
organismos. Isso justifica a perda de sintenia do operon uvrABC com as inúmeras
divergências entre as espécies do domínio Bacteria. No entanto, o operon uvrABC
teve sua sintenia conservada nos genomas das Methanobacterias, e isso pode ter
ocorrido por causa de algum beneficio adaptativo gerado para as bactérias com esse
nível de organização da via NER, já que só é esperado a conservação da ordem de
genes com produtos essenciais como, por exemplo, proteína ribossomais e o
sistema uvrABC não é essencial para a vida (Lemoine et al., 2007).
Com o advento da metagenômica, que é um campo da ciência que seqüência e
estuda microorganismos isolados a partir de ambientes específicos, foram
descobertas várias comunidades polimicrobianas onde co-habitam bactérias e
arqueobactérias (Vickerman et al., 2007; McHardy & Rigoutsos, 2007; Frigaard et al.,
2006; Zaballos et al., 2006). A existência dessas comunidades prova que há
ambientes favoráveis para a ocorrência de eventos de transferência horizontal e
vertical entre membros do domínio Archaea e do domínio Bacteria.
Outro resultado obtido que sugere a aquisição do sistema uvrABC, por parte
das arqueobactérias, através de transferência horizontal é a semelhança encontrada
entre as árvores filogenéticas do uvrABC feita sem Archaea e a do RNAr 16S
(Figura 10). Porque ficou demonstrado que as alterações encontradas na figura 9
foram decorrentes da inclusão das arqueobactérias na análise e a ausência de um
ramo comum para as Archaea sugere que depois houve mais de uma origem do
sistema uvrABC dentro do domínio. Mas a presença dos organismos das classes
Methanobacteria e Methanococci formando um grupo monofilético apontam para
uma transferência horizontal muito antiga, que antecedeu a divergência dessas
classes.
A presença de um ramo conservado formado por espécies de arqueobactérias
da classe Halobacteria: Halobacterium sp., N.pharaonis e H.marismortui, foi
observada em todas as topologias construídas. Tal ramo apresenta proximidade
com espécies distintas de acordo com o gene analisado, mas a partir da filogenia de
todo o sistema uvrABC (Figura 8), pode-se inferir que a origem da via NER nas
classes Halobacteria e Actinobateria se confundem em algum momento. Nos
genomas das espécies analisadas há indícios de que o sistema NER esteve
organizado em operon por causa da presença do uvrB e uvrC em operon nas
espécies Halobacterium sp. e Haloarcula marismortui, e quanto às actinobactérias, a
via se mantêm na forma de operon até hoje nas espécies Frankia sp. e
Symbiobacterium thermophilum. Como a classe das actinobactérias é quase tão
antiga quanto a das halobactérias (Figura 13), é provável que tenha ocorrido
transferência horizontal do operon entre representantes das classes e depois da
divergência entre as espécies tenha ocorrido a perda da sintenia desse operon.
Em resumo, a partir de nossos dados, entendemos que a evolução do sistema
uvrABC em arqueobactérias envolve pelo menos dois eventos de transferência
horizontal. Um primeiro evento que pode ter ocorrido entre as Firmicutes, em
especial as Mycoplasmas e as Methanobacterias e um segundo evento entre as
Actinobacterias ee as Halobacterias, ambos de maneira independente.
Embora existam argumentos em prol da transferência horizontal do sistema
uvrABC de bacttérias para arqueobactérias, não é possível destacar a transferência
vertical, tendo como ancestrais as arqueobactérias. Batistuzzi et al. (2004) utilizando
uma abordagem de filogenia com relógio molecular, considerando 32 proteínas
conservadas concatenadas, estimou a divergência das classes Methanobacteria e
Methanococci para 3,5 bilhões de anos atrás. Período este anterior à divergência
das classes Firmicutes e Actinobacteria (estimada como 3 bilhões de anos atrás). O
ramo de origem dos Mycoplasmas, especificamente, tem como estimativa de 1,5
bilhões de anos. Considerando que nas árvores filogenéticas obtidas para o sistema
uvrABC as arqueobacterias encontram-se em dois grupos monofiléticos é de se
esperar que os genes uvrABC estivessem presentes antes da divergência das
classes. Seguindo este raciocínio, a transferência horizontal é questionável uma vez
que as classes bacterianas divergem posteriormente à divergência das
arqueobactérias. Como as classes Firmicutes e Actinobacterias são consideradas
mais antigas no domínio Bacteria (Battistuzzi et al. 2004; Gupta & Griffiths, 2002),
são filogeneticamente mais próximas das arqueobactérias considerando a herança
vertical, a exemplo da filogenia obtida a partir dos genes de rDNA 16S. Seguindo o
princípio da parcimônia, é possível supor que a origem dos sistemas NER, uvrABC e
XP, tenham uma origem comum na classe Euriarchaeota e devido a redundância de
funções, o sistema uvrABC foi perdido na maioria das arqueobactérias (Ver figuras
13 e 14).
Fiet al., 24,25 bi
gura 13. Escala de tempo da evolução dos procariotos segundo (Battistuzzi 004). Para a análise, foi considerado que o ancestral comum teria surgido a lhões de anos atrás.
as ár
horizo
16S,
prote
apres
próxim
de d
horizo
2007)
repar
como
Fig. 14. Modelo para a história evolutiva da via de reparo por excisão de nucleotídeos com origem em um ancestral comum, onde as arqueobactérias adquirem-no por transferência vertical. Os domínios Bacteria e Eucaria adquirem a via de reparo a partir do domínio Archaea.
A presença das epsilonproteobacterias próximas aos Mycoplasmas, em todas
vores filogenéticas obtidas para o sistema uvrABC, sugere a transferência
ntal a partir das Firmicutes, visto que sua colocação difere da árvore de rDNA
na qual as epsilonproteobacterias estão mais relacionadas ao grupo das
obacterias. Desta forma, seria esperado que se as epsilonproteobacterias
entassem o sistema uvrABC por herança vertical, estas deveriam se posicionar
as às demais proteobacterias.
Na história evolutiva da girase reversa, foi observado que durante a evolução
eterminados genes pode ter ocorrido mais de um evento de transferência
ntal, perda gênica e até várias transferências laterais (Brochier & Forterre,
. De acordo com Eisen e Hanawalt (1999), durante a evolução dos genes de
o das mais variadas vias, há evidências de transferência ou perda gênica,
por exemplo: o gene da 8-oxo-guanina glicosilase (Ogg) pode ter sido obtido
pela M. thermautotrophicus por transferência lateral a partir dos eucariotos ou a
origem do gene anteceda a divergência entre os domínios e só então o gene da Ogg
tenha sido perdido por algumas linhagens de arqueobactérias; a história evolutiva da
do gene da Uracil DNA glicosilase (Ung) também aponta para uma origem
bacteriana, onde algumas linhagens o tenham perdido depois, e esse gene foi
adquirido pelos eucariotos a partir das mitocôndrias. Tais evidências fortalecem a
idéia de que o operon uvrABC pode ter sido adquirido pelas arqueobactérias por
duas ou mais origens diferentes. Um primeiro evento pode ter ocorrido entre as
Firmicutes, em especial as Mycoplasmas, e as Methanobacterias e um segundo
evento entre as Actinobacterias e Halobacterias, ambos de maneira independente.
Um dos modelos para a origem do sistema de reparo por excisão de
nucleotídeos obtido ao final de nosso estudo (Figura 12) está de acordo com Poole
& Penny (2007) que sugere a origem dos eucariotos a partir das arqueobactérias.
Nesse contexto evolutivo seria possível a origem da via NER em um ancestral
comum (LUCA) e a manutenção do sistema formado pelas proteínas XPs em
Archaea e a sua transferência vertical para o domínio Eucaria. O modelo proposto
também concorda com Eisen e Hanawalt (1999) que sugeriram que algumas
arqueobactérias teriam adquirido o NER ( o sistema uvrABC ) por transferência
horizontal das bactérias. Vale ressaltar que as análises feitas por Eisen e Hanawalt
(1999) foram baseadas em quatro genomas de arqueobactérias de um total de
quatorze genomas disponíveis na época, onde só uma espécie detinha a via uvrABC
completo, a Methanothermobacter thermautotrophicus. Atualmente encontram-se
depositados no GenBank 50 genomas completos de arqueobactérias dos quais 25
foram submetidos no banco de dados do ano de 2006 até a atualidade. No presente
estudo foram analisados somente genomas com sistema uvrABC completo,
totalizando onze genomas de arqueobactérias no total, o que caracteriza a nossa
análise filogenética como mais abrangente e importante para confirmar a hipótese
feita por Eisen e Hanawalt em 1999. Além disso, a presença do sistema uvrABC em
somente 11 genomas completos, num total de 50, sugere que a aquisição dessa via
se mostrou favorável apenas para um grupo pequeno de representantes do domínio
Archaea.
De acordo com a filogenia da XPB (Figura 11), mesmo após a divergência entre
as classes Euriarchaeota e Crenarchaeota o gene da XPB foi conservado ao longo
da evolução, o que justifica a ausência de um ramo único para os representantes de
cada classe. Esse resultado é bem interessante, pois o gene da proteína XPF, que é
uma nuclease e também faz parte do complexo NER nos eucariotos, apresenta uma
história evolutiva um pouco diferente. Nas arqueobactérias o processo evolutivo do
gene teve dois momentos: Espécies da classe Euriarchaeota apresentam um
homólogo do XPF muito próximo do gene de eucarioto, pois ambos apresentam as
regiões C e N-terminal com os domínios nuclease e helicase, respectivamente. Já
na classe Crenarchaeota foi encontrado apenas um homólogo que detém apenas a
região C-terminal (White, 2003). Contudo, as helicases XPB e XPD são subunidades
do fator de transcrição TFHII e provavelmente participam do processo de iniciação
da transcrição em Archaea, além de compor o complexo NER. Assim, a conservação
da XPB se torna mais importante para as arqueobactérias, mesmo após a
divergência das classes Euriarchaeota e Crenarchaeota, do que a conservação da
proteína XPF. Tudo isso comprova a particularidade do processo evolutivo de cada
gene, mesmo que esses participem de um mesmo complexo enzimático.
Baseado na mesma filogenia pode-se afirmar que a XPB foi adquirida pelos
eucariotos por transferência vertical a partir das arqueobactérias. Um fato que
fortalece essa afirmação é a existência de eucariotos, como a Arabidopsis thaliana e
o Plasmodium falciparum, que não possuem os genes responsáveis pelo
reconhecimento do dano, XPA, XPC e XPE. Estudos com linhagens mutantes de
A.thaliana para os genes XPB, XPF e XPD verificaram uma deficiência na remoção
do DNA danificado, provando assim que a via NER foi prejudicada (Costa et al.,
2001; Liu et al., 2000; Liu et al., 2001; Liu et al., 2003). Quanto às arqueobactérias,
elas também não possuem os genes responsáveis pelo reconhecimento do dano,
contudo foi comprovada a transcrição dos genes de XPB, XPF e XPG da espécie
Sulfolobus solfataricus após exposição à UV (Salerno et al., 2003). Outro dado que
sugere a proximidade entre os eucariotos e as arqueobactérias quanto a esta via é a
presença de homólogos de RAD3/XPD, RAD25/XPB, RAD2/XPG em todas as
arqueobactérias e a presença de homólogos da RAD1/XPF na maioria (Goosen &
Moolenaar, 2008). As evidências citadas anteriormente leva-nos a afirmar que é
possível as arqueobactérias possuírem tanto o sistema uvrABC quanto o complexo
enzimático das XPs atuando no reparo por excisão de nucleotídeos. Caso isso seja
possível, não podemos descartar a hipótese da via NER do ancestral comum ser
formada pelos dois sistemas enzimáticos e ele ter sido transferido verticalmente para
as arqueobactérias. Dessa maneira, as Archaea teria sido o berço da via NER dos
demais domínios da vida.
6 – CONCLUSÕES
Após o término de nossos estudos podemos afirmar que:
• Embora existam argumentos, na literatura, defendendo a transferência
horizontal do sistema uvrABC de bactérias para arqueobactérias, a
análise feita neste estudo sugere que a transferência vertical, tendo
arquebacterias como origem, tanto do sistema uvrABC quanto dos
genes XP, seja o caminho mais parcimonioso, considerando a
ocorrência de grupos monofiléticos, o tempo de divergência das classes
e o número de espécies de arqueobactérias portadoras dos genes do
sistema uvrABC;
• Sobre a evolução do sistema uvrABC das epsilonproteobacterias, foi
observado que ele provavelmente foi adquirido por transferência
horizontal, tendo as Firmicutes como fonte;
• Os melhores métodos de reconstrução filogenética utilizados para
analisar nossos dados foram os de verossimilhança e o método
Bayesiano.
• Os componentes do sistema de reparo por excisão de nucleotídeos
podem ser usados como modelos para estudos filogenéticos que
busquem a história evolutiva de organismos, visto o grau de
conservação.
7 – REFERÊNCIAS BIBLIOGRÁFICAS
Altschul, S. F., Madden, T. L., Schaffer, A. A., Zhang, J., Zhang, Z., Miller,
W. & Lipman, D. J. (1997). Gapped BLAST and PSI-BLAST: a new generation of
protein database search programs. Nucleic Acids Res. 25: 3389-402.
Aravind, L., Walker, D. R. & Koonin, E. V. (1999). Conserved domains in
DNA repair proteins and evolution of repair systems. Nucleic Acids Res. 27: 1223-42.
Arber, W. (2000). Genetic variation: molecular mechanisms and impact on
microbial evolution. FEMS Microbiol Rev. 24: 1-7.
Battistuzzi, F. U., Feijao, A. & Hedges, S. B. (2004). A genomic timescale of
prokaryote evolution: insights into the origin of methanogenesis, phototrophy, and the
colonization of land. BMC evolutionary biology. 4: 44.
Berlocher, S. H. & Swofford, D. L. (1997). Searching for phylogenetic trees
under the frequency parsimony criterion: an approximation using generalized
parsimony. Syst Biol. 46: 211-5.
Brochier-Armanet, C. & Forterre, P. (2007). Widespread distribution of
archaeal reverse gyrase in thermophilic bacteria suggests a complex history of
vertical inheritance and lateral gene transfers. Archaea (Vancouver, B.C. 2: 83-93.
Brown, J. R. & Doolittle, W. F. (1995). Root of the universal tree of life based
on ancient aminoacyl-tRNA synthetase gene duplications. Proc Natl Acad Sci U S A.
92: 2441-5.
Bult, C. J., White, O., Olsen, G. J., Zhou, L., Fleischmann, R. D., Sutton, G.
G., Blake, J. A., FitzGerald, L. M., Clayton, R. A., Gocayne, J. D., Kerlavage, A.
R., Dougherty, B. A., Tomb, J. F., Adams, M. D., Reich, C. I., Overbeek, R.,
Kirkness, E. F., Weinstock, K. G., Merrick, J. M., Glodek, A., Scott, J. L.,
Geoghagen, N. S. & Venter, J. C. (1996). Complete genome sequence of the
methanogenic archaeon, Methanococcus jannaschii. Science (New York, N.Y. 273:
1058-73.
Cavalier-Smith, T. (2002). The neomuran origin of archaebacteria, the
negibacterial root of the universal tree and bacterial megaclassification. International
journal of systematic and evolutionary microbiology. 52: 7-76.
Choi, I. G. & Kim, S. H. (2007). Global extent of horizontal gene transfer. Proc
Natl Acad Sci U S A. 104: 4489-94.
Cleaver, J. E., Karplus, K., Kashani-Sabet, M. & Limoli, C. L. (2001).
Nucleotide excision repair "a legacy of creativity". Mutation Research-DNA Repair.
485: 23-36.
Costa, R. M., Morgante, P. G., Berra, C. M., Nakabashi, M., Bruneau, D.,
Bouchez, D., Sweder, K. S., Van Sluys, M. A. & Menck, C. F. (2001). The
participation of AtXPB1, the XPB/RAD25 homologue gene from Arabidopsis thaliana,
in DNA repair and plant development. Plant J. 28: 385-95.
Darnell, J. E., Jr. (1978). Implications of RNA-RNA splicing in evolution of
eukaryotic cells. Science (New York, N.Y. 202: 1257-60.
Darnell, J. E. & Doolittle, W. F. (1986). Speculations on the early course of
evolution. Proc Natl Acad Sci U S A. 83: 1271-5.
de la Cruz, F. & Davies, J. (2000). Horizontal gene transfer and the origin of
species: lessons from bacteria. Trends Microbiol. 8: 128-33.
de Laat, S. W., Boonstra, J., Defize, L. H., Kruijer, W., van der Saag, P. T.,
Tertoolen, L. G., van Zoelen, E. J. & den Hertog, J. (1999). Growth factor
signalling. Int J Dev Biol. 43: 681-91.
Di Giulio, M. (2007). The tree of life might be rooted in the branch leading to
Nanoarchaeota. Gene. 401: 108-13.
Doolittle, R. F. (2000). Searching for the common ancestor. Res Microbiol.
151: 85-9.
Doolittle, W. F. (1978). Genes in pieces: were they ever together? Nature.
272: 581-582.
Doolittle, W. F. (1999). Lateral genomics. Trends Cell Biol. 9: M5-8.
Duarte, F. T., Carvalho, F. M., Bezerra e Silva, U., Scortecci, K. C., Blaha,
C. A., Agnez-Lima, L. F. & Batistuzzo de Medeiros, S. R. (2004). DNA repair in
Chromobacterium violaceum. Genet Mol Res. 3: 167-80.
Eisen, J. A. (1995). The RecA protein as a model molecule for molecular
systematic studies of bacteria: comparison of trees of RecAs and 16S rRNAs from
the same species. J Mol Evol. 41: 1105-23.
Eisen, J. A. (2000a). Horizontal gene transfer among microbial genomes: new
insights from complete genome analysis. Curr Opin Genet Dev. 10: 606-11.
Eisen, J. A. (2000b). Assessing evolutionary relationships among microbes
from whole-genome analysis. Curr Opin Microbiol. 3: 475-80.
Eisen, J. A. & Hanawalt, P. C. (1999). A phylogenomic study of DNA repair
genes, proteins, and processes. Mutat Res. 435: 171-213.
Felsenstein, J. (1992). Phylogenies from Restriction Sites - a Maximum-
Likelihood Approach. Evolution. 46: 159-173.
Frigaard, N. U., Martinez, A., Mincer, T. J. & DeLong, E. F. (2006).
Proteorhodopsin lateral gene transfer between marine planktonic Bacteria and
Archaea. Nature. 439: 847-50.
Garrity, G. M., Winters, M., Searles, D. B. (2002) Bergey´s Manual of
Systematic Bacteriology: Taxonomic Outline of the Procaryotic, Springer-Verlag, NY:
Gevers, D., Dawyndt, P., Vandamme, P., Willems, A., Vancanneyt, M.,
Swings, J. & De Vos, P. (2006). Stepping stones towards a new prokaryotic
taxonomy. Philosophical transactions of the Royal Society of London. 361: 1911-6.
Gogarten, J. P., Kibak, H., Dittrich, P., Taiz, L., Bowman, E. J., Bowman,
B. J., Manolson, M. F., Poole, R. J., Date, T., Oshima, T. & et al. (1989). Evolution
of the vacuolar H+-ATPase: implications for the origin of eukaryotes. Proceedings of
the National Academy of Sciences of the United States of America. 86: 6661-5.
Hillis, D.M. e Bull, J.J. (1993) An empirical test of bootstrapping as method
for assessing confidence in phylogenetic analysis. Syst.Biol 42, 182-192.
Goosen, N. & Moolenaar, G. F. (2008). Repair of UV damage in bacteria.
DNA repair. 7: 353-79.
Gupta, R. S. & Griffiths, E. (2002). Critical issues in bacterial phylogeny.
Theoretical population biology. 61: 423-34.
Hall, T. A. (1999). BioEdit: a user-friendly biological sequence alignment editor
and analysis program for Windows 95/98/NT. Nucl. Acids. Symp. Ser. 41: 95-98.
Hoyle, D. C. & Higgs, P. G. (2003). Factors affecting the errors in the
estimation of evolutionary distances between sequences. Mol Biol Evol. 20: 1-9.
Jain, R., Rivera, M. C. & Lake, J. A. (1999). Horizontal gene transfer among
genomes: the complexity hypothesis. Proc Natl Acad Sci U S A. 96: 3801-6.
Jain, R., Rivera, M. C., Moore, J. E. & Lake, J. A. (2003). Horizontal gene
transfer accelerates genome innovation and evolution. Mol Biol Evol. 20: 1598-602.
Jeffares, D. C., Mourier, T. & Penny, D. (2006). The biology of intron gain
and loss. Trends Genet. 22: 16-22.
Jeffares, D. C., Poole, A. M. & Penny, D. (1998). Relics from the RNA world.
J Mol Evol. 46: 18-36.
Karaolis, D. K., Somara, S., Maneval, D. R., Jr., Johnson, J. A. & Kaper, J.
B. (1999). A bacteriophage encoding a pathogenicity island, a type-IV pilus and a
phage receptor in cholera bacteria. Nature. 399: 375-9.
Koonin, E. V., Mushegian, A. R., Galperin, M. Y. & Walker, D. R. (1997).
Comparison of archaeal and bacterial genomes: computer analysis of protein
sequences predicts novel functions and suggests a chimeric origin for the archaea.
Mol Microbiol. 25: 619-37.
Labedan, B., Boyen, A., Baetens, M., Charlier, D., Chen, P., Cunin, R.,
Durbeco, V., Glansdorff, N., Herve, G., Legrain, C., Liang, Z., Purcarea, C.,
Roovers, M., Sanchez, R., Toong, T. L., Van de Casteele, M., van Vliet, F., Xu, Y.
& Zhang, Y. F. (1999). The evolutionary history of carbamoyltransferases: A complex
set of paralogous genes was already present in the last universal common ancestor.
J Mol Evol. 49: 461-73.
Lawson, F. S., Charlebois, R. L. & Dillon, J. A. (1996). Phylogenetic
analysis of carbamoylphosphate synthetase genes: complex evolutionary history
includes an internal duplication within a gene which can root the tree of life. Mol Biol
Evol. 13: 970-7.
Lehmann, A. R. (2000). Replication of UV-damaged DNA: new insights into
links between DNA polymerases, mutagenesis and human disease. Gene. 253: 1-12.
Lemoine, F., Lespinet, O. & Labedan, B. (2007). Assessing the evolutionary
rate of positional orthologous genes in prokaryotes using synteny data. BMC
evolutionary biology. 7: 237.
Liu, Z., Hossain, G. S., Islas-Osuna, M. A., Mitchell, D. L. & Mount, D. W.
(2000). Repair of UV damage in plants by nucleotide excision repair: Arabidopsis
UVH1 DNA repair gene is a homolog of Saccharomyces cerevisiae Rad1. Plant J.
21: 519-28.
Liu, Z., Hall, J. D. & Mount, D. W. (2001). Arabidopsis UVH3 gene is a
homolog of the Saccharomyces cerevisiae RAD2 and human XPG DNA repair
genes. Plant J. 26: 329-38.
Liu, Z., Hong, S. W., Escobar, M., Vierling, E., Mitchell, D. L., Mount, D. W.
& Hall, J. D. (2003). Arabidopsis UVH6, a homolog of human XPD and yeast RAD3
DNA repair genes, functions in DNA repair and is essential for plant growth. Plant
physiology. 132: 1405-14.
McHardy, A. C. & Rigoutsos, I. (2007). What's in the mix: phylogenetic
classification of metagenome sequence samples. Curr Opin Microbiol. 10: 499-503.
Nakamura, Y., Nishio, Y., Ikeo, K. & Gojobori, T. (2003). The genome
stability in Corynebacterium species due to lack of the recombinational repair system.
Gene. 317: 149-55.
Nelson, K. E., Clayton, R. A., Gill, S. R., Gwinn, M. L., Dodson, R. J., Haft,
D. H., Hickey, E. K., Peterson, J. D., Nelson, W. C., Ketchum, K. A., McDonald,
L., Utterback, T. R., Malek, J. A., Linher, K. D., Garrett, M. M., Stewart, A. M.,
Cotton, M. D., Pratt, M. S., Phillips, C. A., Richardson, D., Heidelberg, J., Sutton,
G. G., Fleischmann, R. D., Eisen, J. A., White, O., Salzberg, S. L., Smith, H. O.,
Venter, J. C. & Fraser, C. M. (1999). Evidence for lateral gene transfer between
Archaea and bacteria from genome sequence of Thermotoga maritima. Nature. 399:
323-9.
Phillips, A., Janies, D. e Wheeler, W. (2000) Multiple sequence alignment in
phylogenetic analysis. Mol. Phylogenet. Evol 16, 317-330.
Ponting, C. P. (2001). Plagiarized bacterial genes in the human book of life.
Trends Genet. 17: 235-7.
Poole, A. M. & Penny, D. (2007). Evaluating hypotheses for the origin of
eukaryotes. Bioessays. 29: 74-84.
Posada, D. & Crandall, K. A. (1998). MODELTEST: testing the model of DNA
substitution. Bioinformatics (Oxford, England). 14: 817-818.
Razin, S., Yogev, D. & Naot, Y. (1998). Molecular biology and pathogenicity
of mycoplasmas. Microbiol Mol Biol Rev. 62: 1094-156.
Reanny, D. C. (1974). On the origin of prokaryotes. J. Theor. Biol. 48: 243–
251.
Reardon, J. T. & Sancar, A. (2006). Purification and characterization of
Escherichia coli and human nucleotide excision repair enzyme systems. Methods
Enzymol. 408: 189-213.
Reese, J. T. & Pearson, W. R. (2002). Empirical determination of effective
gap penalties for sequence comparison. Bioinformatics. 18: 1500-7.
Richert, K., Brambilla, E. & Stackebrandt, E. (2007). The phylogenetic
significance of peptidoglycan types: Molecular analysis of the genera Microbacterium
and Aureobacterium based upon sequence comparison of gyrB, rpoB, recA and ppk
and 16SrRNA genes. Systematic and applied microbiology. 30: 102-8.
Sancar, A. & Sancar, G. B. (1988). DNA repair enzymes. Annual review of
biochemistry. 57: 29-67.
Salter, L. A. & Pearl, D. K. (2001). Stochastic search strategy for estimation
of maximum likelihood phylogenetic trees. Syst Biol. 50: 7-17.
Salerno, V., Napoli, A., White, M. F., Rossi, M. & Ciaramella, M. (2003).
Transcriptional response to DNA damage in the archaeon Sulfolobus solfataricus.
Nucleic Acids Res. 31: 6127-38.
Snel, B., Huynen, M. A. & Dutilh, B. E. (2005). Genome trees and the nature
of genome evolution. Annu Rev Microbiol. 59: 191-209.
Swofford, D. L., Waddell, P. J., Huelsenbeck, J. P., Foster, P. G., Lewis, P.
O. & Rogers, J. S. (2001). Bias in phylogenetic estimation and its relevance to the
choice between parsimony and likelihood methods. Syst Biol. 50: 525-39.
Tamames, J. (2001). Evolution of gene order conservation in prokaryotes.
Genome biology. 2: RESEARCH0020.
Truglio, J. J., Croteau, D. L., Van Houten, B. & Kisker, C. (2006).
Prokaryotic nucleotide excision repair: the UvrABC system. Chem Rev. 106: 233-52.
Vickerman, M. M., Brossard, K. A., Funk, D. B., Jesionowski, A. M. & Gill,
S. R. (2007). Phylogenetic analysis of bacterial and archaeal species in symptomatic
and asymptomatic endodontic infections. Journal of medical microbiology. 56: 110-8.
Vinuesa, P., Silva, C., Werner, D. & Martinez-Romero, E. (2005). Population
genetics and phylogenetic inference in bacterial molecular systematics: the roles of
migration and recombination in Bradyrhizobium species cohesion and delineation.
Mol Phylogenet Evol. 34: 29-54.
White, M. F. (2003). Archaeal DNA repair: paradigms and puzzles.
Biochemical Society Transactions. 31: 690-693.
Wolf, Y. I., Aravind, L. & Koonin, E. V. (1999). Rickettsiae and Chlamydiae:
evidence of horizontal gene transfer and gene exchange. Trends Genet. 15: 173-5.
Wong, J. T. (2005). Coevolution theory of the genetic code at age thirty.
Bioessays. 27: 416-25.
Xue, H., Ng, S. K., Tong, K. L. & Wong, J. T. (2005). Congruence of
evidence for a Methanopyrus-proximal root of life based on transfer RNA and
aminoacyl-tRNA synthetase genes. Gene. 360: 120-30.
Xue, H., Tong, K. L., Marck, C., Grosjean, H. & Wong, J. T. (2003). Transfer
RNA paralogs: evidence for genetic code-amino acid biosynthesis coevolution and
an archaeal root of life. Gene. 310: 59-66.
Yang, Z. & Rannala, B. (1997). Bayesian phylogenetic inference using DNA
sequences: a Markov Chain Monte Carlo Method. Molecular biology and evolution.
14: 717-724.
Zaballos, M., Lopez-Lopez, A., Ovreas, L., Bartual, S. G., D'Auria, G.,
Alba, J. C., Legault, B., Pushker, R., Daae, F. L. & Rodriguez-Valera, F. (2006).
Comparison of prokaryotic diversity at offshore oceanic locations reveals a different
microbiota in the Mediterranean Sea. FEMS microbiology ecology. 56: 389-405.
Zillig, W., Schnabel, R. & Stetter, K. O. (1985). Archaebacteria and the origin
of the eukaryotic cytoplasm. Current topics in microbiology and immunology. 114: 1-
18.
8 – ANEXOS
Anexo I
Tabela 1. Abreviações das seqüências do sistema uvrABC e das seqüências de RNAr 16s e seus respectivos números de acesso ao banco de dados GenBank.
Organism Abbreviation UVRA UVRB UVRC RNAr 16s
Chromobacterium violaceum C.violaceum NP901563 NP902822 NP900975 NC005085
Neisseria meningitidis N.meningitidis AAF41368 NP274350 AAF41701 NC003112
Thiobacillus denitrificans Thiob.denitrificans YP314194 YP315326 YP314459 NC007404
Neisseria gonorrhoeae N.gonorrhoeae YP208278 YP207718 YP207721 NC002946
Nitrosospira multiformis N.multiformis YP412913 YP412056 YP411966 NC007614
Azoarcus sp. Azoarcus sp. CAI08310 CAI09217 CAI09284 NC006513
Burkholderia thailandensis B.thailandensis YP441055 YP440229 YP442274 NC007651
Ralstonia eutropha R.eutropha AAZ59749 AAZ60430 AAZ61607 NC007348
Dechloromonas aromatica D.aromatica AAZ45230 YP285219 AAZ46783 NC007298
Pseudomonas aeruginosa P.aeruginosa NP252924 AAG06526 AAG05973 NC002516
Yersinia pestis Y.pestis AAS60749 AAS61254 AAS61762 NC005810
Xylella fastidiosa X.fastidiosa AAF85225 AAF83777 AAF85110 NC002488
Xanthomonas campestris X.campestris AAM40447 AAM41760 AAM41400 NC003902
Photorhabdus luminescens P.luminescens CAE16722 CAE13784 CAE14320 NC005126
Escherichia coli E.coli BAB38463 BAB34280 BAB36074 NC002695
Haemophilus influenzae H.influenzae AAX87308 AAX88673 AAX87060 NC007146
Rhodospirillum rubrum R.rubrum ABC22552 ABC21934 ABC23020 NC007643
Mycoplasma synoviae M.synoviae AAZ43444 AAZ43479 AAZ43690 NC007294
Magnetospirillum magneticum M.magneticum BAE51273 BAE52607 BAE52604 NC007626
Nitrobacter winogradskyi N.winogradskyi ABA04829 ABA05748 ABA05779 NC007406
Bradyrhizobium japonicum B.japonicum BAC49967 BAC52696 BAC52735 NC004463
Rhodobacter sphaeroides R.sphaeroides ABA79127 YP352139 ABA80258 NC007493
Agrobacterium tumefaciens A.tumefaciens AAL42518 NP354972 AAL42142 NC003062
Geobacillus kaustophilus G.kaustophilus BAD77370 BAD77371 BAD76960 NC006510
Bacillus cereus B.cereus NP981564 NP981565 NP980940 NC003909
Mesorhizobium loti M.loti BAB48277 BAB49715 BAB54270 NC002678
Listeria innocua L.innocua CAC97858 CAC97859 CAC96428 NC003212
Geobacter metallireducens G.metallireducens ABB30377 ABB33432 ABB33441 NC007517
Bacillus subtilis B.subtilis CAB15533 CAB15534 CAB14809 NC000964
Pelobacter carbinolicus P.carbinolicus YP355520 ABA87362 ABA87813 NC007498
Methanothermobacter
thermautotrophicus
M.thermautotrophicus AAB84949 AAB84948 AAB84947 NC000916
Thermobifida fusca T.fusca AAZ56057 AAZ55234 AAZ56054 NC007333
Frankia sp. Frankia sp. YP480736 YP480731 YP480738 NC007777
Symbiobacterium thermophilum S.thermophilum BAD39152 BAD39136 BAD39156 NC006177
Methanosphaera stadtmanae M.stadtmanae YP447616 YP447615 YP447614 NC007681
Methanosarcina barkeri M.barkeri AAZ71614 AAZ71612 AAZ71613 NC007355
Prochlorococcus marinus P.marinus EAQ10047 CAE20246 EAQ09140 NC007577
Thermosynechococcus elongatus T.elongatus BAC07737 BAC09585 BAC09305 NC004113
Synechococcus elongatus S.elongatus BAD78882 BAD79149 BAD80339 NC006576
Gloeobacter violaceus G.violaceus BAC92177 BAC89796 BAC91533 NC005125
Anabaena variabilis A.variabilis ABA23197 ABA24277 ABA23894 NC007413
Methanococcus maripaludis M.maripaludis CAF30285 CAF30283 CAF30284 NC005791
Anaeromyxobacter dehalogenans A.dehalogenans YP464338 ABC81049 YP464490 NC007760
Desulfovibrio desulfuricans D.desulfuricans ABB39283 ABB38893 ABB37815 NC007519
Campylobacter jejuni C.jejuni AAW34979 AAW34566 AAW35702 NC003912
Thiomicrospira denitrificans Thiom.denitrificans YP393676 YP394206 ----- NC007575
Helicobacter pylori H.pylori NP207499 NP207905 NP207614 NC000915
Chlorobium tepidum C.tepidum AAM72914 AAM72772 AAM73028 NC002932
Mycoplasma hyopneumoniae M.hyopneumoniae YP115801 YP116177 YP115584 NC006360
Mycoplasma mycoides M.mycoides CAE77552 CAE77553 CAE76938 NC005364
Lactobacillus plantarum L.plantarum CAD63364 CAD63363 CAD64473 NC004567
Lactobacillus sakei L.sakei YP395136 YP395135 YP395665 NC007576
Methanococcoides burtonii M.burtonii YP565831 YP566909 YP566124 NC007955
Methanosarcina acetivorans M.acetivorans AAM06694 AAM06692 AAM06693 NC003552
Methanosarcina mazei M.mazei NP635315 NP635313 NP635314 NC003901
Methanospirillum hungatei M.hungatei YP502627 YP502629 YP502628 NC007796
Natronomonas pharaonis N.pharaonis YP325912 YP326032 YP326203 NC007426
Haloarcula marismortui H.marismortui AAV46967 AAV47725 AAV47764 NC006396
Halobacterium sp. Halobacterium sp. AAG20669 AAG20482 AAG20476 NC002607
Anexo II Tabela 2..Seqüências da helicase XPB selecionadas para análise.
Organismos Abreviação Número de acesso
Homo sapiens H.sapiens AAA52396 Macaca fascicularis M.fascicularis BAD51954 Bos taurus B.taurus AAI14730 Rattus norvegicus R.norvegicus AAH98856 Gallus gallus G.gallus NP001006523 Drosophila melanogaster D.melanogaster Q02870 Apis mellifera A.mellifera XP624125 Geodia cydonium G.cydonium CAA76655 Caenorhabditis elegans C.elegans NP499487 Candida albicans C.albicans XP715839 Schizosaccharomyces pombe S.pombe CAB11506 Arabidopsis thaliana A.thaliana BAB08508 Methanococcus maripaludis M.maripaludis CAF30013 Methanosarcina barkeri M.barkeri AAZ71549 Methanosphaera stadtmanae M.stadtmanae YP447803 Natronomonas pharaonis N.pharaonis YP330829 Halobacterium sp. Halobacterium sp. NP444220 Haloarcula marismortui H.marismortui AAV45245 Methanosarcina mazei M.mazei NP635024 Methanosarcina acetivorans M.acetivorans AAM05789 Methanococcoides burtonii M.burtonii YP565003 Pyrobaculum aerophilum P.aerophilum AAL64197 Sulfolobus tokodaii S.tokodaii BAB66329 Sulfolobus acidocaldarius S.acidocaldarius YP255954 Pyrococcus furiosus P.furiosus AAL80801 Thermoplasma volcanium T.volcanium BAB59714
Anexo III
Tabela 3..Posicionamento do sistema uvrABC nos genomas .
Organismos Posição no Genoma
Genes Observações
Methanosarcina barkeri
3443938-3440912 UvrA
Genes em operon 3438995-3436983 UvrB
3440689-3439130 UvrC
Methanococcus maripaludis
721032-723887 UvrA
Genes em operon 717504-719444 UvrB
719441-721024 UvrC
Helicobacter pylori
760089-757282 UvrA
UVRA e C mais próximos 1177614-1175638 UvrB
873393-875177 UvrC
Campylobacter jejuni
351810-348988 UvrA
Genes distribuídos ao longo do genoma 714300-712327 UvrB
1296619-1294817 UvrC
Thiomicrospira denitrificans
1221062-1218234 UvrA
UVRA e B mais próximos 1773781-1775763 UvrB
419034-417232 UvrC
Mycoplasma
hyopneumoniae
327761-330601 UvrA
UVRC e B bem próximos 842990-845026 UvrB
88394-86847 UvrC
Mycoplasma mycoides
1072184-1069344 UvrA
UVRA e B em operon 1074208-1072193 UvrB
338510-336756 UvrC
Mycoplasma synoviae
24893-22038 UvrA
Genes distribuídos ao longo do genoma 60516-62522 UvrB
295849-297597 UvrC
Natronomonas pharaonis
253407-256340 UvrA
Genes distribuídos ao longo do genoma 374646-376697 UvrB
530270-531997 UvrC
Halobacterium sp.
1960727-1962556 UvrA
UVRC e B em operon 1791684-1793753 UvrB
1784408-1786180 UvrC
Haloarcula marismortui
1893658-1896636 UvrA
UVRC e B em operon 2656630-2658690 UvrB
2699599-2701344 UvrC
Thermobifida fusca
2365792-2368629 UvrA
UVRC e A em operon 1397067-1399172 UvrB
2361510-2363480 UvrC
Frankia sp.
1960338-1963268 UvrA
Genes em operon 1953231-1955375 UvrB
1963875-1965992 UvrC
Symbiobacterium thermophilum
192733-195597 UvrA
Genes em operon 174847-176853 UvrB
198910-200799 UvrC
Anexo IV
Tabela 4. Levantamento de dados sobre os genes de reparo da via NER presentes nas arqueobactérias analisadas.
Organismos Via NER Bacteriana Via NER Eucariótica uvrA uvrB uvrC uvrD Mfd Xpa Xpb Xpc Xpd Xpf Xpg ERCC1
Methanococcus maripaludis + + + - - - - - + + + - ������������ ������+ + + - - - + - + + + + �������� ����� ����������+ + + + - - - - - + - - ������������ �������+ + + + - - + - + - + - ����������� � �+ + + + - - + - + + + - ��������� ���������+ + + - - - + - + + + - ������������ ����+ + + + - - + - + + + + ������������ ���������+ + + - - - - - - - - - ������������ ������+ + + + - - - - + + + -
Pyrobaculum aerophilum - - - - - - - - + - + - Sulfolobus tokodaii - - - - - - - - + - + - Sulfolobus acidocaldarius - + - - - - + - + + + - Pyrococcus furiosus - - - - - - + - + + + + Thermoplasma volcanium - - - + - - + - - - - -
Anexo V
ARTIGO EM PREPARAÇÃO Nucleotide Excision Repair System Evolution
Uaska Bezerra e Silva, Silvia Regina Batistuzzo de Medeiros, Lucymara Fassarela Agnez
Lima*,
Departamento de Biologia Celular e Genética, Centro de Biociências, Universidade Federal
do Rio Grande do Norte, Natal - RN, Brazil. [email protected]
* Correspondence to:
Dr. Lucymara Fassarela Agnez Lima
Departamento de. Biologia Celular e Genética. CB – UFRN
Campus Universitário, Lagoa Nova
Natal, CP 1575, 59072-970, RN, Brazil
Tel.# 55.84.3211-9209; Fax# 55.84. 3215-3346
E-mail: [email protected]
Key-words: Repair, horizontal transfer, phylogeny, ancestral.