UNIVERSIDADE DE SO PAULO
FFCLRP DEPARTAMENTO DE BIOLOGIA
PROGRAMA DE PS-GRADUAO EM BIOLOGIA COMPARADA
Filogenias moleculares e o enraizamento da
rvore da Vida
Emanuelle Corbi Corra
Orientador: Prof. Dr. Dalton de Souza Amorim
RIBEIRO PRETO
2009
Tese apresentada Faculdade de Filosofia,
Cincias e Letras de Ribeiro Preto da USP, como
parte das exigncias para a obteno do ttulo de
Doutor em Cincias, rea: Biologia Comparada
Livros Grtis
http://www.livrosgratis.com.br
Milhares de livros grtis para download.
pessoa que at agora nunca saiu do meu lado...
quela que por pior que a situao fosse sempre tinha palavras de refrigrio...
quela que no poupou esforos para fazer de mim o que sou hoje...
quela que na hora H de todos aqueles momentos mais cruciais da minha existncia
... esteve l por mim. Quanto amor! Hoje eu comeo a conseguir mensurar o quo
grande o seu amor por mim...
Este trabalho dedicado a voc... mame.
O melhor da cincia sua caracterstica inconstante,
busca por quebras de paradigmas e
a possibilidade de chegarmos ao fim e
compreendermos que estvamos errados ou
alegrarmo-nos por termos estado certos.
Agradecimentos
Considero que a elaborao de uma tese de doutorado um produto coletivo
embora sua redao, responsabilidade e stress seja predominantemente individual.
Vrias pessoas contriburam para que este trabalho chegasse a bom termo. A todas elas
registro minha gratido.
Agradeo a Deus, pela graa de no ter tirado a minha vida por duas vezes
quando com a morte quase face a face fiquei durante o perodo deste doutorado.
Agradeo Ele por tudo que sou e que possuo, por cada momento da minha vida ao
longo do tempo de durao deste trabalho e pelo resultado final...Obrigada Senhor!
No mbito familiar, agradeo minha me Yara por todo apoio e amor
incondicional, ao meu pai Paulo pela tomada de algumas decises surpreendentes e
confortantes ao meu corao, ao meu marido, companheiro e parceiro sempre, minha
filha que deixa minha vida repleta de alegria e finalmente, a minha irm Evelyn, a quem
eu amo muito.
Agradeo a todos do laboratrio do professor Dalton de Souza Amorim pela
convivncia e bate-papos. Agradeo, principalmente ao professor Dalton pela
oportunidade, confiana e orientao e a Bel por ser uma grande amiga.
A todos da Excellent Global que entenderam minha quase ausncia por tantos
anos, minhas infindveis anlises impedindo o uso dos computadores na escola e meus
muitos agora no...espero agora estar mais com vocs.
A todos da ps graduao e da Fapesp que sempre estiveram dispostos a ajudar.
Ao professor Fernando Portela de Luna Marques pelas oportunidades de cursos,
pela disponibilidade de ajudar mesmo que a distncia e pela hospitalidade.
A professora Maria de Lourdes Teixeira de Moraes Polizeli pela amizade,
profissionalismo, oportunidades proporcionadas a minha carreira profissional,
companheirismo e orientao.
Ao professor Richard Ward por algumas conversas teis.
A Fapesp pela bolsa concedida.
A todos que contriburam para a concretizao deste trabalho e que, por um
lapso meu, no foram citadas aqui.
Muito obrigada
Sumrio
Resumo..........................................................................................7
Abstract.........................................................................................9
Consideraes Iniciais..................................................................11
Captulo I Estudo das Glicosidases............................................19
Captulo II Estudo das xilanases................................................36
Captulo III Anlise das xilanases do gnero Aspergillus...........68
Captulo IV Estudo dos fatores de alongamento EF-Tu e G......82
Comentrios Finais.....................................................................99
Bibliografia.................................................................................100
Resumo
Os seres vivos tm sido divididos em trs grandes domnios: Bacteria, Archaea e
Eukarya. O relacionamento filogentico entre eles tem sido discutido por vrios autores,
que em sua maioria concordam com o arranjo ((Archaea + Eukarya) Bacteria). Alguns
desses autores tm utilizado protenas parlogas para enraizar as rvores geradas. A
congruncia entre as propostas indicaria robustez no fosse a falta de rigor
metodolgico no delineamento dos protocolos de anlise e no tratamento desses dados.
As nomeaes atribudas a grupos de seqncias compartilhando a mesma
funcionalidade qumica muitas vezes confusa dificultando as proposies de
homologia, principalmente quando h interao de duas ou mais reas do conhecimento.
Ademais, quando protenas so analisadas, importante selecionarmos corretamente
qual parte da seqncia deve ser considerada. vasta a quantidade de trabalhos que
omitem os protocolos metodolgicos completos dificultando ou impossibilitando a
replicao da anlise.
Nossas anlises falharam em propor uma hiptese mais robusta para os trs
domnios, pois, glicosidases e xilanases demonstraram no compor grupos ortlogos de
seqncias. As seqncias dos fatores de alongamento tambm resultaram na
confirmao de que esse agrupamento qumico pode no refletir um grupo evolutivo
vlido. Tambm questionvel a prpria paralogia entre EF-Tu-1 e EF-G-2. Qualquer
futura proposio de alteraes na classificao dessas molculas necessitar de estudos
ainda mais abrangentes no que diz respeito aos grupos taxonmicos includos dada a
escassez de seqncias para alguns taxa.
Devido a importncia das xilanases em estudos de biotecnologia, realizamos um
estudo filogentico de fungos do gnero Aspergillus para entendermos o
comportamento de mltiplas xilanases em uma mesma espcie e propondo uma hiptese
filogentica para o grupo, consegussemos separar xilanases ortlogas e focar futuros
esforos por fungos do gnero Aspergillus que sejam bons produtores dessas enzimas.
Finalmente, o programa POY cuja filosofia de anlise agrada muitos
filogeneticistas pois o que melhor reflete os princpios cladsticos parece ter problemas
em seu algoritmo quando conjuntos grandes de seqncias proticas so analisados.
9
Abstract
All living beings have been divided into three great domains: Bacteria, Archaea
and Eukatya. The phylogenetic relationship among them has been discussed by many
authors who agree with the arrangement ((Archaea + Eukarya) Bacteria). Some of these
authors have used paralog proteins to root the topologies. The congruence among these
hypotheses would indicate robustness if it wasnt for the lack of strictness in the method
outline of the protocols and in the treatment of this king of data. The names given to
groups of sequences sharing the same chemical functions is confused most of the time
leading to an extra difficulty in the homology proposition, mainly when different
disciplines are compared. Furthermore, when proteins are analyzed it is important to
correctly select which part of the sequence will be considered. Many papers dealing
with this issue omit their complete methodological protocols making it harder or even
impossible to replicate the analysis.
Our analysis faild to propose a more robust hypothesis to the three domains,
because glycosidases and xylanases are probably not natural entities. The elongation
factor sequences also corroborate the idea chemical grouping may not reflect orthology
or evolution. The paralogy between EF-Tu and G is also questionable. Any future
proposition concerning the alteration of current molecules classification will need
further studies including taxonomic groups poorly represented herein.
Due to the importance of xylanases in biotechnological studies, we analysed
phylogenetically a group of Aspergillus fungi. First, to understand the behavior of
multiple xylanases in the same organism or species and then to propose a phylogenetic
hypothesis for the group. As a consequence, ortholog xylanases nested in the same clade
and efforts in the search of good xylanases producers was facilitated.
10
Finally, the phylogenetic program POY, which philosophy of analysis pleases
many researchers because it better reflects cladistic principles seems to have problems
in its algorithm when great protein data sets are analyzed.
Consideraes iniciais
_______________________________________________________Consideraes iniciais
11
A imensa diversidade biolgica existente move a curiosidade humana desde a
antiguidade (Eldredge & Cracraft, 1980) e instiga o homem a agrupar e classificar os
seres vivos conhecidos (Wolf, 1930). Essa classificao, em seu princpio, apia-se
evidentemente em similaridades gerais entre os organismos, e no em suas relaes de
parentesco. Entretanto, apenas arranjos taxonmicos que refletem grupos monofilticos
possibilitam compreender os padres evolutivos existentes na natureza e entender os
processos que os geraram (Eldredge & Cracraft, 1980).
Estudos filogenticos que procuram recuperar as relaes de parentesco entre os
grupos na natureza necessitam de caracteres interpretveis indicativos de
transformaes evolutivas (Hawkins, 2000). At meados da dcada de 70, todas as
tentativas de estudar a histria evolutiva dos organismos usando mtodos cladsticos
restringiam-se basicamente a Metazoa e Metaphyta, baseadas em caracteres
morfolgicos complexos, apoiadas adicionalmente em consideraes sobre o registro
fossilfero. Apesar de os microorganismos j serem conhecidos, no era possvel inseri-
los em arranjos taxonmicos filogeneticamente vlidos ou at mesmo puramente
classificatrios devido ausncia de caracteres informativos (Stanier & van Niel, 1962
e Woese et al., 1990). O advento das prticas de seqenciamento molecular
(Zuckerkandl & Pauling, 1965), seu uso para fins de reconstruo filogentica, o
refinamento computacional, com mquinas de alto desempenho e algoritmos mais
eficientes, permitindo uma melhor anlise dessas seqncias, mudaram essa histria
(Sanderon et al., 1993). A obteno de filogenias moleculares tornou-se um programa
de pesquisa progressivamente mais difundido em Biologia Comparada.
Conseqentemente, estudos filogenticos de uma gama muito maior de organismos,
como fungos, bactrias e at mesmo vrus, passaram a ser publicados (p.ex., Gouvea et
al., 1998; Tanabe et al., 2004; Schimitt & Lumbsch, 2004; Zhao et al., 2004).
_______________________________________________________Consideraes iniciais
12
Haeckel (1866) foi o primeiro a questionar a diviso do mundo vivo em apenas
plantas e animais, reconhecendo que os protistas no se encaixavam em nenhum dos
dois grupos, supondo que deveriam ter surgido independentemente. Copeland (1938)
reuniu as bactrias em um quarto grupo e Whittaker (1959) criou um quinto para
acomodar os fungos. Esse arranjo taxonmico que agrupa os seres vivos em cinco
grandes reinos (Animais, Plantas, Fungos, Protistas e Monera) o mais amplamente
utilizado atualmente. Devido ausncia de embasamento filogentico, no entanto, ele
reflete um sistema de classificao artificial (Whittaker, 1959, 1969). Ademais,
posicionar os procariotos (Monera) com o mesmo status taxonmico dos outros quatro
grupos problemtico, j que as diferenas entre eles e os demais grupos so
qualitativamente diferentes e quantitativamente maiores do que quando comparamos os
outros grupos entre si (Kimura et al., 1979).
luz de caracteres moleculares, um novo agrupamento dos seres vivos foi
proposto por Woese & Fox (1977), posteriormente aprimorado por Woese (1987).
Trabalhando com o gene que codifica o RNA da subunidade pequena do ribossomo
(SSU rDNA, tambm chamado de 16S nos procariotos e 18S nos eucariotos), esses
autores redividiram os Monera em dois grandes reinos, Eubacteria e Archaeobacteria,
mantendo o grupo Eukarya. Posteriormente, Woese et al. (1990) propuseram a elevao
de status dos trs reinos para domnios, Archaea, Bacteria e Eukarya. Essa elevao
taxonmica visou acomodar melhor hierarquicamente os organismos que compunham
os reinos. Adicionalmente, para uma simplificao ainda maior da nomenclatura, Woese
et al. (1990) evitaram qualquer conotao que pudesse atribuir um maior
relacionamento evolutivo entre Archaea e Bacteria. Entretanto, esse sistema de
classificao sofreu contestaes, principalmente quanto ao seu relacionamento interno,
e muitos problemas surgiram quanto s inferncias evolutivas quando novos dados
_______________________________________________________Consideraes iniciais
13
moleculares foram utilizados (Karlin et al., 2002; para uma viso diferente ver Gupta,
1998 a e b, 2000; Poole et al., 1999; Lopez et al., 1999; Forterre & Philipe, 1999;
Gribaldo & Philippe, 2002).
A determinao adequada da identidade e do relacionamento cladstico entre os
trs domnios complicada devido diversidade de organismos encontrada em cada
grupo e as dificuldades inerentes ao estudo de organismos to morfologicamente
simples. Archaea e Eukarya compartilham muitos genes e protenas envolvidas na
formao e atividade celular, ao passo que Archaea e Bacteria compartilham muitas
estruturas morfolgicas, genes e protenas metablicas operacionais (Rivera et al.,
1998) possivelmente por plesiomorfia. Atualmente, o domnio Bacteria dividido em
pelo menos 13 grandes grupos. A enorme plasticidade bioqumica e morfolgica
exibida por esse domnio dificultou uma melhor diviso classificatria at que Woese
(1987) props a primeira diviso do grupo com base em dados moleculares de SSU.
Entretanto, genes universais em algum grau parecem definir os grupos, mas no o
relacionamento filogentico entre eles (Baldauf et al., 2000 e Baldauf, 2003). Alm de
SSU e LSU (Brochier et al., 2002), outros 14 genes conservados (Brown et al., 2001),
57 protenas tradutoras (Brochier et al., 2002), 32 protenas ribossmicas (Wolf et al.,
2001), somados a aproximadamente mais 121 genes, compem o conjunto de caracteres
j utilizados para estabelecer diferentes subgrupos dentro deste domnio.
Archaea um domnio cuja criao visou separar organismos que so
morfologicamente muito semelhantes s bactrias e geneticamente to diferentes quanto
o prprio homem de uma bactria. Os organismos que compem esse domnio foram
primeiramente separados das bactrias por Woese e Fox (1977). Atualmente, esse
domnio composto de quatro grandes agrupamentos: Euryarcheota, Crenarcheota,
Korarcheota e Nanoarchaeota. Essa diviso suportada por anlises de SSU, LSU, 53
_______________________________________________________Consideraes iniciais
14
protenas ribossomais (Matte-Tailliez et al., 2002), 14 genes housekeeping (Brown et
al., 2001), protenas ribossomais universais (Wolf et al., 2001) e 14 conjuntos
randmicos de grupos de protenas ortlogas (COGs) (Cockrill & Baldauf, observaes
no publicadas em Baldauf et al., 2004).
Eukarya, finalmente, composto pelos organismos mais conhecidos. Estudos
moleculares de modo geral suportam uma subdiviso em Excavata, amitocondriados,
opistocontes, amebozoa, plantas, cercozoa, alveolados, hetercontes e discicristates
(Sogin, 1991; Keeling & Doolittle, 1996; Van de Peer & De Wachter, 1997;
Bhattacharya & Weber, 1997; Van der Auwera et al., 1998; Burger et al., 1999; Baldauf
et al., 2000; Keeling et al., 2000 e Bapteste et al., 2002). Entretanto, a subdiviso dos
Eukarya em grupos monofilticos menores deve corresponder discusso mais
complexa em todo o estudo de filogenia basal dos seres vivos.
Quais so as relaes de parentesco entre os trs domnios? A resposta para essa
pergunta traria solues para muitas reas do conhecimento, como sade humana,
conservao biolgica, processos heterocrnicos, dentre outros (Amorim & Amorim,
1992 e Yates et al., 2004). No possumos, atualmente, estudos suficientes para inferir
com nenhuma segurana a monofilia dos trs domnios, com a possvel excesso de
Eukarya. Entretanto, se considerarmos cada um deles como grupos monofilticos, algo
que pode ser contestado com relativa facilidade, h solues alternativas. Cada uma
delas amparada por diferentes fontes de informao:
(1) ((Archaea + Eukarya) Bacteria) suportado pela anlise individual dos
genes alginosuccinato sintetase, aspartil-tRNA sintetase, ATPase subunidade , ATPase
subunidade , fator de alongamento 1 /Tu, fator de alongamento G/2, 60-kDa protenas
de choque trmico (HSP60), isoleucil-tRNA sintetase, protenas ribossomais (18),
_______________________________________________________Consideraes iniciais
15
subunidade A da RNA polimerase, subunidade B da RNA polimerase, componente de
membrana SecY, triptofanil-tRNA sintetase, tirosil-tRNA sintetase;
(2) ((Bacteria + Archaea) Eukarya) suportado pela anlise individual dos
genes acido aminolevulnico desidratase (ALADH), citrato sintetase,
fosforibosilformilglicinamidina sintetase, glutamato desidrogenase, protenas
ribossomais e antranilato fosforibosil transferase (trp)D;
(3) ((Bacteria + Eukarya) Archaea) suportado por estudos de enolase,
FeMn superoxido dismutase, gliceraldedo-3-fosfato desidrogenase (GAPDH), his B, 3-
Fosfoglicerato kinase, proC e trpB;
(4) (Bacteria + Archaea + Eukarya) suportado por acetil-coenzima A
sintetase, glu-tRNA redutase, diidrofosfalato redutase, his D e H, fotoliase e trpA, C, E
e G.
Apesar da grande disponibilidade de caracteres, todos os seres vivos so
inseridos na anlise evolutiva dos trs domnios como grupo interno, tornando
tecnicamente impossvel o enraizamento das rvores filogenticas nesses estudos
utilizando grupos mais externos (Brinkmann & Philippe, 1999). A alternativa
metodolgica baseada no uso de protenas parlogas cuja duplicao acredita-se ter
ocorrido anteriormente ao incio da diversificao dos organismos atuais, ou seja,
estavam presentes no organismo ancestral a esses trs domnios (LUCA).
Historicamente, Iwabe et al. (1989) estudou os fatores de alongamento de
traduo EF-Tu/1 -EF-G/2 e postulou um maior relacionamento filogentico entre
Archaea e Eukarya do que qualquer um desses com bactria. Esses autores tambm
embasaram sua proposta em estudos anteriores, como os de Hori & Osawa (1987 e
1979). Apesar da anlise dos fatores de alongamento ter sido criticada pelo seu tamanho
limitado de regies homlogas, erros de alinhamento e amostragem taxonmica
_______________________________________________________Consideraes iniciais
16
inadequada, Baldauf et al. (1996) corroboraram esses resultados re-analisando esses
mesmos fatores, porm considerando seqncias mais longas e, em seu conjunto, mais
representativas. Nesse mesmo ano, Gogarten et al., (1989a e b) trabalharam com as
ATPases do tipo V e F e propuseram, igualmente, um maior relacionamento entre
Archaea e Eukarya. As filogenias geradas a partir dos genes duplicados EF e ATPases
sofreram contestaes, especialmente quando descobriram a existncia de ATPases tipo
V, previamente conhecida apenas em Archaea, em algumas espcies de Bacteria
(Tsutsumi et al., 1991 e Kakinuma et al., 1991) e a presena do gene ATPases-F1
subunidade- em Methanosacrina barkeri, taxonomicamente posicionado dentro de
Archaea (Sumi et al., 1992).
A maioria dos estudos publicados at o momento, de fato, aponta para um maior
parentesco entre Archaea e Eukarya, sendo Bacteria grupo irmo de ambos. Essa
opinio aparentemente est embasada muito mais em observaes informais do que em
estudos filogenticos per se (p.ex., Olsen & Woese, 1996). Entretanto, mesmo sem o
desejado rigor metodolgico, a hiptese de monofilia de (Archaea + Eukarya) parece
concreta (p.ex., Iwabe et al., 1989; Gogarten et al., 1989a e b; Brown e Doolittle, 1995;
Baldauf et al., 1996; Lawson et al, 1996; Brown et al., 1997; Gribaldo & Cammarano,
1998), mas carece de hipteses filogenticas mais robustas demonstrando esse arranjo.
O estudo de novos grupos moleculares, parlogos ou no, poder contribuir
aumentando a robustez ou falseando essas hipteses. Um grupo interessante a ser
estudado um conjunto de enzimas existentes nos trs domnios, chamadas
glicosidases. Essas enzimas, vitais para o funcionamento biolgico, so classificadas
como compondo um grupo de protenas homlogas. Dentro desse grupo, as xilanases,
enzimas de crescente interesse econmico, tambm constituem nosso grupo de
_______________________________________________________Consideraes iniciais
17
interesse. Uma reanlise dos fatores de alongamento, com considervel aumento na
amostragem taxonmica igualmente parte deste estudo.
Captulo I
Estudo das glicosidases
______________________________________________________Estudo das Glicosidases
19
INTRODUO
O grupo de molculas qumica e biologicamente denominado enzimas possui vrias
propostas classificatrias utilizadas na literatura, cada qual com suas vantagens e
desvantagens. A classificao enzimtica proposta em 1964 estabelecida pelo IUBMB
(International Union of Biochemistry and Molecular Biology)
(www.chem.qmul.ac.uk/iubmb/enzyme/index.html) baseada na especificidade de
substrato, uma caracterizao fentica. Para as glicosidases ou glicosil-hidrolases (EC
3.2.1.x), por exemplo, o primeiro dgito indica uma hidrolase, o segundo dgito indica uma
glicosilase e o terceiro indica que a enzima hidrolisa compostos glicosdicos O e S. O ltimo
dgito indica o substrato e, em alguns casos, indica o mecanismo molecular ou tipo de
ligao (ex., -1,4, -1,3, etc.) da enzima. Embora essa classificao no seja adequada para
enzimas com ampla especificidade, ela importante, pois foi criada para evitar
ambigidades como: diferentes enzimas receberem o mesmo nome e enzimas iguais
receberem nomes diferentes. Adicionalmente, evita nomes que reflitam pouco ou nada da
natureza da reao catalisada.
As desvantagens dessa classificao recaem no fato de no acomodarem de forma
adequada e no ambgua as enzimas que possuem dois ou mais substratos de ao, realidade
comum para as glicosidases, por exemplo. Falha tambm em refletir as estruturas tercirias,
que se tornam cada vez mais vastas na literatura. Classifica ainda enzimas, como
myrosinase, que hidroliza uma srie de S-glucosdeos, sob o cdigo EC 3.2.3.1
(thioglucosidase) ainda que possua seqncia aminoacdica, mecanismo molecular e
estrutura terciria muito similar a O--glucosidase, assinalada sob outro cdigo enzimtico,
EC 3.2.1.21. Ainda sob o mesmo aspecto, algumas enzimas no relacionadas
estruturalmente possuem o mesmo substrato de ao e podem ser classificadas sob o mesmo
cdigo de EC. As endoglucanases (EC 3.2.1.4), por exemplo, oferecem uma ampla
http://www.chem.qmul.ac.uk/iubmb/enzyme/index.html
______________________________________________________Estudo das Glicosidases
20
variedade de conformaes tercirias possveis e encontradas naturalmente barris (/)
clssicos e distorcidos, barris , jelly rolls e barris (/)6 (Henrissat & Davies, 1997). Essa
caracterstica demonstra que enzimas com possvel relacionamento filogentico bastante
distante podem, de acordo com essa classificao, ser assinaladas a um mesmo cdigo
enzimtico. Essa classificao, portanto, no reflete a histria evolutiva dessas enzimas,
resultando em agrupamentos artificiais.
Historicamente, a classificao das glicosidases dentro de um contexto evolutivo tem
sido complicada e encontra-se longe de refletir preceitos cladsticos. Henrissat (1991),
assumindo homologia para o grupo das glicosidases realizou uma anlise de similaridade,
isto , fentica, das seqncias proticas desse grupo e incluiu as ciclodextrin
glucanotransferases devido similaridade existente com as -amilases (Hofmann et al.,
1989 e Farber & Petsko, 1990). Um total de 301 seqncias tiveram seus domnios
analisados e os agrupamentos resultantes foram denominados famlias. Trinta e cinco
famlias foram criadas para acomodarem os agrupamentos de seqncias gerados.
Entretanto, no ficou claro como e sob quais critrios as anlises foram feitas, desde os
cortes para extrao dos domnios, passando por alinhamento e reconstruo da topologia.
Posteriormente, com o crescimento constante do nmero de seqncias existentes, novas
anlises foram realizadas por Henrissat & Bairoch (1993), Henrissat & Romeu (1995),
Henrissat & Bairoch (1996), Torronen et al. (1993a e b), Henrissat & Bairoch (1996),
Henrissat (1998), Henrissat & Davies (2000), Henrissat & Coutinho (2001), Bourne &
Henrissat (2001) e Stam et al. (2005) aumentando o nmero de famlias. Para acomodar os
dados de seqncias que se acumulam, Coutinho (1999) e colaboradores implementaram um
endereo web no qual todas as hidrolases esto classificadas em famlias
(www.cazy.org/CAZY/). Ao longo dos ltimos quatro anos de anlises extraindo dados e
consultando este endereo web percebemos que o mesmo sofreu vrias alteraes. Famlias
http://www.cazy.org/CAZY/
______________________________________________________Estudo das Glicosidases
21
que antes englobavam algumas seqncias hoje no englobam mais. Como exemplo,
podemos citar o grupo das xilanases, que no incio estavam presentes nas famlias 5, 8, 10,
11, 16, 43 e 62; Atualmente, as famlias 16 e 62 no tm mais seqncias dessas enzimas.
Infelizmente, os parmetros de anlise e procedimentos metodolgicos utilizados para sua
classificao ou alteraes no esto disponveis no endereo web ou em qualquer de seus
trabalhos anteriores (como Henrissat & Bairoch, 1993; Henrissat & Romeu, 1995 e
Henrissat & Bairoch, 1996). A Tabela I mostra a classificao atual das hidrolases de acordo
com a famlia a que pertencem. Ainda, algumas dessas famlias, que atualmente, vo de 1 a
114 possuem enzimas que no so hidrolases assinaladas a elas. Como exemplo, podemos
citar a famlia 16, que possui as seguintes enzimas: xiloglucosiltransferase (EC 2.4.1.207);
keratano-sulfato endo-1,4- -galactosidase (EC 3.2.1.103); endo-1,3- -glucanase (EC
3.2.1.39); endo-1,3(4)- -glucanase (EC 3.2.1.6); licheninase (EC 3.2.1.73); -agarase (EC
3.2.1.81); -carrageenase (EC 3.2.1.83); xyloglucanase (EC 3.2.1.151).
De acordo com essa proposta de classificao, algumas famlias, por possurem
enzimas cujas seqncias aminoacdicas e conformaes tridimensionais muito similares
entre si, foram agrupadas formando cls. Os cls das glycosyl-hydrolases foram nomeados
pelas iniciais CGH ou somente GH, seguidos de letras do alfabeto de A a N. Portanto, 14
cls foram criados e cada um abriga duas ou mais das atuais 110 famlias existentes (Tabela
II).
As famlias que no esto inseridas em nenhum cl, portanto, so nicas e no
possuem similaridade primria (seqncias de aminocidos) e nem estrutural suficientes
para que fossem agrupadas com qualquer outra famlia. Todas as seqncias de um mesmo
cl exibem a mesma estrutura terciria, o que corrobora a idia de que conformaes
estruturais so mais conservadas do que a seqncia primria das enzimas em geral e,
http://us.expasy.org/cgi-bin/nicezyme.pl?2.4.1.207http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.103http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.39http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.6http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.73http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.81http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.83http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.151
______________________________________________________Estudo das Glicosidases
22
portanto, carregam considervel informao evolutiva (Jansen, 2001; Mirny & Gelfand,
2002). Entretanto, essa abordagem ainda subjetiva, pois a ausncia de uma descrio
______________________________________________________Estudo das Glicosidases
23
do protocolo analtico obscurece as bases desses agrupamentos. Isso permite procedimentos
subjetivos resultando em classes artificiais.
Um outro critrio de classificao dessas enzimas quanto a seu mecanismo de
ao. Glicosidases podem agir basicamente de duas formas. A primeira quando h uma
reteno da configurao do carbono anomrico do anel do acar sofrendo catlise. A outra
quando h uma inverso dessa configurao anomrica. Claramente, como apenas duas
possibilidades existem, no h razo para fazer da estequiometria enzimtica uma base nica
para sua classificao. Entretanto, um agrupamento que consiga refletir esses mecanismos
auxiliaria na predio de reaes laterais, como a transglicosilao, catalizada por enzimas
de reteno (isto , retm a configurao do carbono anomrico).
Uma outra classificao denota se a enzima ataca os terminais (exo) do
polissacardeo ou a regio interna (endo) da cadeia (Sabini et al., 1999). De acordo com
Henrissat & Davies (1997), os resduos catalticos dessas enzimas podem ser encontrados
em trs regies diferentes denominadas por esses autores: bolso (pocket), fissura (cleft)
e tnel (tunnel). Se a enzima possui seus resduos catalticos na regio denominada bolso,
ento, so denominadas verdadeiras enzimas exo. J as que possuem seus resduos
catalticos na regio da fissura so denominadas verdadeiras enzimas endo. Essa
configurao permite a ligao randmica e ao da enzima na parte interna da cadeia
______________________________________________________Estudo das Glicosidases
24
polimrica. Para enzimas que degradam polissacardeos fibrosos com muito poucos
terminais da cadeia expostos, como o caso da celulose, por exemplo, o melhor
desempenho realizar mltiplos ataques, muitos eventos hidrolticos, sem que ocorra o
desligamento com a cadeia polissacardica. Superficialmente, existe uma diferena
acentuada entre endo e exo-glicosidases, porm, na prtica, a distino desses dois diferentes
estados prova ser difcil de designar, com muitas enzimas aparentemente possuindo um
estado intermedirio, como o caso das enzimas de ataque mltiplo (Thompson, et a.l,
1999).
Tomando esse conjunto de classificaes em grande medida, cabe a questo da
homologia das glicosidases. O conhecimento das relaes filogenticas das glicosidases em
geral seria importante, pois permitiria uma busca eficiente por clados que compartilham
caractersticas de interesse comum, como econmico, por exemplo (Polizeli et al., 2005).
Conseqentemente, uma classificao que reflita a histria evolutiva dessas enzimas
proveria informaes valiosas a uma ampla rea do conhecimento. Este trabalho tem como
objetivo propor uma hiptese filogentica para o grupo das glicosidases partindo da
premissa essencial para anlises filogenticas, de que este grupo de enzimas estritamente
homlogo.
______________________________________________________Estudo das Glicosidases
25
MATERIAL E MTODOS
Existem vrios bancos de dados eletrnicos abrigando diferentes conjuntos genmicos
e proticos incluindo grupos enzimticos. Dentre os utilizados para este estudo, esto
BRENDA (http://www.brenda-enzymes.info/), CAZY (http://www.cazy.org), UniProt
(http://expasy.org/sprot/) e GenBank (www.ncbi.nlm.nih.gov). As seqncias proticas
includas no grupo das glicosilases somam 7.258 em Agosto de 2006 de acordo com o site
BRENDA. Antes de delimitarmos um conjunto representativo desse total existente, foi
realizado um estudo mais detalhado de algumas seqencias pertencentes a esse grande grupo
de enzimas.
Conjuntos aleatrios de seqencias foram estudados quanto s conformaes
primrias, resduos que compem domnios e stios ativos. Um desses conjuntos era
composto pelas enzimas alfa-amilases em Pyrococcus furiosus DSM 3638, beta-
galactosidase em Pyrococcus woesei, betaxilosidase e alfa-L-arabinosidase em Sulfolobus
solfataricus P2, quitinase em Thermococcus kodakaraensis KOD1 e glucoamilase em
Methanococcus jannaschii. As informaes pertinentes a essas seqencias e s de todos os
outros grupos analisados por este estudo foram extradas dos sites supracitados. Algumas
tentativas de estabelecimento de homologia primria foram efetuadas por meio de
alinhamentos dessas seqencias. Somente as regies correspondentes aos domnios foram
utilizadas. Para os cortes dos domnios, utilizamos o software BioEdit (Hall, 1999) e as
informaes contidas no site UNIPROT (www.uniprot.org). Aps todos os domnios terem
sido separados, eles foram submetidos a um protocolo de alinhamento no software ClustalW
implementado em BioEdit (Hall, op. Cit.). O software POY3 (Wheeler, 2003), que uma
alternativa de alinhamento por parcimnia, no analisa diretamente seqncias
aminoacdicas. Assim, as seqncias devem ser extradas no formato de nucleotdeos e deve
http://www.cazy.org/geno/186497.htmlhttp://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/2190.html
______________________________________________________Estudo das Glicosidases
26
ser feita a delimitao do cdigo iniciador com as informaes contidas em UNIPROT.
Posteriormente, o smbolo # deve ser inserido de forma a separar cada cdon. Assim, o
POY entende os trs pares de base de um cdon como sendo um carter. A questo
metodolgica intrigante nesse ponto quando pensamos nas substituies sinnimas. O
POY trata essas como substituies ordinrias. Entretanto, esse recurso metodolgico a
nica forma de utilizarmos o POY para seqncias aminoacdicas.
______________________________________________________Estudo das Glicosidases
27
RESULTADOS
Na Figura 1, podemos ver uma ilustrao esquemtica das protenas utilizadas em um
dos grupos de seqncias analisadas neste estudo. O resultado dos grficos e do estudo
estabelecidos para as enzimas alpha-amilase em Pyrococcus furiosus DSM 3638, beta-
galactosidase em Pyrococcus woesei, beta xylosidase e alpha-L-arabinosidase em
Sulfolobus solfataricus P2, chitinase em Thermococcus kodakaraensis KOD1 e
glucoamilase em Methanococcus jannaschii gerou um conjunto de informaes que nos
permite discutir homologia dentro do contexto das glicosidases. A protena de Pyrococcus
furiosus (cdigo Cazy - Q8TZP8) com domnio alfa-amilase (glicosidase) classificada
como EC 3.2.1.1 de acordo com Brenda e essa protena encontra-se dentro da famlia 13 do
Clan GHH de acordo com Cazy. Outros nomes que essa enzima pode receber so
glucogenase, endoamilase, Taka-amilase A, 1,4--D-glucan glucanohidrolase e
neopullulanase. Seus limites de domnio so estabelecidos nos aminocidos 211 e 577,
estando os stios ativos localizados nos resduos D411, E426 e D502.
A protena de Pyrococcus woesei (cdigo Cazy O52629) com domnio beta-
galactosidase (glicosidase) classificada como EC 3.2.1.23 de acordo com Brenda e, apesar
de essas protenas em geral estarem classificadas dentro de quatro famlias diferentes de
glicosidases, essa especficamente encontra-se dentro do grupo da famlia 1 do Clan GHA.
Outros nomes que esta enzima pode receber so exo-1,4-beta-D-galactanase e lactase. Seus
limites de domnio so estabelecidos nos aminocidos 1 e 510, estando os stios ativos
localizados nos resduos E210 e E414.
As protenas de Sulfolobus sulfataricus (cdigo Cazy Q97UI4) com domnios beta
xilosidase (glicosidase) classificada como EC 3.2.1.37 e alfa-L-arabinosidase (glicosidase)
classificada como EC 3.2.1.55 esto inseridas na famlia 3 e no pertencem a nenhum Cl.
http://www.cazy.org/geno/186497.htmlhttp://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/2190.html
______________________________________________________Estudo das Glicosidases
28
Seus limites de domnio so estabelecidos nos aminocidos 76 e 301 e tambm nos resduos
372 e 620, respectivamente, estando os stios ativos localizados nos resduos D161 e D267.
A protena de Thermococcus kodakaraensis (cdigo Cazy Q9UWR7) com domnio
chitinase (glicosidase) classificada como EC 3.2.1.14 de acordo com Brenda e, apesar das
protenas assinaladas a esse cdigo estarem classificadas dentro de trs famlias diferentes
de glicosidases, essa em especfico encontra-se dentro do grupo da famlia 18 do Cl GHK.
Seus limites de domnio so estabelecidos nos aminocidos 175 e 528. O stio ativo,
curiosamente, encontra-se na posio E1024, isto , fora do domnio da protena. A protena
de Methanococcus jannaschii (cdigo Cazy Q59005) com domnio glucoamilase
(glicosidase) classificada como EC 3.2.1.3 de acordo com Brenda e encontra-se dentro do
grupo da famlia 15 do Cl GHL. Seus limites de domnio so estabelecidos nos
aminocidos 262 e 607. Os stios ativos esto localizados nos resduos D403 e D406.
Pyrococcus furiosus DSM 3638 (Cazy - Q8TZP8) EC 3.2.1.1 (alpha-amilase)
Pyrococcus woesei (Cazy O52629) EC 3.2.1.23 (beta-galactosidase)
Sulfolobus solfataricus P2 (Cazy Q97UI4) EC 3.2.1.37 (beta xylosidase) e EC 3.2.1.55 (alpha-L-
arabinosidase)
http://www.cazy.org/geno/2190.htmlhttp://www.cazy.org/geno/186497.htmlhttp://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.html
______________________________________________________Estudo das Glicosidases
29
Thermococcus kodakaraensis KOD1 (Cazy Q9UWR7) EC 3.2.1.14 (chitinase)
Methanococcus jannaschii (Cazy Q59005) EC 3.2.1.3 (glucoamilase)
Figura 1. Desenho esquemtico de seis enzimas pertencentes a cinco organismos diferentes do domnio
Archaea, classificadas como glicosidases: Pyrococcus furiosus EC 3.2.1.1 (alpha-amylase), Pyrococcus woesei
EC 3.2.1.23 (beta-galactosidase), Sulfolobus solfataricus P2 EC 3.2.1.37 (beta xylosidase) e EC 3.2.1.55
(alpha-L-arabinosidase), Thermococcus kodakaraensis KOD1 EC 3.2.1.74 (chitinase), Methanococcus
jannaschii EC 3.2.1.3 (glucoamilase).
O alinhamento resultante da anlise desse grupo de seqencias foi extremamente
pobre no estabelecimento de homologias primrias. Como podemos observar na figura 2,
grande parte das estruturas primrias das protenas no possuem regies ou resduos
homlogos nas outras do grupo estudado.
Por outro lado, o resultado da verificao quanto distribuio dessas glicosidases
nos organismos nos possibilitou verificar a existncia de muitos domnios enzimticos
diferentes de glicosidases em um nico genoma, como em Pyrococcus furiosus (Figura 3),
por exemplo.
A protena beta-galactosidase (Figura 3J), encontra-se classificada dentro da famlia
35 pelo site cazy, porm, quando acessamos links auxiliares, como o Pfam, para a deteco
dos domnios, verificamos que ambos os domnios existentes na seqncia protica so
designados como pertencentes famlia 42. Esse tipo de incongruncia de informaes no
incomum. Notamos ainda a presena de duas protenas beta-galactosidases, indicando
http://www.cazy.org/geno/2190.htmlhttp://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/2190.htmlhttp://www.cazy.org/geno/2190.htmlhttp://www.cazy.org/geno/2190.html
______________________________________________________Estudo das Glicosidases
30
paralogia ou evoluo convergente. A mesma observao estende-se para todas as protenas
da Figura 3 quando consideramos o grupo das glicosidases.
Figura 2. Alinhamento realizado em Clustal W das seqncias aminoacdicas referentes aos domnios das
protenas glicosidases: Pyrococcus furiosus EC 3.2.1.1 (alfa-amilase), Pyrococcus woesei EC 3.2.1.23 (beta-
galactosidase), Sulfolobus solfataricus P2 EC 3.2.1.37 (betaxilosidase) e EC 3.2.1.55 (alfa-L-arabinosidase),
Thermococcus kodakaraensis KOD1 EC 3.2.1.74 (quitinase), Methanococcus jannaschii EC 3.2.1.3
(glucoamilase).
a) Pyrococcus furiosus (cdigo Cazy Q9HHB3) beta-glucosidase (famlia 1)
b) Pyrococcus furiosus (cdigo Cazy Q8U3U9) beta-galactosidase (famlia 1)
c) Pyrococcus furiosus (cdigo Cazy Q51723) beta-glucosidase (famlia 1)
http://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/2190.html
______________________________________________________Estudo das Glicosidases
31
d) Pyrococcus furiosus (cdigo Cazy Q51733) beta-mannosidase (famlia 1)
e) Pyrococcus furiosus (cdigo Cazy - - - ) (famlia 5)
Nome da protena e cdigo Cazy no disponveis
Cdigo Genbank AAM56798.1
f) Pyrococcus furiosus (cdigo Cazy Q9V2T0 ) - endoglucanase (famlia 12)
g) Pyrococcus furiosus (cdigo Cazy Q8U3I9) - alfa-amilase (famlia 13)
h) Pyrococcus furiosus (cdigo Cazy O73951) beta-glucanase (famlia 16)
i) Pyrococcus furiosus (cdigo Cazy Q8U1H4) quitinase (famlia 18)
j) Pyrococcus furiosus (cdigo Cazy Q8U3U2) beta-galactosidase (famlia 35)
Figura 3. Desenhos esquemticos das seqncias proticas enzimticas de glicosidases encontradas em
Pyrococcus furiosus (Archaea).
Glyco_hydro 18
Glyco_hydro 12
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=protein&val=AAM56798.1
______________________________________________________Estudo das Glicosidases
32
DISCUSSO
O grupo de seqncias cujo resultado de alinhamento demonstramos aqui apenas
um dos muitos grupos abordados por este estudo. A representatividade necessria s seria
acessada se muitos grupos com arranjos diferentes de seqncias fossem estudados. Apenas
um grupo exemplificado para basearmos nossa discusso porque os resultados obtidos da
anlise so semelhantes e relevantes. Os programas computacionais de alinhamento, em
geral, mostraram-se incapazes de gerar qualquer alinhamento confivel. Os resultados de
alinhamentos das seqncias pelo POY e ClustalW foram igualmente pobres no sentido de
estabelecer regies homlogas. Ainda que haja um protocolo computacional de alinhamento,
as limitaes atuais de velocidade computacional e de desenvolvimento de algoritmos obriga
a anlise visual do alinhamento resultante por parte do pesquisador para verificar se
realmente existem regies homlogas. Mesmo quando POY utilizado, com alinhamento e
reconstruo filogentica atravs de iluminao recproca, o alinhamento implcito deve ser
igualmente analisado. Esse tipo de anlise est demonstrada na Figura 2, na qual podemos
perceber a inexistncia de regies homlogas.
Philippe & Laurent (1998) apontaram para o problema de analisarmos
filogeneticamente organismos distantes. A evoluo tendo acontecido dentro de um perodo
longo de tempo resultaria em inmeras regies saturadas nas seqncias moleculares. Esse
processo causa a perda do sinal filogentico, incorrendo em resultados esprios, ainda que
em molculas ortlogas. Essas modificaes podem ser to intensas que impossibilitam o
estabelecimento de regies homlogas suficientes para reconstruirmos a histria evolutiva.
Em nossos dados, no entanto, essa explicao nem mesmo parece plausvel. Organismos de
apenas 1 domnio Archaea foram analisados. Ao incluirmos outras enzimas ainda do
grupo das glicosidases e dos mesmos organismos porm com os outros cdigos (EC)
______________________________________________________Estudo das Glicosidases
33
semelhantes aos j existentes na anlise altera o grau de similaridade dos dados e promove o
aparecimento de regies homlogas aparentes.
Estes resultados corroboram a hiptese de que grupos menores dentro das
glicosidases classificados pelo ltimo nmero do cdigo enzimtico podem ser homlogos
com algum grau de diferena, mas ainda assim com alguma histria evolutiva em comum.
Entretanto, o grupo das glicosidases parece incluir grupos enzimticos evolutivamente muito
distantemente relacionados, com possvel aparecimento independente no LUCA j que no
h qualquer grau de similaridade entre as glicosidases de ECs diferentes nem mesmo dentro
de um mesmo domnio de organismos. Outra possibilidade, a despeito de sua classificao
como enzimas dentro da mesma classe geral, que elas seriam enzimas xenlogas.
Ao verificarmos a distribuio dessas protenas nos organismos em geral,
percebemos que muitos organismos possuem inmeras glicosidases em seus genomas. Esse
fato, esperado e bvio, denota uma possvel paralogia das seqncias dentro de cada
subgrupo enzimtico, alm de alguma possibilidade de xenologia mesmo nesses grupos.
Ademais, tambm observado que em muitas espcies h dois ou mais domnios idnticos
de uma determinada protena em seu genoma. Isso aponta para a existncia de duplicao ou
multiplicao gnica recente e, portanto, algum nvel de paralogia.
A concluso de que h mltiplas paralogias dentre as enzimas classificadas como
glicosidases, ou por que no sugerir o mltiplo aparecimento independente deste tipo de
protena ao longo da evoluo? - resulta na impossibilidade de reconstrues evolutivas
utilizando essas protenas sem que seja refeita uma classificao que reconhea famlias
estritamente ortlogas. Anlises filogenticas, nessa situao, ficam restritas apenas a grupos
menores dentro do grupo das glicosidases, em que haja corroborao que se esteja lidando
com ortologia. Ademais, estudos considerando eventos de transferncia horizontal podem
elucidar a origem de determinadas molculas nos organismos e ajudar o estabelecimento de
______________________________________________________Estudo das Glicosidases
34
uma hiptese filogentica promovendo explicaes que saem do padro dicotmico e
entrelaam os eventos evolutivos resultando em um cenrio evolutivo mais em forma de
rede do que de rvore (Huang & Gogarten, 2006).
Este trabalho mostra, portanto, que a classificao das hidrolases glicosdicas,
precisa sofrer alteraes substanciais para que tenha um carter evolutivo e no apenas
artificial. Uma primeira anlise de grupos menores assinalados a um mesmo cdigo
enzimtico necessria para identificar grupos homlogos menores, para gradualmente
expandir a anlise e incluir grupos mais abrangentes. No grupo enzimtico das Glicosidases
no esto necessariamente relacionados enzimas homlogas. Ainda que quimicamente a
classificao seja til (Hennig, 1966), as glicosidases no compem uma unidade homloga
ou evolutiva.
Captulo II
Estudo das Xilanases
________________________________________________________Estudo das Xilanases
36
INTRODUO
Dentre as glicosidases, que em geral englobam grupos no homlogos de
protenas, as xilanases compem um grupo de interesse para estudos evolutivos e em
biotecnologia. Anlises filogenticas dessas enzimas facilitaro estudos mais
abrangentes considerando o grande grupo das glicosidases. As xilanases so enzimas
assinaladas sob o cdigo EC 3.2.1.8 e j foram relatadas como existentes em Bacteria e
Eukarya (Ito, 1992, Whitehead, 1995; Hernandez et al., 2001; Sasaki et al., 2002 e
Ciaffi et al., 2005, dentre inmeros outros). Essas enzimas poderiam, apesar de nunca
terem sido relatadas em Archaea, oferecer maiores subsdios informativos para a
elucidao da filogenia basal dos Eukarya. Em princpio, elas deveriam ao menos
separar completamente os organismos pertencentes a cada um destes domnios.
A biomassa vegetal compe uma extensa fonte renovvel que, alm do
importante papel na nutrio herbvora, tambm possui um enorme potencial em servir
como matria prima para processos industriais e, conseqentemente, produo de massa
orgnica, produtos qumicos especficos e biocombustvel (Gilbert & Hazlewood,
1991). Enzimas que degradam a biomassa produzidas tanto por procariotos (bactrias e
archaeas), quanto por eucariotos (fungos, vegetais, nematdeos dentre outros),
representam o meio pelo qual a maior parte da energia e do carbono nela contidos
liberada. Atualmente, a identificao de bons produtores dessas enzimas (ou de algumas
seqncias especficas dessas enzimas) importante para acessarmos organismos que
podem tomar parte em processos industriais em larga escala.
Os maiores componentes das paredes celulares vegetais so hemicelulose
(glucans, mannans, xilans dentre outros), celulose (fibras insolveis de B-1,4-glucan) e
lignina (uma estrutura polifenica complexa) (Demeyer, 1981). Dentre esses materiais
________________________________________________________Estudo das Xilanases
37
hemicelulosdicos, a xilana geralmente o componente encontrado em maior
abundncia, alm de ser a segunda mais extensa fonte de recursos renovveis, com alto
potencial para degradao e conseqente produo de compostos finais teis (Kulkarni
et al., 1999). As enzimas que decompem a xilana so, em geral, denominadas
xilanases que so includas em uma classe maior de enzimas chamada de glicosidases,
grupo de enzimas amplamente distribudo que em geral hidrolisa a ligao glicosdica
entre dois ou mais carbohidratos ou entre um carbohidrato e uma outra poro
molecular que no consiste em um carbohidrato. As xilanases foram primeiramente
descobertas por Whistler e Masck (1955) e nomeadas pentosanases, mas s foram
reconhecidas pela Unio Internacional de Bioqumica e Biologia Molecular (IUBMB)
em 1961, tendo sido assinaladas sob o cdigo EC 3.2.1.8 (Collins et al., 2005).
Atualmente, seu nome oficial 1,4- -xilanase, mas vrios outros termos sinnimos
podem ser encontrados, como xilanase, endoxilanase, 1,4- -D-xilana-xilanohidrolase,
endo-1,4- -D-xilanase, -1,4-xilanase e -xilanase.
As xilanases catalisam a endohidrlise das ligaes 1,4- -D xilosdicas da xilana
e, portanto, esto envolvidas com a produo de xilose, monmero que constitui a maior
fonte primria de carbono para o metabolismo celular de organismos patgenos vegetais
(Collins et al., 2005). Muitas vezes denominadas enzimas do complexo xilanoltico ou
simplesmente xilanases e causadoras de certa confuso de nomenclatura (Sapag, 2002).
Contudo, necessrio notar que h outras enzimas que possuem papel fundamental no
processo de degradao da xilana. Isto ocorre porque a hemicelulose , na verdade,
um composto heterogneo, constitudo por monossacardeos em diferentes propores,
como D-xilose, D-mannose, D-glucose, L-arabinose, D-galactose, D-cido glucornico
e D-cido galacturnico. Quando o polmero hidrolizado e o monmero que compem
o produto da hidrlise a D-xilose, ento, a hemicelulose em questo denominada
________________________________________________________Estudo das Xilanases
38
xilana e a enzima responsvel pela liberao da D-xilose a xilanase. Sendo assim, o
que nomeia a hemicelulose a principal unidade de acar encontrada aps a hidrlise
(Polizeli et al., 2005).
Na natureza, raro encontrarmos hemiceluloses compostas de apenas um tipo de
monmero de acar. A maioria das hemiceluloses composta por dois ou mais
monmeros, recebendo nomes como xiloglucano (D-xilose + D-glucose), arabinoxilana
(L-arabinose + D-xilose), glucuronoxilana (D-cido glucornico + D-xilan) e
glucuronoarabinoxilana (D-cido glucornico + L-arabinose + D-xilan) dentre outros
(Shallom & Shoham, 2003). Dessa forma, xilanase o nome dado para as enzimas que
degradam a poro da xilana composta apenas por monmeros de D-xilose. O conjunto
completo de enzimas que degradam todas as partes da xilana denominado enzimas do
complexo xilanoltico.
Conseqentemente, dada a imensa complexidade e heterogeneidade da xilana,
esta requer um grupo de vrias enzimas atuando para que sua degradao ocorra (Biely,
1985 e Subramaniyan & Prema, 2002). Enquanto a xilanase (EC 3.2.1.8) cliva
randomicamente o esqueleto estrutural da xilana, as -xilosidases (EC 3.2.1.37) clivam
ligaes liberando os monmeros de xilose dos terminais no redutores de xilo-
oligossacardeos e xilobiose. A remoo dos grupos laterias catalisada pelas -L-
arabinofuranosidases (EC 3.2.1.55), -D-glucoronidases (EC 3.2.1.139), acetilxilan
esterases (EC 3.1.1.72), cido ferlico esterases (EC 3.1.1.73) e cido p-cumrico
esterases (EC 3.1.1.-) (Collins et al., 2005).
Dentre as 114 famlias de glicosidases, as xilanases podem ser encontradas
em 6 diferentes famlias, de acordo com o site CAZY, e compondo cinco cls (CGH)
5 (CGH A), 8 (CGH M), 10 (CGH A), 11 (CGH C), 16 (CGH B) e 43 (CGH F). Essa
________________________________________________________Estudo das Xilanases
39
indicao inicial de falta de ortologia fornece subsdios para concluses relacionadas
evoluo independente de seqncias que se especializaramao longo do tempo
convergiram para atuarem sobre um mesmo substrato, nominalmente, a degradao da
xilana. Entretanto, a prpria artificialidade da classificao nos obriga a investigao
dessas relaes evolutivas mais a fundo com cuidados redobrados na constituio de
protocolos de anlises de bases efetivamente filogenticas de modo a reconhecer os
conjuntos de seqncias no-ortlogas.
Ainda na a classificao acima das glicosidases, as xilanases (EC 3.2.1.8) no
apenas esto distribudas em seis famlias, como tambm se encontram agrupadas com
outras enzimas, principalmente celulasess (EC 3.2.1.4), endo-1,3- -xilanase (EC
3.2.1.32), alph -L-arabinofuranosidases (EC 3.2.1.55), liqueninases (EC 3.2.1.73),
chitosanases (EC 3.2.1.132) e reducing-end-xylose releasing exo-oligoxilanases (EC
3.2.1.156), dentre outras. Existem basicamente muitos tipos de endoxilanases que j
foram purificadas e seqenciadas (Sunna & Antranikian, 1997), demonstrando, mesmo
dentro desse grupo relativamente restrito de enzimas uma imensa heterogeneidade, isto
disparidade evolutiva.
Cada uma das famlias de glicosidases caracterizada por estruturas e
mecanismos de ao prprios. Em uma anlise pr-cladstica, podemos identificar essas
diferenas entre xilanases mesmo dentro de uma mesma famlia. As xilanases das
famlias 10 e 11 tm sido mais extensivamente estudadas, o que no se aplica s
protenas das demais famlias com atividade xilanoltica. As xilanases da famlia 10
apresentam domnios catalticos com pesos moleculares maiores do que os da famlia 11
e uma conformao estrutural do tipo (/)8 (Harris et al., 1996), enquanto a famlia 11
apresenta uma conformao estrutural do tipo -jelly roll (Himmel et al., 1997), dentre
http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.4http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.32http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.55http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.73http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.132http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.156
________________________________________________________Estudo das Xilanases
40
outras caractersticas qumicas que as definem e diferenciam. Tambm sabido o fato
de que algumas xilanases possuem outros domnios, como celulase, por exemplo, ou
mais de um domnio cataltico xilanoltico (Trrnen & Rouvinen, 1997), tornando a
discusso mais complexa.
Mesmo na ausncia de um embasamento maior quanto s premissas existentes
em qualquer anlise filogentica, hipteses alternativas e conflitantes tm sido propostas
desde o trabalho pioneiro de Henrissat (1991) at o presente. Georis et al. (1999a)
seqenciaram uma xilanase S38 Xyll de Streptomyces sp. e compararam-na com mais
14 xilanases da famlia 11, deduzindo que os 27 resduos conservados entre as
seqncias, dentre os 190 existentes, eram suficientes para a inferncia de homologia,
(isto , ortologia), classificando-a na famlia 11. Essa nova seqncia no foi testada
dentro de um contexto mais geral entre as xilanases e os autores selecionaram apenas as
pores referentes aos domnios catalticos para minimizar o rudo da anlise, sem
indicar claramente os procedimentos utilizados para sua separao, resultando em
concluses frgeis e questionveis.
Mais recentemente, uma anlise abrangente das enzimas restritas famlia 11 foi
efetuada (Georis et al., 1999b). Sessenta e trs xilanases da famlia 11 foram includas
nessa anlise, resultando em uma topologia que separa bactrias gram-positivas,
negativas e fungos. Metodologicamente, os alinhamentos efetuados com algortimos de
mxima verossimilhana e posterior reconstruo da topologia sob parmetros de
distncia resultam em inconsistncia filosfica quanto aos procedimentos
metodolgicos utilizados e, portanto, baixa robusts nos resultados gerados. Ademais,
em nenhum desses estudos a homologia da famlia 11 foi testada, o que gera dvidas
________________________________________________________Estudo das Xilanases
41
quanto premissa fundamental de uma anlise filogentica, que a ortologia das
seqncias inseridas no grupo interno.
Outra caracterstica da anlise realizada por esses autores a presena de
xilanases diferentes provenientes de uma mesma espcie. Aspergillus awamori, por
exemplo, est representado na topologia no enraizada por trs diferentes xilanases
XynB, Xyn1 e Xyn3, sendo que Xyn1 e Xyn3 apresentam-se como grupos irmos e
XynB agrupa-se com outras xilanases de outras espcies de fungos. A incluso de vrias
xilanases de uma mesma espcie em uma anlise filogentica ser discutida em detalhes
mais adiante, porm, torna evidente o problema da falta de homologia. Finalmente, seus
resultados falharam em separar com eficincia os grupos Bacteria e Fungo (Figura 1).
Figura 1. rvore no enraizada da hiptese filogentica das xilanases familia 11 proposta por Georis et
al. (1999a). Os cdigos, origens microbianas e nmeros de acesso dos sites SWISS-PROT, Genbank or
Clado Fungo + Bacteria
XynB de Aspergillus
awamori
Xyn1 e Xyn3 de
Aspergillus awamori
________________________________________________________Estudo das Xilanases
42
PIR de 63 xilanases comparadas neste estudo so: Xyl1 aerca (Aeromonas cavia Xyl1; D32065), Xyl
ascpi (Ascochyta pisi Xyl; Z68891), XynB aspak (Aspergillus awamori XynB; P48824), Xyn1 aspak (A.
awamori Xyn1; P55328), Xyn3 aspak (A. awamori Xyn3; P33557), Xyn1 aspnd (Aspergillus nidulans
Xyn1; Z49892), Xyn1 aspng (Aspergillus niger Xyn1; A19535), Xyn2 aspng (A. niger Xyn2; P55330),
Xyn5 aspng (A. niger Xyn5; U39784), Xyn1 asptu (Aspergillus tubigensis Xyn1; P55331), XynA aurpu
(Aureobasidium pullulans XynA; U10298), Xyn aurpu (A. pullulans Xyn; patent US-5591619), XynA
bacci (B. circulans XynA; P09850), XynA bacpu (Bacillus pumilus XynA; X00660), BdX bacd3
(Bacillus strain D3; Patent FR-9101191), XynS bacya (Bacillus sp. YA-14 XynS; S48126), XynY bacya
(Bacillus sp. YA-335XynY; S51779), XynA bacst (Bacillus stearothermophilus XynA; P45705), XynA
bacsu (Bacillus subtilis XynA; P18429), XynD celfi (C. fimi XynD; P54865), XylA celmx (Cellvibrio
mixtus XylA; S52741), CgXA chagr (Chaetomium gracile CgXA; D49850), CgXB chagr (C. gracile
CgXB; D49581), XynA cloab (Clostridium acetobutylicum XynA; P17137), XynA closr (C. stercorarium
XynA; D13325), Xyl1 cocca (Cochliobolus carbonum Xyl1; Q06562), Xyl2 cocca (C. carbonum Xyl2;
U58915), Xyl3 cocca (C. carbonum Xyl3; U58916), Xyn crysp (Cryptococcus sp.S2 Xyn; D63382),
XynB dicth (Dictyoglomus thermophilum XynB; U76545), Xyn1 emeni (Emericella nidulans Xyn1;
P55332), Xyn2 emeni (E. nidulans Xyn2; P55333), XynC fibsu (Fibrobacter succinogenes XynC;
P35811), Xyn1 humin (Humicola insolens Xyn1; P55334), Xyl4 maggr (Magnaporthe grisea Xyl4;
L81127), Xyn2 maggr (M. grisea Xyn2; P55335), Xyn1 neofr (Neocallimastix frontalis Xyn1; S49528),
Xyn2 neofr (N. frontalis Xyn2; S48865), XynA neopa (Neocallimastix patriciarum XynA; P29127),
XynB penpu (Penicillium purpurogenum XynB; Z50050), XylF psefl (Pseudomonas fluorescens XylF;
S59633), XynA orpsp (Orpinomyces sp. XynA; U57819), XylA pirsp (Piromyces sp. XylA; X91858),
XynA rumal (Ruminococcus albus XynA; U43089), XylA rumfl (R. flavefasciens XylA; P29126), XylB
rumfl (R. flavefasciens XylB; S51592), XylD rumfl (R. flavefasciens XylD; A36910), Xyl1 rumsp
(Ruminococcus sp.Xyl1; Z49970), XynA schco (Schizophyllum commune XynA; P35809), XlnB strli (S.
lividans XlnB; P26515), XlnC strli (S. lividans XlnC; P26220), XlnC strec3 (Streptomyces sp. EC3 XlnC;
S47512), Xyn str36 (Streptomyces sp. No.36aXyn; E02180), Xyl1 str38 (Streptomyces sp. S38 Xyl1;
X98518), Stx2 strth (S. thermoviolaceus Stx-II; D85897), TfxA Thefu (T. fusca TfxA; U01242), XynA
thela (Thermomyces lanuginosus XynA; PDB entry 1YNA), Xyn triha (T. harzianum; P48793), Xyn1
trire (T. reesei Xyn1; P36218), Xyn2 trire (T. reesei Xyn2; U24191), Xy2a trivi (Trichoderma viride
Xyn2A; A44594), Xy2b trivi (T. viride Xyn2B; U44595), Xyn unktfu (Unknown fungus; A17518
patent EP 0463706-A).
Seguindo a mesma linha de raciocnio, apenas implementando anlise de fator
prvia ao alinhamento mltiplo das seqncias, Sapag et al. (2002) estudaram 82
xilanases da famlia 11 de organismos pertencentes a Bacteria e Eukarya. Esses autores
concluram que algumas xilanases bacterianas eram mais prximas a seqncias de
fungos do que a de outras bactrias. A inadequao de seu protocolo de anlise
filogentica provavelmente a maior responsvel pela baixa robustez de seus
resultados.
Degefu et al. (2004), por sua vez, estudaram 51 seqncias de xilanases de
fungos e bactrias tambm pertencentes famlia 11, utilizando um protocolo mais bem
elaborado, mas omisso em alguns pontos cruciais de uma anlise filogentica por
exemplo, os critrios para a separao das regies conservadas anteriores ao
alinhamento, parmetros de alinhamento utilizados etc. Suas anlises resultaram em
________________________________________________________Estudo das Xilanases
43
uma completa separao entre xilanases de fungos e bactrias e mostrou uma duplicao
gnica dentro de fungos (Figura 2). Esses autores, entretanto, concluram que o uso de
xilanases em interferncias filogenticas s vlido para txons mais derivados e
relacionados, ou seja, as xilanases no seriam capazes de recuperar com eficcia eventos
evolutivos muito basais. Essa viso, no entanto, contraditria com seus prprios
resultados, uma vez que a topologia obtida separa Fungo e Bacteria.
Os conceitos de homologia e similaridade esto relacionados, mas no so
idnticos ou bvios, o que torna complexa a tarefa de estabelecer homologia entre
molculas. Definies quanto aos tipos diferentes de homologia encontrados em nvel
molecular foram originalmente apresentadas por Walter Fitch em 1970 e recentemente
se tornaram objeto de intensa discusso em Biologia Evolutiva e Bioqumica (Koonin,
2001; Petsko, 2001; Jensen, 2001 e Gerlt & Babbitt, 2000). Similaridade molecular
uma medida do quanto duas seqncias, duas molculas ou dois genes correspondem
um ao outro, ao passo que homologia uma relao de duas seqncias gnicas quanto
a sua derivao de um mesmo ancestral comum mais recente entre as espcies que as
possuem. Homologia entre sequencias pode ser de trs tipos: homologia ortloga ou
ortologia, correspondente aos genes dos quais o ltimo ancestral comum divergiu em
duas linhagens de genes por meio de especiao; homologia parloga ou paralogia,
genes os quais divergiram por meio de duplicao intragenmica; e homologia
xenloga ou xenologia, na qual a relao de homologia surge por mecanismos de
transferncia gentica horizontal. Esta ltima considerada mais freqente entre
procariotos que em eucariotos; entretanto, devido ao menor nmero de seqncias
especficas existentes para eucariontes, essa viso poder ser modificada em um futuro
prximo.
________________________________________________________Estudo das Xilanases
44
Quando genes parlogos ou xenlogos erroneamente identificados so
erroneamente tomados como ortlogos, topologias profundamente equivocadas podem
surgir. Primeiramente, a prpria fonte de informao est equivocada. Alm disso, os
programas utilizados resultaro inevitavelmente em concluses indevidas tanto em
protocolos de alinhamento quanto de reconstruo filogentica. Na Figura 3-1 podemos
visualizar a filogenia dos grupos A, B e C gerada a partir da anlise dos genes parlogos
Y e Z. Supondo essa como a filogenia verdadeira para o grupo em questo, as
topologias geradas por dois genes distintos, mesmo quando analisados conjuntamente
(evidncia total), devem expressar a mesma histria evolutiva (Figura 3-2). Entretanto,
todas as duplas de seqncias parlogas existentes em cada organismo devem ser
consideradas, o que nem sempre possvel, j que a natureza parloga de um grupo de
seqncias nem sempre conhecida antes da anlise. Se, por um erro no processo desde
extrao at seqenciamento, j que algumas regies de genes parlogos mantem-se
extremamente conservadas, o iniciador identificar e genes parlogos forem
amplificados, como no exemplo AY, BY e CZ, ento, uma outra topologia ser gerada
(Figura 3-3) confundindo e alterando todas as discusses de processos evolutivos que
conduziram diversidade de espcies e de sequencias do grupo.
Ademais, muita ateno deve ser requerida na escolha dos fragmentos gnicos
que sero analisados. Muitos dos atuais bancos de dados moleculares disponveis
eletronicamente fornecem subsdios para que, em certas situaes, novas seqncias
sejam analisadas e identificadas quanto paralogia com certa coerncia. Entretanto,
algumas vezes a parlogia pode permanecer no identificada e, portanto de difcil
diagnstico, a priori, mas tende a ter seus efeitos minimizados dentro de um contexto
parcimonioso medida que mais caracteres so inseridos na anlise. Este cuidado na
escolha e detalhamento das caractersticas das seqncias so procedimentos ainda mais
________________________________________________________Estudo das Xilanases
45
importantes quando nos referimos seqncias codificadoras ou proticas per se. Isso
ocorre, porque o grau de complexidade dos detalhes a serem observados aumenta com
esse tipo de carter.
Durante a fase inicial de evoluo da vida, antes da formao dos clados hoje
conhecidos de bactrias, a duplicao gnica, dando origem a genes parlogos, foi de
importncia crucial para a diversificao enzimtica, aumentando a diversidade de
reaes catalizadas por essas protenas e, conseqentemente, conduzindo a um
significativo aumento do tamanho do genoma (Lazcano & Miller, 1994).
Adicionalmente, esses eventos de duplicao proveram material para o aparecimento de
novas propriedades enzimticas, diversificao dos elementos do citoesqueleto e
padres regulatrios de
Fig. 4 Exemplo de seqncias de natureza parloga alinhadas e analisadas filogeneticamente como
ortlogas.
desenvolvimento mais complexos (Haldane, 1933; Ohno, 1970 e Chervitz et al., 1998).
Quando tratamos de protenas, especificamente, podemos ter duas principais
abordagens: (1) a busca por regies homlogas ortlogas, o que geralmente implica em
A B CAY AZ BY BZ CY CZ
A B C
ABC
2 3
1
________________________________________________________Estudo das Xilanases
46
um maior grau de similaridade entre as seqncias primrias, posies especficas nos
diferentes genomas e funes muito semelhantes ou idnticas nos diferentes
organismos; (2) a busca por regies homlogas ortlogas ou parlogas, as quais so
inseridas como um todo na anlise afim de separarmos as famlias ortlogas e, dentro de
cada unidade ortloga, reconstruir a filogenia dos organismos em questo.
Na prtica, a busca pelas seqncias de ambos os grupos no to simples. Em
recursos como o BLAST (Altschul, 1990), uma determinada seqncia comparada
com aquelas armazenadas no banco de dados e o programa responde separando desde a
seqncia mais similar encontrada at aquelas que possuem pouca similaridade. Embora
evoluo convergente tenha sido observada (Gandbhir et al., 1995 e Haney et al., 1999),
o espao de uma seqncia protica, ou seja, todas as possveis permutaes, inseres e
delees de aminocidos, grande. Em conseqncia, muitos pesquisadores atribuem
nfimas similaridades como resultado de homologia.
Um estudo amplo das xilanases incluindo outras menos conhecidas das famlias
5, 8, 16 e 43 poderia dar fundamentao filogentica a hipteses de homologia
construdas com base nas enzimas das famlias 10 e 11. Assim, objetivo deste
trabalho, estudar filogeneticamente as seqencias de xilanases includas nas seis
famlias que as abrigam propondo uma hiptese filogentica para o grupo.
________________________________________________________Estudo das Xilanases
47
Figura 2. A rvore mais parcimoniosa obtida analisando seqncias de DNA de xilanases da famlia 11.
Bootstrap Valores de suporte bootstrap esto plotados em seus respectivos clados. Os nmeros em
parnteses indicam os valores de bootstrap quando gaps foram codificados como 5 estado de caracter
(Modificado de Degefu et al., 2004).
Duas diferentes
xilanases
produzidas por
uma mesma
espcie,
portanto
parlogas ou
completamente
no relacionadas
________________________________________________________Estudo das Xilanases
48
MATERIAL E MTODOS
Bancos de dados de protenas de acesso pblico abrigam conjuntos diferentes e
complementares de seqncias e informaes sobre as glicosidases. Cada qual apresenta
um conjunto diferente de informaes. Foram escolhidos oito diferentes servidores de
bancos de dados no s para extrao das seqncias enzimticas, mas tambm para o
estudo individual de cada uma:
SRS (http://srs.ebi.ac.uk/srsbin/cgi-bin/wgetz);
CATH (www.biochem.ucl.ac.uk/bsm/cath/);
GenBank (www.ncbi.nlm.nih.gov/GenBank);
MODBASE (guitar.rockefeller.edu/modbase/);
PDB (www.rcsb.org/pdb/);
SWISS-PROT (www.ebi.ac.uk/swissprot);
CAZY (http://afmb.cnrs-mrs.fr/CAZY/);
BRENDA (www.brenda.uni-koeln.de).
Sites interligados aos citados acima foram acessados para implementao de
recursos e complementao de dados. Atualmente, um dos servidores mais completos e
aquele que clama ser o mais freqentemente atualizado o CAZY. BRENDA to
vasto quanto CAZY e com mais recursos computacionais, otimizando temporalmente a
extrao de dados de seqncias completas (sem extrao dos domnios). Desta forma, o
banco de dados BRENDA foi escolhido para a extrao dos dados e CAZY para o
estudo estrutural das protenas includas na anlise. Foram selecionadas para anlise 229
seqncias com tamanhos maiores que 100 aas (Tabela I).
http://www.biochem.ucl.ac.uk/bsm/cath/http://www.ncbi.nlm.nih.gov/GenBankhttp://www.rcsb.org/pdb/http://www.ebi.ac.uk/swissprothttp://afmb.cnrs-mrs.fr/CAZY/http://www.brenda.uni-koeln.de/
________________________________________________________Estudo das Xilanases
49
Tabela I. Lista de cdigos utilizados por este estudo para cada uma das seqncias acompanhado do cdigo da
seqncia utilizado por CAZY, famlia a qual a seqncia pertence, organismo do qual a seqncia foi extrada e
sua classificao sistemtica atual. As diferentes cores na tabela indicam grupos taxonmicos diferentes.
Cdigo da
sequencia
Cdigo
Cazy
Famlia Organismo classificao
1 P07986 10 Cellulomonas fimi Actinobacteria
2 P55334 11 Humicola insolens Fungi ascomycetes
4 P35811 11 Fibrobacter succinogenes Acidobacteria
6 Q60041 10 Thermotoga neapolitana Thermotogales
7 P00694 11 Bacillus pumilus Firmicutes
8 P26223 10 Butyrivibrio fibrisolvens Firmicutes
9 P83513 11 Pseudobutyrivibrio xylanivorans Firmicutes
10 P07529 10 Cryptococcus albidus Fungi basidiomycota
11 P26515 11 Streptomyces lividans Actinobacteria
12 P55335 11 Magnaporthe grisea Fungi ascomycetes
13 P29126 10 Ruminococcus flavefaciens Firmicutes
14 P45796 43 Paenibacillus polymyxa Firmicutes
15 P55329 11 Aspergillus niger Fungi ascomycetes
16 P84195 10 Gloeophyllum trabeum Fungi basidiomycota
17 P36217 11 Trichoderma reesei Fungi ascomycetes
18 P35809 11 Schizophyllum commune Fungi basidiomycota
19 Q53317 16 Ruminococcus flavefaciens Firmicutes
20 Q12603 10 Dictyoglomus thermophilum Dyctioglomi
21 P36218 11 Trichoderma reesei Fungi ascomycetes
22 Q12667 11 Piromyces sp Neocallimastigomycota
23 P45705 10 Bacillus stearothermophilus Firmicutes
24 P23551 10 Butyrivibrio fibrisolvens Firmicutes
25 P55333 11 Emericella nidulans Fungi ascomycetes
26 P45703 10 Bacillus stearothermophilus Firmicutes
27 P14768 10 Pseudomonas fluorescens Gama proteobacteria
28 P54865 11 Cellulomonas fimi Actinobacteria
29 P09850 11 Bacillus circulans Firmicutes
30 P48824 11 Aspergillus kawachi Fungi ascomycetes
31 P17137 11 Clostridium saccharobutylicum Firmicutes
32 P23030 10 Pseudomonas fluorescens Gama proteobacteria
33 P55328 11 Aspergillus awamori Fungi ascomycetes
34 P55332 11 Emericella nidulans Fungi ascomycetes
35 P55330 11 Aspergillus niger Fungi ascomycetes
36 P48789 10 Prevotella ruminicola Chlorobi
37 P26220 11 Streptomyces lividans Actinobacteria
38 P23556 10 Caldocellum saccharolyticum Firmicutes
________________________________________________________Estudo das Xilanases
50
39 P33559 10 Aspergillus kawachi Fungi ascomycetes
40 P36917 10 Thermoanaerobacter saccharolyticum Firmicutes
41 P33558 11 Clostridium stercorarium Firmicutes
42 Q60037 10 Thermotoga maritima Thermotogae
43 P48793 11 Trichoderma harzianum Fungi ascomycetes
44 O59859 10 Aspergillus aculeatus Fungi ascomycetes
45 Q60042 10 Thermotoga neapolitana Thermotogales
46 P23557 10 Caldocellum saccharolyticum Firmicutes
47 P23360 10 Thermoascus aurantiacus Fungi ascomycetes
48 P51584 10 Clostridium thermocellum Firmicutes
49 O60206 49 Agaricus bisporus Fungi basidiomycota
50 P49942 10 Bacteroides ovatus Chlorobi
51 Q06562 11 Cochliobolus carbonum Fungi ascomycetes
52 P29417 10 Penicillium chrysogenum Fungi ascomycetes
53 Q00177 10 Emericella nidulans Fungi ascomycetes
54 Q8GJ44 11 Clostridium stercorarium Firmicutes
55 O43097 11 Thermomyces lanuginosus Fungi ascomycetes
56 P10478 10 Clostridium thermocellum Firmicutes
57 P33557 11 Aspergillus kawachi Fungi ascomycetes
58 P26514 10 Streptomyces lividans Actinobacteria
59 P40942 10 Clostridium stercorarium Firmicutes
60 P07528 10 Bacillus halodurans Firmicutes
61 P40943 10 Bacillus stearothermophilus Firmicutes
62 P81536 11 Paecilomyces variotii Firmicutes
63 P40944 10 Caldicellulosiruptor sp. Firmicutes
64 P18429 11 Bacillus subtilis Firmicutes
66 P55331 11 Aspergillus tubingensis Fungi ascomycetes
67 P29127 11 Neocallimastix patriciarum Neocallimastigomycota
68 Q1XMC9 11 Flavobacterium johnsoniae Chlorobi
69 Q3MDD9 10 Anabaena variabilis Cyanobacteria
70 O94163 10 Aspergillus oryzae Fungi ascomycetes
71 Q1FKL7 10 Clostridium phytofermentans Firmicutes
72 Q0H3C1 8 uncultured bacterium Bacteria
73 Q6QHA2 11 uncultured bacterium Bcateria
74 Q7UU28 nc Rhodopirellula baltica Plactomycetes
75 Q0Q592 11 Alternaria sp. Fungi ascomycetes
76 Q12562 11 Aureobasidium pullulans Fungi ascomycetes
77 O30700 10 Bacillus sp. Firmicutes
78 Q7UFF3 nc Rhodopirellula baltica Plactomycetes
79 Q3BMC4 10 Xanthomonas campestris Gama proteobacteria
________________________________________________________Estudo das Xilanases
51
80 Q9HEP2 11 Bipolaris sorghicola Fungi ascomycetes
81 Q9HGX1 10 Agaricus bisporus Fungi basidiomycota
82 Q1FPL8 11 Clostridium phytofermentans Firmicutes *
83 Q59301 10 Cellvibrio mixtus Gama proteobacteria
85 Q0LVJ0 10 Caulobacter sp. Alpha proteobacteria
86 Q45VU9 11 Paenibacillus polymyxa Firmicutes
87 O74717 10 Claviceps purpurea Fungi ascomycetes
88 Q2I0I8 11 Aspergillus sulphureus Fungi ascomycetes
89 Q9HDL7 11 Cochliobolus heterostrophus Fungi ascomycetes
90 P93187 10 Hordeum vulgare Spermatophyta
91 Q11T96 10 Cytophaga hutchinsonii Chlorobi
92 Q59257 11 Bacillus sp. Firmicutes
93 Q5K2M7 nc Bacillus licheniformis Firmicutes
94 Q9HEN3 11 Cochliobolus spicifer Fungi ascomycetes
95 Q9HFH0 11 Penicillium funiculosum Fungi ascomycetes
96 Q60046 10 Thermoanaerobacter thermosulfurogenes Firmicutes
97 Q1R4L7 nc Escherichia coli Gama proteobacteria
100 Q59922 10 Streptomyces halstedii Actinobacteria
101 Q14ST6 11 Cellulomonas flavigena Actinobacteria
102 Q7UMH7 nc Rhodopirellula baltica Plactomycetes
104 Q5YB84 11 Neocallimastix frontalis Neocallimastigomycota
105 Q19N52 11 Neocallimastix frontalis Neocallimastigomycota
106 Q9HFA4 11 Aspergillus oryzae Fungi ascomycetes
107 Q1FPM1 10 Clostridium phytofermentans Firmicutes
108 Q45VU6 11 Bacillus amyloliquefaciens Firmicutes
109 Q59278 10 Cellulomonas fimi Actinobacteria
111 A0UUT3 10 Clostridium cellulolyticum Firmicutes
112 Q9HEN4 11 Cochliobolus spicifer Fungi ascomycetes
113 A2R4D1 11 Aspergillus niger Fungi ascomycetes
114 Q4H018 10 Hordeum vulgare Spermatophyta
115 Q9AG99 11 Cellulomonas flavigena Actinobacteria
116 O69231 10 Bacillus sp. Firmicutes
117 O52374 43 Caldicellulosiruptor sp. Firmicutes
118 Q59254 11 Bacillus subtilis Firmicutes
119 Q7UT87 nc Rhodopirellula baltica Plactomycetes
120 Q2PGV8 10 Aureobasidium pullulans var. melanigenum Fungi ascomycetes
121 Q59675 10 Cellvibrio japonicus Gama proteobacteria
122 Q59256 11 Bacillus sp. Firmicutes
123 Q5NUI5 10 uncultured bacterium Bacteria
124 Q8GJ38 10 Clostridium stercorarium Firmicutes
________________________________________________________Estudo das Xilanases
52
125 Q9UUQ2 11 Penicillium sp. Fungi ascomycetes
126 Q094N0 10 Stigmatella aurantiaca Delta proteobacteria
127 Q8GJ37 10 Clostridium stercorarium Firmicutes
128 Q7WYB0 11 Fibrobacter succinogenes Acidobacteria
129 Q9HEN7 11 Cochliobolus heterostrophus Fungi ascomycetes
130 Q9RQB7 10 Xylanimicrobium pachnodae Actinobacteria
131 Q45VU5 11 Brevibacillus brevis Firmicutes
132 Q59790 11 Ruminococcus sp Firmicutes
133 Q7P3F6 nc Fusobacterium nucleatum Fusobacteria
134 Q5KQS0 10 Pseudomonas sp. Gama proteobacteria
135 Q7UM13 nc Rhodopirellula baltica Plactomycetes
136 O13436 10 Cryptococcus adeliensis Fungi basidiomycota
137 Q6TDT4 10 Bacillus alcalophilus Firmicutes
138 Q6QHA3 8 uncultured bacterium Bacteria
139 Q2PGY1 11 Penicillium citrinum Fungi ascomycetes
140 Q7Z8Q3 11 Trichoderma viride Fungi ascomycetes
141 Q14RS0 11 Thermobacillus xylanilyticus Firmicutes
142 Q2PS23 10 Penicillium chrysogenum Fungi ascomycetes
143 Q12666 11 Penicillium purpurogenum Fungi ascomycetes
144 A2QBA9 11 Aspergillus niger Fungi ascomycetes
145 Q6QHA0 11 uncultured bacterium Bacteria
146 Q5NDZ1 11 Gibberella zeae Fungi ascomycetes
147 Q4H019 10 Hordeum vulgare Spermatophyta
148 Q60044 10 Thermotoga sp Thermotogae
151 Q5RZ98 11 Thermomonospora fusca Actinobacteria
152 Q47QL8 11 Thermobifida fusca Actinobacteria
153 Q45VU2 11 Bacillus subtilis Firmicutes
154 Q76BV3 10 Streptomyces thermoviolaceus Actinobacteria
155 Q21GI8 10 Saccharophagus degradans Gama proteobacteria
156 Q4ZMT4 10 Pseudomonas syringae Gama proteobacteria
157 Q7UGG0 nc Rhodopirellula baltica Plactomycetes
158 Q12580 11 Chaetomium gracile Fungi ascomycetes
159 Q45UD8 11 Aspergillus usamii Fungi ascomycetes
160 Q8TG22 11 Aspergillus niger Fungi ascomycetes
161 A2QVZ0 43 Aspergillus niger Fungi ascomycetes
162 Q45VU7 11 Bacillus licheniformis Firmicutes
164 Q76BV2 11 Streptomyces thermoviolaceus Actinobacteria
165 Q704N9 11 Pseudobutyrivibrio xylanivorans Firmicutes
167 O52730 8 Bacillus sp. Firmicutes
169 A1YPP6 10 Thermobifida fusca Actinobacteria
________________________________________________________Estudo das Xilanases
53
170 P77853 11 Dictyoglomus thermophilum Dyctioglomi
171 Q9RJ91 10 Streptomyces coelicolor Actinobacteria
172 Q45VU3 11 Bacillus cereus Firmicutes
173 Q12550 11 Aspergillus niger Fungi ascomycetes
174 Q59300 11 Cellvibrio mixtus Gama proteobacteria
175 A0UUT4 10 Clostridium cellulolyticum Firmicutes bact
176 Q3BMC2 10 Xanthomonas campestris Gama proteobacteria
177 Q9UVF9 11 Trichoderma viride Fungi ascomycetes
178 O69261 10 Thermobacillus xylanilyticus Firmicutes
179 Q21BJ6 10 Rhodopseudomonas palustris Alpha proteobacteria
180 Q21HD6 10 Saccharophagus degradans Gama proteobacteria
181 Q59139 10 Actinomadura sp. Actinobacteria
182 Q1WS39 nc Lactobacillus salivarius Firmicutes
183 Q7UF11 nc Rhodopirellula baltica Plactomycetes
184 Q31ND9 10 Synechococcus sp. Cyanobacteria
185 Q7UKV6 10 Rhodopirellula baltica Plactomycetes
186 Q9HEN5 11 Cochliobolus sativus Fungi ascomycetes
188 Q47L48 10 Thermobifida fusca Actinobacteria
189 O74716 11 Claviceps purpurea Fungi ascomycetes
190 P93185 10 Hordeum vulgare Spermatophyta
191 Q9XGT8 10 Triticum aestivum Spermatophyta
193 A0PL74 nc Mycobacterium ulcerans Actinobacteria
194 Q9HEP3 11 Bipolaris sorghicola Fungi ascomycetes
195 Q9P8J1 10 Penicillium purpurogenum Fungi ascomycetes
196 O97402 11 Phaedon cochleariae Arthropoda besouro
197 Q59674 11 Cellvibrio japonicus Gama proteobacteria
198 Q45VU1 11 Bacillus subtilis Firmicutes
199 Q60043 10 Thermoanaerobacterium Firmicutes
200 Q5XQ46 10 Cryptovalsa sp. Fungi ascomycetes
201 Q6PRW6 10 Penicillium chrysogenum Fungi ascomycetes
202 Q6TLP3 11 uncultured bacterium Bacteria
203 O69230 10 Bacillus sp. Firmicutes
204 Q59150 10 Anaerocellum thermophilum Firmicutes
205 O52373 10 Caldicellulosiruptor sp. Firmicutes
207 A0PQI8 nc Mycobacterium ulcerans Actinobacteria
208 Q8RJN8 8 Pseudoalteromonas haloplanktis Gama proteobacteria
209 Q01YB0 10 Solibacter usitatus Acidobacteria
210 Q9EW89 11 Streptomyces olivaceoviridis Actinobacteria
211 Q12549 11 Aspergillus niger Fungi ascomycetes
212 Q8J0K5 11 Penicillium funiculosum Fungi ascomycetes
________________________________________________________Estudo das Xilanases
54
213 Q45F01 11 Aspergillus niger Fungi ascomycetes
214 Q0ZHI9 11 Verticillium dahliae Fungi ascomycetes
215 Q45VU4 11 Bacillus pumilus Firmicutes
217 A0LRT6 10 Acidothermus cellulolyticus Actinobacteria
218 Q1FG63 10 Clostridium phytofermentans Firmicutes
219 Q6QJ75 11 Aspergillus niger Fungi ascomycetes
220 Q9HEN6 11 Cochliobolus sativus Fungi ascomycetes
221 Q5ZNB1 10 Penicillium funiculosum Fungi ascomycetes
222 Q70WH8 11 Polyplastron multivesiculatum Protozorio ciliophoro
223 Q1FLY3 10 Clostridium phytofermentans Firmicutes
224 Q024A6 10 Solibacter usitatus Acidobacteria
225 Q4H017 10 Hordeum vulgare Spermatophyta
227 Q6QHA1 11 uncultured bacterium Bacteria
229 O52375 11 Caldicellulosiruptor sp. Firmicutes
230 Q7WYB1 11 Fibrobacter intestinalis Acidobacteria
231 Q3S401 11 Aspergillus sulphureus Fungi ascomycetes
232 Q7Z948 10 Volvariella volvacea Fungi basidiomycota
233 Q15SG8 10 Pseudoalteromonas atlantica Gama proteobacteria
234 Q3YAW6 10 Cellulomonas fimi Actinobacteria
235 Q19N51 11 Neocallimastix frontalis Fungi Neocallimastigomycota
236 Q12579 11 Chaetomium gracile Fungi ascomycetes
237 Q09E20 10 Stigmatella aurantiaca Delta proteobacteria
238 Q9RQB8 11 Xylanimicrobium pachnodae Actinobacteria
239 Q2K5B0 10 Rhizobium etli Alpha proteobacteria
240 A2R5J7 11 Aspergillus niger Fungi ascomycetes
241 A2QFV7 10 Aspergillus niger Fungi ascomycetes
242 P93186 10 Hordeum vulgare Spermatophyta
243 Q704P0 11 Pseudobutyrivibrio xylanivorans Firmicutes
244 Q0M5K3 10 Caulobacter sp. Alpha proteobacteria
245 Q45VU8 11 Paenibacillus macerans Firmicutes
246 Q59962 11 Streptomyces sp. Actinobacteria
247 Q3BMC7 10 Xanthomonas campestris Gama proteobacteria
Essas 229 seqncias foram submetidas a alinhamento e reconstruo topolgica
com base em parcimnia por meio de anlise dinmica implementada em POY 4 (Varn
et al. 2008). Vrios grupos de dez construes de Wagner seguidos dos comandos select
() e swap() foram realizados seguidos de um ltimo comando select(). Dessa forma, um
________________________________
Top Related