(Sthael) (Singer) Phillips-Mora por modelagem comparativa

83
, seu UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA PROGRAMA DE PÓS-GRADUAÇÃO EM BIOTECNOLOGIA MANOELITO COELHO DOS SANTOS JUNIOR DETERMINAÇÃO ESTRUTURAL DA ENZIMA PIROFOSFORILASE DO FUNGO MONILIOPHTHORA PERNICIOSA (STHAEL) (SINGER) PHILLIPS-MORA POR MODELAGEM COMPARATIVA Feira de Santana, BA 2007

Transcript of (Sthael) (Singer) Phillips-Mora por modelagem comparativa

Page 1: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

, seu

UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA

PROGRAMA DE PÓS-GRADUAÇÃO EM BIOTECNOLOGIA

MANOELITO COELHO DOS SANTOS JUNIOR

DETERMINAÇÃO ESTRUTURAL DA ENZIMA PIROFOSFORILASE DO FUNGO MONILIOPHTHORA

PERNICIOSA (STHAEL) (SINGER) PHILLIPS-MORA POR MODELAGEM COMPARATIVA

Feira de Santana, BA 2007

Page 2: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

MANOELITO COELHO DOS SANTOS JUNIOR

DETERMINAÇÃO ESTRUTURAL DA ENZIMA PIROFOSFORILASE DO FUNGO MONILIOPHTHORA

PERNICIOSA (STHAEL) (SINGER) PHILLIPS-MORA POR MODELAGEM COMPARATIVA

Dissertação apresentada ao Programa de Pós-graduação em Biotecnologia, da Universidade Estadual de Feira de Santana, como requisito parcial para obtenção do título de Mestre em Biotecnologia. Orientador: Prof. Dr. Alex Gutterres Taranto Co-orientador: Prof. Drª Sandra Aparecida de Assis

Feira de Santana, BA 2007

Page 3: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

Aos meus pais e a pessoa que me proporcionou os momentos mais felizes de minha vida.

Page 4: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

AGRADECIMENTOS

A minha mãe, Aldezira Mascarenhas, por todo o amor e dedicação durante todas as etapas de

meu desenvolvimento, sem ela eu não conseguiria chegar onde estou. Ao meu pai, Manoelito

Coelho, devido ao incentivo dado nas horas mais difíceis. A meu irmão, Ailton Mascarenhas,

pelo companheirismo, amizade e incentivo.

A meu orientador professor Alex Gutterres pela dedicação e atenção dada durante a

construção deste trabalho e também pelos incentivos e apoio nos momentos mais

complicados, fatos estes que nem mesmo a distância conseguiu atrapalhar.

A minha co-orientadora Sandra Assis pela amizade e pelos incentivos dados, contribuindo

para meu desenvolvimento profissional.

Aos amigos do Laboratório de Modelagem Molecular, Franco Henrique e André Teles por

todo o companheirismo e ajuda, e por mostrar que a união no ambiente de trabalho ajuda

muito no desenvolvimento de qualquer atividade.

As minhas estagiárias de OURO, Vivian Miranda, Nara Andrade e Priscila Gonçalves, que

participaram de maneira marcante no desenvolvimento deste trabalho.

E aos amigos Vitor Francisco, Josimar Santos, Boni Sena, Larissa Morgan e Danyo Maia que

incentivaram em todos os momentos.

Ao programa de Pós-Graduação em Biotecnologia UEFS/FIOCRUZ-Ba pelos incentivos

dados para a construção deste trabalho.

A Fundação de Amparo a Pesquisa da Bahia (FAPESB), ao Conselho Nacional de

Desenvolvimento Científico e Tecnológico (CNPq) e a Financiadora de Estudos e Projetos

(FINEP) pelos incentivos financeiros para o desenvolvimento deste trabalho.

Page 5: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

Conhecimento real é saber a extensão da própria ignorância (Confúcio).

Page 6: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

RESUMO

A doença vassoura-de-bruxa, causada pelo fungo Moniliophthora perniciosa (Sthael)

(Singer) Phillips-Mora, é uma das enfermidades que mais afeta a produção do cacaueiro.

Reduzindo, assim, drasticamente o rendimento das lavouras nas diferentes regiões produtoras

do continente americano, sendo, atualmente, considerada a mais importante doença da lavoura

cacaueira da Bahia e da Amazônia brasileira. O presente trabalho teve como principal

objetivo a determinação estrutural (3D) da pirofosforilase por modelagem comparativa, que é

uma das enzimas encontrada na via metabólica da síntese de quitina. Após a liberação da

respectiva seqüência primária, esta foi submetida ao BLASTp obtendo-se a proteína 1JV1

com 46% de similaridade estrutural como molde. No entanto, como esta não possui as

coordenadas atômicas de duas regiões, um refinamento prévio do molde foi necessário

obtendo uma proteína resultante (CILA3) com 99,7% dos aminoácidos em regiões

energeticamente favoráveis segundo o gráfico de Ramachandran. A seguir, uma etapa de

validação foi executada para determinar o valor de cutoff e a melhor metodologia para o

sistema, obtendo 14Ǻ e a metodologia MM3 como resultado desse processo, respectivamente.

Assim, cinco estruturas modelos (MCJ1-MCJ5) foram criadas a partir da estrutura molde

(CILA3), sendo quatro (MCJ1-MCJ4) obtidos através do protocolo do BioMedCache e um

único modelo (MCJ5) pelo DeepView. Dentre os modelos contruídos, o MCJ4 foi o mais

satisfatório após refinamento e validação pelo PROCHECK. Este apresentou 94,9% dos

aminoácidos em regiões energeticamente favoráveis e um valor de rms de 1,2Ǻ quando

comparado com CILA3. Por este modelo foi possível constatar que a proteína pirofosforilase

pertence a familia α+β. A seguir estudos de docking, cálculo de energia livre e orbitais de

fronteira (HOMO e LUMO) foram executados para que se possa ter uma melhor compreenção

do mecanismo enzimático. Com estes estudos, foi possível identificar que a pirofosforilase do

fungo M. perniciosa não apresenta um bolsão hidrofóbico muito comum em outras

pirofosforilases. Os orbitais HOMO e LUMO localizaram-se sobre o átomo de oxigênio da

Glu304 e nos átomos de fósforos do ligante, respectivamente. Esta informação pode

contribuir para o desenvolvimento de novos fungicidas no combate da doença vassoura-de-

bruxa.

Palavras-chave: Pirofosforilase, Modelagem Comparativa, Moniliophthora perniciosa.

Page 7: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

ABSTRACT

The Witche’s broom is a serious fungal disease of cocoa caused by Moniliophthora

perniciosa (Sthael) (Singer) Phillips-Mora, which reduces drastically the cocoa production in

different regions in the American continent. The witche’s broom is considered the most

important cocoa disease in Brazil. The main objective of this study was to evaluate the

structural determination (3D) of pyrophosphorylase, one of the enzymes of the metabolic way

of quitin synthesis, through comparative modeling. After the release of respective primary

sequence, this was submitted to the BLASTp resulting in the 1JV1 protein with 46% of

structural similarity as a template. However, this protein had not determinated the atomic

coordinates of two regions by ray-X. Thus, a previous refinement of the template was

necessary to build the whole protein. The result protein was denoted by CILA3, which had

99.7% of aminoacids in energetically favorable regions according to the Ramachandran plot.

Following, a validation stage was carried out to determinate the cutoff value and the best

methodology for this system. The cutoff value of 14Ǻ and the MM3 methodology were

obtained by this process, respectively. Thus, five models (MCJ1-MCJ5) were created from the

CILA3, being four (MCJ1-MCJ4) obtained through BioMedCache´s protocol and a model

(MCJ5) through the DeepView program. Among the models constructed by both protocols,

the MCJ4 was the most satisfactory after the refinement by DM simulations and validation

using PROCHECK software. This model showed 94.9% of aminoacids in energetically

favorable regions and a rms value of 1.2Ǻ, when this is compared with CILA3. This final

model showed a protein with characteristics typical of pyrophosphorylase, which belongs to

the family α+β. After, docking, free energy and frontier orbital (HOMO and LUMO) were

performed to obtain more information about enzymatic mechanism. These studies showed

that pyrophosphorylase from M. perniciosa has not a hydrophobic pocket that is very

common in other pyrophosphorylase. Orbital HOMO and LUMO were centered on the

oxygen atom of Glu304 and phosphorus atoms of ligant, respectively. These studies can

contribute to the development of new fungicides against the witche’s broom.

Keywords: Pyrophosphorylase, Comparative Modeling, Moniliophthora perniciosa

Page 8: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

LISTA DE FIGURAS

Figura 1: Comparação entre partes do cacaueiro antes e após a infecção. Em I está mostrado uma plantação de cacau, em II folhas normais e III um fruto em perfeitas condições para consumo. IV fica evidente a mudança no tronco da árvore após a infecção, assim como nas folhas e frutos, V e VI respectivamente.

16

Figura 2: Segmento de quitina com unidades de N-acetil-D-glicosamina em ligações (α1→4).

19

Figura 3: Metabolismo de quitina. 20

Figura 4: Formação de UDP-N-acetilglicosaina devido à ação da pirofosforilase sobre acetilglicosamina-1-fosfato.

21

Figura 5: Estrutura da UDP-N-acetilglicosamina. 22

Figura 6: Interações hidrofílicas (A) e hidrofóbicas (B) entre a acetilglicosamina e o sítio ativo da enzima pirofosforilase.

23

Figura 7: Etapas da modelagem comparativa para a construção de modelos 3D de receptores, a direita de cada etapa se encontram exemplos de programas que podem ser utilizados

27

Figura 8: Equação clássica dos métodos empíricos. 31

Figura 9: Seqüência de aminoácidos da 1JV1 indicando as regiões sem estrutura 3D determinada.

42

Figura 10: Estruturas 3D dos GAP 1 e 2 após otimização por MM3. 42

Figura 11: Gráfico de Ramachandran para os GAP-1 (A) e GAP-2 (B). 43

Page 9: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

Figura 12: Ligação de hidrogênio entre o O32 e H155 da His6, e entre o O87 e H88 da Asp11 do GAP-1.

44

Figura 13: Resultados encontrados nas simulações de Dinâmica Molecular utilizando-se as temperatura de 100K (A), 200k (B) e 300K (C) para o GAP 1. A figura mostra os confôrmeros de menor energia.

45

Figura 14: Gráficos de Ramachandran das estruturas com menor energia geradas após cálculos de Dinâmica Molecular. A - temperatura de 100K; B – temperatura de 200K; C – temperatura de 300K.

46

Figura 15: Resultados das dinâmicas moleculares do GAP-2. A - temperatura de 100K; B – temperatura de 200K; C – temperatura de 300K.

47

Figura 16: Gráfico de Ramachandran da 1JV1 após a adição dos GAP, correções

estruturais e neutralização.

48

Figura 17: Gráfico de Ramachandran da 1JV1: A) estrutura cristalina extraída do PDB; B) Otimizada pelo Amber; C) Otimizada pelo UFF; D) Otimizada por MM3; E) Otimizada por MOZYME-PM5.

50

Figura 18: Alinhamento realizado pelo Clustal W entre a proteína 1JV1 e a seqüência problema. Os resíduos conservados estão marcados com “*”, “:” indicam substituições conservadas e “.” denota regiões semi-conservadas

51

Figura 19: Modelo MCJ1. Em evidência a região sem estrutura terciária definida. 52

Figura 20: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ1.

53

Figura 21: Modelo MCJ2. 54

Figura 22: Modelo MCJ3 construido os circulos indicam ligações com comprimento superior a 3Ǻ.

55

Figura 23: Alinhamento entre o molde 1JV1 e a seqüência da pirofosforilase. Os retângulos indicam as regiões onde foram inseridos aminoácidos na seqüência da

56

Page 10: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

pirofosforilase.

Figura 24: Modelo MCJ4 57

Figura 25: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ4.

58

Figura 26: Gráfico de Ramachandran para cada um dos aminoácidos do modelo MCJ4, o valor entre parênteses indica o numero do aminoácido correspondente na sequência da MCJ4

59

Figura 27: Seqüência de aminoácidos da MCJ4 evidênciando aqueles que estão localizados dentro das regiões desfavorecidas. Em azul a localização destes aminoácidos na proteína

60

Figura 28: Qualidade da cadeia principal do modelo MCJ4: a-Avaliação do gráfico de Ramachandran; b-Planaridade da ligação peptídica; c-Interações ruins; d-Distorção dos carbonos alfa; e-Energia das ligações de hidrogênio; f- Fator-G

61

Figura 29: Resultado encontrado após a simulação de DM para o modelo MCJ4. 62

Figura 30: Resultado da sobreposição feita pelo DeepView 3.7 para a construção do modelo MCJ5, na parte superior é possíve observar os moldes utilizados para a construção

63

Figura 31: Modelo MCJ5 contruido no DeepView 3.7 64

Figura 32: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ5.

65

Figura 33: Gráfico de Ramachandran para cada um dos aminoácidos do modelo MCJ5. O valor entre parenteses indica o numero do aminoácido correspondente na seqüência da MCJ5

66

Figura 34: Sequência de aminoácidos da MCJ5 na qual os aminoácidos sombreados indicam aqueles que estão localizados dentro as regiões desfavorecidas de acordo com o gráfico de Ramachandran. A estrutura abaixo indica a localização destes aminoácido na proteína, os mesmos encontram-se marcados de azul

67

Page 11: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

Figura 35: Qualidade da cadeia principal do modelo MCJ5: a-Avaliação do gráfico de Ramachandran; b-Planaridade da ligação peptídica; c-Interações ruins; d-distorção dos carbonos alfa; e-Energia das ligações de hidrogênio; f- Fator-G

68

Figura 36: Localização da UDP-N-acetilglicosamina no sitio ativo da enzima 1JV1 69

Figura 37: Alinhamento entre a proteína molde 1JV1 e os modelos MCJ4 e MCJ5. As regiões em vermelho indicam os aminoácidos que fazem parte do sítio ativo da enzima. A região em verde indica a porção semi-conservada responsável pela transferência do grupamento UDP.

70

Figura 38: Comparação entre a posição espacial dos aminoácidos que compõem o sítios ativos dos modelos construídos: A) Sítio ativo do modelo MCJ4; B) Sítio ativo do modelo MCJ5.

71

Figura 39: A- Localização do ligante no sítio ativo do modelo MCJ4. B- Em detalhe o ligante e os aminoácidos que fazem parte do sítio ativo da enzima

72

Figura 40: Ligações de hidrogênio identificadas após a otimização do complexo MCJ4-ligante. Em vermelho os aminoácidos e em azul as ligações de hidrogênio.

73

Figura 41: Orbitais de fronteira. As cores verde e azul indicam a distribuição do orbital HOMO, equanto as cores amarelo e vermelho mostram a distribuição do orbital LUMO. A) Complexo ligante-proteína; B) Sítio ativo; C) Ligante.

74

Page 12: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

LISTA DE TABELAS

Tabela 1: Valores de energia relativa encontrados para os GAP 1 e 2, após os cálculos de dinâmica molecular.

44

Tabela 2: Valores de cutoff, energia relativa e tempo computacional encontrados para a proteína 1JV1.

49

Tabela 3: Valores de energia encontrados após as simulações de DM. 75

Page 13: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

SUMÁRIO

1 INTRODUÇÃO 13

2 REVISÃO DA LITERATURA 15

2.1 A VASSOURA DE BRUXA 15

2.2 O FUNGO MONILIOPHTHORA PERNICIOSA 17

2.3 A PAREDE CELULAR DOS FUNGOS 18

2.4 METABOLISMO DA QUITINA 19

2.5 UDP-N-ACETILGLICOSAMINA PIROFOSFORILASE 20

3 MODELAGEM COMPARATIVA 24

4 MATERIAIS E MÉTODOS 37

4.1 DETERMINAÇÃO DA ESTRUTURA 3D 37

4.1.1 Identificação e alinhamento seqüencial da proteína molde 37

4.1.2 Validação dos métodos de MM e semi-empírico 38

4.1.3 Construção e refinamento do modelo 39

4.2 ESTUDOS DE DOCKING E CÁLCULO DE ENERGIA LIVRE 40

5 RESULTADOS E DISCUSSÕES 41

6 CONCLUSÕES 78

REFERÊNCIAS 80

Page 14: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

1. INTRODUÇÃO

A cultura do cacau marcou época na economia brasileira, sendo uma das principais

fontes geradoras de divisas da década de 70. Nesta época, cerca de 90% da produção era

destinada à exportação (BASTOS, 1987). A partir de 1989, ocorreu uma queda da produção

de cacau, o que, em parte, pode ser explicado pelo surgimento e desenvolvimento do fungo

Moniliophthora perniciosa (Stahel) Singer, que é responsável por uma doença conhecida

como vassoura-de-bruxa do cacaueiro (PEREIRA et al., 1990). É uma enfermidade

responsável por danos que compreendem efeitos econômicos e sociais, além do impacto

agronômico imediato. E devido a ela o Brasil passou a importar o produto. Em 2000, foram

importadas cerca de 71.000 toneladas de amêndoas de cacau (COMPANHIA DAS DOCAS

DO ESTADO DA BAHIA, 2002).

Devido ao impacto socioeconômico decorrente desta enfermidade, os governos

Estaduais, Federais e produtores discutem medidas que possam solucionar ou amenizar o

problema nas lavouras de cacau. Atualmente, uma das recomendações da Comissão Executiva

do Plano da Lavoura Cacaueira (CEPLAC) para a reabilitação de plantas suscetíveis à

vassoura-de-bruxa é o uso de variedades clonais resistentes, por meio da enxertia, combinado

com aplicação de fungicidas cúpricos, como o óxido cuproso, para o controle da doença

(ROSA, 1998). No entanto, esta metodologia não mostra resultados muito satisfatórios, pois

estes fungicidas não protegem tecidos em crescimento, necessitando de inúmeras

pulverizações (CRONSHAW, 1979).

Vários compostos químicos vêm sendo testados com o objetivo de prevenir ou erradicar

a vassoura-de-bruxa, porém os resultados não têm sido satisfatórios, pois o rápido

crescimento da superfície dos frutos durante os dois ou três meses de desenvolvimento faz

com que o fungicida tenha que ser aplicado freqüentemente, entretanto, isto é especialmente

difícil em árvores muito altas (SOBERANIS et al., 2000).

Inibidores da biossíntese da parede celular bacteriana, como as penicilinas e

cefalosporinas, têm apresentado bons resultados no controle de infecções bacterianas. Desta

forma, a parede celular dos fungos é um bom alvo para o desenvolvimento de potentes

antifúngicos (GRIFFITH, TRACY, 2002). A UDP-N-acetlglicosamina, a forma ativa da

acetilglicosamina, é o precursor chave nas N- e O- alquilações, como também é essencial para

Page 15: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

14

a síntese de quitina, o maior componente da parede celular de fungos (HERSCOVICS;

ORLEAN, 1993). Na busca por um controle efetivo da vassoura-de-bruxa, escolheu-se a rota

metabólica que leva a síntese da quitina. O alvo nessa via metabólica é a enzima

pirofosforilase que é a responsável em realizar a reação que forma UDP-N-acetlglicosamina.

Desta forma, a inibição da formação de UDP-N-acetlglicosamina afetará a formação de

quitina e assim a síntese da parede celular, um componente crucial para o desenvolvimento do

fungo.

O desenvolvimento racional de novos antifúngicos de baixo peso molecular baseia-se na

obtenção de substâncias detectadas por screening bioquímico completo. Levando, assim, em

consideração a relação quantitativa entre a estrutura e a atividade biológica; e elucidação de

interações ligante-enzima alvo, idealmente com um modelo tridimensional (RAST, 2003).

Desta forma, este trabalho visa à obtenção da enzima pirofosforilase e sua determinação

estrutural através de modelagem comparativa (Homologia), permitindo o desenvolvimento da

pesquisa de novos antifúngicos cada vez mais seletivos e eficazes. Patrick (2001) relata que

esta estratégia poderá levar a novos compostos com atividade biológica desenvolvidos de

forma racional, ou seja, leva ao desenvolvimento de substâncias quimicamente capazes de se

ligar a uma proteína específica e, assim, inibir ou estimular sua ação biológica, através do

conhecimento do mecanismo de ação.

O trabalho justifica-se nos impactos provocados pela vassoura-de-bruxa, pois esta causa

a queda de produção, aumento dos custos e gastos diretos em função do uso de medidas de

controle, afetando diretamente o produtor e o preço do produto, atingindo de forma indireta o

consumidor. Além de impactos sócios econômicos resultantes da menor produção de cacau,

outras mudanças ocorrem na região produtora da Bahia, como: uso da terra, venda de

propriedades, nível de emprego e danos ao meio ambiente (TREVIZAN, 1996).

Page 16: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

15

2. REVISÃO DA LITERATURA

2.1. A VASSOURA DE BRUXA

A vassoura-de-bruxa foi observada inicialmente em 1700, mas a investigação científica

sobre a devastação que esta doença causa em plantações iniciou-se em 1890 por Gregor

Stahel, que isolou e nomeou o fungo causador - Marasmius perniciosa. A vassoura de bruxa

já foi detectada na Bolívia (1989), Brasil (Bahia e Região da bacia Amazônica) (1989),

Colômbia (1917), Equador (1921), Granada (1948), Guiana (1906), Panamá (1989), São

Vicente (1988), e em Trindade e Tobago (1939) (PURDY; SCHMIDT, 1996). Atualmente

distribui-se nas regiões da América do Sul e do Caribe podendo também ser encontrado no

Panamá. Neste caso, a disseminação ocorreu do lado da América do Sul (PURDY, 2005).

Na região costeira da Mata Atlântica da Bahia, a incidência da vassoura-de-bruxa foi

observada pela primeira vez em 1989. A alta densidade de plantações de cacau aliada à falta

de um período seco contribuiu para o estabelecimento e propagação da vassoura-de-bruxa. Na

cidade de Ilhéus-BA, uma grande área de plantações de cacau foi infectada pela vassoura-de-

bruxa, segundo dados da Companhia das Docas do Estado da Bahia (2002), até 1989, data em

que a vassoura-de-bruxa chegou à Bahia. Este estado correspondia à cerca de 84,5% da

produção nacional e 15% da mundial de cacau. Com a ocorrência da doença na região

cacaueira baiana, a produção caiu drasticamente transformando o Brasil de exportador a

importador de cacau.

A vassoura-de-bruxa é uma das mais importantes doenças do cacau, ocorrendo

principalmente nos países da América do Sul. No Brasil, atinge as lavouras cacaueiras da

Bahia e da Amazônia, causando perdas de até 90% da produção (PURDY; SCHIMIDT,

1996). A vassoura-de-bruxa provoca um superbrotamento das partes terminais do cacaueiro,

possuindo sintoma característico à formação dos brotos hipertrofiados de excessivo

desenvolvimento, aparentando vassoura - surgindo daí, o nome da doença. De início, o

desenvolvimento da doença é rápido, porém depois de 5 a 6 semanas começa a secar, podendo

cair ou ficar aderente à árvore (PEREIRA, 1990).

Page 17: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

16

A infecção tem início quando os basidiósporos germinam e penetram no tecido

meristemático e vagens da planta originando assim o estágio biotrófico da colonização. Com

isso, ocorre uma hipertrofia ou hiperplasia das células hospedeiras. Esse intumescimento leva

a parte atingida a ter uma aparência de uma vassoura-de-bruxa. Essas vassouras, quando

jovens, têm uma coloração verde, mas morrem com 1 a 2 meses dando uma coloração marrom

as árvores infectadas, devido a necrose ocasionada pela colonização (estágio saprofítico). A

infecção mais grave ocorre nas flores jovens e nos frutos que estão no tronco (Fig. 1). Como o

fungo responsável pela infecção que leva a vassoura-de-bruxa acomete plantas em

desenvolvimento, a utilização de fungicidas não apresenta efetividade ficando o controle

biológico como alternativa estratégica para o combate a propagação da vassoura-de-bruxa

(GRIFFITH et al., 2003; RUBINI et al, 2005; PEREIRA, 1990).

Figura 1: Comparação entre partes do cacaueiro antes e após a infecção. Em I está mostrado uma plantação de cacau, em II folhas normais e III um fruto em perfeitas condições para consumo. IV mostra o tronco da árvore após a infecção, assim como nas folhas e frutos, V e VI respectivamente.

Fonte: BOTANISCHER GARTEN, 2007; NEW CROP, 2007.

As patologias relacionadas às plantas têm como principal causa patógenos do tipo

Ascomicetos, Oomicetos ou Heterobasidiomicetos. Fungos agáricos raramente causam

I II III

IV V VI

Page 18: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

17

infecções em plantas, um exemplo bem conhecido é a infecção de raízes causada por

Armillaria mellea. Nestas condições, a vassoura-de-bruxa pode ser considerada uma doença

inesperada, uma vez que a sua causa é um Basidiomiceto, mais precisamente pelo

Moniliophthora perniciosa, cuja infecção causa deformação de tecidos verdes (GRIFFITH et

al., 2003).

2.2. O FUNGO MONILIOPHTHORA PERNICIOSA

O fungo M. perniciosa pertence à divisão Eumycota, subdivisão Basidimycotatina,

ordem agaricales e família Tricholomataceae (LANA, 2000). Foi identificado inicialmente

por Stahel, como Marasmius perniciosus, e posteriormente foi transferido por Singer para

outro gênero, Crinipellis, o que foi endossado por outros pesquisadores (BRANDEAU, 1992).

No entanto, a classificação sofreu uma reformulação, por meio de análises filogenéticas de

cinco regiões de genes nucleares (28S rDNA, 18S rDNA, RPB1 e EF1-α), Aime e Phillips-

Mora (2005) determinaram que os fungos C. perniciosa e Moniliophthora roreri pertencem

ao mesmo grupo taxonômico. Desta forma, o C. perniciosa passou a ser denominado de

Moniliophthora perniciosa.

O fungo M. perniciosa é um patógeno destrutivo, causador da vassoura-de-bruxa em

cacau (Theobroma cacao). Desde a sua ocorrência na costa do Equador, em 1984, este fungo

representa, atualmente, um dos principais fatores limitantes na produção de cacau na América

do Sul e nas Ilhas do Caribe, tendo assumido o papel de mais importante patógeno do

cacaueiro. Além disso, sua disseminação acompanhou a do T. cacao na Bacia Amazônica,

atualmente ambos são endêmicos nesta região (GRIFFITH et al, 1994). Originário da bacia

Amazônica, este fungo infecta plantas da família Malvaceae, Solanaceae, Bignoniaceae,

Bixácea e Malpighiaceae (RINCONES at al, 2006).

A grande variabilidade de hospedeiros do M. perniciosa permite separá-lo em grupos de

acordo com o gênero que infectam, denominados biótipos. Desta forma, há três biótipos

caracterizados: o biótipo Cacau (biótipo-C), que tem como hospedeiro as espécies do gênero

Theobroma, principalmente o T. cacao; o biotipo Solanacea (biótipo-S) que infetam as

Page 19: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

18

espécies da família Solanaceae, e o biótipo Liana (biótipo-L) que são encontrados em lianas e

cipós das famílias Malpighiaceae e Bignoneaceae (PURDY, 2005). O biótipo Bixa é

considerado o quarto biótipo e foi relatado por Bastos e Andebrahn (1986) apud Leal Júnior et

al (2005), mas não foi notificada a produção de basidiocarpos nos ramos infetados. Um quinto

biótipo, o biótipo-H, foi sugerido por Griffith et al. (2003) no qual se enquadra o Heteropterys

acutifolia A. Juss.

O M. perniciosa é um patógeno hemibiotrófico nos quais os basidiósporos são as únicas

estruturas do fungo em condições naturais capazes de infectar os tecidos meristemáticos do

Theobroma cacao e várias outras espécies do gênero Theobroma e Herrania (todos os

membros da família Sterculiaceae). Estes são produzidos em lamelas, na região inferior do

píleo do basidiocarpo, onde os dois núcleos nas células da hifa dicariótica da camada do

himênio migram para o interior da basídia enquanto ocorre fusão nuclear. As condições

climáticas ideais para a liberação dos basidiósporos são a umidade do ar próximo a saturação

e temperaturas em torno de 20 a 30 ºC (GRIFFITH et al, 2003; PURDY; SHMIDT, 1996).

Os basidiósporos do M. perniciosa não têm grande disseminação. No entanto, devido à

curta distância entre as árvores da plantação de cacau, a disseminação tornou-se mais

devastadora. As pessoas que transitam nas regiões infectadas também contribuíram para a

propagação da vassoura-de-bruxa, podendo ser consideradas como os principais vetores de

transmissão da doença (GRIFFITH et al, 2003).

2.3. A PAREDE CELULAR DOS FUNGOS

A quitina é um homopolissacarídeo composto por resíduos de N-cetil-D-glicosamina em

ligação -β (ou β-(1→4) 2-acetoamido-2-deoxi-D-glicose) (Fig. 2) (LENHNINGER,

NELSON, COX, 2000). Trata-se de uma estrutura rígida amplamente distribuída pelos

invertebrados, fungos e algas conferindo a força necessária para proteger a célula de choques

osmóticos (TRABULSI, 1999; TAKAYA et al., 1998). Nos fungos filamentosos, a quitina é o

maior componente da parede celular atuando de forma marcante para a manutenção da

integridade celular (TAKAYA et al, 1998).

Page 20: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

19

Figura 2: Segmento de quitina com unidades de N-acetil-D-glicosamina em ligações (α 1→4).

Fonte: NELSON; COX, 2000.

2.4. METABOLISMO DE QUITINA

A ocorrência de quitina, em organismos como nematódeos, moluscos, insetos e na

parede celular de fungos e algumas algas, leva o metabolismo de quitina a ser um excelente

alvo para o desenvolvimento de estratégias para o controle da disseminação de pestes

(KRAMER; MUTHUKRISHNAN, 1997).

Apesar da quitina ser um dos mais importantes biopolímeros da natureza, o

conhecimento da sua biossíntese ainda é fragmentado, até o presente momento se conhece

quatro etapas (Fig. 3): (i) conversão da frutose-6-fosfato em glicosamina-6-fosfato, pela ação

da frutose-6-fosfato aminotransferase (EC 2.6.1.16); (ii) acetilação da glicosamina-6-fosfato

formando N-acetilglicosamina-6-fosfato, catalisada pela 2-acetilglicerolfosfoetanolamina

acetiltransferase (EC 2.3.1.4); (iii) conversão de N-acetilglicosamina-6-fosfato em N-

acetilglicosamina-1-fosfato, pela ação da N-acetilglicosamina fosfomutase (EC 5.4.2.3); (iv)

conversão da N-acetilglicosamina-1-fosfato em UDP-N-acetilglicosamina, catalisada pela

ação da UDP-N-acetilglicosamina pirofosforilase (EC: 2.7.7.23) (MIO et al., 1998; POMPEO

et al., 2001; YAMADA-OKABE et al., 2001 ).

Page 21: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

20

Figura 3: Metabolismo de quitina

Fonte: Adaptado de Pirovani et al., 2004.

2.5. UDP-N-ACETILGLICOSAMINA PIROFOSFORILASE

A enzima UDP-N-acetilglicosamina pirofosforilase (EC 2.7.7.23) é uma proteína que

pertence à superfamília nucleotídeos-difosfo-açúcar transferase e a família UDP-glicose

pirofosforilase. Esta enzima é constituída de folhas beta paralela (beta/alfa/beta) segundo a

Structural Classification of Protein Database- SCOP (RSCB, 2000a). Sua purificação foi

Page 22: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

21

realizada a partir de cepas de Staphylococcus aureus cerca de 30 anos atrás. No entanto, a

seqüência gênica que codifica esta enzima foi elucidada a partir de genes de Escherichia coli,

somente em 1993 (DE LUCA et al. 1996).

No ciclo de formação da parede celular, a enzima UDP-N-acetilglicosamina

pirofosforilase cliva a acetilglicosamina-1-fosfato e UTP em UDP-N-acetilglicosamina,

conforme mostra a reação abaixo (Fig. 4):

Figura 4: Formação de UDP-N-acetilglicosaina devido a ação da pirofosforilase sobre acetilglicosamina-1-fosfato.

Fonte: DE LUCA, 1996.

UDP-N-acetilglicosamina é a forma ativa da acetilglicosamina (Fig. 5). Este metabólito

intermediário tem importância central em muitos organismos (OLSEN; RODERICK, 2001).

Dentre suas funções, pode-se destacar: a) precursor de muitas biomoléculas, incluindo

lipopolissacarídeos e peptidioglicano; b) um importante precursor de glicosilações N- e O-

dirigidas, quando presentes na superfície celular. As glicoproteínas atuam como sinalizadores

para o processamento de certas reações como a identificação imunológica, desenvolvimento

de tumores e interações célula-célula; c) essencial para a síntese de quitina (principal

componente da parede celular fúngica) e glicosilfosfatidilinositol (componente de muitas

proteínas de membrana) (PENEFF et al, 2001; MIO et al, 1998).

Page 23: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

22

Figura 5: Estrutura da UDP-N-acetilglicosamina

Fonte: RSCB, 2007

As pirofosforilases mostram um domínio central na forma α/β, este enovelamento

característico é denominado de Rossmann fold, e é constituído de oito folhas beta rodeadas

por oito alfa hélices, e nas extremidades duas pequenas regiões de folha beta. Este pequeno

domínio carboxi terminal extra é formado por 68 resíduos de aminoácidos. Em contraste com

o domínio carboxi terminal, a região amino terminal é formada por seguimentos semi-

conservados na seqüência de aminoácidos (PENEFF et al, 2001). No entanto, mesmo sendo

descontinuo esta região mostra certo grau de homologia quando comparada com enzimas de

bactérias e de outros organismos superiores. A seqüência semi-conservada inclui Leu-X2-Gly-

X-Gly-Thr-X-Met-X4-Pro-Lys. Esta região é a responsável pela reação de transferência do

UTP para a acetilglicosamina, sendo que esta reação é estimulada por vários cátions

divalentes, incluindo Mg+2, Co+2 e Mn+2 (OLSEN; RODERICK, 2001).

O modo com o qual o nucleotídeo se liga no sítio ativo da pirofosforilase é similar em

todas as enzimas. O complexo açúcar-nucleotídeo acopla-se na região central da enzima,

estabelecendo contato com a primeira metade desta região (resíduos 68-260) e em particular

com o loop composto pelos resíduos Asp221-Leu226. O açúcar é estabilizado principalmente

por ligações de hidrogênio formadas com os resíduos da segunda metade do loop central

(resíduos 261-417) (PENEFF et al, 2001).

A conformação da acetilglicosamina também tem importância para seu reconhecimento

pelo sítio ativo da enzima. O grupamento hidroxila, ligado ao C4, liga-se em conformação

equatorial por meio de ligações de hidrogênio a Gly290 e Asn327. A porção N-acetil

N

HN

OO P

P

O

O

HO

OH

OHHN

O

O

O

HO

O

O

HO

HO

OH

O

Page 24: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

23

estabelece numerosas ligações de hidrogênio com os aminoácidos Glu303, His331 e Asn223,

e uma interação hidrofóbica com Phe381 e Phe383. Estes contatos sugerem uma

especificidade da enzima por hexosaminas acetiladas (Fig. 6). Ao contrário do açúcar e do

nucleotídeo, o grupamento fosfato é bem menos estabilizado (PENEFF et al, 2001).

Figura 6: Interações hidrofílicas (A) e hidrofóbicas (B) entre a acetilglicosamina e o sítio ativo da enzima pirofosforilase

Fonte: RSCB, 2007.

Page 25: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

24

3. MODELAGEM COMPARATIVA

Com os recentes sucessos de projetos genomas, principalmente nas técnicas de

seqüenciamento de aminoácidos e de genes, houve um avanço no entendimento das funções

desenvolvidas pelas proteínas nas células. No entanto, para uma melhor compreensão destas

funções é necessário um estudo das interações que ocorrem entre essas biomacromoléculas.

Para isso, a estrutura 3D de uma proteína geralmente providencia um grande número de

informações sobre a forma de interação entre a arrumação espacial de aminoácidos e outras

moléculas (KUNDROTAS, ALEXOV, 2006; SÁNCHEZ, SALI, 1998; SCHWEDE et al,

2003).

Uma variedade de seqüências de nucleotídeos ou aminoácidos é mantida em banco de

dados que permanecem disponíveis via acesso da Internet. Dentre diversos banco de dados

destacam-se o European Molecular Biology Laboratory (EMBL), o qual consiste em um

banco de dados somente com seqüências de nucleotídeos, e o SWISS-PROT que é destinado

para o depósito de proteínas que tiveram sua seqüência primária elucidada. Este de forma

conjunta com o Swiss Institute for Bioinformatics e com a European Bioinformatics Institute,

oferece um alto grau de informação sobre as proteínas depositadas. Desta forma, é possível

encontrar dados como a função da proteína, domínios estruturais e a família (HÖLTJE, 2003).

Para estruturas 3D o banco de dados mais conhecido é o Protein Data Bank, o qual

possui cerca de 43.045 estruturas depositadas, este número mostra como a elucidação da

seqüência de aminoácidos é uma tarefa relativamente mais simples que a elucidação

estrutural, uma vez que o SWISS-PROT contém cerca de 264.492 estruturas depositadas

(RSCB, 2007; SWISS-PROT, 2007). Desta forma, a busca por elucidações estruturais vem

crescendo a cada dia e a inclusão de métodos computacionais com este objetivo ganhou

especial interesse nos últimos anos (SCHWEDE et al, 2003).

A determinação da estrutura 3D de proteínas pode ser realizada por técnicas

experimentais como a cristalografia de raio-X e através de Ressonância Magnética Nuclear

(RMN). No entanto, estes métodos apresentam algumas limitações como: a) nem todas as

proteínas são passíveis de serem cristalizadas; b) a cristalização pode demorar muito tempo;

c) os cristais formados são em rendimento insuficiente. Estas limitações impossibilitam que

estas técnicas sejam utilizadas em larga escala, além de serem métodos com elevado custo

Page 26: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

25

financeiro. Por outro lado, uma estrutura 3D de uma proteína pode ser determinada por meio

de técnicas computacionais. Existem diferentes metodologias computacionais com esta

finalidade. Um exemplo é a metodologia ab inicio. O método ab initio é aquele empregado

para predição de estruturas a partir da seqüência de aminoácidos utilizando uma função

objetiva que irá depender das energias de interação e algumas vezes do conhecimento acerca

de outra seqüência relatada. Infelizmente, tais metodologias têm produzidos modelos com

enovelamento ruim e com um erro de root mean square (rms) de aproximadamente 4Ǻ, isso

quando empregados em estruturas relativamente simples. Este valor de rms obtido indica que

a estrutura do modelo esta muito diferente da estrutura do molde, uma vez que o valor ideal é

próximo de zero (SÁNCHEZ, SALI, 1998). No entanto, a metodologia melhor sucedida é

denominada de homologia ou modelagem comparativa (SÁNCHEZ, SALI, 1998), segundo a

competição da área denominada de “Critical Assessment of techniques for protein Structure

Prediction (CASP)” 1.

A metodologia de modelagem comparativa, para que possa construir um modelo,

necessita de pelo menos uma estrutura molde elucidada previamente por técnicas

experimentais, e que as seqüências (problema e molde) sejam correlacionadas

evolucionariamente a partir de um ancestral comum, possuindo função e estrutura semelhante.

Quando isto é observado, significa que estas proteínas são homólogas entre si. Pode-se então

afirmar que a elucidação experimental e a modelagem comparativa completam-se uma a outra

na busca pela exploração de estruturas protéicas (SCHWEDE et al, 2003).

A modelagem comparativa baseia-se em alguns padrões gerais observados em nível

molecular durante processo de evolução biológica: A homologia entre seqüências de

aminoácidos implica em semelhança estrutural e funcional; proteínas homólogas apresentam

regiões internas conservadas, principalmente constituídas de elementos de estruturas

secundárias – alfa hélices e folhas beta; as principais diferenças estruturais entre proteínas

homólogas ocorrem nas regiões externas, constituídas principalmente por alças (loops), que

ligam os elementos de estruturas secundárias. Outro fator de extrema relevância é que as

proteínas agrupam-se em um número limitado de famílias tridimensionais, atualmente há uma

estimativa de cerca de 5.000 famílias protéicas. Desta forma, quando se conhece pelo menos a

estrutura de um representante de uma família é possível modelar, na maioria dos casos, os

demais membros da família (SANTOS FILHOS; ALENCASTRO, 2003).

1 Este evento é bianual sendo oferecido pelo Protein Structure Prediction Center. O CASP iniciou-se em 1994 e, atualmente, encontra-se em seu sétimo evento ocorrido no ano de 2006.

Page 27: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

26

No desenvolvimento racional de fármacos, a modelagem comparativa tem assumido

importância crucial, uma vez que a estrutura 3D do receptor fornece informações importantes

acerca das interações que ocorrem entre o novo fármaco e seu sítio de ligação, assim como é

possível otimizar moléculas já existentes. A modelagem comparativa pode ser dividida nos

seguintes passos: a) seleção da seqüência; b) identificação de seqüências homologa e

estruturas relacionadas; c) alinhamento entre as seqüencias; d) modelagem das regiões

estruturalmente conservadas; e) modelagem das regiões não conservadas; f) refinamento do

modelo e g) validação do modelo. Estas etapas, assim como os possíveis programas e cálculos

empregados, estão descritos na figura 7. Após estas etapas, o modelo pode ser submetido a

estudos de docking para o desenvolvimento de novos ligantes (PATNY, DESAI, AVERY,

2006).

A metodologia de modelagem comparativa inicia-se com o processo de alinhamento

sequencial, o qual envolve a identificação da(s) proteína(s) de referência, sendo que estas

devem apresentar adequado grau de homologia com a proteína problema. Esta etapa é seguida

da seleção do molde a ser utilizado devendo possuir pelo menos 30% de homologia com a

seqüência problema. Nesta etapa utiliza-se os métodos FASTA e BLAST (ou PSI-BLAST),

que executam um alinhamento local entre a seqüência problema contra seqüências

depositadas em um banco de dados de estruturas elucidadas por técnicas experimentais.

Dentre estes depósitos, o mais conhecido é o Protein Data Bank (PDB) (PATNY; DESAI;

AVERY, 2006). Estes métodos buscam tanto pela seqüência completa como por seqüências

parciais que combinem com a seqüência da pesquisa, e necessariamente não se extende do

começo ao fim da seqüência. Pode ser interrompido e reiniciado, finalizando em qualquer

ponto. Assim, não é garantido encontrar a melhor solução para o alinhamento por estes

métodos. No entando, estes raramente não localizam uma estrutura que tenha um bom grau de

homologia. Na prática, os métodos de alinhamento local são mais utilizados para encontrar

um conjunto de proteínas homólogas no PDB. Esta é uma etapa fundamental, uma vez que a

qualidade do modelo a ser construído e, assim, sua aplicabilidade no desenvolvimento de

novos fármacos, depende predominantemente da similaridade entre a seqüência da proteína

com a estrutura conhecida (proteína molde) e a seqüência da proteína a ser modelada

(proteína problema). Geralmente, uma similaridade de 30% entre a seqüência problema e a

seqüência molde constitui um bom indício para a construção por modelagem comparativa

(SÁNCHEZ, SALI, 1998; PATNY, DESAI; AVERY, 2006).

Page 28: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

27

Figura 7: Etapas da modelagem comparativa para a construção de modelos 3D de receptores. A direita de cada etapa se encontram exemplos de programas que podem ser utilizados.

Assim, o PDB é o mais importante banco de dados padrão para todas as informações

estruturais em biomacromoléculas. Por causa do contínuo crescimento do número de

estruturas experimentalmente resolvidas, o banco de dados é continuamente ampliado.

Baseado no PDB, alguns pequenos bancos de dados estruturais estão sendo criados, por

exemplo, os banco de dados Homology derived Secondary Structure of Proteins (HSSP) e o

Structural Classification of Proteins (SCOP). O HSSP contém derivados homólogos de

estruturas de proteínas, a qual combina a informação do PDB e seqüências de proteínas

derivadas de bancos de dados como SWISS-PROT. O banco de dados SCOP contêm

Seleção da seqüência

Identificação da(s) seqüência(s) homóloga(s)

Alinhamento entre as seqüências

Modelagem das regiões conservadas

Modelagem das regiões não conservadas

Refinamento do modelo

Validação do modelo

BLASTp

CLUSTAL W

BioMedCache,

Sybyl

MODELLER

Swiss-Pdb Viewer

BioMedCache

Amber

Sybyl

PROCHECK WATHCHECK

Page 29: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

28

alinhamentos detalhados de todas as proteínas com estrutura conhecida e estas são agrupadas

em famílias, concordando com sua evolução e relações estruturais. Os domínios protéicos no

SCOP são agrupados dentro de espécies e classificados hierarquicamente (BERMAN et al,

2000; HÖLTJE, 2003).

Em geral, os arquivos PDB apresentam a organização e as informações contidas nos

diferentes arquivos de dados estruturais de forma muito semelhante. O início do arquivo

fornece alguns dados que compreendem informações gerais sobre a proteína, como o nome

oficial, referências da estrutura cristalina, e algumas observações úteis da estrutura secundária

que a compõe proteína. Adicionalmente, são listadas as coordenadas atômicas (BERMAN et

al, 2003). Os átomos que pertencem ao padrão de resíduos de aminoácidos são denominados

ATOM. Para a distinção entre as cadeias peptídicas individuais, os ATOMs são separados por

uma linha adicional começando com a abreviação TER. Entre ATOMs, a ligação é geralmente

construída quando os arquivos são lidos dentro do programa de modelagem. Os átomos, que

não pertencem a resíduos de aminoácidos, recebem a denominação de HETATM. Uma tabela

de conectividade é gerada no final do arquivo somente para os ATOMs. Esta tabela, por não

considerar a conectividade dos HEATOMs, podem gerar uma estrutura incorreta, requerendo

assim uma observação mais criteriosa, principalmente do ponto de vista químico (HÖLTJE,

2003; RSCB, 2007). Adicionalmente, os átomos deste grupo podem não pertencer aos padrões

definidos para aminoácidos como, por exemplo, no caso de ligantes complexados com a

proteína. Como o tipo de átomo proposto atribuído não é reconhecido pelo PDB, é

absolutamente necessário checar com cuidado todos os tipos de átomos para evitar uma

construção errada nestes ligantes (HÖLTJE, 2003; RSCB, 2003).

Usualmente, todas as estruturas do PDB não incluem átomos de hidrogênio. Para

muitos tipos de investigação, os átomos de hidrogênio podem ser negligenciados, mas para o

estudo entre interações ligante-proteína é inevitável adicionar os hidrogênios. As ligações das

moléculas devem ser checadas com cuidado especial com a ordem para confirmar o correto

grau de protonação que foi atribuído em casos de substâncias ácidas ou básicas.

Adicionalmente, os átomos de hidrogênio nunca são alocados para todas as moléculas de

água. Como conseqüência, elas são indicadas somente como simples pontos representando as

posições dos oxigênios. Estas podem apresentar-se distribuídas pela superfície da proteína

como em seu sítio ativo. No último caso, é absolutamente necessário incluir as coordenadas

completas nas informações adicionais porque eles podem influenciar na interação entre o

ligante e a proteína. Isto também é verdadeiro para cátions encontrados na estrutura cristalina

Page 30: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

29

que podem ter um função importante para a formação do complexo proteína-ligante ou para a

atividade enzimática (BERMAN et al, 2000; RSCB, 2003; HÖLTJE, 2003; FUJTISU, 2003).

Muitos programas de modelagem molecular podem executar o arquivo pdb sem

problemas, transformando a informação estrutural em informação 3D. No entanto, alguns

cuidados devem ser tomados no momento de se utilizar o arquivo pdb. A estrutura cristalina

deve possuir pelo menos de 2,5 a 1,5 Ǻ de resolução, pois estruturas com baixa resolução

podem não apresentam informações de valor, uma vez que a falta de resíduos ou informações

incompletas podem dificultar o processo de construção por homologia. Algumas proteínas

apresentam função bioquímica somente na forma dimérica ou trimérica. Desta forma, não há

por que trabalhar com um arquivo que contenha somente uma cadeia (HÖLTJE, 2003).

De posse de um conjunto de estrutras obtidas pelo PDB, a etapa a seguir é o emprego

dos métodos de avaliação por comparação entre seqüências múltiplas. Estes métodos são

muito úteis quando o grau de homologia entre a seqüência problema e o molde esta abaixo de

25%. O alinhamento múltiplo usualmente detecta três vezes mais relações evolucionárias que

o alinhamento simples, quando o grau de identidade esta abaixo de 30%. Um dos programas

mais utilizados para este fim denomina-se CLUSTAL W (Fig. 7). Através de programação

dinâmica, o programa utiliza modelos matemáticos para gerar o alinhamento criando tabelas

de scores entre os aminoácidos. Estas tabelas são geradas pelas matrizes PAM250 e

BLOSUM62, as quais são capazes de realizar inserções ou deleções de diferentes tamanhos.

O alinhamento realizado pelo CLUSTAL W segue três etapas: a) as seqüências são alinhadas

separadamente com o objetivo de se calcular uma matriz de distância; b) uma árvore guia é

criada a partir da matriz gerada na primeira etapa; c) a seqüência é gradualmente alinhada de

acordo com a matriz e com a árvore gerada nas etapas anteriores (THOMPSON; HIGGINS;

GIBSON, 1994). Como descrito anteriormente, o sucesso para obtenção de um modelo para

sequência problema depende desta etapa. Estudos anteriores mostram que a um grau de

homologia entre a sequência alvo e a problema de 50% pode levar a obtenção de bons

modelos, com uma estrutura bem próxima do molde. A redução para 20% pode levar a

construção de modelos com grandes diferenças estruturais, mas a geometria do sítio ativo fica

mantida, uma vez que este é bem conservada durante o processo de evolução (SÁNCHEZ,

SALI, 1998; PATNY; DESAI; AVERY, 2006).

Após selecionado a proteína molde, a etapa a seguir é a contrução do modelo. De uma

forma geral, a construção do modelo pode ser realizada pelos métodos ab initio, restrição

espacial, e por transferência de coordenadas atômicas. A metodologia de construção por

Page 31: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

30

restrição espacial é realizada por meio da geração de um conjunto de restrições espaciais que

são aplicadas à seqüência alvo. As restrições limitam, por exemplo, a distância entre dois

resíduos no modelo que está sendo construída baseada na distância entre dois resíduos

homólogos na estrutura molde. As restrições também podem ser aplicadas a outros parâmetros

como ângulos de ligação, ângulos diedros e pares diedros, aumentando-se o número de

restrições espaciais. Assim, pode-se efetivamente reduzir o número de conformações que o

modelo poderá assumir (GIBAS; JAMBECK, 2001; ŠALI; BLUNDELL, 1993).

As restrições são baseadas em análises estatísticas de diferenças entre pares de

estruturas homologas. Desta forma, estas estatísticas contribuem como uma descrição

quantitativa de quantas propriedades podem ser variadas entres as estruturas homologas. Esta

propriedade é expressa na forma de Função de Densidade de Probabilidade (PDF), e seria, por

exemplo, a variação permitida da distância entre carbonos-alfa (GIBAS; JAMBECK, 2001;

ŠALI; BLUNDELL, 1993).

O uso de restrições baseadas em PDF permite construir um modelo que não seja

exatamente igual a estrutura de referência. Esta pequena diferença estaria compatível com as

alterações encontradas entre as proteínas homologas com estruturas conhecidas. Vale ressaltar

que as restrições espaciais não são as únicas limitações aplicadas sobre o modelo. Um campo

de força para controlar a estereoquímica também é aplicado. Com isso evita-se que o modelo

possa violar as regras da química para satisfazer as restrições espaciais derivadas das

estruturas dos modelos. Sendo assim, a metodologia de restrição espacial adota tanto

restrições espaciais quanto restrições químicas para a construção de modelos 3D (ŠALI;

BLUNDELL, 1993; GIBAS; JAMBECK, 2001).

Diferentemente da construção de modelos por meio de restrição espacial, a metodologia

por transferência de coordenadas também pode ser empregada na modelagem compartiva.

Nesta metodologia, a construção da proteína problema ocorre por meio das transferências de

coordenadas atômicas. Após o alinhamento entre as seqüências molde e problema, os resíduos

são sobrepostos, de tal foram que os resíduos são trocados, mas as coordenadas espaciais são

mantidas (GOLDSMITH-FISCHMAN; HONIG, 2003). A seguir, um processo de

refinamento se faz necessário, o qual consiste na otimização de geometria e análise

conformacional de cadeias laterais e estruturas secundárias (LI et al, 1997).

Durante o desenvolvimento do modelo 3D, algumas anomalias estruturais podem ser

introduzidas na proteína problema. Desta forma, é imprescindível que o modelo 3D recém

construído seja cuidadosamente refinado, antes de ser utilizado para estudos de interação

Page 32: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

31

fármaco-receptor. Algumas incongruências que podem ocorrer após a construção incluem:

substituição de uma cadeia grande por uma pequena ou vice-versa; ligações peptídicas

“esticadas” e loops com conformações ruins. A maioria destes problemas podem ser

resolvidos por meio de protocolos de minimização por mecânica molecular (MM) seguido de

simulações de dinâmica molecular (DM) (PATNY, DESAI; AVERY, 2006).

Dessa forma, o refinamento é realizado por métodos de mecânica molecular e

dinâmica molecular. Estes métodos não consideram explicitamente os elétrons em um sistema

molecular (baseiam-se em interações entre núcleos), embora os efeitos eletrônicos estejam

implicitamente incluídos nos campos de força através de parametrizações, reduzindo assim o

custo computacional. Portanto, esta é a metodologia de escolha para estudar propriedades de

grandes sistemas como biomacromoléculas dentre as disponíveis pela química teórica. A

parametrização é obtida por cálculos de orbital molecular e por métodos experimentais. A

mecânica molecular utiliza equações da física clássica Newtoniana para determinação da

geometria molecular. Esses métodos descrevem as forças atuantes nos átomos das moléculas

por meio de equações empiricamente derivadas. Nestes métodos empíricos, a energia do

sistema é descrita pelo somatório das contribuições das energias de ligação, angular, torsional

e por interações de átomos, não ligados, onde estes valores são previamente obtidos a partir de

dados experimentais ou através de cálculos ab initio2. A equação, descrita na figura 8 abaixo,

representa uma forma de como a energia de um modelo teórico é obtida após cálculos de

mecânica molecular (FUJTISU, 2003; FORESMAN; FRISCH, 1996).

Etotal = ∑Eligação + ∑Eangular + ∑Etorcional + ∑Eint. de átomos ...

Figura 8: Equação clássica dos métodos empíricos.

Assim, os métodos de MM utilizam algorítmos para otimizar a geometria encontrando

confôrmero de menor energia na superfície de energia potencial (SEP). Os algorítmos

aplicados para otimização de geometria normalmente encontram regiões de mínimo na SEP

próximo as coordenas inicias (geometria de partida). Dentre os algorítmos de minimização de

2 -Ab inicio nesta etapa refere-se a metodologia desenvolvida pela química tyeórica a qual propriedades atômicas e moleculares são obtidas através de aproximações da equação de Schrödinger, sendo impraticável (ainda) para biomacromoléculas.

Page 33: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

32

energia, os mais frequentemente utilizados são: Steepest Descent e Gradiente Conjugado,

ambos utilizam técnicas que calculam a primeira derivada da energia. (LYBRAND, 1990).

Existem vários métodos de MM, também chamados de campos de força, os quais diferem-

se pela natureza das equações, assim como detalhes das suas parametrizações. A lista a seguir

são exemplos de campos de força: ff99 (AMBER), UFF, MM3, dentre outros.

O Amber é um pacote de programas utilizado para conduzir cálculos de Mecânica e

Dinâmica Molecular em biomoléculas. Em algumas situações, o termo Amber também é

empregado para descrever alguns campos de força empíricos, por isso em alguns outros

programas, como o Gaussian 03, é possível encontrar um campo de força com esta

denominação (CASE et al, 2004).

Vários campos de força foram desenvolvidos para Amber, a qual incluem: a) parm99,

usado para o tratamento eletrostático em aminoácidos e algumas moléculas orgânicas; b)

Gaff, campo de força para moléculas orgânicas; c) frcmod, para modificações nos ângulos phi

e psi e d) all_amino03 para determinação de carga e os tipos atômicos em proteínas. No

entanto, a parametrização padrão utiliza campos de força que fixam a carga parcial centradas

nos átomos. Exemplos destes campos de força incluem o ff94, ff03 e o ff99, implementados

no Amber 6, 7 e 8, respectivamente (FORESMAN; FRISCH, 1996; CASE et al, 2004).

A etapa inicial para a utilização do Amber é a identificação do arquivo de entrada, que

pode deve estar no formato pdb. Nesta fase, o programa LEaP analisa a proteína inserida no

sistema, valência, proximidade entre os átomos, erros estruturais e carga total. Além destas

funcionalidades, o LEaP tem como função gerar dois arquivos importantes para o

funcionamento do Amber que são eles: o arquivo topológico e o arquivo de coordenada. As

informações para a construção destes dois arquivos vêm de um banco de dados contido no

próprio Amber, onde estão descritos a topologia dos aminoácidos essenciais (bem como a

carga pontual das regiões N- e C- terminal dos mesmos), DNA, RNA, alguns açúcares

comuns, e um padrão de coordenadas internas para as unidades monoméricas. Assim, ao

submeter a molécula ao LEap, este a “prepara” corrigindo átomos não descritos anteriormente

e neutralizando a sua carga total. O LEaP utiliza um potencial Coulombiano para neutralizar a

molécula por meio de uma rede de 1Ǻ ao seu redor, podendo essa rede ser extendida para 4Ǻ

quando se utiliza solvente. Deve-se atentar que os íons a serem adicionados são de natureza

monoatômica. A topologia de moléculas, que não estejam padronizadas no banco de dados do

Amber, pode ser gerada por um outro programa chamado de Antechamber. A utilização do

Antechamber é de fundamental importância quando se deseja realizar estudos de Docking ou

Page 34: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

33

cálculos de energia livre. Resumidamente, pode-se afirmar que a função do LEaP é preparar a

molécula para os programas de cálculos como o SANDER (CASE et al, 2004; PEARLMAN

et al, 1995).

SANDER é o principal módulo do Amber, pois é nele que são conduzidos cálculos de

minimização, dinâmica molecular e deslocamentos químicos para RMN. Os três principais

algorítmos utilizados são Steepest Descent, Gradiente Conjugado, ambos para o refinamento

de estrutura por MM, e o Verlet para cálculos de trajetória atômica em DM. Usualmente, a

energia de minização calculada pelo SANDER deriva de cálculos de Steepes Descent

seguidos por cálculos de Gradiente Conjugado, desta forma muitos contatos desnecessários

entre átomos são removidos. Este processo é uma das formas efetivas de se encontrar o

mínimo local. Os cálculos de DM no Amber seguem o princípio inicialmente desenvolvido no

programa GROMOS, como comentado, por meio do algorítmo Verlet (PEARLMAN et al,

1995).

O Universal Force Field (UFF) foi desenvolvido com o objetivo de facilitar o estudo de

uma variedade de associações atômicas, como as que ocorrem em proteínas e ácidos

nucléicos. Os parâmetros usados para gerar o UFF incluem um conjunto de hibridizações

dependente da ligação atômica, ângulos de hibridização, parâmetros de van der Waals,

barreiras torcionais e cargas nucleares. A energia potencial de uma geometria arbitrária para

uma molécula é escrita como uma sobreposição de várias interações entre dois, três e quatro

corpos. Esta energia é expressa como a soma da valência ou interações de ligação com as

interações não ligadas (REPPÉ et al, 1992).

Os átomos no campo de força UFF são padronizados de acordo com cinco caracteres

que são usados para descrevê-los, gerando um total de 126 tipos atômicos diferentes. Dessa

forma, os dois primeiros caracteres correspondem ao símbolo químico; se este possuir uma

letra, uma linha então é colocada no lugar do segundo caractere. O terceiro caractere descreve

a hibridização ou a geometria (1 = linear, 2 = trigonal, R = Resonante, 3 = tetraédrico, 4 =

quadrado plana, 5 = trigonal bipiramidal, 6 = octaédrica). O quarto e quinto caractere são

usados para descrever parâmetros de estado de oxidação (REPPÉ et al, 1992).

Diferentemente dos métodos de campo de força, recentemente foi desenvolvido o

método semi-empírico denominado de MOZYME/PM5 para o estudo de macromoléculas,

sendo implementado no pacote MOPAC 2002, também presente no BioMedCache. Os

métodos semi-empíricos, usam dentre outras aproximações, a aproximação NDDO (Neglect

of Diatomic Differential Overlap) (FORESMAN; FRISCH, 1996), considerando que os

Page 35: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

34

orbitais atômicos de diferentes átomos não se sobrepõem. Empregam parâmetros empíricos e

utilizam somente os elétrons da camada de valência (restringindo-se a uma base mínima).

Com isso, os cálculos são simplificados, reduzindo o custo computacional (memória e tempo)

quando comparado aos métodos ab initio. Os prováveis erros introduzidos devido às várias

aproximações inerentes ao método são, muitas vezes, compensados através do próprio

processo de parametrização, o qual ajusta os resultados do método, a resultados experimentais

ou ab initio (FORESMAN; FRISCH, 1996). Este procedimento pode produzir modelos que

algumas vezes fornecem resultados mais próximos dos resultados experimentais do que os

resultados obtidos com modelos mais sofisticados ou por MM (FORESMAN; FRISCH,

1996).

O MOZYME possui a opção de substituir o algoritmo de busca de mínimos do MOPAC

(EF) pelo LBFGS. Neste, além de requisitar menor capacidade de memória do que o EF

realiza uma série de pequenos cálculos com cerca de 50 a 200 ciclos. Isto é necessário porque

a geometria poderá mudar consideravelmente durante a otimização. Os átomos que não

interagiram, durante o início do cálculo, podem interagir fortemente no final. O MOZYME é

usado para cálculos simples ligados à geometria de molécula, como, por exemplo, a

otimização de geometria, localização do estado de transição e cálculos de polaridade

(FUJITSU, 2003; STEWART, 1997). No entanto, este apresenta algumas limitações, uma vez

que, somente cálculos onde todos os elétrons estão emparelhados (camada fechada – Restrict

Hatree-Fock) podem ser executados. Conseqüentemente, não é permitido cálculos de radicais

livres e estados excitados. Para cálculos que exijam precisão, o MOZYME também não é

recomendado (FUJITSU, 2003; STEWART, 1997).

Se o modelo gerado é baseado somente em técnicas de modelagem comparativa, os loops

e as cadeias laterais necessitam de um refinamento mais apurado. Isto se deve ao fato que a

geometria obtida pelo processo de otimização representa somente uma possível conformação

encontrada pelo algorítmo na região de mínimo local. Sendo assim é necessário investigar o

comportamento conformacional através da SEP para que se possa aproximar o máximo

possível da região de mínimo global, encontrando a estrutura 3D mais favorável

energeticamente. A métodologia para que se possa resolver esta questão denomina-se

dinâmica molecular (DM), que é um processo sistemático de busca conformacional, sendo

uma ferramenta bastante útil para se encontrar várias regiões de mínimo na SEP (LYBRAND,

1990; HÖLTJE, 2003).

Page 36: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

35

A dinâmica molecular (DM) consiste em determinar explicitamente as trajetórias de

pontos representativos no espaço através da solução numérica das equações de movimento. O

objetivo básico deste método é observar a evolução do sistema através destas equações.

Devido às interações entre as partículas, o sistema é capaz de manter tanto o equilíbrio

mecânico quanto térmico, e caso haja alguma perturbação externa, o sistema tende a atingir

um novo equilíbrio (RINO; STUDART, 2001).

Seguindo este conceito, as simulações de DM estimam aproximadamente os

movimentos dos átomos. A energia potencial de um sistema é governada por um campo de

força empírico. Muitos programas computacionais voltados para simulações de DM usam

campos de força ligados à métodos de mecânica molecular. As simulações de DM

determinam aproximadamente o movimento real do sistema por meio de algum campo de

força que descreve a energia potencial de uma molécula em termos de geometria molecular

demonstrando o movimento de cada átomo. A energia cinética de um sistema é derivada da

velocidade atômica, essa por sua vez é influenciada pela temperatura da simulação. Desta

forma, as simulações DM tem por objetivo estudar o movimento do sistema, sendo por isso

também empregados para a validação de modelos 3D (FUJTISU, 2003).

O Verlet é o algoritmo mais utilizado para simulações DM. O algoritmo Verlet é uma

integração numérica da equação Newtoniana do movimento. Esta simulação conserva a

energia total e o volume do sistema (FUJTISU, 2003). Neste algoritmo, as posições são

determinadas nos tempos t, ∆t, t + 2∆t, ... e as velocidades nos tempos t-∆t/2, t + ∆t/2, t +

∆t/2... a regulação da temperatura pode ser conduzida por escalonamento periódico, ou por

meio de uma relação com a velocidade (PEARLMAN et al, 1995).

Após o refinamento do modelo por meio das técnicas citadas acima, a etapa seguinte é a

validação do modelo (Fig. 7). O primeiro passo da validação consiste na checagem da

qualidade do enovelamento, sendo este parâmetro muito ligado a qualidade do molde

utilizado. Desta forma, esta análise é feita comparando-se o valor de rmsd do molde e do

modelo construído, cujo o valor deve ser menor do que 5Ǻ (PATNY, DESAI; AVERY,

2006).

Há uma série de programas que analisam a estereoquímica do modelo. Dentre estes

programas pode-se incluir: PROCHECK, WHATCHECK e AQUA. Estes programas

usualmente verificam os comprimentos de ligação, ângulos de ligação, ligação peptídica,

Page 37: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

36

planaridade de anéis, quiralidade, ângulos torsionais da cadeia principal e lateral, contato

estérico entre átomos não ligados.

Após todas estas etapas, em princípio, se tem um modelo 3D de um alvo para que se

possa estudar as interações deste com um composto protótipo, e assim desenvolver um novo

composto bioativo.

Page 38: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

37

4. MATERIAIS E MÉTODOS

4.1. DETERMINAÇÃO DA ESTRUTURA 3D

A predição da estrutura 3D da pirofosforilase foi realizada por modelagem

comparativa utilizando métodos computacionais como ferramentas. A modelagem

comparativa seguiu os seguintes passos sucessivos: 1- identificação e seleção da(s) proteína(s)

molde(s) e alinhamento das seqüências de resíduos; 2- análise estrutural da proteína molde

identificada; 3- refinamento da proteína molde; 4- construção do modelo; 3- validação do

modelo (GOLDSMITH-FISCHMAN; HONIG, 2003; SANTOS FILHO; ALENCASTRO,

2003). Também foi utilizado o processo automatizado de modelagem de proteínas por

homologia oferecido pelo SWISS MODEL (GUEX; PEITSCH, 1997). No final de todo

processo, vários modelos foram comparados entre si.

Os cálculos realizados pelos programas BioMedCache e Gaussian foram realizados em

um servidor Intel Xeon Dual-Core presente no Laboratório de Modelagem Molecular da

Universidade Estadual de Feira de Santana. Para o programa Amber foi utilizado a estação de

trabalho RedWood presente no Mississipi Center for Supercomputing Research (MCSR) da

University of Mississipi.

4.1.1 Identificação e alinhamento seqüencial da proteína molde

A seqüência primária da proteína, obtida em colaboração com Laboratório de pesquisa

Microbiológica (LAPEM) da Universidade Estadual de Feira de Santana, foi submetida ao

programa BLAST (ALTSCHUL et al, 1990) contra as proteínas presentes no Protein Data

Bank (PDB) (RSCB, 2005). Dessa forma selecionou-se proteínas conhecidas estruturalmente

Page 39: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

38

como moldes. Estas devem apresentar o maior grau de homologia possível, igual ou superior

a 30% (GOLDSMITH-FISCHMAN; HONIG, 2003).

4.1.2 Validação dos métodos de MM e semi-empírico

Inicialmente, como o valor de cutoff é importante para especificar a distância das

interações de Van der Walls para átomos não ligados, foi realizado um prévio estudo cujo o

objetivo foi a determinação deste valor utilizando o próprio molde obtido no PDB como

referência. Para isso, variou-se o valor de cutoff entre 3 a 20Ǻ realizando cálculos de

MM3(ALLINGER; LII, 2004) no programa BioMedCache desenvolvido pela Fujitsu (2005).

A seguir, foi realizado uma etapa de validação em diferentes métodos e programas

disponíveis no Laboratório de Modelagem Molecular da UEFS. Esta etapa tem como objetivo

estudar o melhor método teórico para o sistema em questão. A etapa inicial de qualquer

cálculo independente do programa/campo de força a ser utilizado foi a neutralização da

molécula através do protocolo descrito no programa tLeap, com o campo de força ff99,

contido no pacote de programas Amber 8.0. Após a neutralização, a estrutura resultante foi

utilizada como input em todos os cálculos de otimização. Os pacotes utilizados foram o

BioMedCache 6.1, Gaussian 03W, e Amber com os seus respectivos campos de força MM3,

UFF, e ff99. O método semi-empírico MOZYME-PM5, presente no BioMedCache, também

foi utilizado. Assim, a qualidade geométrica das proteínas resultantes foram comparadas entre

si através do gráfico de Ramachandran.

Para o processo de otimização pelo campo de força MM3 foram especificados como

parâmetros de controle de interação um valor de convergência igual a 0,001kcal/mol e 300

ciclos, realizando um cálculo Steepest Descent, seguido de um cálculo de Gradiente

Conjugado, finalizando com um cálculo Steepest Descent (GETHER, KOBILKA, 1998). O

valor de cutoff foi o mesmo determinado na etapa anterior.

Através do programa Gaussian 03W, foi empregado o campo de força UFF, utilizando

as seguintes palavras chaves: opt (requere otimização de geometria), UFF (especificação do

campo de força a ser utilizado) e geom=connectivity (determina a ligação entre os átomos).

Nesta metodologia, o algorítmo de Berny foi utilizado durante o processo de otimização,

sendo o valor de cutoff determinado pelo default do programa. (FRISCH, FRISCH,

TRUCKS, 2003)

Page 40: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

39

A otimização realizada no programa Amber 8.0 foi feita em duas etapas. Na primeira

etapa, a molécula foi preparada usando-se o programa tLeap por meio do campo de força ff99.

O programa tLeap também é utilizado para gerar os arquivos topológicos e de coordenadas da

proteína. Esses arquivos são fundamentais para os cálculos de otimização no Amber. A

otimização foi feita por meio do programa SANDER, sendo utilizadas as seguintes keyword:

a) imin=1, realiza uma otimização da estrutura; b) maxcyc=200, número máximo de ciclos; c)

ncyc=100, número de ciclos necessários para a mudança de Steepest Descent para Gradiente

Conjugado; d) cut=14, valor de cutoff; e) ntb=0, manter volume constante; f) igb=0, não

incluir modelo de solvatação.

O método MOZYME-PM5 do BioMedCache 6.1 tem como fundamento um

refinamento estrutural utilizando os parâmetros do método semi-empíricos PM5 para

estruturas de alto peso molecular. Para esta otimização foram implementados 50 ciclos

máximos, algorítmo de otimização BFGS, correção de mecânica molecular para grupos –

HNCO-. A keyword LBFGS foi utilizada para indicar uma otimização de geometria usando a

função minimizadora L-BFGS-B, que é um algorítmo específico para cálculos de moléculas

grandes como proteínas. A keyword GEO-OK foi utilizada para desconsiderar pequenos erros

de geometria que a molécula poderia apresentar.

Após a otimização da proteína molde por qualquer um dos protocolos acima citados, a

qualidade estrutural foi checada por meio dos gráficos gerados pelo programa PROCHECK.

4.1.3. Construção e refinamento do modelo

De posse da melhor metodologia para o sistema, validada pelo gráfico de

Ramanchandran, seguiu-se para a etapa de construção. O modelo 3D da proteína-problema foi

construído segundo protocolo presente no pacote BioMedCache (FUJITSU, 2003), e refinado

através sucessivos ciclos de otimização Steepest Descent, Gradiente Conjugado, seguido de

simulações de DM. A cadeia principal e as alfa-hélices foram fixadas durante uma simulação

inicial de 1.000K, procedidas de simulações a 600K, a qual as alfa-hélice foram “relaxadas”

uma a uma de forma sistemática. Todas as simulações foram executadas por 50 picosegundos.

Estas simulações permitem estudar o movimento atômico, observar as estruturas de menor

energia na SEP, e também avaliar o comportamento termodinâmico da proteína (FUJITSU,

Page 41: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

40

2005; ŠALI; BLUNDELL 1993). O modelo resultante foi avaliado sobre a qualidade do efeito

estérico da cadeia lateral através do gráfico de Ramachandran (RAMACHANDRAN;

SASISEKHARAN, 1968).

4.2. ESTUDOS DE DOCKING E CÁLCULO DE ENERGIA LIVRE

A primeira etapa é a localização do sítio ativo da enzima homologa a partir do sítio ativo

da proteína modelo. Desta forma, as duas seqüências foram alinhadas. Os aminoácidos que

fazem parte do sítio ativo da proteína molde foram utilizados como referência na proteína

problema. Com base na localização do sítio ativo, o ligante é aproximado sendo orientado

pelos principais aminoácidos que fazem parte do sítio ativo na proteína molde. Após esta

etapa de localização espacial, o complexo formado é minimizado por meio de cálculos de

MM empregando os algoritmos SD e GC, sucessivamente. Após a otimização, fez-se uma

análise acerca dos principais tipos de interações que ocorreram.

O cálculo da energia de ligação foi realizado por meio do programa Amber 8.0. Para

isso foram realizadas otimizações MM seguidas de simulações DM nos seguintes sistemas:

proteína molde, complexo entre a proteína molde e o ligante, somente ligante, e complexo

entre proteína problema e ligante. Os seguintes parâmetros foram utilizados para as

minimizações de MM: imin=1; maxcyc=200; ncyc=100; cut=14, ntb=0; igb=1. Esta

otimização inicial tem por objetivo retirar os choques que possam ter ocorrido com a

aproximação do ligante da proteína. Para a DM foram empregados os seguintes parâmetros:

imin=0, realiza um cálculo de dinâmica molecular; irest=0; nstlim=10000; dt=0,001;

ntwx=20; cut=14, ntb=0; igb=1; ntt=3; gamma_ln=1,0; tempi=0,0; temp0=300,0. A energia

de ligação foi calculada pela seguinte fórmula: Eligação = Ecomplexo – Eproteína - Eligante.

Page 42: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

41

5. RESULTADOS E DISCUSSÕES

A elucidação de seqüências de aminoácidos é uma tarefa proporcionalmente mais

simples que a determinação de estruturas tridimensionais. Devido a este fato, hoje se dispõe

muito mais de estruturas primárias e secundárias do que de estruturas terciárias (SANTOS

FILHO; ALENCASTRO, 2003). Ao submeter à seqüência problema ao servidor BLASTp, foi

possível identificar 180 seqüências com grau de homologia superior a 30%. No entanto,

somente duas proteínas possuíam estrutura tridimensional determinada, sendo que a proteína

originada do Mus musculus (PDB ID 1VM8) possuía 47% de similaridade e a proteína

originada do Homo sapiens (PDB ID 1JV1) cerca de 46%, logo estas estruturas foram

selecionadas para a construção do modelo 3D da proteína pirofosforilase do M. perniciosa.

Analisando-se o arquivo pdb da 1JV1 foi constatado que a mesma apresenta duas

cadeias polipeptídicas, sendo que estas cadeias apresentam elevado grau de homologia entre si

(98%). Desta forma, uma delas foi eleita para a construção do modelo da pirofosforilase,

sendo essa escolha realizada com base no número de erros estruturais existentes na estrutura.

Assim optou-se em trabalhar com a cadeia “A”, uma vez que esta cadeia apresentou um

menor número de erros.

As imperfeições estruturais ou falhas que ocorreram durante a sua determinação

estrutural foram detectadas utilizando-se os programas Amber e BioMedCache. Por meio do

programa tLeap do pacote de programas Amber 8.0, as falhas estruturais (incompleta

descrição geométrica) foram identificadas, e as devidas correções foram realizadas pelo

programa BioMedCache. Foram encontrados dois erros estruturais, um deles na Arg74 e outro

na Val501, em ambos os casos havia uma falta da cadeia lateral. Uma outra constatação foi

que a 1JV1 apresenta falha nas coordenadas atômicas de 15 aminoácidos, sendo 11 deles entre

os resíduos 56 e 68 (Phe57, Asn58, Gln59, Ser60, Ser61, His62, Gln63, Lys, Asn65, Val66,

Asp67, Ala68) e quatro na região terminal da seqüência (Lys 502, Asn 503, Gly 504 e Ile

505) (Fig. 9). Analisando-se o arquivo PDB foi possível identificar os aminoácidos destas

duas regiões. Devido a estas porções da molécula serem regiões de alça de grande mobilidade

conformacional, durante a cristalografia de raio-X não foi possível determinar com exatidão

sua posição espacial (PENEFF et al, 2001).

Page 43: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

42

Região 1

Região 2

Figura 9: Seqüência de aminoácidos da 1JV1 indicando as regiões sem estrutura 3D determinada

Após o conhecimento dos aminoácidos que não obtiveram sua geometria espacial

estabelecida, foram utilizados os métodos de MM e DM para elucidar espacialmente esta

região. A etapa inicial desta construção foi o desenho estrutural dessas regiões no programa

BioMedCache. As regiões foram denominadas de GAP e cada uma recebeu uma numeração

específica em algarismo arábico, sendo desta forma o GAP 1 para os aminoácidos 57 a 68 e

GAP 2 para os aminoácidos 502 a 505. Após a construção destas duas regiões, partiu-se então

para sua otimização, utilizando-se o campo de força MM3 implementado no programa

BioMedCache, empregando 300 ciclos de otimização e um critério de convergência igual a

0,001kcal/mol. As estruturas dos GAP 1 e 2 estão indicados na figura 10.

Figura 10: Estruturas 3D dos GAP 1 e 2 após otimização por MM3.

GAP GAP-

Page 44: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

43

Após a otimização por MM3 obteve-se uma energia de formação de 81,50 kcal/mol para

o GAP 1 e 41,10 kcal/mol para o GAP 2. A qualidade estrutural dos GAPs foi verificada pelo

gráfico de Ramachandran (Fig. 12). O GAP 1 apresenta 60% do aminoácidos em regiões

energeticamente favoráveis, sendo que dois aminoácidos (His6; Asp11) encontraram-se em

regiões desfavoráveis. O GAP 2 apresentou 100% de seus aminoácidos em regiões favoráveis

(Fig. 11).

Figura 11: Gráfico de Ramachandran para os GAP-1 (A) e GAP-2 (B).

A ocorrência da His6 do GAP-1 está em uma região não favorável, provavelmente foi

devido à formação de uma interação de hidrogênio entre o O32 e o H155, o mesmo tipo de

análise pode ser feita para a Asp11 no qual entre o O87 e H88 também houve a formação de

uma interação fraca (Fig 12). Desta forma, em ambos os casos, a ligação de hidrogênio

alterou os ângulos phi e psi fazendo com que os aminoácidos adotassem uma conformação

menos favorável segundo o gráfico de Ramachrandran.

Page 45: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

44

Figura 12: Ligação de hidrogênio entre o O32 e H155 da His6, e entre o O87 e H88 da Asp11 do GAP-1.

Os GAPs construídos e otimizados foram submetidos a simulações de DM, usando os

seguintes parâmetros: a) período de equilíbrio de 1 ps; b) tempo de simulação de 100 ps; e)

constante dielétrica de 1,5. As simulações iniciaram-se a 100K, e o sistema foi “aquecido”

para 200K e por fim 300K, sucessivamente. A tabela 1 indica os valores de energia relativa

encontrados ao final de cada dinâmica. Com os cálculos de dinâmica molecular, espera-se que

essas ligações sejam rompidas e a molécula adote uma conformação mais estável.

Tabela 1: Valores de energia relativa encontrados para os GAP 1 e 2, após os cálculos de dinâmica molecular.

Temperatura (K)

Energia (kcal/mol)

GAP 1 GAP 2

100 18,59 40,79

200 22,17 40,79

300 0,0 0,0

Ligação de hidrogênio

Page 46: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

45

Cada simulação de DM gerou cerca de 1.000 estruturas diferentes, sendo que a estrutura

de menor energia era utilizada na simulação seguinte. Essa escolha foi feita com base no

gráfico de energia gerada ao final de cada cálculo. O resultado para o GAP 1, utilizando uma

temperatura inicial de 100K, mostra que a molécula sofreu uma arrumação espacial (Fig. 13-

A), uma vez que a estrutura inicial era praticamente planar (Fig. 13-B). Ao submeter essa

estrutura gerada na simulação seguinte (200K), nota-se um crescimento do número de

moléculas com conformação energeticamente mais estável, zona verde e azul no gráfico.

Resultados semelhantes foram encontrados após a realização da dinâmica molecular com

temperatura de 300K (Fig. 13-C). Isso denota que na finalização do processo houve a

obtenção de uma confôrmero energeticamente mais estável que os demais.

Figura 13: Resultados encontrados nas simulações de dinâmica molecular utilizando-se as temperatura de 100K (A), 200k (B) e 300K (C) para o GAP 1. A figura mostra os confôrmeros de menor energia.

A

B

C

Page 47: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

46

Os confôrmeros obtidos nas três simulações foram avaliados quanto à qualidade

geométrica da cadeia principal através do gráfico de Ramachandran. De acordo com a figura

15, pode-se observar que o gráfico C possui um número maior de aminoácidos dentro da

região energeticamente permitida, correspondendo a 60%, enquanto que os gráficos A e B

possuem 40%. Nas três simulações a His6 permaneceu em uma região energeticamente

desfavorável, fato este explicado pela formação da ligação de hidrogênio entre O32 e H155

deste aminoácido (Fig. 14). Este resultado era esperado uma vez que os confôrmeros gerados

a 300K obtiveram energia suficiente para romper barreiras rotacionais e adotar uma

conformação de menor energia.

Figura 14: Gráficos de Ramachandran das estruturas com menor energia geradas após cálculos de dinâmica molecular. A - temperatura de 100K; B – temperatura de 200K; C – temperatura de 300K.

Page 48: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

47

Com o GAP-2 foram realizadas as mesmas etapas descritas para o GAP-1 (minimização

seguida de simulações DM). Os resultados da DM para o GAP-2 encontram-se na figura

abaixo:

Figura 15: Resultados das dinâmicas moleculares do GAP-2. A - temperatura de 100K; B – temperatura de 200K; C – temperatura de 300K.

Com base nos dados obtido nos cálculos de dinâmica molecular foi possível determinar

a conformação espacial de cada uma das regiões que não foram elucidadas estruturalmente

durante a cristalografia de raio-X (PENEEF et al, 2001). Os confôrmeros de menor energia

do GAP-1 e 2 obtidos na DM 300K foram então inseridos na cadeia da 1JV1. Essa inserção

ocorreu com a adição dos aminoácidos e depois o ajuste dos ângulos phi e psi de acordo com

Page 49: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

48

os resultados obtidos nos cálculos de DM. Após as devidas inserções, a molécula foi

neutralizada no programa tLeap por meio da adição de íons H+.

Após a neutralização, a molécula foi otimizada pelo método MM3 implementado no

programa BioMedCache. Verificou-se a qualidade estrutural pelo gráfico de Ramachandran.

A figura 16 mostra que 100% dos aminoácidos encontram-se em regiões energeticamente

favoráveis, apresentando então uma boa qualidade estrutural.

Figura 16: Gráfico de Ramachandran da 1JV1 após a adição dos GAP, correções estruturais e neutralização.

Após sucessivos cálculos foi possível determinar o melhor valor de cutoff a ser

empregado para a otimização da 1JV1. Os resultados indicaram que após a otimização com o

valor de cutoff de 12Ǻ ocorreu uma queda brusca na energia de formação da molécula

(Tabela 2), sendo que o valor de energia passou a ficar praticamente constante, ou seja,

mesmo com o aumento do cutoff não ocorreram diminuições significativas na energia, e

portanto não havendo alteração na geometria. No entanto, observa-se um aumento no tempo

computacional para a realização do cálculo (Tabela 2). Com base nestes aspectos pode-se

inferir que o melhor valor de cutoff foi o de 14Ǻ, uma vez que é possível observar que a

molécula apresenta uma baixa energia de formação quando é utilizado este valor para sua

Page 50: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

49

otimização. Valores de cutoff acima de 14Ǻ implicam apenas no aumento do tempo

computacional.

Tabela 2: Valores de cutoff, energia relativa e tempo computacional encontrados para a proteína 1JV1.

Com o objetivo de verificar qual seria a melhor metodologia de otimização disponível,

procedeu-se uma validação comparando os seguintes métodos: MM3, MOZYME-PM5,

Amber, UFF. Vale destacar que a própria proteína 1JV1 foi utilizada para essa validação.

Cutoff (Ǻ) Energia (Kcal/mol) Tempo (seg)

3 4810,04 450

4 4389,28 252

5 3299,37 238

6 2754,48 253

7 2473,43 297

8 2339,46 342

9 2259,34 406

10 2205,21 502

11 2174,42 619

12 2152,92 712

13 27,54 6824

14 19,39 7200

15 13,42 8640

16 8,89 8040

17 5,73 8640

18 3,28 9300

19 3,3 9600

20 0 10620

Page 51: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

50

A comparação entre os resultados deste programas foi feita com base no gráfico de

Ramachandran (Figura 17). Pode-se afirmar que a melhor metodologia de otimização foi

aquela realizada pelo programa BioMedCache usando o campo de força MM3, pois, após

otimização o número de aminoácido em regiões energeticamente favoráveis foi maior

(99,7%) do que a dos outros programas cujos valores foram: 98,9% para o Amber, 100% para

o UFF, 97,6% para o MOZYME-PM5. Logo, a otimização de modelos da pirofosforilase

foram realizados no programa BioMedCache 6.1 usando-se o campo de força MM3.

Figura 17: Gráfico de Ramachandran da 1JV1: A) estrutura cristalina extraída do PDB; B) Otimizada pelo Amber; C) Otimizada pelo UFF; D) Otimizada por MM3; E) Otimizada por MOZYME-PM5.

Page 52: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

51

Desta forma, o BioMedCache foi utilizado para a otimização dos modelos construídos

da pirofosforilase. No entanto, o campo de força UFF apresenta como desvantagem, em

relação ao MM3, o maior tempo computacional. A construção do modelo teve início com a

comparação entre as duas seqüências, sendo realizada no programa CLUSTAL W (Figura

18). Foram encontrados 11 gaps, duas inserções e nenhuma ligação dissulfeto no alinhamento

realizado. As duas seqüências apresentam tamanhos diferentes. A 1JV1 apresenta 506

aminoácidos, enquanto que a MP Pirofosforilase apresenta 456 aminoácidos. Essa diferença

no tamanho foi levada em consideração no momento da escolha e forma de construção do

modelo da proteína problema, pois foi necessário realizar inserções ou deleções durante a

etapa de construção.

CLUSTAL W (1.83) multiple sequence alignment Pirofosforilase MSFESLKKRYEVAGQGHLLKFWPQLSESEQKSLLDQLDALDIERVNRIYNNAVS-AEARA 59 Homo sapiens (1JV1) MNINDLKLTLSKAGQEHLLRFWNELEEAQQVELYAELQAMNFEELNFFFQKAIEGFFNQS 60 *.::.** . *** ***:** :*.*::* .* :*:*:::*.:* ::::*:. :: Pirofosforilase GDPNAPQVLIEPLPKDASESVT-DATKVEEWRRTGLDAISRGHVGVLLMAGGQGTRLGSS 118 Homo sapiens (1JV1) SHQKNVDARMEPVPREVLGSATRDQDQLQAWESEGLFQISQNKVAVLLLAGGQGTRLGVA 120 .. : :. :**:*::. *.* * ::: *. ** **:.:*.***:********* : Pirofosforilase APKGCYDIGLPSHKSLFQYQAERIARLQTVAELEFKKSAGSVIIPWYVMTSGPTRRDTED 178 Homo sapiens (1JV1) YPKGMYDVGLPSRKTLFQIQAERILKLQQVAEKYYGN---KCIIPWYIMTSGRTMESTKE 177 *** **:****:*:*** ***** :** *** : : . *****:**** * ..*:: Pirofosforilase FFTKHSYFDR-----------TLPCLTMDGKLLGSP-SHVAVAPDGNGGLYAATRSPLSP 226 Homo sapiens (1JV1) FFTKHKYFGLKKENVIFFQQGMLPAMSFDGKIILEEKNKVSMAPDGNGGLYRALAA---- 233 *****.**. **.:::***:: . .:*::********* * : : Pirofosforilase KDKSRTVLSDLAKRKILYVHAYCVDNCLVRVADPVFLGYSIQKQADCAAKVVPKTRPTES 286 Homo sapiens (1JV1) ----QNIVEDMEQRGIWSIHVYCVDNILVKVADPRFIGFCIQKGADCGAKVVEKTNPTEP 289 :.::.*: :* * :*.***** **:**** *:*:.*** ***.**** **.***. Pirofosforilase VGVVARRGDKFSVVEYSEIS--DRQRNEIPDRLAPHCS--QENLSHRRDGRVGETLETKW 342 Homo sapiens (1JV1) VGVVCRVDGVYQVVEYSEISLATAQKRSSDGRLLFNAGNIANHFFTVPFLRDVVNVYEPQ 349 ****.* .. :.******** *:.. .** :.. ::: * .: Pirofosforilase NETRTIRVRLPIHGTFCCLGGEERGISTECAGYRLRRPRNSRECAGYRLRR--------- 393 Homo sapiens (1JV1) LQHHVAQKKIPYVDTQGQLIKPDKPNGIKMEKFVFDIFQFAKKFVVYEVLREDEFSPLKN 409 : :. : ::* .* * :: . : : : : ::: . *.: * Pirofosforilase --PRNSR-----LVFPAQTVPTCWCDRQG---------------WRGDRDFTARLCRRRF 431 Homo sapiens (1JV1) ADSQNGKDNPTTARHALMSLHHCWVLNAGGHFIDENGSRLPAIPRLKDANDVPIQCEISP 469 .:*.: .. :: ** . * * : .. *. Pirofosforilase GIRQGQDFLQVWPG--RVHR-------GVGCIAL--- 456 Homo sapiens (1JV1) LISYAGEGLESYVADKEFHAPLIIDENGVHELVKNGI 506

Figura 18: Alinhamento realizado pelo Clustal W entre a proteína 1JV1 e a seqüência problema. “*”; “:” e “.” Denotam resíduos conservados, substituições conservadas e regiões semi-conservadas, respectivamente.

Page 53: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

52

A partir do alinhamento entre a sequência molde e a sequência problema (figura 18) foi

possível identificar as regiões conservados assim como as regiões semi-conservadas e não-

conservadas. Com base nos resultados obtidos pelo Clustal W, foram estabelecidas 5

diferentes metodologias de construção de modelos da pirofosforilase do M. perniciosa, sendo

4 empregando-se o programa BioMedCache 6.1 e uma o DeepView 3.7. A primeira estratégia

foi a construção do modelo segundo o protocolo do BioMedCache (FUJTSU, 2003), ou seja,

substituição dos aminoácidos do molde pelos da sequência problema. O modelo originado

recebeu a denominação de MCJ1. No entanto, alguns problemas foram detectados nesta

construção, uma vez que o programa substitui os aminoácidos a partir do primeiro aminoácido

da sequência. Como as sequências possuem tamanhos diferentes (Figura 19), aminoácidos

conservados não tinham participação no processo de construção. Este modelo gerado foi

refinado por MM3 SD e GC. Ao final do cálculo obteve-se um valor de energia de -8,76 x 107

kcal/mol. No entanto vale salientar que mesmo com este valor de energia não houve

convergência durante os 300 ciclos, desta forma, este modelo foi submetido a outros cálculos

de otimização, no entanto, mesmo com estes cálculos os critérios de convergência não foram

alcançados.

Figura 19: Modelo MCJ1. Em evidência a região sem estrutura terciária definida.

Page 54: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

53

A próxima etapa referente a construção deste primeiro modelo foi a verificação da

qualidade geométrica pelo gráfico de Ramachandran gerado pelo programa PROCHECK

(LASKOWSKI et al, 1994). Os resultados indicam que 64,6% dos aminoácidos encontram-se

em regiões energeticamente favoráveis, 29,2% em regiões energeticamente permitidas,

enquanto as regiões generosamente permitida e não permitidas foram encontrados 4,5 e 1,7%

dos resíduos, respectivamente (Fig. 20). Um bom modelo deve possuir pelo menos 90% dos

resíduos na região central (engergeticamente favorável + energeticamente permitida)

(LASKOWSKI et al, 1994). Portanto, este modelo construído apresenta boa qualidade

geométrica, uma vez que, 93,8% dos resíduos apresentam-se na região central.

Figura 20: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ1.

No segundo modelo obtido (MCJ2), apenas os aminoácidos conservados tiveram seus

ângulos phi e psi alterados de acordo com os aminoácidos da seqüência molde. O resultado

encontrado foi um modelo sem estrutura 3D bem definida mesmo após o refinamento (Fig

21). A falta de informações das regiões variáveis e pouco conservadas levou a um modelo

com baixa qualidade de enovelamento.

Page 55: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

54

Figura 21: Modelo MCJ2.

O terceiro modelo (MCJ3) teve uma adição de aminoácidos nas regiões de GAP,

fazendo com que as duas seqüências adquirissem o mesmo tamanho. Após a construção, os

aminoácidos adicionados para facilitar a construção foram deletados da seqüência, fazendo

com que a seqüência da pirofosforilase retornasse ao seu tamanho original. No entanto, este

mesmo modelo apresentou muitos problemas estruturais, principalmente com ligações

químicas com comprimento superior a 3Ǻ (Fig. 22). Mesmo após a otimização, as ligações

continuaram com valores superiores a 3Ǻ. Devido a este fato, o modelo não foi submetido ao

programa PROCHECK para sua validação.

Page 56: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

55

Figura 22: Modelo MCJ3 construído. Os circulos indicam ligações com comprimento

superior a 3Ǻ

O quarto modelo (MCJ4) teve como metodologia de construção a adição de

aminoácidos nas regiões de GAP e deleção de 3 aminoácidos na seqüência problema (Ser156,

Ala157 e Gly158). Desta forma, obteve-se duas seqüências de tamanho compatível. Sendo

assim, durante a substituição de aminoácidos manteve-se conservado os ângulos phi e psi

gerando um modelo sem aparentes problemas espaciais. O novo alinhamento com a

substituição está representado na figura 23.

Page 57: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

56

Figura 23: Alinhamento entre o molde 1JV1 e a seqüência da pirofosforilase. Os retângulos indicam as regiões onde foram inseridos aminoácidos na seqüência da pirofosforilase.

O modelo resultante foi analisado mostrando que não há anormalidades estruturais na

proteína. O modelo MCJ4 apresenta 13 alfa hélices, sendo 4 destas do subtipo hélice 310.

Estas hélices são menos estáveis e raramente são concontradas em proteínas (SILVA, 1999).

Com relação as folhas beta, é possível verificar 24 folhas na estrutura da MCJ4, sendo 15

delas do tipo beta paralela (segmentos orientados no mesmo sentido) e 9 do tipo antiparalela

(segmentos adjacentes orientados em direções opostas). Adicionalmente, algumas folhas betas

são muito curtas apresentando, em alguns casos, apenas 2 aminoácidos (Fig. 24). Pode-se

notar que a proteína pertence a classe α+β, na qual a disposição de alfa hélices e folhas beta

não apresentam uma ordem específica

Page 58: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

57

Figura 24: Modelo MCJ4.

Este modelo foi então otimizado por MM SD seguido por GC e, assim, obtendo como

resultado final uma energia de -2,25 x 103 kcal/mol. A qualidade geométrica foi analisada

pelo gráfico de Ramachandran gerado pelo programa PROCHECK (Fig 25). O modelo gerado

possui 78,6% dos aminoácidos em regiões energeticamente permitidas, 16,3% em regiões

favoráveis, 3,5% em regiões generosamente permitidas e 1,6% em regiões não permitidas.

Logo, o modelo construído possui boa qualidade geométrica, uma vez que, 94,9% dos

aminoácidos estão dentro da região central, localizando-se dentro da região vermelha do

gráfico de Ramachandran (Fig. 25). O valor de rms de 1,17 foi obtido entre 1JV1 e MCJ4

para a sobreposição dos Cα.

Page 59: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

58

Figura 25: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ4.

O gráfico de Ramachandran pode ser analisado por aminoácido. Esta análise permite

uma melhor descrição da qualidade geométrica do modelo, sendo também gerado pelo

programa PROCHECK (Fig. 26). Todas as asparaginas, glicinas, histidinas, lisinas,

metioninas, triptofanos e tirosinas estavam dentro das regiões energeticamente favoráveis. No

entanto, alguns aminoácidos apresentaram conformações geométricas desfavoráveis

enegerticamente: Arg315, Asp186, Asp298, Asp320, Cys366, Gln314, Glu4, Glu27, Glu90,

Ile42, Leu69, Phe3, Phe185, Pro63, Pro66, Pro72, Pro482, Ser2, Ser5, Ser415, Thr115,

Thr235, Val53, Val264.

Page 60: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

59

Figura 26: Gráfico de Ramachandran para cada um dos aminoácidos do modelo MCJ4, o valor entre parênteses indica a quantidade do aminoácido correspondente na seqüência da MCJ4.

Os aminoácidos em regiões energeticamente desfavoráveis estão presentes na superfície

da molécula. Desta forma, a estrutura global da proteína não é afetada de forma significativa.

A figura 27 mostra a localização de cada um destes aminoácidos na seqüência de MCJ4 e na

estrutura 3D.

Page 61: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

60

Figura 27: Seqüência de aminoácidos da MCJ4 evidênciando aqueles que estão localizados dentro das regiões desfavorecidas. Em azul a localização destes aminoácidos na proteína.

A qualidade da cadeia principal do modelo MCJ4 foi analisada por meio do gráfico

número 4 gerado pelo programa PROCHECK. Neste gráfico o modelo contruído é

representado por um quadrado que é plotado em seis gráficos com regiões que indicam a

qualidade do Ramachandran, planaridade da ligação peptídica, interações ruins, distorção do

carbono alfa, energia das ligações de hidrogênio e o fator-G (Figura 28). Os resultados para a

qualidade do gráfico de Ramachandran (Figura 28-a) mostraram que o modelo encontra-se

dentro da faixa ideal. Este fato pode ser corroborado analisando-se o próprio gráfico de

Ramachandran do modelo MCJ4 exposto na figura 28. A planaridade da ligação peptídica do

modelo MCJ4 encontra-se fora dos limites estabelecidos, indicando que alguns aminoácidos

possuem o ângulo torsional ômega em uma conformação não ideal (Figura 28-b). Verificou-se

Page 62: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

61

que no modelo construído ainda é possível encontrar alguns contatos ruins, mesmo após os

cálculos de otimização. Esses contatos ruins ocorrem devido a proximidade inferior a 2Ǻ ou

entre 2 e 4Ǻ para resíduos e átomos respectivamente (Figura 28-c). A distorção do ângulo

diedro do carbono alfa mostrou-se dentro dos limites aceitáveis (Figura 28-d). A energia das

ligações de hidrogênio encontram-se fora dos limites estabelecidos (Figura 28-e). O fator-G é

uma medida da normalidade da estrutura. Ele é obtido pela média dos outros fatores-G (phi-

psi, chi1-chi2 distribuição e resíduos-resíduo), com base nos resultados apresentados pela

figura 28-f, a modelo construído não apresenta um bom fator-G.

Figura 28: Qualidade da cadeia principal do modelo MCJ4: a-avaliação do gráfico de Ramachandran; b-planaridade da ligação peptídica; c-interações ruins; d-distorção dos carbonos alfa; e-energia das ligações de hidrogênio; f- fator-G.

Page 63: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

62

O modelo foi então submetido a simulações de DM, com o objetivo de verificar a sua

estabilidade, termodinâmica e buscar um confôrmero de menor energia na superfície de

energia potencial, uma vez que é possível observar o movimento das partículas individuais a

medida que a simulação se desenvolve. Ao final das simulações cerca de 2501 confôrmeros

foram gerados. Os resultados da dinâmica estão indicados na figura 29. É possível constatar

uma diminuição nos valores de energia a medida que a simulação se desenvolve. A região em

vermelho indicada no gráfico representa confôrmeros que possuem alta energia de formação,

enquanto que as regiões em azul indicam estruturas de menor energia, como pode ser

observado na figura 29 a maioria das estruturas encontraram-se dentro desta região.

Figura 29: Resultado encontrado após a simulação de DM para o modelo MCJ4

O confôrmero de menor energia foi analisado com relação a sua qualidade geométrica.

Por meio do gráfico de Ramachandran foi possível constatar que 91,1% dos aminoácidos

encontram-se em regiões energeticamente favoráveis (core region), sendo que apenas 2,8%

estão localizados em regiões desfavoráveis. Este fato indica que o modelo apresentou uma

boa qualidade geométrica após as simulações de DM. Adicionalmente, o modelo não perdeu

Page 64: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

63

sua estrutura terciária após a finalização dos cálculos, mostrando uma estabilidadde

termodinâmica. Modelos instáveis podem perder as estruturas terciárias no fim da simulação.

Comparando-se os valores do gráfico de Ramachandran antes e após a dinâmica molecular,

pode-se verificar uma queda no número de aminácidos em regiões favoráveis e um aumento

dos localizados em regiões desfavoráveis. No entanto, é importante destacar que o objetivo da

dinâmica também é avaliar a estabilidade do modelo.

Além dos modelos construídos no BioMedCache 6.1, um outro programa de modelagem

comparativa foi utilizado para a construção do modelo 3D da pirofosforilase do M.

perniciosa. O programa DeepView 3.7 foi empregado para a construção de um outro modelo,

identificado como MCJ5. A maior vantagem deste programa é que há a possibilidade de se

trabalhar com várias estruturas como molde, enquanto que no BioMedCache 6.1 a construção

ocorre com apenas um molde por vez. O DeepView 3.7 é uma forma automática de

construção de modelos 3D. O próprio programa faz uma busca por molde com base na

seqüência FASTA da proteína problema, e posteriormente é feito uma sobreposição das

estruturas 3D. Como pode ser observado na figura 30. O programa identificou cerca de 10

moldes para a seqüência submetida. Além destes moldes, também foi inserido durante a

construção o molde CILA3, este molde foi a proteína 1JV1 com a inserção das duas regiões

que não tiveram sua estrutura 3D determinada. O modelo foi então submetido ao servidor do

Swiss-Model.

Figura 30: Resultado da sobreposição feita pelo DeepView 3.7 para a construção do modelo MCJ5, na parte superior é possíve observar os moldes utilizados para a construção.

Page 65: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

64

A figura 31 abaixo mostra o modelo resultante das sobreposições. Como pode ser

observado as regiões em verde e vermelho indicam regiões com alta e baixa similaridade,

respectivamente (GUEX; PEITSCH, 1997). O modelo MCJ5 apresentou um alto grau de

similaridade estrutural com os moldes, como pode ser visto na figura 32. Apenas uma

pequena região apresentou uma baixa similaridade, a qual é um loop composto pelos

aminoácidos Leu151, Glu152, Phe153, Lys154, Lys 155, Ser156, Ala157, Gly158.

Figura 31: Modelo MCJ5 contruído no DeepView 3.7

O modelo MCJ5 foi então refinado comforme descrito anteriormente. Seguindo a

mesma metodologia adotada para o modelo MCJ4, a qualidade geométrica foi analisada por

meio do gráfico de Ramachandran gerado pelo programa PROCHECK (Fig 32). O modelo

gerado possui 78,3% dos aminoácidos em regiões energeticamente permitidas; 17,3% em

regiões favoráveis; 3,1% em regiões generosamente permitidas e 1,3% em regiões não

permitidas. O modelo construído possui boa qualidade geométrica, uma vez que, 95,6% dos

aminoácidos estão dentro da região central (Fig. 32). Para este modelo o valor de rms

encontrado foi de 7,51

Page 66: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

65

Figura 32: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ5.

Analisando-se os aminoácidos individualmente pode-se perceber que todas as argininas,

metioninas, triptofanos e tirosinas estavam dentro das regiões energeticamente favoráveis (Fig

33). No entanto, alguns aminoácidos apresentaram conformações geométricas

enegerticamente desfavoráveis: Ala52, Ala219, Ala318, Asn51, Asn311, Asp295, Asp412,

Cys321, Cys414, Cys453, Gln270, Gln435, Glu312, Gly112, Gly158, Gly452, His183,

His320, Ile42, Ile69, Ile348, Leu317, Lys241, Phe401, Pro62, Pro65, Pro210, Pro279,

Pro314, Pro319, Pro472, Ser54, Ser204, Ser298, Thr113, Thr168, Thr181, Thr220, Thr232,

Thr347, Val53, Val12, Val166, Val67, Val400, Val451. Percebe-se que este modelo

construído apresenta um número maior de aminoácidos em regiões desfavoráveis, quando

comparado com o modelo MCJ4.

Page 67: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

66

Figura 33: Gráfico de Ramachandran para cada um dos aminoácidos do modelo MCJ5. O valor entre parênteses indica a quantidade do aminoácido correspondente na seqüência da MCJ5.

Os aminoácidos em regiões energeticamente desfavoráveis estão presentes na superfície

da proteína e alguns poucos em seu interior. Desta forma, sua conformação não afeta de

maneira siginificativa a estrutura global da proteína. A localização de cada um destes

aminoácidos na seqüência e na estrutura de MCJ5 é mostrado pela figura 34. Como pode ser

observado estes aminoácidos localizam-se essencialmente na parte esterna da proteína.

Page 68: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

67

Figura 34: Seqüência de aminoácidos da MCJ5 na qual os aminoácidos sombreados indicam aqueles que estão localizados dentro as regiões desfavorecidas de acordo com o gráfico de Ramachandran. A estrutura abaixo indica a localização destes aminoácido na proteína, os mesmos encontram-se marcados de azul.

Utilizando-se o programa PROCHECK, a qualidade da cadeia principal do modelo

MCJ5 foi analisada por meio do gráfico número 4 (Fig. 35). Observando os resultados para a

qualidade do gráfico de Ramachandran (Figura 35-a), pode-se concluir que o modelo

encontra-se dentro da faixa ideal. Este fato pode ser corroborado analisando-se o próprio

gráfico de Ramachandran do modelo MCJ5 exposto na figura 35. A planaridade da ligação

pepitídica do modelo MCJ5 encontra-se dentro dos limites estabelecidos, indicando que os

ângulos torsionais ômega dos aminoácidos da MCJ5 estão na conformação ideal (Figura 35-

b). Verificou-se que no modelo construído possui alguns contatos ruins (Figura 35-c). A

distorção para o carbono alfa mostrou-se dentro dos limites aceitáveis (Figura 35-d). A

energia das ligações de hidrogênio encontraram-se fora dos limites estabelecidos (Figura 35-

e). Com base nos resultados apresentados pela figura 36-f, o modelo construído apresenta um

bom fator-G.

Page 69: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

68

Figura 35: Qualidade da cadeia principal do modelo MCJ5: a-avaliação do gráfico de Ramachandran; b-planaridade da ligação peptídica; c-interações ruins; d-distorção dos carbonos alfa; e-energia das ligações de hidrogênio; f- fator-G.

Durante a elucidação estrutural da enzima pirofosforilase obteve-se dois modelos que

apresentaram boa qualidade estrutural como visto pelos resultados mostrados pelo programa

PROCHECK. A etapa seguinte foi a localização do sítio ativo nos modelos construídos. Para

isso a etapa inicial foi a localização do sítio ativo por meio da metodologia descrita no

programa BioMedCache 6.1. De pose das coordenadas do ligante UDP-N-acetilglicosamina,

Page 70: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

69

presente na proteína molde, foi feito um corte de 5Ǻ ao redor deste sendo possível indentificar

os aminácidos que interagem com o ligante (Fig 36).

Figura 36: Localização da UDP-N-acetilglicosamina no sítio ativo da enzima 1JV1.

Os seguintes resíduos são cruciais para a reação feita pela pirofosforilase: Leu108,

Gly111, Gly112, Gln197, Gly223, Asn224, Asp254, Gly291, Glu304, Tyr305, Asn328,

His331, Phe381, Phe383 e Lys408 (PENEFF, 2001). A porção osídica da UDP-N-

acetilglicosamina estabelece numerosas ligações de hidrogênio com a Glu304, His331 e a

Asn224, e também uma interação hidrofóbica com o Phe381 e Phe383. Desta forma as

seqüências da proteína molde e dos modelos MCJ4 e MCJ5 foram alinhadas, e os

aminoácidos que fazem parte do sítio ativo da proteína molde foram marcados nos dois

modelos (Fig 38). O grupamento UDP é transferido para a acetilglicosamina por uma região

semi-conservada, composta pelos seguintes resíduos: Leu-X2-Gly-X-Gly-Thr-X-Met-X4-Pro-

Lys (OLSEN; RODERICK, 2001).

Page 71: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

70

Figura 37: Alinhamento entre a proteína molde 1JV1 e os modelos MCJ4 e MCJ5. As regiões em vermelho indicam os aminoácidos que fazem parte do sítio ativo da enzima. A região em verde indica a porção semi-conservada responsável pela transferência do grupamento UDP.

Como pode ser observado pela figura 37, o sítio ativo da enzima encontra-se

extremamente conservado. Apenas as regiões compreendidas entre os resíduos 379-384 e

403-409 não apresentaram similaridade. Adicionalmente, os modelos construídos não

apresentam as fenilalaninas necessárias para a formação das interações hidrofóbicas. No

entanto, diferenças espaciais entre a localização dos sítios ativos dos dois modelos foram

constatadas. Na figura 38 estão indicadas os sítios ativos dos dois modelos. Pode ser

Page 72: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

71

observado que os amoniácidos que se encontram fora das especificações do gráfico de

Ramachandran (Fig. 25 e 32) não fazem parte do sítio ativo dos modelos construídos.

Figura 38: Comparação entre a posição espacial dos aminoácidos que compõem o sítios ativos dos modelos construídos: A) sítio ativo do modelo MCJ4; B) sítio ativo do modelo MCJ5.

A

B

Page 73: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

72

O sítio ativo do modelo MCJ4 apresentou uma disposição espacial melhor do que o

modelo MCJ5. Neste último, os resíduos que foram indentificados apresentaram-se muito

dispersos pela enzima, fato este não observado no modelo MCJ4. A construção manual

realizada no programa BioMedCache gerou resultados melhores do que a construção

automática feita pelo Deep View 3.7. Desta forma a proteína MCJ4 foi utilizada para a

realização dos estudos de docking. O ligante utilizado foi o mesmo que estava complexado

com o molde 1JV1.

A ancoragem do ligante no modelo foi realizada por meio da aproximação entre o

ligante e os aminoácidos que fazem parte do sítio ativo da enzima. Este processo foi realizado

por meio da observação das coordenadas do ligante complexado com a proteína molde

(1JV1), e levando-se em consideração os aminoácidos chaves, descritos anteriormente (Fig.

39).

Figura 39: A- Localização do ligante no sítio ativo do modelo MCJ4. B- Em detalhe o ligante e os aminoácidos que fazem parte do sítio ativo da enzima.

As otimizações inicias do complexo enzima-ligante foram realizadas com o objetivo de

reduzir as interações muito próximas, e observar as possíveis ligações hidrofóbicas e

hidrofílicas que se formaram. Neste sentido foi possível constatar que houve a formação de

ligações de hidrogênios entre o grupamento amino do resíduo Asn224 e Leu383 com o

oxigênio 22 e 29 do ligante, respectivamente (Fig. 40). Estes dois aminoácidos tem

Page 74: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

73

importância comprovada para a ligação de um substrato no sítio ativo de pirofosforilases,

pois, os aminoácidos Asn224 e Phe383 são fundamentais para o acoplamento do ligante com

o sítio ativo da enzima, levando a formação de interações como ligações de hidrogênio e

hidrofóbicas (PENEFF et al, 2001; POMPEO, 2001). Desta forma interações deste tipo

também foram observadas no modelo construído. No entanto, deve-se atentar para o fato que

na posição 383 no modelo MCJ4 o resíduo correspondente é uma leucina e não uma

fenilalanina, como descrito por Pennef et al (2001). Estes resíduos guardam proximidade

química, uma vez que ambos são hidrofóbicos e ocorrem comumente em alfa hélices e folhas

beta.

Figura 40: Ligações de hidrogênio identificadas após a otimização do complexo MCJ4-ligante. Em vermelho os aminoácidos e em azul as ligações de hidrogênio.

A interações hidrofóbicas que ocorrem no sítio ativo de pirofosforilase derivam

principalmente de uma bolsa hidrofóbica formada entre dois anéis benzênicos de resíduos de

fenilalaninas localizadas nas posições 381 e 383. No entanto, o modelo construído não

apresenta esta bolsa hidrofóbica. No modelo MCJ4, as posições 381 e 383 encontraram-se

uma glicina e uma leucina, respectivamente. Estas informações podem ser levadas em

consideração para o desenvolvimento de novos inibidores mas específicos para a

pirofosforilase fúngica.

Com o objetivo de estudar as principais interações que realmente contribuem para a

formação do complexo entre a proteína e o ligante, os orbitais de fronteira (Highest Occupied

Molecular Orbital – HOMO e Lowest Unoccupied Molecular Orbital – LUMO) foram

Page 75: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

74

obtidos através de cálculo single point (sem otimização de geometria), pelo método

MOZYME-PM5. Como pode ser observado pela figura 41a, os orbitais HOMO localizaram-

se essencialmente no oxigênio da Glu304 (-7,25 ev), enquanto os orbitais LUMO localizaram-

se nos átomos de fósforos (-3,20 ev) do ligante. A posição destes orbitais não se alteraram

quando o sítio ativo e o ligante foram calculados isoladamente (Fig. 41b e c). Estes resultados

podem sugerir mais detalhadamente o mecanismo de ação da enzima pirofosforilase, em que

o par de elétrons do oxigênio da glutamina pode realizar um ataque nucleofílico nos fósforos

do ligante acarretando em sua hidrólise. No entanto, cálculos QM/MM e simulações Car-

Parrinello são necessários para o completo entendimento deste mecanismo. A sua

compreensão é de fundamental importância para o desenvolvimento de novos ligantes, uma

vez que análogos do estado de transição se ligam mais fortemente as enzimas (MANNHOLD;

KUBINYI; FOLKERS, 2003).

Figura 41: Orbitais de fronteira. As cores verde e azul indicam a distribuição do orbital HOMO, equanto as cores amarelo e vermelho mostram a distribuição do orbital LUMO. A) Complexo ligante-proteína; B) Sítio ativo; C) Ligante.

Page 76: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

75

Simulações de DM realizadas no programa Amber foram empregadas para calcular a

energia livre após o docking do ligante no sítio ativo do modelo construído. Conforme

mostrado pela tabela 3, a energia livre do sistema obtida foi de 34,66 kcal/mol. As simulações

de DM sugerem que este valor poderia ser reduzido se a MCJ4 possuísse a bolsa hidrofóbica

característica da família das pirofosforilases (PENEFF et al, 2001), fazendo uma provável

interação hidrofóbica com o ligante.

Tabela 3: Valores de energia encontrados após as simulações de DM.

Estrutura Energia (kcal/mol)

Complexo (Ligante+MCJ4) -15,438 x 103

MCJ4 -15,030 x 103

UDP-N-acetilglicosamina -4,443 x 102

Energia Livre* 34,66

* Eligação = Ecomplexo – Eproteína - Eligante

Page 77: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

76

6 CONCLUSÕES

A elucidação estrutural de alvos moleculares tem sido uma das principais ferramentas

para o desenvolvimento racional de novos fármacos. Tendo em mãos a conformação espacial

de um receptor é possível prever qual a estrutura do novo ligante, e com isso há um

planejamento racional deste composto protótipo. Desta forma há um ganho de tempo

significativo e uma redução nos custos das pesquisas. O presente trabalho teve como objetivo

central o desenvolvimento de um modelo 3D, por modelagem comparativa, da enzima

pirofosforilase.

Durante o desenvolvimento 3D do modelo da pirofosforilase foi possível encontrar uma

proteína molde com grau de homologia satisfatório, permitindo a construção da proteína

homologa. No entanto, houve a necessidade de construir duas regiões da proteína problema

que não foram determinadas experimentalmente, mostrando assim a versatilidade dos

métodos teóricos. Assim pode-se construir um molde, e conseqüentemente um modelo mais

próximo da realidade considerando o completo ambiente protéico.Tendo a proteína molde

completa, foi possível proceder para a construção do modelo, para isso dois programa foram

utilizados, BioMedCache e DeepView 3.7. Os dois programas ofereceram bons modelos para

a pirofosforilase do fungo M. perniciosa, no entanto, o método automático do DeepView 3.7

não foi muito satisfatório quanto o do BioMedCache, uma vez que o sítio ativo da enzima não

assumiu uma conformação espacial esperada.

A pirofosforilase é uma enzima beta/alfa/beta, assim como a maioria das pirofosforilases

descritas na literatura. O fator que mais chamou a atenção nessa estrutura foi a presença de

hélices 310. Estas hélices diminuem a estabilidade do modelo, sendo por isso muito

importante durante as etapas de otimização do modelo, uma vez que, otimizações com

número de ciclos superiores ao necessário podem levar a uma “desnaturação” da conformação

espacial para esta enzima.

Por meio da proteína molde foi possível determinar o sítio ativo do modelo construído.

Este sítio ativo apresentou-se muito conservado, o que irá facilitar bastante futuros estudos

sobre um desenvolvimento racional de fungicida com o modelo construído, uma vez que

existem análises sobre o sítio ativo de pirofosforilase em outros trabalhos científicos

(PENEFF et al, 2001; OLSEN; RODERICK, 2001). Adicionalmente o modelo 3D não

apresenta uma bolsa hidrofóbica muito comum em algumas pirofosforilases (PENEFF et al,

Page 78: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

77

2001), devendo-se então levar este fator em consideração durante o desenvolvimento do

inibidor específico.

Durante o desenvolvimento deste trabalho, foi construído e validado o modelo da

pirofosforilase, o que representou um grande avanço em termos de aprendizado para o grupo,

considerando-se este como o primeiro trabalho na área. A etapa a seguir de desenvolvimento

será realizar estudos de inibição, tanto teórico quanto experimentalmente. Em nível teórico

serão utilizados os métodos QM/MM, Car-Parrinello e efeito solvente, com isso pode-se ter

uma melhor compreeensão sobre o mecanismo de ação enzimática, direcionando assim o

desenvolvimento do novo fungicida. Paralelo a este estudo teórico, será realizado o

isolamento, purificação, carcaterização e estudos de inibição da enzima pirofosforilase do M.

perniciosa. Espera-se assim, obter uma avaliação da utilização da enzima pirofosforilase

como uma possível forma de controle da doença de vassoura-de-vassoura.

Page 79: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

78

REFERÊNCIAS

AIME, M. C.; PHILLIPS-MORA, W. The Causal agents of witche’s broom and frosty pod of cacao (chocolate, Theobroma cacao) form a new lineage of Marasmiaceae. Mycologia, v. 97, n. 5, p. 1012-1022, 2005.

ALLINGER, N. L.; LII, J. H. The MM3 force field for amides, polypeptides and proteins. Journal of Computational Chemistry, v. 12, p. 186 – 199, 2004. ALTSCHUL, S. F. et al. Basic local aligment search tool. Journal Molecular Biology, v. 215, p. 403, 1990.

BASTOS, E. Cacau: a riqueza agrícola da América. São Paulo: Ícone, 1987. 130p.

BERMAN, H. M. et al.The Protein Data Bank. Nucleic Acids Research. v. 28, n. 1, p. 235-242, 2000.

BRANDEAU, J. El cacao. Barcelona: Blume, 1992.

BOTANISCHER GARTEN, 2007. Theobroma cacao. Disponível em: http://www.botanik.uni-karlsruhe.de/garten/fotos-knoch/Theobroma%20cacao%20Echter%20Kakaobaum%207.jpg. Acesso em: 14 mar. 2007

CASE, D. A. et al. Amber 8: User Manual. San Francisco: University of California, 2004, 320 p.

COMPANHIA DAS DOCAS DO ESTADO DA BAHIA, 2002. Apresenta em estatística os principais produtos movimentados. Disponível em: http://www.cobeda.com.br/portoilheus. Acesso em: 25 jan. 2005.

CRONSHAW, D. K. Fungicide application together with cultural practices to control cocoa disease in Ecuador. Tropical Agriculture, v. 56, n. 2, p. 165-171, 1979.

DAPPRICH, S. et al. A new ONIOM implementation in Gaussian98. Part I. The calculation of energies, gradients, vibrational frequencies and electric field derivatives. Journal of Molecular Structure, n.461, p. 1-21, 1999.

DE LUCA, C. et al. Overexpression, one-step purification and characterization of UDP-glucose dehydrogenase and UDP-N-acetylglucosamine pyrophosphorylase. Bioorganic e Medicinal Chemistry. v. 4, n.1, p. 131-142, 1996.

FORESMAN, J. B.; FRISCH, Æ, Exploring Chemistry with Electronic Structure Methods 2. ed. Pittsburgh, Gaussian, Inc. 1996.

FRISCH, Æ.; FRISCH, M. J.; TRUCKS, G. W. Gaussian 03: User’s Reference. Gaussian Inc: Carnegie, 2003, 327p.

FUJITSU, 2002. BioMedCaChe protein-drug discovery modeling software on windows. Disponível em: http://www.cachesoftware.com/biomedcache/index.shtml. Acesso em : 23 mai 2005.

Page 80: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

79

FUJITSU. BioMedCache 6.1: User Guide. Oxford: Fujitsu Limited, 2003, 200 p.

GETHER, U.; KOBILKA, B.K. G protein-coupled receptors. II. Mechanism of agonist activation. Journal of Biological Chemisthy, n. 273, p. 17979-17982, 1998.

GIBAS, C.; JAMBECK, P. Visualização de estruturas de proteínas e computação de propriedades estruturais. In: ______. Desenvolvendo a Bioinformática. Rio de Janeiro, 2001, p. 222-277.

GOLDSMITH-FISCHMAN, S.; HONIG, B. Structural genomics: computacional methods for structure analyses. Protein Science, v. 12, p. 1813-1821, 2003.

GRIFFITH, G. W. et al. Autencology and evolution of the wicth’broom patogen (Crinipellis perniciosa) of cocoa. In: BLAKEMAN, J. P.; WILLIAMISON, B. Ecology of Plant Pathogens. Oxon: CAB International, 1994, p. 245-267.

GRIFFITH, G. W. et al. Witches’brooms and frosty pods: two major pathogens of cacao. New Zeland Journal of Botany. v. 41, p. 423-435, 2003.

GRIFFITH, R.; TRACY, T. Antifungal drugs. In: WILLIANS, D. A.; LEMKE, L. Foye’s principles of medicinal chemistry. 5. ed. Philadelphia. Lippincott Williams & Wilkins, 2002, p. 891-903.

GUEX, N.; PEITSCH, M. C. SWISS-MODEL and the Swiss-PdbViewer: An environment for comparative protein modeling. Electrophoresis, n.18, p. 2714-2723, 1997

KABSCH, W.; SANDER, C. Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features. Biopolimers, v. 22, p. 2577-2637, 1983.

KRAMER, K. J.; MUTHUKRISHNAN, S. Insect chitinase: molecular biology and potencial use as biopesticides. Insect Biochemstry Molecular Biology, v. 27, n. 11, p. 887-900, 1997.

KUNDROTAS, P. J.; ALEXOV, E. Predicting 3D structures of transcient protein-protein complexes by homology. Biochimica et Biophysica Acta. 2006.

HEHRE, W. J.; et al. Ab Initio Molecular Orbital Theory . New York: Wiley, 1986.

HENSEN, C. et al. A combined QM/MM approach to protein-ligant interactions: polarization effects of the HIV-1 protease on selected high affinity inhibitors. Journal of Medicinal Chemistry, n. 47, p. 6673-6680, 2004. HERSCOVICS, A.; ORLEAN, P. Glycoprotein biosynthesis in yest. FASEB Journal, n. 7, p. 540-550, 1993.

HÖLTJE, H. D. et al. Introduction to comparative protein modeling. In: ______. Molecular Modeling: basics principles and applications. 2. ed. Germany: Wiley-VCH GmbH, 2003, p. 87-144.

LANA, T. G. Caracterização genética e fisiológica de Crinipellis perniciosa. 2000. 106p. Tese (doutorado) – Escola Superior de Agricultura Luiz de Queiroz, Universidade de São Paulo, Piracicaba.

Page 81: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

80

LEAL JÚNIOR, G. A. Produção de soros policlonais com alta afinidade contra o biótipo ‘C’ e o biótipo ‘S’ de Crinipellis perniciosa. Fitopatologia Brasileira, v. 30, n. 5, p. 482-488, 2005.

LI, H. et al. Homology modeling using simulated annealing of restrained molecular dynamics and conformacional search calculations with CONGEN: Aplication in predicting the three-dimensional structure of murine homeodomain Msx-1. Protein Science, n. 6, p. 956-970, 1997.

LYBRAND, T. P. Computer Simulation of Biomolecular Systems Using Molecular Dynamics and Free Energy Pertubation Methods. In: LIOKWITZ, K. B.; BOYD, D. B. Reviews in computacional chemistry. United States of America: VCH Publishers, 1990, p. 295-320.

MANNHOLD, R.; KUBINYI, H.; FOLKERS, G. Quantum Medicinal Chemistry. Weinheim: WILEY-CCH GmbH & Co. KGaA, 2003.

MIO, T. et al. The eukaryotic UDP-N-Acetylglucosamine pyrofosforilases. The Journal of Biological Chemistry. v. 273, n. 23, p. 14392-14397, 1998.

NEW CROP, 2007. Tropical Beverage Crops-Cacao. Disponível em: http://www.hort.purdue.edu/newcrop/tropical/lecture_18/lec_18.html. Acesso: 14 mar. 2007.

OLSEN, L. R.; RODERICK, S. L. Structure of Echerichia coli GlmU pyrophosphorylase and acetyltransferase active sites. Biochemistry, n. 40, p. 1913-1921, 2001.

PATNY, A.; DESAI, P.; AVERY, M. A. Homology modeling of G-protein-coupled receptors and implications in drug design. Current Medicinal Chemistry , n. 13, p. 1667-1691, 2006.

PATRICK, G. L. An Introduction to Medicinal Chemistry. Oxford University Press Inc., New York, 2001.

PEARLMAN, D. A. et al. Amber, a package of computer programs for applying molecular mechanics, normal mode analysis, molecular dynamics and free energy calculations to simulate the structural and energetic properties of molecules. Computer Physics Communications. n. 91, p. 1-41, 1995.

PENEFF, C. el al. Crystal structures of two human pyrophosphorylase isoforms in complexes with UDPGlc(Gal)NAc: role of the alternatively spliced insert in the enzyme oligomeric assembly and active site architecture. The European Molecular Biology Organization Journal, v. 20, n. 22, p. 6191-6202, 2001.

PEREIRA, J. L. et al. First occurence of witches’broom disease in the principal cocoa-growins region of Brazil. Tropical Agriculture , v. 67, n. 2, p. 188-189, 1990. POMPEO, F. et al. Dissection of the bifunctional Escherichia coli N-Acetylglucosamine –1-phosphate uridyltransferase enzyme into autonomously functional domains and evidence that trimerization is absolutely required for glucosamine-1-phosphate acetyltransferase activity and cell growth. The Journal of Biological Chemistry, v.276, p.3833-3839, 2001.

PURDY, L. H. Fungal Disease of Cacao. Disponível em: http://www.cabi-commodities.org/Acc/ACCrc/PDFFiles/W-BPD/Ch1.pdf. Acesso em: 25 abr 2007.

Page 82: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

81

PURDY, L. H.; SCHMITDT, R. A. Status of caco witches’ broom: biology, epidemiology and management. Annual Review of Phytopathology, v. 34, p. 573-594, 1996.

RAST, D. M. et al. Cell wall-associated in fungi. Phytochemistry, v. 64, p. 339-366, 2003.

RAMACHANDRAN G. N.; SASISEKHARAN, V. Conformation of polypeptides and proteins. Advanced Protein Chemistry, n. 23, p. 283-438, 1968.

RINCONES, J. et al. Genetic variability and chromosome-lenght polymorphisms of the witches’broom pathogen Crinipellis perniciosa from various plant hosts in South America. Mycological Research, p. 821-832, 2006.

RINO, J. P.; STUDART, N. Um potencial de interação para o estudo de materiais e simulações por dinâmica molecular. Química Nova, v. 24, n. 6, p. 838-845, 2001.

ROSA, I. S. Enxertia do cacaueiro. Ilhéus: CEPALC/SUBES/CEPEC, 1998, 42p.

RSCB, 2000a. RSCB Protein Data Bank. Disponível em: http://www.rcsb.org/pdb/explore/explore.do?structureId=1JV1. Acesso em: 25 abr 2007.

RSCB, 2000b. RSCB Protein Data Bank. Disponível em: http://www.rcsb.org/pdb/ligand/ligandsummary.do?hetId=UD1&sid=1JV1. Acesso: 22 abr 2007.

RUBINI, M. R. et al. Diversity of endophylic fungal community of cacao (Theobroma cacao L.) and biological control of Crinipellis perniciosa, causal agent of Witches’broom disease. International Journal of Biological Sciences, n. 1, p. 24-33, 2005.

ŠALI, A.; BLUNDELL, T. L. Comparative protein modelling by satisfaction of spacial restraints. Journal Molecular Biology. v. 234, p. 779-815, 1993.

SÁNCHEZ, R.; SALI, A. Comparative protein modelling in genomics. Journal of Computacional Physics. n. 151, p. 388-401, 1999.

SANTOS FILHO, O. A.; ALENCASTRO, R. B. Modelagem de proteínas por homologia. Química nova, v. 26, n. 2, p. 253-259, 2003.

SCHWEDE, T. et al. SWISS-MODEL: an automated protein homology-modeling server. Nucleic Acids Research, v. 31, n. 13, p. 3381-3385, 2003.

SOBERANIS, W. Increased frequency of phitissanitary pod removal in cocoa (Teobroma cacao L.) increases yied economically in eastern Peru. Crop Protetion, v. 18, p. 667-685, 2000.

STEWART, J. J. P. Calculation of the geometry of a small protein using semiempirical methods. Journal of Molecular Structure, v. 401, n. 3, p. 195-205, 1997.

SWISS-PROT, 1996, Swiss-Prot Protein knowledgebase. Disponível em: http://ca.expasy.org/sprot/. Acesso: 25 abr 2007.

TAKAYA, N. et al. Intracellular chitinase gene from Rhizopus oligosporus: molecular cloning and characterization. Microbiology, n. 144, p. 2647-2654, 1998.

Page 83: (Sthael) (Singer) Phillips-Mora por modelagem comparativa

82

TOMPSON, J.D.; HIGGINS, D.; GIBSON, T.J. CLUSTAL W: improving the sensitivy of progressive multiple aligment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Research, v. 22, n. 22, p. 4673-4680, 1994.

TRABULSI, L. R. et al. Microbiologia . 3. ed. São Paulo: Atheneu, 1999.

YAMADA-OKABE, T.; et al. Identification and characterization of the genes for N-Acetylglucosamine kinase and N-Acetylglucosamine-phosphate deacetylase in the pathogenic fungus Candída albicans European Journal of Biochemistry, v.268, p.2498-2505, 2001.

VREVEN, T. et al. Combining quantum mechanics methods with molecular mechanics methods in ONIOM. Journal of Chemical Theory and Computation, n. 2, p. 815-826, 2006.