Protein Modelling

77
Gustavo Machado Álvares de Lima Bacharel em Ciências Físicas e Biomoleculares Orientador: Rafael V. C. Guido

description

protein modelling -practical approach

Transcript of Protein Modelling

Gustavo Machado lvares de Lima Bacharel em Cincias Fsicas e Biomoleculares Orientador: Rafael V. C. Guido Introduo Importncia das estruturas 3D de protenas Modelagem por homologia Bases da modelagem Funo da modelagem Validaes bsicas Validaes avanadas Programas de modelagem ViTaMIn ndice Estrutura De Uma Protena Estrutura primria Em protenas, o termo estrutura primria refere-se sequncia linear de aminocidos que as compem. Fonte: Bacteriology at UW-Madison - Lectures in Microbiology by Kenneth Todar Estrutura De Uma Protena Estrutura primria Em protenas, o termo estrutura primria refere-se sequncia linear de aminocidos que as compem. Fonte: Bacteriology at UW-Madison - Lectures in Microbiology by Kenneth Todar Aestruturadeumaprotena ditadabasicamentepela sua sequncia primria. Estrutura De Uma Protena Estrutura secundria -hlice Mantida devido a ligaes de hidrognio dos grupos carboxila nos resduos i e i+4 Molculas anfiflicas Estrutura De Uma Protena Estrutura secundria -folha Formada por -fitas estabilizadas por ligaes de hidrognio entre o grupo carboxila e o grupo amida de resduos diferentes

Molculas anfiflicas Estrutura De Uma Protena Estrutura terciria Resultado do enovelamento de todas as estruturas secundrias

Forma ativa da protena

A estrutura da protena determina sua funo cataltica

Posio Relativa Entre Os Resduos De Aminocidos phingulodefinidoentreo grupoamidaeocarbonoalfada unidade peptdica psingulodefinidoentreo carbonoalfaeacarboxilada unidade peptdica Enovelamento Aprotenateriaqueexperimentar todososngulosphiepsipara cadaligaopeptdicaantesde encontraroenovelamento correto? Enovelamento Aprotenateriaqueexperimentar todososngulosphiepsipara cadaligaopeptdicaantesde encontraroenovelamento correto? Tempo mdio para dois ngulos psi/phi distintos 10 Picosegundos-1 (10-13s-1) 18 ngulos/aa x 100 aminocidos 10-13s-1 = 18100 s 10-13

= 10140s~ 10132 anosEnovelamento Aprotenateriaqueexperimentar todososngulosphiepsipara cadaligaopeptdicaantesde encontraroenovelamento correto? Tempo mdio para dois ngulos psi/phi distintos 10 Picosegundos-1 (10-13s-1) 18 ngulos/aa x 100 aminocidos 10-13s-1 = 18100 s 10-13

= 10140s~ 10132 anosIdade do Universo = 1.5x1010 anos Enovelamento Aprotenateriaqueexperimentar todososngulosphiepsipara cadaligaopeptdicaantesde encontraroenovelamento correto? Tempo mdio para dois ngulos psi/phi distintos 10 Picosegundos-1 (10-13s-1) 18 ngulos/aa x 100 aminocidos 10-13s-1 = 18100 s 10-13

= 10140s~ 10132 anosIdade do Universo = 1.5x1010 anos Paradoxo de Levinthal Importncia Das Estruturas 3D De Protenas Planejamento de Frmacos Baseado na Estrutura (SBDD) Resduos importantes para a interao Bolses para possveis ligantes Carga eletrosttica da superfcie Interao com outras protenas Importncia Das Estruturas 3D De Protenas Planejamento de Frmacos Baseado na Estrutura (SBDD) Resduos importantes para a interao Bolses para possveis ligantes Carga eletrosttica da superfcie Interao com outras protenas Entender a funo da protena Modelagem Comparativa por Homologia Utiliza uma protena homloga comomoldeparasimularum enovelamento Restries so feitas de acordo comarotinacomputacional empregada Quantomaioronmerode modelosgerados,maiora chancedeencontrarumcom a energia prxima da mnima Bases Da Modelagem Por Homologia 1. Identidadeentresequnciasdeaminocidossugeresemelhana estrutural e funcional; 2. Protenashomlogasapresentamregiesinternasconservadas (principalmenteconstitudasdeelementosdeestruturasecundria: hlices- e fitas-); 3. Asprincipaisdiferenasestruturaisentreprotenashomlogas ocorrem nas regies externas, constitudas principalmente por alas (loops), que ligam os elementos de estruturas secundrias. Ala de baixa identidade Evoluo Das Protenas Conservao da Famlia SERA de Plasmodium sp. Mercereau-Puijalon et al. Three multigene families in Plasmodium parasites: facts and questions. Int. J. Parasitol. 2002, 1323-1344 Por que existe a necessidade de conservao de regies inteiras no genoma de organismos distintos? Evoluo Das Protenas Fonte: EMBL Protein Evolution Colunas bem conservadas e com alta score de conservaoColunas idnticas com o maior score possvel de conservao Colunas com baixa conservao e score de conservao Conservao Evoluo Das Protenas Fonte: EMBL Protein Evolution Colunas bem conservadas e com alta score de conservaoColunas idnticas com o maior score possvel de conservao Colunas com baixa conservao e score de conservao Porque existem resduos essenciais para a atividade cataltica Conservao Estruturas Resolvidas Por Tcnicas Fonte: Protein Data Bank, Abril 2012 Microscopia Eletrnica Dificuldades De Se Conseguir Estrutura Por Raio-x Fonte: Invitrogen Life Technologies Vetor Solubilidade Clonagem e expresso Pureza Rendimento Purificao Cristal vivel Alta resoluo Cristalizao Dificuldades De Se Conseguir Estrutura Por Raio-x Vetor Solubilidade Clonagem e expresso Pureza Rendimento Purificao Cristal vivel Alta resoluo Cristalizao Fonte: Invitrogen Life Technologies Dificuldades De Se Conseguir Estrutura Por Raio-x Fonte: Invitrogen Life Technologies Vetor Solubilidade Clonagem e expresso Pureza Rendimento Purificao Cristal vivel Alta resoluo Cristalizao Funo Da Modelagem Por Homologia Alinhamento MoldeFuno Da Modelagem Por Homologia Alinhamento MoldeModelo Etapas Da Modelagem 1. Alinhamento das sequncias com as estruturas 2. Extrao de restries espaciais 3. Satisfao de restries espaciais Diagrama Da Iteratividade Da Modelagem 7: Validao do modelo 6: Otimizao do modelo 5: Modelagem da cadeia lateral 4: Modelagem de alas 3: Criao do esqueleto 2: Correo de alinhamento 1: Reconhecimento do molde e alinhamento inicial 8: Iterao Modelo Sequncia 1: Reconhecimento Do Molde E Alinhamento Inicial Sequncia FASTA Fonte: NCBI website 1: Reconhecimento Do Molde E Alinhamento Inicial Sequncia FASTA Fonte: NCBI website Sequncia FASTA: Sequncia de texto que representa ou uma sequncia de aminocidos ou nucleotdeos, usando o cdigo de uma letra em ambos os casos. o formato padro em bioinformtica. A primeira linha, iniciada com o smbolo >, um identificador da sequncia (i.e. organismo, protena/gene, cdigo no banco de dados). Pode ser adquirida livremente em bancos de dados como o NCBI. 1: Reconhecimento Do Molde E Alinhamento Inicial Sequncia FASTA Fonte: NCBI website 1: Reconhecimento Do Molde E Alinhamento Inicial Sequncia FASTA Fonte: NCBI website Alinhamentocontrao bancodedadosdoPDB 1: Reconhecimento do molde e alinhamento inicial Sequncia FASTA Fonte: NCBI website Alinhamentocontrao bancodedadosdoPDB 1: Reconhecimento do molde e alinhamento inicial Sequncia FASTA Fonte: NCBI website Alinhamentocontrao bancodedadosdoPDB BLAST: Ferramenta de busca de alinhamento local bsico (Basic Local Alignment Search Tool). um algoritmo para comparao de sequncias biolgicas primrias (nucleotdeos ou aminocidos). Faz a comparao com uma base de dados, extraindo dela sequncias que tenham semelhanas com a sequncia buscada, baseada num limite fornecido. o programa mais usado em bioinformtica 1: Reconhecimento do molde e alinhamento inicial Sequncia FASTA Fonte: NCBI website Analisara%de identidadeeoe-value Alinhamentocontrao bancodedadosdoPDB 1: Reconhecimento Do Molde E Alinhamento Inicial Sequncia FASTA Fonte: NCBI website Analisara%de identidadeeoe-value Alinhamentocontrao bancodedadosdoPDB E-value: Varivel estatstica (valor esperado), que relaciona o valor mdio do resultado com todos os valores que este resultado poderia assumir. Quanto menor o valor, maior a confiana do resultado. 1: Reconhecimento Do Molde E Alinhamento Inicial Sequncia FASTA Fonte: NCBI website Analisara%de identidadeeoe-value Alinhamentocontrao bancodedadosdoPDB 2: Correo do alinhamento Alinhamento inicial pode no levar em conta a necessidade de se manter a atividade cataltica ou regies de hlices e folhas Usar programas especficos para editar alinhamentos, como por exemplo o JalView ou Clustal* 2: Correo do alinhamento Alinhamento inicial pode no levar em conta a necessidade de se manter a atividade cataltica ou regies de hlices e folhas Usar programas especficos para editar alinhamentos, como por exemplo o JalView ou Clustal* 3: Criao Do EsqueletoSegunda etapa Criao do modelo: Um esqueleto da protena em estudo gerado 4: Modelagem De Alas Fonte: Modeller website Analisaroperfildeenergiadecada resduo(valordecortede-0,03)e identificarasregiesemquea energia excede o valor de corte.Confirmarseestasregiesestoem regiesdeala,usandouma ferramentadeprediode estruturassecundrias(e.g.ExPASy, PsiPred, etc) Executarrotinasderefinamentodas alas 5: Modelagem Da Cadeia Lateral Fonte: LNCC Priscila V. Z. C. Goliatt Predio de estrutura 3D de protenasAnalisaraocupnciadacadeia lateral dos resduos.Avaliaraenergiarelativaentreas vrias conformaes 6: Otimizao Do Modelo O que pode ser feito para otimizar um modelo gerado? 6: Otimizao Do Modelo O que pode ser feito para otimizar um modelo gerado? Otimizao Mltiplos moldes Combinao mtodos Dados externos 6: Otimizao Do Modelo O que pode ser feito para otimizar um modelo gerado? Modela as regies de acordo com a conservao em diferentes protenas Otimizao Mltiplos moldes Combinao mtodos Dados externos 6: Otimizao Do Modelo O que pode ser feito para otimizar um modelo gerado? Dados de Cryo-EM ou SAXS Modela as regies de acordo com a conservao em diferentes protenas Otimizao Mltiplos moldes Combinao mtodos Dados externos 7:Validaes Bsicas 1 Alinhamento 2 Estrutura de molde 3 IdentidadeAlinhamentosruinsgeram aberraes estruturais Moldedebaixaqualidadegera modelos de baixa qualidade Sequnciasdebaixaidentidade temmuitasregiessemmolde adequado Pode ser necessrio fazer o refinamento do moldeusandoumaferramentaadequada (e.g. Coot) 8: Iterao Casoomodelofinalnoseja satisfatrio,ouseja,no respondasperguntasque levaramcriaodomodelo, refazer todo o procedimento Modelo Criado Modelo gerado, e agora? Validaes Avanadas 1 Energia DOPE 2 Diagrama de Ramachandran 3 Ligantes DiscreteOptimizedProtein Energy(DOPE)Avaliaaenergia total do modeloAvalia os ngulos didricos e do modelo Fazerdocagemmolecularcomo substratonaturaleobterum resultadoinsatisfatrio*indica um mau modelo Diagrama de Ramachandranphi psi Fonte: Wikipedia / University Of Georgia - Tutorial On Peptide And Protein Structure Dados observados nas estruturas conhecidas com alta resoluo 0180 180 -180 -180 0 Primeiras Abordagens Modelagem manual usando programas de refinamento de estruturas FRODO; Browne W.J. et al(1969) J. Mol.Biol. 42:65-86; Warme P.K. et al(1974) Biochemistry 13:768-782; Primeiras Abordagens ModeloMolde Triagem biolgica, Qumica medicinal e Biologia estrutural Projeto Jovem Pesquisador - Processo FAPESP 2011/08042-9 Gustavo M. A de Lima Prof. Dr. Rafael V. C. Guido Os 10 principais produtores de cana-de-acar Mdia regional de produo de cana-de-acar (kg/ha) Fonte: Unio da Indstria de Cana-de-acar/UNICA e Ministrio da Agricultura, Pecuria e Abastecimento/MAPA.2009 Cana-de-acar No Mundo 88% na regio centro-sul 60% no estado de So Paulo Produo em Kg Fonte: Unio da Indstria de Cana-de-acar/UNICA e Ministrio da Agricultura, Pecuria e Abastecimento/MAPA.Cana-de-acar No Brasil Obioetanolcapazdereduzirasemissesde gasesdeefeitoestufaemmaisde90%,quando comparado com a gasolina. Abiomassaobtidadossubprodutosdo processamentodacanatemimportncia socioeconmica. EPE: Balano Energtico Nacional 2010: Ano base 2009. Rio de Janeiro Matriz Energtica Brasileira Consumo De Combustveis No Brasil Obioetanolcapazdereduzirasemissesde gasesdeefeitoestufaemmaisde90%,quando comparado com a gasolina. Abiomassaobtidadossubprodutosdo processamentodacanatemimportncia socioeconmica. EPE: Balano Energtico Nacional 2010: Ano base 2009. Rio de Janeiro Matriz Energtica Brasileira Consumo De Combustveis No Brasil Obioetanolcapazdereduzirasemissesde gasesdeefeitoestufaemmaisde90%,quando comparado com a gasolina. Abiomassaobtidadossubprodutosdo processamentodacanatemimportncia socioeconmica. EPE: Balano Energtico Nacional 2010: Ano base 2009. Rio de Janeiro Matriz Energtica Brasileira Consumo De Combustveis No Brasil A escaldadura das folhas Xanthomonas albilineans (Ashby) Gram-negativa Flagelada Crescimento lento Parasitas obrigatrias Caractersticas CrnicaAguda Fitopatologias Da Cana-de-acar Biologia estrutural Qumica medicinal computacional Microbiologia Desenvolvimento De Um Novo Agroqumico Via de biossntese de albicidinas Essencial para o desenvolvimento da doena Birch et al. Physiol. Mol. Plant. 1987, 30, 199-206 Alvos Moleculares 696 aa Caractersticas: Massa 75,250KDa Funo Promove a ligao carbono-enxofre para formar o Benzoil-CoA +CoA-SH ATPAMP + Benzoato Coenzima ABenzoil-CoA Difosfato CoA Benzoato CoA Ligase 278 aa Apo-protena Coenzima AHolo-protena Caractersticas: Massa 29,260KDa Funo Ativar algumas enzimas sintetizadoras, como NRPS (Non Ribosomal Peptide Synthetases) Mg2+ 3,5-ADP Fosfopanteteinil Transferase Benzoato CoA Ligase Stio de ligao do benzoato Benzoato Coa Ligase Substituio no conservativa da Lys520 Homologia Cristalogrfico Benzoato Coa Ligase Substituio no conservativa da Lys520 Homologia Cristalogrfico Benzoato Coa Ligase Fosfopanteteinil Transferase Stio de ligao da CoA Fosfopanteteinil Transferase Fosfopanteteinil Transferase PPT HumanaPPT Ashby Softwares De Modelagem Importncia Das Estruturas 3D De Protenas Algoritmo de satisfao de restries espaciais Obteno emprica das restries espaciais (funes densidade de probabilidade): A partir de banco de dados contendo informaes sobre alinhamentos entre estruturas proticas de alta resoluo. Minimizao das violaes das restries espaciais: As restries espaciais e os termos de energia so combinados em uma funo objetivo, sendo submetida a mtodos de otimizao (e.g. gradiente conjugado). Objetivos: Dinamizar a produo de modelos por homologia; Fornecer dados sobre a qualidade do modelo; Integrar principais programas de modelagem e visualizao de protenas; No impedir nenhuma interferncia do pesquisador no modelo.ViTaMIn Visual Table Modeller Interface ViTaMIn Visual Table Modeller Interface Demonstrao Dvidas Agradecimentos Msc. Jos Fernando Ruggiero Bachega Lucas Assirati Fernando Vasconcelos Maluf Dr Fernanda Cristina Costa Grupo de Cristalografia Prof. Dr. Rafael V. C. Guido Prof. Dr. Helio Jose Montassier