ABC do Folding de Proteínas Globulares

Post on 26-Jan-2016

35 views 0 download

description

ABC do Folding de Proteínas Globulares. O Problema do Folding. Um dos grandes desafios atuais da Biologia Estrutural. Física Biológica Departamento de Física e Química FFRP – USP A. Caliri. Porque o Problema do Folding é importante?. - PowerPoint PPT Presentation

Transcript of ABC do Folding de Proteínas Globulares

ABC do Folding de Proteínas Globulares

Um dos grandes desafios atuais da Biologia

Estrutural.

Física Biológica

Departamento de Física e Química

FFRP – USP

A. Caliri

Porque o Problema do Folding é importante?

2)- Já se conhece a constituição básica de cerca de 300.000 proteínas (tarefa rápida e cada vez mais barata), mas somente 10% delas tem sua estrutura 3-D determinadas experimentalmente por difração de R-X e NMR (processos lentos e caros).

. . . ARQUIVO MORTO !!!

1)- Admite-se que a estrutura 3-D de muitas moléculas biológicas seja determinante para o funcionamento pleno.

1TSK – Toxina de escorpião

35 aminoácidos; 518 átomos

Do que se trata, afinal, o Problema do Folding ?

Em resumo: Previsão da estrutura tridimensional de uma (macro)molécula biológica, dado que sua constituição atômica básica seja conhecida.

Especificando para uma Proteína

Estrutura Primária(Seqüência de aminoácidos) Estrutura 3-D

REPRESENTAÇÃO ESQUEMÁTICA

Como e do que as proteínas são

formadas?

elementos básicos, singelos

In vivo

Leo / 2001

Como uma proteína é fabricada?

A maquinaria biológica envolvida no encadeamento de aminoácidos

A MaquinariaBiológica

O código genético

Cada terno de bases nitrogenadas(U, C, A e G), chamado códon, corresponde a um aminoácido.

Tabala dos tripletes

Um gene Uma proteína?Porém, as proteínas a serem produzidas dependem das circunstâncias.

Potencialmente temos que (possibilidades combinatoriais):

2 genes 2 + 1 = 3 proteínas; 3 genes 3 + 3 + 1 = 7 proteínas; ...

n genes { n + n (n - 1) / 2! + n (n - 1) (n - 2) / 3! + ... + n + 1} proteínas

Seq A + Seq B Seq AB; sempre ??

Brain

MAS ... de fato, através da análise, e do método tem-se abarcado, e de certa forma resolvido, muitos problemas antes tidos mesmo como impensáveis. Apesar de que nem todos os problemas sejam suscetíveis à análise: a soma das partes nem sempre resulta no todo.

Problemas biológicos são, em geral muito complexos; pelo menos a primeira vista.

Porem, hoje contamos com uma ferramenta adicional: O COMPUTADOR ELETRÔNICO

(... depois, o ótico, o quântico, ...)

ABC do Folding de Proteínas Globulares

MÉTODO INTUITIVO PARA ABARCAR PROBLEMAS COMPLEXOS

1)- Iniciar com o caso mais simples do problema em foco. Exemplo: Se o objeto de estudo é uma aeronave, escolhemos inicialmente um ultra-leve, ao invés de um Jumbo.

2)- Focar especificidades do problema (todo problema é redutível até um certo grau). Exemplo: O tópico “aerodinâmica” pode ser focado especificamente num determindo tópico; todos os outros aspectos do problema (a eletrônica por exemplo) pode ser isolado.

3)- Simplificar o problema, evitando detalhes desnecessários (mas nem sempre é fácil: arte!) Exemplo:

Poder das pontas (eletrostática):

Fração de 3% de uma única

molécula de DNA constituinte de

um dos 46 cromossomos presentes na

célula humana.

Como simplificar o problema do folding de proteínas, no sentido de melhorar o entendimento do processo?

... seguimos os três passos enunciados: consideramos o caso das proteínas pequenas de s20 a s100 aminoácidos; focamos tópicos específicos do problema; e procuramos simplificar o problema.

Um tipo de abordagem:

Usar Modelos Computacionais simplificados

O tópico é:Saber relacionar a seqüência de aminoácidos da proteína com

sua Estrutura 3-D.

Será que conseguimos criar um sistema

simplificado para o qual posso encontrar a solução

para o tópico isolado acima?

Diversas representações simplificadas de uma mesma proteína

20 aminoácidos (especificidades estereoquímicas)

Moléculas do solvente

Cadeia com 27 unidades

Esquema do processo de folding

Representação Esquemática de uma cadeia

Representação Esquemática do processo de folding

Representação Esquemática de uma cadeia

Representação Esquemática do processo de folding

SINTAXE:

Dada uma estrutura nativa, qual a seqüência de aminoácidos?

r(0): R

r(3): C

r(1,1): A

r(1,2): H

r(2,1): B

r(2,2): G

r(2,3): F

r(2,4): I

r(2,5): E

r(2,6): D

},{

},{),,(,, )()},{(ji

lkjijiji chlkE

AD

D AA

BC

F

DAC

C

C

B

B

CC

B

B

B F

CCB

A

A

R

Design para a estrutura nativa: ADADA DAFCB CBCBC BCBCB CBCFA RA

Uma das questões atuais :

Taxa de Folding kf(“velocidade” com que as proteínas se enovelam)

Existe correlação entre parâmetros topológicos da nativa e log kf de pequenas proteínas e quando a cinética do folding pode

serdescrita como a cinética de sistemas de dois estados: N e U)

Plaxco, Simons, Baker J.Mol.Biol, 287, 985,1998

Kaya, Chan Proteins, 52, 524, 2003

32/41

RESULTADOS EXPERIMENTAIS E TEÓRICOS

Maritan, Micheletti, BanavarPRL 84, 3009,

2000

Silva, dos Reis, Caliri

To apper in JCP - 2005

Taxa de Folding kf

O MODELO

Modelo utilizado não é nativa-dirigido: possui um alfabeto de dez letras e provê uma regra (sintaxe) para o design da seqüência.

Para Estrutura Nativa são efetuadas 15 simulações independentes, com janela de tempo pré-estabelecida: tw = 3107 passos MC (sucesso: se ti < tw)

Taxa de Folding: representada pelo inverso do tempo médio < ti > requerido para a primeira passagem pela nativa. Alternativamente, utilizou-se a média geométrica dos tempos {ti} para encontrar a nativa.

PROTEÍNAS PEQUENAS: distribuição dos tempos { ti } de enovelamento

Para um conjunto {ti} grande suficiente,

< ti > pode ser aproximado pela média aritmética

O logaritmo comum da taxa de enovelamento é então log kf = < ti >-1

N

iitNt

1

/1

)/exp()( 0tttP

0

0)( tdtttPt

1)( dttP

ttk f log/1log)log(

Propriedade matemática útil

)ln()()ln()ln(0

tdttPtt

)log(.)log()log( ett

Utilidade? a função logarítmica aplicada no conjunto de simulações reduz o efeito das flutuações para amostragens pequenas

15

1

1log.15

1log

iif tkDaí então:

[*STTS*] [*TTTT*] [*TT*]

[*STS*] Snail Staple

Caracterização Topológica das estruturas nativas

Padrões estruturais

29/41 0,238095 0,494709

Caracterização Topológica das estruturas nativasORDEM DE CONTATO RELATIVO: separação média entre os monômeros contatantes, normalizado pelo tamanho da cadeia.

L

l

Nji

c

,.1

2827

.2

n

n = 90, 91, ..., 187n 185

31/41

Determinantes da taxa de enovelamento e “estruturas tipo-secundárias” Simulação com as especificidades estéricas

RESULTADOS

33/41

0,2381 0,2725 0,3333

0,3175 0,3280 0,4153

* Determinantes da taxa de enovelamento`: “estruturas tipo-secundárias”

34/41

RESULTADOS

0,2434 0,2593 0,2619

0,3333 0,4127 0,4524

* Determinantes da taxa de enovelamento: “estruturas tipo-secundárias”

31/41

Determinantes da taxa de enovelamento: “estruturas tipo-secundárias” Simulação com as especificidades estéricas

RESULTADOS

35/41

0,2460 0,3307 0,4841

* Determinantes da taxa de enovelamento e “estruturas tipo-secundárias”

31/41

Determinantes da taxa de enovelamento e “estruturas tipo-secundárias” Simulação com as especificidades estéricas

36/41

0,2381 0,2593 0,3175

0,4048 0,4286 0,4788

* Determinantes da taxa de enovelamento e “estruturas tipo-secundárias”

37/41

* Determinantes da taxa de enovelamento e “estruturas tipo-secundárias”

0,2381 0,2460

CONCLUSÕES

O que seira conteúdo de estruturas tipo-secundária?

Bio-ExATA

December 8, 1999Web posted at: 10:05 a.m. EST (1505 GMT)by Nancy

Weil

If the project succeeds, the computer will be able to handle more than 1 quadrillion operations per second, or one petaflop, which is a million billion floating point operations per second. ...

The first science project earmarked for Blue Gene is to model folding of human proteins. Better understanding of how proteins fold is likely to give medical researchers clues into diseases and possibly into cures, as they learn how it is that particular diseases attack cells. (kilo, mega, giga, tera, .... peta-flop)

Big Blue's SMASHing Blue Gene

(IDG) -- IBM has unveiled plans for "Blue Gene," a $100 million research project to build a supercomputer with 500 times the computing power of today's machines.

The new IBM computer, nicknamed "Blue Gene", will be capable of more than one quadrillion operations a second.

BigBlue

BlueGene

Blue Gene/L

A Metáfora da Linguagem(advertência ...)

Macaco do Léo

A procura pelo entendimento dos mecanismos da Natureza pode ser comparada a seguinte situação análoga:

Imagine um computador cuja interface de comunicação com o ser humano seja apenas o seu Sistema Operacional (Windows, digamos) e mais alguns aplicativos (Office, Fortran,C ...). [S.O. Linguagem.]

Problema: Descobrir como funciona o Hardware em todos os seus níveis: processador, os tipos de memórias, o mouse, o monitor, ... o transistor. [Hardware Natureza]

Leo/2001