Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

33
Análise de Estruturas de Proteínas (Parte 2) Jeane Melo

Transcript of Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Page 1: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Análise de Estruturas de Proteínas

(Parte 2)

Jeane Melo

Page 2: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Roteiro

Introdução

Predição de Estrutura Secundária (Parte 1) Apresentação do problema Exemplos de abordagens Preditor NNPSS

Comparação e Detecção de Padrões Estruturais (Parte 2) Apresentação do problema Exemplos de abordagens Modelo desenvolvido

Page 3: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Introdução Proteínas

Metabolismo, suporte de filamentos, catálise bioquímica, regulação do volume celular e imunização

Page 4: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Introdução

PDB

48235

Swiss-Prot

290484

Seqüências

X

Estruturas

Page 5: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Introdução

Page 6: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Predição de Estrutura Secundária de

Proteínas

Page 7: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Predição de Estrutura Secundária

Patrick J. Fleming, Haipeng Gong and George D. Rose (2006) Secondary structure determines protein topology. Protein Science 15:1828-1834.

Page 8: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

O Preditor NNPSS

Page 9: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Extração de Características

Page 10: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Comparação e Detecção

de Estruturas

Page 11: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Comparação e Detecção de Estruturas

Page 12: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Motivos (motifs) estruturais

Elemento estrutural tri-dimensional encontrado em diversas moléculas.

Ex.: Coiled Coil

GCN4 leucine zipper

gp41 hexamer: initiates the entry of HIV into its target cell.

Page 13: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Domínios Estruturais

Estruturas compactas

Função

Ação individual ou em conjunto

Delimitação

Bases de Dados 3Dee CATH Dali SCOP

Pyruvate kinase, a protein from three domains

Page 14: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Classificação de Estruturas

Page 15: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Alinhamento Estrutural

Alinhamento de seqüências baseado em comparação estrutural

Comparação de proteínas com baixa similaridade entre as seqüências.

Thioredoxin: Humano X Drosophila melanogaster.

Page 16: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Processo de Comparação

Escolha das características Elementos geométricos Elementos topológicos Propriedades físico-químicas dos

aminoácidos

Representação Rotação e translação Pouca variação diante de

pequenas diferenças

Page 17: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Processo de Comparação

Representação através de um conjunto de pontos Coordenadas dos centros

dos átomos Restrição da região de

comparação Cadeias laterais

Escalier, V. (1997). Algorithmes pour la comparaison de structures moléculaires tridimensionnelles. PhD thesis, Université Paris VII.

Page 18: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Processo de Comparação

Representação através de EES Mais simples e compacta (15~300) Mecanismos genéticos raramente produzem mutações

topológicas

Dror, O., Benyamini, H., Nussinov, R., and Wolfson, H. J. (2003). Multiple structural alignment by secondary structures: Algorithm and applications. Protein Science, 12:2492-2507.

Page 19: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Exemplos de Abordagens

Arthur Lesk, 1995 Distribuição dos elementos

de estrutura secundária (SSEs) ao longo da cadeia

Interações geométricas entre tais elementos

Representação Matricial Classes de interação

1 1 2 3

1 PE KK

1 PD

2 PE HH

3 HH PD HH

Lesk, A. M. (1995). Systematic representation of protein folding patterns. Journal of Molecular Graphics, 13:159-164.

Page 20: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Exemplos de Abordagens

Ferramenta TOPS Seqüência de SSEs (grafos) Relações entre pares de

elementos Ignora tamanho e orientações

precisas up e down

Busca em bancos de dados definidos

Michalopoulos, I., Torrance, G. M., Gilbert, D. R., and Westhead, D. R. (2004). TOPS: an enhanced database of protein structural topology. Nucleic Acids Research, 32.

Page 21: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Exemplos de Abordagens

Ferramenta MASS Dois níveis

Elementos de estrutura secundária (SSEs) Tipo, distância 1.5Å,

diferença entre ângulos 0.3 rad

Coordenadas atômicas dos C

Dror, O., Benyamini, H., Nussinov, R., and Wolfson, H. J. (2003). Multiple structural alignment by secondary structures: Algorithm and applications. Protein Science, 12:2492-2507.

Page 22: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Exemplos de Abordagens

Melhor alinhamento pivot

Ferramenta MASS (cont.)

Page 23: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Pontos Abordados

Informações a serem consideradas no processo da comparação

Comparação múltipla

Page 24: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Representação Proposta

Dados Obtenção de vetores através do VAST Acesso direto ao valor do ângulo ou dupla codificação Distâncias Tamanho dos vetores Flexibilidade

Representação através de grafos

Gibrat, J.-F., Madej, T., and Bryant, S. H. (1996). Surprising similarities in structure comparison. Current Opinion in Structural Biology.

Page 25: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Busca por Motivos

Isomorfismo de subgrafos

a

b

c d

e f

Page 26: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Busca por Motivos

Algoritmo do Ullmann Estender um mapeamento M inicialmente vazio Enumerar todos os possíveis isomorfismos Seleção de possibilidades baseada no grau dos

vértices Teste de adjacência

Page 27: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Busca por Motivos

Adaptação do algoritmo do Ullmann Representação adotada para o problema Restrições

Grau dos vértices, tipo, tamanho Relações entre pares de elementos

Ângulo, código, distâncias Grau dos vértices

Testes preliminares Conjunto de 20 globinas

Reconhece a ocorrência de motivos no conjunto Proteínas similares têm representações similares

Page 28: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Busca por Subestrutura Comum

Busca por subgrafo maximal Generalização de isomorfismo de grafos NP-completo

Adaptação do algoritmo de McGregor Representação adotada Comparação múltipla

Page 29: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Busca por Subestrutura Comum

Algoritmo de McGregor

Efetuar o produto dos grafos envolvidos

Efetuar a busca por cliques no grafo resultante Cliques nos grafos resultantes corresponderão a

subestruturas comuns

Page 30: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Busca por Subestrutura Comum

Produto de grafos

a

b

c d

e

adae

bd

be

cdce

f

af

bf

cf(A) (B)

(AXB)

Page 31: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Busca por Subestrutura Comum

Generalização para N proteínas Representação adotada Vértices similares

Tipo, tamanho Arestas

Ângulos, distâncias

Page 32: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Busca por Subestrutura Comum

Testes Conjunto de 20 globinas

Tipo (não muito seletivo) Tamanho

30% Ângulos e distâncias

Proteínas com dois domínios em comum Retorna elementos pertencentes a ambos os domínios

Page 33: Análise de Estruturas de Proteínas (Parte 2) Jeane Melo.

Jeane Melo

Busca por Subestrutura Comum

Proteínas muito semelhantes e com número de elementos de estrutura secundária bem acima da média Número de vértices considerados Cliques Grafos esparsos