Predição de interações proteína-proteína e domínio-domínio
description
Transcript of Predição de interações proteína-proteína e domínio-domínio
Predição de interações proteína-proteína e domínio-domínio
Diego Lemos
Roteiro
Introdução Métodos Parsimonious Explanation (PE) Experimento I Experimento II Raciocínio por traz do método PE Conclusão
Introdução
O conhecimento sobre as interações entre as proteína ajuda a fornecer uma visão mais profunda do funcionamento das células.
Muitos estudos na área.
Introdução
Interação entre proteínas tipicamente envolve ligações entre domínios específicos.
Identificar os pares de domínio que interagem é um importante passo para entender as interações entre proteínas.
O que é um domínio?
Definem a estrutura e características das proteínas.
Proteínas geralmente possui dois ou mais domínios.
Métodos
Association Method Expectation Maximization (EM) Linear Programming Support Vector Machines Probabilistic network Modeling Domain pair Exclusion
Analysis(DPEA)
Association Method
Pontua cada par de domínio com um escore que é a relação entre o número de ocorrências do par numa interação de proteínas e o número de ocorrências independentes desses domínios.
O escore é interpretado como a probabilidade de interação entre os dois domínios.
Expectation Maximization(EM)
Proposto por Deng e colegas. Aplica a estimativa da máxima
esperança para determinar a interação domínio-domínio.
Computa a probabilidade de interação entre os domínios de forma que maximize a esperança da rede.
Domain Pair Exclusion Analysis (DPEA)
Proposto por Riley e colegas. Executa o EM várias vezes. Computa um valor E que mede o grau de
redução da esperança da interação proteína-proteína causada pelo bloqueio de uma dada interação domínio-domínio.
DPEA supera os métodos Association e EM.
Método muito custoso computacionalmente.
Parsimonious Explanation(PE)
Formulado como um problema de otimização de programação linear, em que cada potencial contato domínio-domínio é uma variável que pode receber um valor ( (LP)-score).
O LP-score estima o potencial de um dado par de domínio em explicar a interação entre proteínas.
Parte do princípio da parcimônia para identificar as interações entre proteínas.
Calculando o LP-Score
Para cada par de domínio Di Dj cria a variável xij ≥ 0.
Para cada interação de proteínas Pm Pn
Cria-se uma restrição:
xij
Pm Pn
i
j
xij 1
xij {Pm , Pn}
Para a rede ao lado temos 6 restrições.
PW-Score
Utilizado para filtrar as predições. Derivado de duas observações:
Interações que tem muitas testemunhas são mais prováveis de serem corretas do que as que apresenta poucas ou nenhuma testemunha.
Promíscuas interações domínio-domínio que tem sua pontuação relacionada com à freqüência de sua aparição.
PW-score compensa interações de domínio que têm muitas testemunhas e penaliza interações promíscuas.
pw-score(i,j) = min (p-value (i,j), (1-r)w(i,j) )
Experimento I
Aplicou-se o método PE sobre dados de interação proteína-proteína compreendendo 26032 interações subjacentes de 11403 proteínas de 69 organismos.
Experimento I
O papel do pw-score é permitir algum controle sobre os fatores de confiabilidade na testemunha.
Escolhendo um menor pw-score leva à previsão com precisão mais elevada.
Foi feito um estudo sobre a performance do PE em relação aos demais métodos.
Utilizou-se interações domínio-domínio do conjunto padrão ouro, que são pares confirmados que se interagem.
Utilizou-se um pw-score com valores 0.01 e 0.05
Experimento II
Existe o problema em que dado um par de proteínas predizer o par de domínios que media a interação entre as proteínas.
Pm
Pn
Foi feito um estudo comparativo entre os resultados do método PE em relação aos demais sobre determinado problema.
Raciocínio por traz do método PE
Raciocínio por traz do método PE
Conclusão
O estudo das interações entre proteínas ajuda a entender o funcionamento das células.
Interação de domínio-domínio podem ser preditos identificando o mínimo de pares de domínio que podem justificar uma determinada rede de interação de proteína-proteína.
O método PE que utiliza uma programação linear superou os demais métodos.
Dúvidas?