Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da...

48
Triagem Virtual em Larga Escala Profa. Dra. Rafaela Ferreira Dept. de Bioquímica e Imunologia [email protected] 21 de agosto de 2014 1

Transcript of Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da...

Page 1: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem Virtual em Larga Escala

Profa. Dra. Rafaela Ferreira

Dept. de Bioquímica e Imunologia

[email protected]

21 de agosto de 2014 1

Page 2: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

O que é triagem virtual?

Grande conjunto de compostos

Compostos Selecionados

Validação experimental

Estratégia computacional

2

Page 3: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Geralmente apenas uma pequena porcentagem do conjunto de compostos é avaliada

Zu et al, J Med Chem, 2013

Número de artigos

Número de artigos

50 em 1.000.000 = 0.005%

3

Page 4: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

O emprego de triagem virtual tem aumentado nos últimos anos

Ripphausen P et al, J Med Chem, 2010

(Até julho)

4

Page 5: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

O espaço químico é muito amplo

Espaço químico = conjunto de todas as estruturas químicas possíveis Estima-se cerca de 1060 pequenas moléculas

GD-13 – 977 milhões - 99,9% nunca foi sintetizado GB-17 – 166 bilhões

5

Page 6: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Milhões de compostos são comercialmente disponíveis

ZINC – maior base de dados de compostos comercialmente disponíveis (zinc.docking.org) Mais de 35 milhões de compostos (agosto de 2014)

6

Page 7: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Bases de dados podem ser filtradas de acordo com propriedades físico-químicas

Propriedade Similar a

Fármaco

(drug-like)

Similar a

protótipo

(lead-like)

Fragmentos

(fragment-

like)

Massa molecular (g/mol) < 500 < 350 < 250

cLogP < 5 3,5 2,5

No. doadores de lig. de H < 5 < 4 < 2

No. aceptores de lig. de H < 10 < 8 < 4

Lipinski, J Pharmacol Toxicol Methods. 2000 Jul-Aug;44(1):235-49.

Teague, Davis, Leeson, Oprea, Angew Chem Int Ed Engl. 1999 Dec 16;38(24):3743-3748. Carr RA, Congreve M, Murray CW, Rees DC, Drug Discov Today. 2005 Jul 15;10(14):987

Relação com biodisponibilidade

Permite otimização

7

Page 8: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Abordagens para descoberta de ligantes para um alvo

8

Experimental (HTS) Todos compostos são experimentalmente

avaliados

Baseada na estrutura do ligante (LBVS)

Baseada na estrutura do alvo (SBVS)

Triagem virtual (vHTS) Apenas o conjunto selecionado de compostos é experimentalmente

avaliado

Alto custo Baixa % de ligantes

Extensivo trabalho de validação

Page 9: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Que tipo de informação podemos empregar para construir estratégias de triagem virtual?

9

LBVS Atividade biológica de pequenas moléculas

SBVS Estrutura do alvo

102.500 estruturas (12/08/14)

Page 10: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

O objetivo na triagem virtual é conseguir classificar compostos ligantes melhor do que não ligantes

REALIDADE

Ligantes

Não ligantes

Falso positivos

Verdadeiros positivos

Falso negativos

OBJETIVO

Lista ordenada de compostos

Ligantes

Não ligantes

Verdadeiros negativos

Triagem

10

Page 11: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

A triagem virtual por docking é a estratégia mais comumente empregada

Ripphausen P et al, J Med Chem, 2010 11

Page 12: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem virtual baseada na estrutura de ligantes

Similaridade química

Construção de farmacóforo

Aprendizagem de máquinas

12

Page 13: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem virtual baseada na estrutura de ligantes 1. Comparação de similaridade 2D

http://www.cmbi.ru.nl/edu/bioinf4/2D-Prac/pic1.gif

1.1 Determinação de digitais moleculares (molecular fingerprints)

Baseado na conectividade química

13

Page 14: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem virtual baseada na estrutura de ligantes 1. Comparação de similaridade 2D

A= número de fragmentos em ambos conjuntos = 3 B = número de fragmentos em (1), mas não em (2) = 2 C = número de fragmentos em (2), mas não em (1) = 0 Coeficiente de Tanimoto = A/(A+B+C) = 3/(3 + 2 + 0) = 0.6 ou 60%

1.2 Cálculo da similaridade através de uma métrica

(ex: coeficiente de Tanimoto)

14

Page 15: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem virtual baseada na estrutura de ligantes 1. Comparação de similaridade 2D

Definição de um valor do coeficiente de Tanimoto como cutoff

Se o valor for muito alto – apenas busca de análogos

1.3 Triagem da base de dados por comparação com ligantes conhecidos

15

Page 16: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Discontinuidades de relação estrutura-atividade são um desafio para métodos de similaridade 2D

http://www.int.laborundmore.de/thumb/e0eabf14/Bajorath_03_lm0213_INT.jpg 16

Page 17: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem virtual baseada na estrutura de ligantes 2. Comparação de similaridade 3D

2.1 Cálculo de volume e de outras propriedades dos compostos ativos

2.2 Sobreposição de compostos ao padrão gerado

- maximização de sobreposição (ex: algoritmo genético)

17

Page 18: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem virtual baseada na estrutura do receptor 1. Docking molecular

Inspeção visual e seleção de compostos

Validação experimental

-3 -2 -1 0 1 20

20

40

60

80

100

log conc. (M)

% a

tivi

dad

e

Base de dados 103 – 106 compostos

DOCKING

2 500 1 ...

Estrutura do alvo

18

Page 19: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Por que realizar uma seleção “manual” de compostos?

Baixa precisão da função de pontuação

Presença de falsos positivos

Possibilidade de incorporar conhecimento específico para uma classe de alvos

CLASSIFICAÇÃO DA BASE DE DADOS

- 35 (2ª) - 30 (3ª) - 28 (4ª) - 36 (1ª) Pontuação e classificação

Pose melhor pontuada de cada molécula

19

Page 20: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Critérios para seleção de compostos

Complementaridade ao sítio

Facilidade de síntese de análogos

Diversidade química

Predição de ADMETox

Também podem ser aplicados antes da triagem

20

Page 21: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem virtual baseada na estrutura do receptor 2. Determinação de farmacóforo

21

Page 22: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem virtual baseada na estrutura do receptor 2. Determinação de farmacóforo

Wolber G et al, Drug Discov. Today, 2007

Aceptores e doadores de ligação de hidrogênio – vetores

Interações hidrofóbicas e elestrostáticas - esferas

Farmacóforo 3D

Conjunto de grupos funcionais essenciais para atividade, organizados espacialmente

Farmacóforo extraido a partir de complexos

22

Page 23: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Triagem virtual baseada na estrutura do receptor 2. Determinação de farmacóforo

Wolber and Langer, JCIM, 2005 23

Page 24: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Combinação de LBVS e SBVS

Heikamp and Barjotath, Chem Biol Drug Design, 2013 24

Page 25: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Combinação de LBVS e SBVS

Aplicação sequencial Aplicação em paralelo

Drwal et al, Drug Discov. Today, 2013 25

Page 26: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Combinação de triagem virtual e HTS

Triagem virtual

Hits computacionais

Conjunto de Compostos

HTS

Hits experimentais

Ensaios secundários

26

Page 27: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Combinação de triagem virtual e HTS

Triagem virtual

Hits computacionais

Conjunto de compostos

Ensaios secundários

Hits experimentais Hits comuns

HTS

27

Page 28: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Combinação de triagem virtual e HTS

Triagem virtual

Hits computacionais

Conjunto de compostos

Validação experimental

Hits experimentais

HTS

28

Validação experimental

Page 29: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Avaliação da performance na triagem virtual

REALIDADE

Ligantes

Não ligantes

Falso positivos

Verdadeiros positivos

Falso negativos

OBJETIVO

Lista ordenada de compostos

Ligantes

Não ligantes

Verdadeiros negativos

Pouca (ou nenhuma) informação sobre os negativos

29

Page 30: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Análise retrospectiva: Capacidade de classificar bem ligantes

Curva ROC – Ligantes conhecidos são melhor classificados do que decoys?

http://www.sprawls.org/ppmi2/IMGCHAR/1IMCHAR12.gif

% de não ligantes

% d

e li

gan

tes

30

REAL

Ligantes

Não ligantes

IDEAL

Page 31: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Análise retrospectiva: Capacidade de classificar bem ligantes

Curva ROC – Ligantes conhecidos são melhor classificados do que decoys?

http://www.sprawls.org/ppmi2/IMGCHAR/1IMCHAR12.gif

Limitações: - Atividade dos decoys é desconhecida - Não garante desempenho prospectivo - Resultado depende muito dos decoys utilizados

% de não ligantes

% d

e li

gan

tes

31

Page 32: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

É importante escolher criteriosamente os decoys

DUD – 40 alvos e decoys para docking

DUD-E:

Alvos mais diversos – 102 no total

22886 ligantes obtidos do ChEMBL, cada um com 50 decoys gerados do ZINC

32

Page 33: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

DUD-E

Propriedades consideradas: Massa molecular

LogP

Numero de ligações rotacionáveis

Número de doadores de lig de H

Número de aceptores de lig de H

Carga total

33

Page 34: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Através de curvas ROC diversos protocolos podem ser comparados

Escala logartimica – enfatiza dados para o topo da lista 34

Page 35: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Babaoglu, K. et al. J Med Chem, 2007; Teotico, D. et al. PNAS, 2009

Análise retrospectiva – Reprodução de dados de cristalografia

Comparação entre estrutura cristalográfica e pose predita:

Rmsd < 2 Å

Interações intermoleculares mantidas?

35

Page 36: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Análises retrospectivas podem auxiliar a parametrização da triagem

Preparação do receptor e da

base de dados

-1.0 -0.5 0.0 0.5 1.0 1.5 2.00

25

50

75

100random

cluster 1

cluster 2

log (% of ranked database)

% o

f h

its f

ou

nd

% d

e lig

ante

s en

con

trad

os

Log (% da base de dados ordenada)

Avaliação de diversos protocolos de docking

Avaliação dos resultados e seleção dos compostos

Triagem virtual utilizando o(s) melhor(es) protocolo(s)

Validação experimental 36

Page 37: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Dentre os compostos selecionados após VS, quantos são confirmados experimentalmente como ligantes?

“Hits” definidos arbitrariamente em diferentes estudos

Zu et al, J Med Chem, 2013 37

Page 38: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Dentre os compostos selecionados após VS, quantos são confirmados experimentalmente como ligantes?

Valor mediano = 13 %

HTS experimental – valores entre 0.01 e 0.14%

Zu et al, J Med Chem, 2013

% dos estudos avaliados

2

15.2

16.5

16.5

6.3

7.3

26.1

10.1 38

Page 39: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Qual a afinidade dos compostos encontrados?

Ripphausen P et al, J Med Chem, 2010

SBVS LBVS

39

Page 40: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Qual a afinidade dos compostos encontrados?

Ripphausen P et al, J Med Chem, 2010 40

Page 41: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

A afinidade média varia de acordo com a classe do alvo

Ripphausen P et al, J Med Chem, 2010 41

Page 42: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Os hits descobertos por VS podem ser eficientemente otimizados

Zu et al, J Med Chem, 2013

Maior aumento de potência através de otimização por química sintética

Em média, potência aumenta 70x

42

Page 43: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Os hits descobertos por VS podem ser eficientemente otimizados

Zu et al, J Med Chem, 2013 43

Page 44: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Vantagens e desvantagens de HTS e VS

Método Vantagens Desvantagens

HTS

Informação experimental sobre toda a base de

dados

Alta porcentagem de falso-

positivos

Possibilidade de descoberta de inibidores que

atuem em diversos sítios do receptor Grande exigência de

infraestrutura Independente de existência de outros ligantes

e de conhecimento de estrutura do alvo

VS

Restrição do número de compostos a serem

testados

Necessidade de modelo

tridimensional do alvo (SBVS)

Menor exigência de infraestrutura Ligantes restritos a um

determinado sítio de ligação

Maior porcentagem de ligantes específicos

entre compostos avaliados experimentalmente Falso-negativos

44

Page 45: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Vantagens e desvantagens de LBVS

Adaptado de Drwal, Drug Discov. Today, 2013

Possível sem informação sobre a estrutura proteica Simples e rápido

Possibilidade de scaffold hoping

Desconsideração da estrutura proteica Viés para ligantes semelhantes aos já conhecidos

Descritores dependentes de conformação

45

Page 46: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Vantagens e desvantagens de SBVS

Adaptado de Drwal et al, Drug Discov. Today, 2013

Possível sem informação sobre ligantes Predição de modo de ligação

Necessidade de considerar múltiplas conformações da proteína

Todo o sítio de ligação é considerado Scaffold hoping

Não apresenta viés para ligantes conhecidos

Dificuldade em determinar características essenciais

Funções de pontuação super simplificadas Alto custo computacional

46

Page 47: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

Genômica, Bioinformática estrutural

47

Page 48: Triagem Virtual em Larga Escala - emmsb.lncc.br · Se o valor for muito alto ... Avaliação da performance na triagem virtual REALIDADE Ligantes Não ligantes Falso positivos Verdadeiros

DOUTORADO

Francielly Rodrigues Raoni Souza

IC Filipe Vilela

MESTRADO

Fabiana Póvoa

Edson Folador Alberto Júnior

[email protected]

CO-ORIENTAÇÃO

Luan Carvalho Saulo Braga João Fernandes

48