Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 –...

50
Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr Arthur Gruber Instituto de Ciências Biológicas

Transcript of Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 –...

Page 1: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

MetagenômicaCarla BartelsFrancisco M Ulloa StanojlovicLuis Fábio Batista

BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias

Prof Dr Arthur GruberInstituto de Ciências Biológicas

Page 2: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

• O termo Metagenômica foi usado primeiramente em 1998 por Jo Handelsman (Universidade de Wiscosin – EUA)

Dr. Anand Kumar &Dr. R. A. Siddique

Page 3: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

METAGENOMAÉ o genoma coletivo da microbiota total, encontrada

em um determinado habitat.

METAGENOMAÉ o genoma coletivo da microbiota total, encontrada em um determinado habitat

METAGENÔMICAÉ a análise genômica das comunidades de

microrganismos de um determinado ambiente por técnicas independentes de cultivo.

Introdução

Dr. Anand Kumar &Dr. R. A. Siddique

Page 4: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Handelsman, 2004

Page 5: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Metatranscritoma

Permite a identificação de genes que estão ou não

sendo expressos

Metaproteômica

Permite uma melhor caracterização funcional

da comunidade microbiana

Metagenômica

Fornece a informação da capacidade metabólica

e funcional da comunidade microbiana

Dr. Anand Kumar &Dr. R. A. Siddique

Page 6: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Metagenômica aplicada

Dr. Anand Kumar &Dr. R. A. Siddique

Page 7: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Metagenômica fornece

Informação genética sobre possíveis novos biocatalizadores ou enzimas

Conexões genômicas entre função e filogenia de organismos “não cultiváveis”

Perfis evolutivos de função e estrutura de comunidades

Novas hipóteses de funções microbiais

Thomas et al, 2012

Page 8: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

JCSetubal, 2012

Page 9: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

JCSetubal, 2012

Page 10: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

JCSetubal, 2012

Page 11: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Desenho do Estudo

Amostragem

Fracionamento da amostra

Extração de DNA

Sequenciamento de DNA

Montagem

Anotação

Análises Estatísticas

Armazenamento de dados

Compartilhamento de dados

Binning

Thomas et al, 2012

Page 12: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Handelsman, 2004

Page 13: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Amostragem• Isolar o DNA

• Depende do tipo de amostras

• Clonar DNA• Inserir dentro de um

vetor (plasmídio, cosmídio, BAC)

• Biblioteca• Screening e

sequenciamento

Daniel, 2005 em Prentice Hall, 2005

Page 14: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Amostragem {desafios}

• Amostras devem representar a população → Quantas amostras são necessárias? Curvas de raridade para estimar fração de espécies sequenciadas. (Abundância x Complexidade).

• Presença de populações dominantes afeta análises → representação maior e maior chance de montar contigs.

• Quanto mais metadados forem coletados mais detalhadas serão as inferências das condições ambientais. Ex.: dados geográficos, bioquímicos, data de coleta, métodos de extração do DNA.

Bruno Malveira Peixoto 2011

Page 15: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Sequenciamento – Shotgun

Commins, Toft, Fares, 2009

Genoma completo

Hierárquico

Page 16: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Prakash and Taylor, 2012

Page 17: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Montagem• Fatores a serem considerados:

• Tamanho das leituras de sequenciamento usadas para criar a base de dados de metagenômica

• São necessárias sequências mais longas para anotação?

• A base de dados está montada para reduzir os requerimentos de processamento de dados?

Page 18: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

MIRA: An Automated Genome andAssembler

Montagem baseada em referência:

Montagem “de novo”:

Algoritmos rápidos rodam em laptop em 2h; Regiões divergentes não são cobertas – inserções, deleções ou

polimorfirmos.

Velvet Baseados em gráficos de Bruijn Requer grandes recursos computacionais Requer milhares de gigabytes – dias. Meta-IDBA e MetaVelvet – não clonalidade de populações naturais -

subgráficos de Bruijn - N50 e tam. contig

Thomas, Gilbert e Meyer, 2011

Meta-IDBA MetaVelvet

Montagem

Page 19: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Montagem {limitações}

• Amostragem incompleta – genomas parcialmente amostrados

• Formação de quimeras – sequências de espécies diferentes

• Dificuldade em montar amostras ricas em espécies (solo).

Bruno Malveira Peixoto 2011

Page 20: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Métodos de DiscriminaçãoProcesso de classificação das seqs de DNA em grupos que possam representar um genoma individual ou genomas de organismos fortemente relacionados

• Classificação composicional• Similaridade

Vários algoritmos foram desenvolvidos – empregam dois tipos de informações contidas dentro de uma dada seq DNA

Pontos importantes a considerar:• Tipo de dado de entrada disponível• Existência de training datasets adequados ou genomas de referência• Algumas ferramentas combinam os dois approachs – PhymmBl,

MetaClusterThomas et al, 2012; Liu, 2012

Page 21: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Classificação Composicional• Genomas têm composição de nucleotídeos conservada e isto será

refletido nos fragmentos de sequência dos genomas

• Conteúdo de GC• Uso de códons• Sítios de reconhecimento – 5S ou 16S rRNA

• Bioinfo tools:• Phylopythia• S-GSCM• TACAO

• Não funciona bem com leituras curtas por não conterem informações suficientes

Thomas et al, 2012; Liu, 2012

Page 22: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Conteúdo GC• Karlin & Burge, 1995

• A distribuição de nucleotídeos é relativamente constante dentro do genoma, mas varia entre genomas.

• A razão de possibilidades (odds ratio) de frequência de conteúdo C+G é essencialmente a mesma na maioria dos organismos para todo o DNA versus o DNA codificante e também a mesma para as frações de DNA das diferentes sequências.

• Talvez existam fatores que imponham limites às variações composicionais e estruturais de um genoma e que o conjunto de valores das odds ratios do dinucleotídeo seja uma assinatura genômica.

• Diferenças significativas entre procariotos e eucariotos, entre vírus e seus hospedeiros.

• Pxy = fxy / fx fyKarlin, 1995; Liu, 2012

Page 23: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Karlin, 1995

Page 24: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Karlin, 1995

Page 25: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Uso de códons

Codon Usage Database - http://www.kazusa.or.jp/codon/

Cada genoma tem uma estratégia particular de codificaçãoPercentual de G+C na 3a posição do códon tRNA

Códons redundantes/sinônimos para qq aa não são usados com frequências iguais entre os diversos organismos

Todos os aminoácidos, exceto Met e Trp, são codificados por 2 a 6 códons

Karlin, 1998; Ikemura, 1985

Page 26: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Similaridade• Compara leituras curtas contra sequências

codificadoras de bases de dados públicas de genes usando BlastX e então designa para o seu ancestral comum mais tardio (LCA) de um organismo alvo

• Bioinfo tools• IGG/M• MG-RAST• MEGAN• CARMA• Sort-ITEMS• MetaPhyler

Thomas et al, 2012; Liu, 2012

Page 27: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Classificação {Bioinfo}

• Análise de similaridade: IMG/M, MG-RAST, MEGAN, CARMA, Sort-ITEMS, MetaPhyler

• Análise composicional: Phylopythia, S-GSOM, PCAHIER, TACAO

• Similaridade e composicional: PhymmBL e MetaCluster

Necessidade de sequências de referência* (marcador de RNAr) para fechar o alinhamento para sequenciamentos de leitura curta.

* Base de dados escassas e tendenciosas para apenas três filos Proteobacteria, Firmicutes e Actinobacteria

Thomas, Gilbert e Meyer, 2011Bruno Malveira Peixoto 2011

Page 28: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

ANÁLISES DOS DADOS

• Dados de metagenômica cada vez mais abundantes necessitam de banco de dados para cobrir as informações taxonômicas e funcionais

• Plataforma computacional robusta, combinado com programas de pesquisa de similaridade adaptados a esses dados.

Page 29: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Anotação

• Contigs longos ≥ 30.000 pb: RAST ou IMG

• Contigs curtos

Fase 1: identificação dos genes: FragGeneScan (FGS) 1-2% erro, MetaGeneMark (MGM), MetaGeneAnotator (MGA), Metagene e Orphelia

Fase 2: identificação atribuição de função e agrupamento taxonômico

Page 30: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

• Usa FGS, Greengenes , RDP e similaridade por RNAr• Usa bases de dados funcionais de ontologia GO

(KEGG, eggNOG, COG/KOG, PFAM e TIGRFAM).

Pipelines

Thomas, Gilbert e Meyer, 2011

Sistema aberto que processa automaticamente as sequências de metagenomas, faz comparações com bases de dados existentes, computa reconstruções filogenéticas e classifica funcionalmente potenciais genes.

Page 31: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

• Usa FGS, MGA e taxonomia baseada em 16S RNAr• Usa bases de dados funcionais de ontologia GO (KEGG,

eggNOG, COG e SEED).

Pipelines

Thomas, Gilbert e Meyer, 2011

Page 32: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

• Usa FGA e MGA• Oferece esquema de anotação mais flexível

• Requer o uso do mesmo workflow para análise

Pipelines

Thomas, Gilbert e Meyer, 2011

Page 33: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

MEGANPipelines

Page 34: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Aplicações

Page 35: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Aplicações

oIdentificar genes funcionais e/ou novas vias metabólicasoEstimar a diversidade microbiana;

permitindo o estudo dos genomas em uma comunidade como um todooCompreender a dinâmica da população de

uma comunidade inteira.

Page 36: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Saúde

Page 37: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Bioenergia

Page 38: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Metabolismo animal

Page 39: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Identificação novos patógenos

Page 40: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Vigilância

Page 41: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Medicina forense

Page 42: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

FUNCIONAL

SEQUÊNCIAS

BIOPROSPECÇÃO

Page 43: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

BIOPROSPECÇÃO

Page 44: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

ESTUDOS ECOLÓGICOSPrimeiros estudos

• Mar de Sargaços– Comunidade

complexa– Genes

desconhecidos– Filotipos novos– Impossibilidade de

sequenciar todos os genomas presentes na amostra

Page 45: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

• Global Ocean Sampling (GOS)

Fonte: http://camera.calit2.net/about/gos.shtm

Projetos recentes

Page 46: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

• Microorganismos representam mais de 90% da biomassa do oceano, mediam todos os ciclos bioquímicos nos oceanos e são responsáveis por 98% da produção primária no mar.Metagenômica é uma abordagem inovadora de sequenciação para examinar as espécies microbianas de espaço aberto sem a necessidade de isolamento e cultura de laboratório de espécies individuais.

Alves, 2007

Page 47: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Projetos recentes

Page 48: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Projetos recentes

Page 49: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Fluxograma comparativo de projetos genoma tradicionais e metagenômicos

Page 50: Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

OBRIGADO!