Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação...

39
Metagenômica e sequenciamento de nova geração Fabrício Campos 25 de junho de 2015

Transcript of Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação...

Page 1: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Metagenômica e sequenciamento de nova geração

Fabrício Campos

25 de junho de 2015

Page 2: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Conceitos

• METAGENOMA

– É o genoma coletivo do microbioma total

encontrado em um determinado habitat

• METAGENÔMICA

– É a análise genômica das comunidades de

microrganismos de um determinado ambiente por

técnicas independentes de cultivo

Page 3: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Viroma

Page 4: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Ferramenta poderosa

• Informação genética sobre novos

microrganismos e seus produtos (genes,

proteínas, enzimas, etc)

• Conexões genômicas entre função e filogenia

de organismos “não cultiváveis”

• Perfis evolutivos de função e estrutura de

comunidades

Page 5: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Sample preparation

Page 6: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Sample preparation

Page 7: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Genome fragmentation

Page 8: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Genome fragmentation

Page 9: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

What is genome assembly?

• Hierarchical structure

Page 10: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Scaffolds

Page 11: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Digamos que você sequenciou o genoma abaixo (depois da fragmentação):

“era o melhor dos tempos, era o pior dos tempos, a era da sabedoria, a era da bobagem...” Charles Dickens

era o melhor dos

dos tempos, era o pior

a era da sabedoria,

melhor dos tempos, era

a era da bobagem,

Page 12: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

reads

contigs

scaffolds

era o melhor dos

era o melhor dos tempos

o melhor dos tempos, era

melhor dos tempos, era

dos tempos, era o

dos tempos, era o melhor dos tempos, era o pior

“era o melhor dos tempos, era o pior dos tempos ...”

Page 13: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

O que é montagem de genomas?

• Processo de reconstrução da sequencia de DNA original de um organismo a partir dos “reads”

• Mundo ideal

– “Reads” não ambíguos e livres de erros

– Simples problema de dedução

• Mundo real

– “Reads” ambíguos (muito curtos ) e com erros

– Problema de inferência complicado de resolver

Page 14: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

O que fazer após o sequenciamento

• Editar, montar e anotar todos os contigs

– Software Geneious

• Fazer a predição dos genes daquelas regiões não anotadas

– FGenesB

• Fazer o Blastp > identificar a proteína

• Volta para o Geneious e edita as anotações

• Depositar Contigs no Genbank

Page 15: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

SoftBerry - Gene identification

Page 16: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Annotation in Geneious

Page 17: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Problemas na montagem

• Kit Illumina de 2 x 75 pb (melhor 2 x 300 pb)

• Falta de processador e memoria computacional para processamento de dados

– Processador 4 núcleos e 8 Gb de memoria RAM não é suficiente

– Ferramenta Geneious “Combined mapping and de novo assembly” não roda ou demora muito

– Pelo menos um servidor com 16 núcleos e 64 Gb de memoria RAM

Page 18: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Problemas na montagem

Page 19: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

The limitations of draft assemblies for understanding prokaryotic adaptation and evolution

Fonte: N. Ricker et al. / Genomics 100 (2012) 167–175

Page 20: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

6 fagos inseridos no genoma

E. faecalis P8

Page 21: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Demora na montagem

Page 22: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Demora na montagem

Page 23: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Genomas montados no lab

• Metagenômica de fezes de suínos

Page 24: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Genomas montados no lab

• Porcine parvovirus tipo 2

– Montagem do genoma de PPV-2 a partir dos “contigs” gerados pelo software Geneious

– Os 5425 pb foram cobertos pelos contigs (região azul) em até 31.767 vezes

Page 25: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

PPV-2

Page 26: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

PPV-2: Ref-Seq no GenBank

Page 27: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)
Page 28: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Herpesvirus bovino 1

Page 29: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Genoma de herpesvirus humano x herpesvirus bovino 1

BoHV-1 (~135kb)

Page 30: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Diferenças entre Cooper GenBank e a “nossa”

• Cooper GenBank (JX898220): 134.896 pb e 72,4% de GC

• Cooper “nossa”: 134.004 pb e 72,5% de GC

• Nível de identidade: 98,5%

• Diferença: 892 pb

Page 31: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Região US1.67/US2 excisada durante replicação

Cooper GenBank

Nossa Cooper

Page 32: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Região US1.67/US2 excisada durante replicação

Cooper GenBank

Nossa Cooper

/

Nossa Cooper

Page 33: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

O que acham disso?

Page 34: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Aplicações em medicina

• Identificar genes funcionais e/ou novas vias metabólicas

• Estimar a diversidade microbiana; permitindo o estudo dos genomas em uma comunidade como um todo

• Compreender a dinâmica da população de uma comunidade inteira

• Identificação novos patógenos

Page 35: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Aplicações em medicina

Page 36: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Aplicações em medicina

Page 37: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Aplicações em medicina

Page 38: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Referencias

• J. Miller, S. Koren, G. Sutton (2010) Assembly algorithms for

next-generation sequencing data Genomics 95 315-327.

• M. Pop (2009) Genome assembly reborn: recent computational

challenges Briefings in Bioinformatics 10:4 354-366.

• Web

– http://bioinformatics.net.au/

– http://vicbioinformatics.com/

Page 39: Metagenômica e sequenciamento de nova geração - UFRGS · Ferramenta poderosa •Informação genética sobre novos microrganismos e seus produtos (genes, proteínas, enzimas, etc)

Grato pela atenção!!!

[email protected]