Análises de sequências metagenômicas via MG-RAST

51
An´ alises de sequˆ encias metagenˆ omicas via MG-RAST Leandro Nascimento Lemos Doutorando em Biologia na Agricultura e no Ambiente Orientadora: Profa. Tsai Novembro/2016 Leandro Nascimento Lemos An´ alises de sequˆ encias metagenˆ omicas via MG-RAST

Transcript of Análises de sequências metagenômicas via MG-RAST

Page 1: Análises de sequências metagenômicas via MG-RAST

Analises de sequencias metagenomicas viaMG-RAST

Leandro Nascimento Lemos

Doutorando em Biologia na Agricultura e no AmbienteOrientadora: Profa. Tsai

Novembro/2016

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 2: Análises de sequências metagenômicas via MG-RAST

Big Data

Geracao de dados massivos em Biologia Molecular;

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 3: Análises de sequências metagenômicas via MG-RAST

Big Data

Sequenciamento massivo gera muitos dados!Illumina Hiseq: sequenciamento de ate 2.000 genomasmicrobianos em uma unica corrida.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 4: Análises de sequências metagenômicas via MG-RAST

Bioinformatica

O que e: Aplicacao da Cienciade Dados na resolucao deproblemas biologicos;Desafio: processar umaavalanche de dados gerados porsequenciadores de nova geracao;Solucao: Produzir novasferramentas computacionais.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 5: Análises de sequências metagenômicas via MG-RAST

Bioinformatica

Ferramentas deProcessamento:

Ferramentas deVisualizacao:

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 6: Análises de sequências metagenômicas via MG-RAST

Bioinformatica: Human Microbiome Project

Explorar as relacoes entre doencas humanas e alteracoes namicrobiota;Desenvolvimento de novas ferramentas de Bioinformatica

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 7: Análises de sequências metagenômicas via MG-RAST

Bioinformatica: Human Microbiome Project

Desenvolvimento de novas ferramentas de Bioinformatica(IMG/M)

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 8: Análises de sequências metagenômicas via MG-RAST

Bioinformatica: Computadores de alto desempenho

Alta capacidade deprocessamento,armanezamento e memoria;Illumina Hiseq(18.000.000/reads poramostra);128 processadores e 2 TBde memoria ram.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 9: Análises de sequências metagenômicas via MG-RAST

Linux

Sistema operacional livre.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 10: Análises de sequências metagenômicas via MG-RAST

Estudos de comunidades microbianas (ou de microbiomas)

Tecnicas independentes de cultivo de microrganismosPerfil de 16S rDNA; Metagenomica; Metatranscritomica

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 11: Análises de sequências metagenômicas via MG-RAST

Metagenomica pra que?

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 12: Análises de sequências metagenômicas via MG-RAST

Metagenomica: Informacao Taxonomica e Funcional

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 13: Análises de sequências metagenômicas via MG-RAST

Metagenomica: Pipelines

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 14: Análises de sequências metagenômicas via MG-RAST

MG-RAST: plataforma online de processamento de dadosmetagenomicos

Acesso: http://metagenomics.anl.gov

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 15: Análises de sequências metagenômicas via MG-RAST

MG-RAST: plataforma online de processamento de dadosmetagenomicos

Arquivos brutos (raw data) ou contigs (montagem - assembled data);Arquivo de metadados (sample description data);Upload: Interface grafica ou linha de comando.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 16: Análises de sequências metagenômicas via MG-RAST

MG-RAST

Pipeline (Fluxo de analise de dados).

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 17: Análises de sequências metagenômicas via MG-RAST

Arquivo em formato fastq (10 minutos)

https://lemosbioinfo.wordpress.com/material-aulapratica/Verificar a qualidade das dez primeiras bases da primeira, segunda eterceira sequencia.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 18: Análises de sequências metagenômicas via MG-RAST

Arquivo em formato fastq - Phred score

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 19: Análises de sequências metagenômicas via MG-RAST

Qualidade de sequenciamento/Remocao de sequencias debaixa qualidade

Qualidade do sequenciamentoSoftware: FastQC(http://www.bioinformatics.babraham.ac.uk/projects/fastqc)

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 20: Análises de sequências metagenômicas via MG-RAST

MG-RAST - Controle de Qualidade

4. Choose pipeline options

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 21: Análises de sequências metagenômicas via MG-RAST

MG-RAST - Upload

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 22: Análises de sequências metagenômicas via MG-RAST

MG-RAST - Upload

1. Metadata file: MetaZen tool2. Select project.3. Select sequence files (s)4. Choose pipeline options

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 23: Análises de sequências metagenômicas via MG-RAST

Dereplicacao, DRISEE e Screening

Deplicacao e DRISSE: Removacao de sequencias artificaisgeradas durante o sequenciamento.Screening: Removacao de sequencias nao-microbianas.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 24: Análises de sequências metagenômicas via MG-RAST

MG-RAST

Pipeline (Fluxo de analise de dados).

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 25: Análises de sequências metagenômicas via MG-RAST

Predicao de Genes

Identificacao de regioes codificadoras.ORFs (Open reading frames).Tamanho medio de um gene microbiano: 950 bp.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 26: Análises de sequências metagenômicas via MG-RAST

Predicao de Genes: Problemas

Fragmentos de sequencias (genes incompletos);Erros de sequenciamento.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 27: Análises de sequências metagenômicas via MG-RAST

Solucao: Aprendizagem de Maquina

Netflix.Ensinar o computador a pensar usando exemplos.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 28: Análises de sequências metagenômicas via MG-RAST

Solucao: Aprendizagem de Maquina

Ensinar o computador a pensar usando exemplos: HMMs (ModelosOcultos de Markov).O que o computador precisa aprender?A) Desvio no uso de codons; B) Modelos de Erros de Sequenciamento; C)Padroes de codon de iniciacao e terminacao.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 29: Análises de sequências metagenômicas via MG-RAST

MG-RAST

Pipeline (Fluxo de analise de dados).

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 30: Análises de sequências metagenômicas via MG-RAST

Agrupamento de aminoacidos

Agrupamento de sequencias proteıcas (90% de similaridade).Redudacao da complexidade computacional.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 31: Análises de sequências metagenômicas via MG-RAST

MG-RAST

Pipeline (Fluxo de analise de dados).

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 32: Análises de sequências metagenômicas via MG-RAST

Identificacao de proteınas

Busca por sequencias similares em bancos de dados publicos.GenBank, SEED, IMG, UniProt, KEGG e eggNOGs.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 33: Análises de sequências metagenômicas via MG-RAST

Perfil de Abundancia

Best hit, Representative hit e Menor Ancestral Comum (LCA).

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 34: Análises de sequências metagenômicas via MG-RAST

Analise exploratoria: Atividade em grupo (30 minutos)

1 Clique em AulaPratica2016.2 Clique em Amostra de interesse do grupo.3 Predicted feature (16S rDNA e proteınas); Unknown; failed QC.4 Predicted Features: unknown protein; annotated protein; ribosomal RNA.5 Analysis Statistics: Predicted Protein Features vs. Identified Protein

Features.6 Modificar metadados.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 35: Análises de sequências metagenômicas via MG-RAST

Analise exploratoria: Atividade em grupo (10 minutos)

1 Qual o filo mais abundante?2 Qual a funcao mais abundante?3 Qual e a proporcao de Proteobacteria?4 Qual e a proporcao de Acidobacteria?

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 36: Análises de sequências metagenômicas via MG-RAST

Informacao funcional: o que estao fazendo?

COG, KO, NOG e Subsystems.Abundancia de categorias funcionais.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 37: Análises de sequências metagenômicas via MG-RAST

Informacao taxonomica: Quem esta ali?

RefSeq.Abundancia taxonomica.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 38: Análises de sequências metagenômicas via MG-RAST

Analises Comparativas (10 minutos)

1 Clique em Analysis.2 Aguarde...3 Create a new Analysis.4 Selecionar RefSeq, KEGG, Subsystems e Silva SSU.5 Selecionar as amostras.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 39: Análises de sequências metagenômicas via MG-RAST

Analises Comparativas: selecao de parametros de anotacao

1 Clicar em metadata e metadata2 sample, add (sinal de mais): Nomes e Tratamento.3 Parametros: I) e-value II) Identidade III) length IV) min.abundance.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 40: Análises de sequências metagenômicas via MG-RAST

Analise exploratoria: Atividade em grupo (30 minutos)

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 41: Análises de sequências metagenômicas via MG-RAST

Analise exploratoria: Atividade em grupo (10 minutos)

1 Qual o filo mais abundante?2 Qual a funcao mais abundante?3 A proporcao do filo mais abundante e alterada quando os parametros de

anotacao sao modificados? Por que?4 A proporcao da funcao mais abundante e alterada quando os parametros

de anotacao sao modificados? Por que?5 Qual e a proporcao de Proteobacteria?6 Qual e a proporcao de Acidobacteria?

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 42: Análises de sequências metagenômicas via MG-RAST

SubSystems

1 Exemplo...2 Carbohydrate (nıvel 1)3 One-carbon Metabolism (nıvel 2)4 Methanogenesis (nıvel 3)

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 43: Análises de sequências metagenômicas via MG-RAST

STAMP

1 Clique em Analysis2 Export

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 44: Análises de sequências metagenômicas via MG-RAST

STAMP

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 45: Análises de sequências metagenômicas via MG-RAST

MetaZoo

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 46: Análises de sequências metagenômicas via MG-RAST

MetaZoo: Estrutura, Dinamica e Funcoes Metabolicas dacompostagem - Abordagem multi-omica.

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 47: Análises de sequências metagenômicas via MG-RAST

Modelo de degradacao de biomassa vegetal pormicrorganismos na compostagem - Modelo conceitual

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 48: Análises de sequências metagenômicas via MG-RAST

BMPOS - Ferramentas de Bioinformatica para analises demicrobiomas

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 49: Análises de sequências metagenômicas via MG-RAST

Onde aprender?

Coursera: https://www.coursera.org

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 50: Análises de sequências metagenômicas via MG-RAST

Onde aprender?

Coursera: https://www.coursera.org

Gut Check: Exploring Your Microbiome

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST

Page 51: Análises de sequências metagenômicas via MG-RAST

Obrigado pela atencao!

Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST