454 Outline – Complexidade… – Conceito – Metodologia detalhada – Aplicações –...

Post on 07-Apr-2016

221 views 1 download

Transcript of 454 Outline – Complexidade… – Conceito – Metodologia detalhada – Aplicações –...

454

• Outline– Complexidade…– Conceito– Metodologia detalhada– Aplicações– Relevância

Qual a importância do sequenciamento de DNA para o conhecimento biológico?

Fractal DNA – Science out/09

A descoberta que o DNA genômico é organizado em forma de um Fractal, sem nó ou cantos, nos demonstra a complexidade desse molécula e a destreza da natureza em termos de organização.

Como podemos desconstruir essa complexidade afim de compreender nossa natureza?

Complexidade a ser entendida

“Uma molécula de DNA teria 2 metros de comprimento quando esticada, porém cabe dentro do núcleo celular”

Comparativo Sanger x Nova Geração

Tempo de preparo da amostra Anos – Meses Dias

Valor 106 $ por Genoma 104 $ por Genoma

Mão de obra 10 2

Conceito

DOE Joint Genome Institute 454 sequencers

One Fragment = One Bead = One Read• Sequenciamento baseado em pirosequenciamento• Não necessita de clonagem • Amostra de DNA mínima • Procedimento de sequenciamento fácil, rápido e relativamente barato• Resultados robustos, taxa de erro controlada

Metodologia detalhada

Preparação da Biblioteca de seq.

Origens das amostras:gDNA, plasmids, fosmids, BACs, long PCR products (>1.5 kb),cDNA

Fragmentação por nebulização

Opções de escalonamento do sequenciamento

Preparação da Biblioteca de DNA

Tag A – PCR Tag B – Sequenciamento

DNA bead montada pronta para emPCR

Amplificação da Biblioteca

Cada DNA bead contém apenas uma cópia DNA simples fita.

Essa bead então será levada ao processo de emPCR para que essa fita seja multiplicada gerando uma DNA bead com milhares de cópias da mesma sequencia de DNA.

Após esse processo é gerada uma biblioteca com 10 a 50 cópias do genoma original.

Processo de sequencimento

Bead acessória contendo Sulfurilase e Luciferase

As beads obtidas no emPCR são então depositadas na placa de seq. sendo que cada uma ocupa um único well.

Em cada well são adicionadas beads acessórias contendo as enzimas responsáveis pela emissão de photons na reação de sequencimento.

Processo de sequencimento

Aparelho pronto para corrida

Processo de sequencimento

Supplementary Figure 3. Kinetic modeling of single well. Assumption: 10 million DNA copies per bead, [DNA] = 0.3 μM.

O processo de sequenciamento é baseado na emissão de photons pela enzima luciferase de maneira dependente a adição de nucleotídeos durante a síntese da fita complementar do DNA sequenciado. Sendo o fluxo de nucleotídeos cíclico, ou seja, apenas um nucleotídeo por vez, a sequencia vai sendo formada gerando uma informação de imagem a cada adição.

Processo de sequencimento

Um dos adaptadores anteriormente adicionados a fita de DNA são utilizados para o inicio do sequenciamento nos primeiros fluxos de nucleotídeos. Essa sequencia será utilizada no processamento do sequenciamento possibilitando a leitura do restante do fragmento a ser sequenciado.

Análise de dados do sequenciamento

Figura colorida artificialmente demonstrando o tipo de informação adquirida durante o sequencimento. A cada fluxo de nucleotídeos (previamente conhecido) as imagens são processadas gerando a sequencia da fita de DNA

Processo de sequencimento

Análise de dados do sequenciamento

Tipos de dados gerados pelo sequenciador:

Análise de dados do sequenciamento

Análise de dados do sequenciamento

Assembler

Análise de dados do sequenciamentoReference Mapper

Análise de dados do sequenciamento

Amplicon Variant analyser

Análise de dados do sequenciamento

Análise de dados do sequenciamento

Para a análise dos dados de sequencimento, três ferramentas de bioinformática são fornecidas pelo fabricante:

Sequenciamento de novos genomas até 3Gb

Re-análises de genomas já sequenciados

Avaliação de variantes em amplicons em comparação com uma sequencia referência

Relevância – Sequenciamento de novos genomas

Here we report the DNA sequence of a diploid genome of a single individual, James D.Watson, sequenced to 7.4-fold redundancy in two months using massively parallel sequencing in picolitre-size reaction vessels. This sequence was completed in two months at approximately one hundredth of the cost of traditional capillary electrophoresis methods. Comparison of the sequence to the reference genome led to the identification of 3.3million single nucleotide polymorphisms, of which 10,654 cause amino-acid substitution within the coding sequence .In addition, we accurately identified small scale (2–40,000basepair(bp)) insertion and deletion polymorphism as well as copy number variation resulting in the large-scale gain and loss of chromosomal segments ranging from 26,000 to 1.5million base pairs.

Relevância – Sequenciamento de novos genomas

Protocolo de sequenciamento a partir de amostras de pacientes é capaz de detectar o virus H1N1 com rapidez e qualidade

Relevância – Sequenciamento de transcriptoma

Classificação das sequencias

Descoberta de novos ncRNAs

Relevância Avaliação de variantes em amplicons -

Most importantly, we estimate the cost of SNP discovery in this study at $0.38/SNP, yet note that several aspects of the molecular methods used here can be optimized for much higher sequencing yield and broader genome coverage. Such optimization, combined with further advances in high throughput sequencing yield, longer read-lengths, lower error rates, and cheaper run costs, can further reduce the cost of SNP discovery in diverse maize, such that several million gene-enriched SNPs needed for comprehensive association studies is an immediate economic possibility

Descoberta de novas SNPs no genoma do Milho.

Futuro do Sequenciamento

Maior quantidade de reads por corrida – Menor preço por base.

Evolução do aparelho

Evolução do Sistema

Junior system

454

Obrigado pela atenção

julioclorenzi@usp.br