Apresentação do PowerPoint - Universidade de São … de... · –Tempo para sequenciamento do...

Post on 20-Sep-2018

216 views 0 download

Transcript of Apresentação do PowerPoint - Universidade de São … de... · –Tempo para sequenciamento do...

Genômica

• O que chamou mais atenção no filme?

– Tempo para sequenciamento do genoma

– Predição do fenótipo com base no genótipo

– Como este conhecimento pode ser usado para gerar novas tecnologias?

Sequenciamento de Genoma

Sequenciamento do Genoma

Genoma Humano: 3 bilhôes de bases

• AGCAATCAACTCGCTCGTGCTGC

AGCTTGGCAAGCGGCACAGAAAC

CGGGAGACCGTACTCACAACCCT

CTATTGCTCTATGGTGGGACTGG

TTTGGGTAAAACCCATTTAATGT

TTGCTGCAGGTAACGTAATGCGG

CAAGTAAACCCAACTTATAAAGT

AATGTATCTTCGTTCGGAACAGT

TTTTCAGCGCCATGATAAGAGCG

TACAAGATAAAAGTATGGATCAU

AAATGGAATCTTGGTCCCGTTGC

CTGGAACGTCTTGAAACTGAATT

CCCGCCAGAAGATGTTCATACTT

GGTTAAGACCTTTACAAGCCGAC

CAACGTGGTGACAGTGTCGTCCT

CGTACCAGTAGACACTACAGGAC

• Animação DNA polimerase

Replicação do DNA

DNA sequencing

• Animationcycseq.exe

Sequenciamento de DNA

Limitação: tamanho da sequencia

• ATGGAATCTTGGTCCT……………CCCGCCAGAAGATGTTCATACAAGACCTTTAC (M bases)

• ATTTCTCATACG………TGAAGTAG (600 bases)

http://www.k.u-tokyo.ac.jp/pros-e/person/shinichi_morishita/shinichi_morishita.htm

Shot gun sequencing

Montagem dos fragmentos

Fechamento dos gaps

Análise

Genome Assembly

Contigs

Assembler: Phrap (www.phrap.org)

Gaps

Complete Genome

O projeto foi fundado em 1990, com prazo de conclusão de 15 anos. James D. Watson, na época chefe dos Institutos Nacionais de Saúde dos EUA, assumiu inicialmente a direção do projeto.[1] Em 1990, o PGH tinha o envolvimento de mais de 5000 cientistas, de 250 diferentes laboratórios, que contavam com um orçamento, segundo diferentes fontes, que variou de US$ 3 bilhões a US$ 53 bilhões. O PGH contou com um financiamento de 3 milhões de dólares do Departamento de Energia dos Estados Unidos e do NIH estadunidense. O Projeto contou com o envolvimento de diversos laboratórios e centros de pesquisa ao redor do mundo, criando dessa forma o Consórcio Internacional de Sequenciamento do Genoma Humano. Este consórcio publicou um esboço inicial na revista científica Nature em fevereiro de 2001 com cobertura de cerca de 90 por cento do genoma. [2]

O genoma humano contém cerca de 3 bilhões de pares٭de nucleotídios.

O tamanho médio médio de um gene é cerca de 3.000 ٭pares de nucleotídios, mas a variação é muito grande; o maior gene humano é o da distrofina, com 2,4 milhões de pares de nucleotídios.

O número de genes no genoma humano está entre ٭20.000 e 25.000.

A seqüência de nucleotídios é muito semelhante ٭(99,9%) entre todas as pessoas.

O que o PGH nos informa?

*A função de 50% dos genes humanos descobertos é totalmente desconhecida.

*Menos do que 2% do genoma humano codifica proteínas.

* Seqüências repetitivas que não codificam proteínas (DNA lixo) constituem pelo menos 50% do genoma humano. * As seqüências repetitivas parecem não desempenhar nenhuma função direta, mas elas podem ter papel na dinâmica estrutural dos cromossomos. De tempos em tempos, essas seqüências possibilitam rearranjos do genoma, criando genes novos e modificando outros.

* O genoma humano possui regiões onde se concentram genes e regiões muito pobres em genes

* As regiões onde se concentram os genes possuem blocos ricos nas bases C e G, enquanto as regiões pobres em genes possuem blocos ricos nas bases A e T.

* A região rica em genes parecem se concentrar aleatoriamente no genoma, separados por longas seqüências de DNA não-codificante.

* O cromossomo 1 é o que contém o maior número de genes (2.968), e o cromossomo Y, o menor (231).

• O número de genes, suas localizações exatas e suas funções • Como os genes são regulados • Detalhes da estrutura dos cromossomos e da organização dos genes • Os tipos de DNA não-codificante, sua quantidade, sua distribuição, se contêm algum tipo de informação e suas funções • Como as células coordenam a expressão dos genes, a síntese das proteínas e os eventos pós-tradução • A interação das proteínas nas complexas maquinarias celulares • Explicar a conservação evolutiva entre as espécies • O proteoma, ou seja, o conjunto total de proteínas e suas funções • A correlação entre as diferenças genéticas entre as pessoas com a saúde e com as doenças • Predizer a susceptibilidade a doenças com base na variação da seqüência gênica • Os genes envolvidos em traços complexos e doenças multigênicas • O controle genético do desenvolvimento

O que ainda não sabemos...

Novas tecnologias

Illumina Genome Analyzer Workflow

Preparação das bibliotecas

Formação dos clusters

sequenciamento

Preparação das bibliotecas (6 horas)

Illumina Genome Analyzer

A

A

Preparação das bibliotecas

Illumina Genome Analyzer

A

A

T

T

A

A

T T

Preparação das bibliotecas

Illumina Genome Analyzer

Preparação dos clusters (5 horas)

Illumina Genome Analyzer

Lâmina – 8 canais

1 a 12 amostra por canal = 96 amostras

~375 Mb por canal

3 a 3,5 GB (3 bilhões de bases)

48 horas

Illumina Genome Analyzer

Re-sequenciar um genoma microbiano inteiro (5 MB)

- 75 x de cobertura (um canal)

genoma humano (1 x – lâmina inteira)

Illumina Flow Cell •One (1) flow cell.

•Eight (8) channels.

•Each channel can run up to twelve (12) differently tagged libraries (Multiplexed Sequencing).

•Input requirement: 0.1–1.0 μg (single- and paired-end reads), 10 μg (Mate Pair reads).

•1.4-mm wide channels.

•Relies on the binding of randomly fragmented DNA to attached oligos on a planar, optically transparent surface (flow cell).

•96-120 million reads (clusters) per flow cell, each containing ~1,000 copies of the same template.

Preparação dos clusters

Illumina Genome Analyzer

Preparação dos clusters

Illumina Genome Analyzer

Preparação dos clusters

Illumina Genome Analyzer

Preparação dos clusters

Illumina Genome Analyzer

Preparação dos clusters

Illumina Genome Analyzer

Sequencing Technology Overview

Sequencing Technology Overview

Preparação dos clusters

Illumina Genome Analyzer

A

C

T

G

G

C

T

Sequenciamento (2-3 dias)

- 4 nucleotídeos marcados ao mesmo tempo

- acurácia

- sem problemas com homopolimeros

Illumina Genome Analyzer

Incorporação

detecção

desbloqueio

Sequenciamento

Illumina Genome Analyzer

Sequenciamento

Illumina Genome Analyzer

Sequenciamento

Illumina Genome Analyzer

A

T C

G

Sequenciamento

Illumina Genome Analyzer

A T

C

G

Sequenciamento

Illumina Genome Analyzer

A

Sequenciamento

Illumina Genome Analyzer

A T

C

G

A

Sequenciamento

Illumina Genome Analyzer

A

T

C

G

A

Sequenciamento

Illumina Genome Analyzer

A

T

Illumina Genome Analyzer

Illumina Genome Analyzer

Illumina Genome Analyzer

Variante

não conhecida SNP

Illumina Genome Analyzer

Illumina Genome Analyzer

ILLUMINA HiScanSQ DNA, RNA sequencing and Genotyping

Novas tecnologias de Sequenciamento

60

Novas tecnologias de Sequenciamento

61

Novas tecnologias de Sequenciamento

62

Variações encontradas no genoma

• Microssatélites

• SNP

• Outras...

>ZZFIGCO001g_A04_.g_033_Rome.ab1 CHROMAT_FILE: CGATTGGGCCGACGTCCATGCTCCGGNNCGCATGTCGGCCGCGGGAATTCGATTCTCTTGCTTACGCGTGGACTAGCTTACAATA

GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGTTTTGGCTGATGCCTTATCTCAAAAG

AAGAAACGACCCTATATATAGAAAAGAAAAAAACAGAAAGAATCTATGCACAGTAAAGTAGGTCCCATATGTGGGTCCCTTATACAGT

GTATTTACTGTGTATACAATATTTCTACTATATAAACAATGTATCTACTGTTGAGTGGGTCGGCGGCCTCACTGTTGATCATATTCCAC

GTCTCTCTAATTCTTTCATCTGTTGGATGAAATCTTCCGCATTTTCTACAGCTTCGTCAGATAATATCTTCTCCGATTGAATAGGCTGA

GAATCTTCTGCAATATCATCGTTGCTTGTTTCACTTCGCATTAAAGTGTCAGATTTTTCATACTGGTTAATAGATTGAAGTAAGTTTCTT

TTTACTTCTTCCAAATACTTATTAATCAATTTCTATAAGATAAACATATAAGTTCAGATCCAGGCACATAATTATAACCATGCGTTTTCA

CACGTATTTGTCAAAATAAGTCTGCATTTCTCACTTCTTTTTCCTGGTTAAGACCCGTTATACCCTCCAATTATACTTGGAACACCTTT

TATCGGCGCTATTTATCCTTTTACTAGCATAGATTCTAAAGGATTTACCACAACTTATAAAAATAAAAGAATAGGTTATACCTTTGTTAC

CGATCCCGTAACTAGGGGATATAATGGCTTTATTAGATATAAATCCAAAATATATT

(AG)30

DNA sequencing

mutation

Useful when you suspect a gene, but don’t know

the variant. This one is BRAF gene in leukemia

The products of the sequencing reaction are separated on a

gel mixture that can separate fragments by one base pair.

Larger fragments Smaller fragments

SNP

Discovery of SNPs in aligned DNA sequence data using PolyBayes in the

Consed viewer

SNP Discovery

software

DNA Sequence Alignment for Single Nucleotide Polymorphism (SNP) Discovery in Soybean

Observações após o sequenciamento de vários genomas

• Se somos 99,9% iguais, onde estão as diferenças?

• Como uma mudança de bases pode mudar o fenótipo?

Atalho para 3D Animations - Disease Mutation Sickle Cell Dolan DNA Learning Center.lnk

Mutação: Albinismo

McPherron et al., Nature e PNAS 1997

Musculatura dupla em bovinos

• Mutações em regiões não codificantes podem alterar o fenótipo?

• Exemplos?

Georges, 2007

• Como estas informações de mutações podem ser utilizadas?

• Detecção de doenças

• Como esta informação pode ser usada para curar ou minimizar as doenças?

• Como a identificação dos polimorfismos podem ser usados para prever o fenótipo?