Introdução a Bioinformática Curso de Verão 2011 · 2011-02-16 · desenvolvimento, se defender...

Post on 06-Dec-2018

219 views 0 download

Transcript of Introdução a Bioinformática Curso de Verão 2011 · 2011-02-16 · desenvolvimento, se defender...

1

Introdução a Bioinformática – Curso de Verão 2011

Nivelamento na área de Biológicas

2 2

O que é genoma? • Um genoma é o DNA completo de um organismo, incluindo os genes.

Os genes levam a informação para produzir todas as proteínas

necessárias para todos os organismos. Estas proteínas determinam

como um organismo se parece, como pode ser seu crescimento e

desenvolvimento, se defender de infecções e doenças, e possivelmente

sobre seu comportamento.

• A molécula do DNA é composta por 4 bases: Adenina (A), Timina (T),

Citosina (C) e Guanina (G). Estas bases são repetidas muitas vezes no

genoma. A ordem dos As, Ts, Cs e Gs é crítico. A ordem destas letras

determinam se um organismo é um humano ou de outra espécie como

rato, chipanzé, etc.

• Esta é a razão estão muito interessados no seqüênciamento de

genomas. Comparar DNA de outros organismos com o humano e

entender a seqüência, irá ajudar os pesquisadores a aprender mais

sobre evolução e a vida humana.

3

4

Célula procariota (bactérias)

5

Células Eucarióticas

célula animal

célula vegetal

6

Genoma (DNA)

Gene

(informação genética)

RNAm

transcrição

tradução

Proteína (função)

www.cib.org.br

7

8

2003

1953

1953

2003

Abril de 1953: James Watson e Francis Crick descobrem a

estrutura de dupla hélice do DNA.

9

Nucleotídeos

• Base nitrogenada + Pentose + Fosfato

10

Ligação Fosfodiester Polaridade 5’ -> 3’ pH 7 = fosfatos c/ carga negativa neutralizados por interações iônicas com ptn, ions, poliaminas

11

Nucleotídeos

Base nitrogenadas

• Pirimidina: Timina (T), Uracil (U) e Citosina (C)

• Purina: Adenina (A) e Guanina (G)

12

13

Nucleotídeos e Ácidos Nucleicos

• DNA: Armazenamento da informacão genética – estabilidade

• RNA: várias funções – RNA ribossomal (rRNA) - componentes

estruturais de ribossomos – RNA mensageiro (mRNA) - intermediário – RNA transferência (tRNA) - moléculas

adaptadoras que traduzem informação do mRNA em aminoácidos

– snRNA, microRNA, etc

14

Organização dos genomas dos

Procariotos e dos Eucariotos

15

A molécula do DNA está organizada em estruturas

chamadas CROMOSSOMOS.

Bactérias e vírus = um único cromossomo

Organismos eucariotos = muitos cromossomos

ex: Levedura possui 16

milho possui 20

humanos possui 46

O tamanho da molécula do DNA é freqüentemente

muito maior que o compartimento que a contém.

Assim, o empacotamento do DNA no cromossomo.

precisa ser precisamente organizado

16

O superenrolamento do DNA

é importante para compactar

o DNA e assim caber dentro

da célula. Isto implica em um

alto grau de organização

estrutural para permitir

acesso da informação contida

no DNA para os processos de

replicação e transcrição.

17

Cromatina = DNA + proteína ( histonas e não-histônicas)

Estrutura de um nucleossomo

(150 a 250 pb de DNA

associados a 2 cópias das

proteínas chamadas de

histonas (H2A, H2B, H3 e H4)

e uma histona H1 externa

18

• Representação esquemática

do DNA cromossomico preso a

um scaffold nuclear.

• Cada dobra representa mais

uma compactação.

• Dentro dos loops estão genes

com funções relacionadas.

Microscopia eletrônica da estrutura

Compactação dos nucleossomos

19

Dogma Central da Genética

20

21

22

Replicação do DNA

23

Fragmento de Okazaki:

Procariotos: 1000 e 2000 nt

Eucariotos: 100 e 200 nt

24

A fita de DNA que

direciona a síntese da

molécula de mRNA

complementar é

chamada de fita molde

ou codificadora ou fita

antisenso.

A transcrição ocorre

no núcleo!!!!

Transcrição

25

26

27

Splicing Alternativo

28

29

Síntese de Proteínas

30

Síntese de Proteína:

31

32

33

34

35

Dobramento da Proteína

36

Seqüênciamento de DNA

Foi desenvolvido após o conhecimento de poder separar

os fragmentos de DNA por tamanho

O método de seqüênciamento de DNA de Sanger:

ddNTP

37

ELETROFORESE

38

Tem a importância de produzir muitas cópias de um

Fragmento de DNA

Até 1980 o único método para produzir grandes quantidades

de DNA era inserindo fragmentos de DNA em bactérias e

selecionar aquelas contendo o fragmento isolados de muitas

colônias crescendo numa placa.

1985: Kary Mullis, desenvolveu a técnica do PCR.

PCR : Reação de Polimerase em Cadeia

39

Em 1985 Mullis

desenvolveu o

método de PCR.

40

41

Sequenciamento de DNA

Manual

Automático

43

Estratégias de Sequênciamento Completo

de Genomas Procariotos

44

45

Estratégias de Seqüenciamento Completo

(Shotgun de DNA Genômico)

1 a 2 kb

50 kb

50 kb

TGCCCCCAAAAGGGGG

ATGGGCCTTTG CTTTGCCCCCAAA

AAAGGGGGAAAAG

ATGGGCCTTTGCCCCCAAAAGGGGGAAAAG

1 a 2 kb

Gaps

DNA genômico

Seqüenciamento

completo

GGGAAAAGGGTACGCCGGGG

CCTGGGTTAGCTGCCTTTGC CTTTGCGGGTACGCCGGGGGAAAAG

Estratégias de Sequenciamento:

Genômico

• direto - biblioteca em cosmídeos - insertos de ~40kb

• randômico - bibliotecas em plasmídeos insertos entre 1-4kb

• biblioteca em fagos - insertos de ~20kb

• produtos de PCR

• digestão eletrônica x digestão em gel

PCR

47

“Expressed Sequence Tags”

(EST)

cana de açúcar, arroz, eucalipto, humano, etc

Exon 1 Exon 2 Exon 3 Intron 1 Intron 2 DNA extra gênico

Síntese de RNA

RNA primário

RNAm

Processamento

Transcriptoma: Estudo de

seqüências expressas (EST)

49

Bibliotecas de cDNA

RNA

Proteína

DNA

cDNA: ATGTACGGGCTAC-TTTTTTT

RNA: ATGTACGGGCTAC-AAAAAA

cDNA

50

3. Síntese de cDNA RNA m

AAAAAA

TTTTTT Not I

Síntese da Primeira fita

AAAAAA

TTTTTT Not I

Síntese da Segunda fita

AAAAAA

TTTTTT Not I

Adição do Adaptador SalI

AAAAAA

TTTTTT Not I

AAAAAA

TTTTTT Not I

Digestão com NotI

Sal I Sal I

Sal I

51

5. Ligação e Transformação

AAAAAA

TTTTTT Not I

Ligação no Plasmídio

Sal I Plasmídio Plasmídio

E coli

competente

52

6. Mini Prep

7. Seqüênciamento

cDNA

ACGTACGTACGTAC

TGCATGCATGCATG Primer

3’ 5’

3’

Plasmídio

53

Qualidade das seqüências

phred phrap consed

http://www.isrec.isb-sib.ch/DEA/module8/phredPhrap_slides/sld003.htm

54

Bioinformática

TATTATCGTATCCTGGTCATACCATTGA

TCGTATCCTGGTCATACCATTGACTGGCTATAACTGCCTAGCT

ATACCATTGACTGGCTATAACTGCCTAGCTCTTCGTAATCTAGTATTATATCG

TGCCTAGCTCTTCGTAATCTAGTATTATATCGCATATCGTCGATGT

GACTGGCTATAACTGCCTAGCTCTTCGTAATCTAGTATTATATCGCATATCGTCGAT

TATTATCGTATCCTGGTCATACCATTGACTGGCTATAACTGCCTAGCTCTTCGTAATCTAGTATTATATCGCATATCGTCGATGT

consenso

Códon de iniciação ATG, TTG e GTG

Stop Códon: TGA, TAG e TAA

Porcentagem de GC do genoma

Glimmer - RBSfinder

Phred/Phrap and Consed

ORFs

55

Suposta Função da

Proteína

Obtenção da

Seqüência de

Nucleotídeos

Obtenção da

Seqüência de

Aminoácido

Programas especiais que identificam seqüências de leitura aberta

(ORF) - Glimmer RBSfinder

atggaaactcgttactggtacgcctgcggtaccggtccggaattcccgggtcgacccacg

M E T R Y W Y A C G T G P E F P G R P T

cgtccggcgagttcttggttgacctcttcctcttcgaccacctcccaggctcttggtgta

R P A S S W L T S S S S T T S Q A L G V

gcttgccactctcaccaatcaagttttcatctctcatctcgacgttcagatcccaactgc

A C H S H Q S S F H L S S R R S D P N C

ctttcatccctttgctcaccccactcgtgcccactctggtgcggcagcaggatcaaagga

L S S L C S P H S C P L W C G S R I K G

ctacgt

L R

ATGGAAACTCGTTACTGGTACGCCTGCGGTACCGGTCCGGAATTCCCGG

TCGACCCACGCGTCCGGCGAGTTCTTGGTTGACCTCTTCCTCTTCGACC

ACCTCCCAGGCTCTTGGTGTAGCTTGCCACTCTCACCAATCAAGTTTTC

ATCTCTCATCTCGACGTTCAGATCCCAACTGCCTTTCATCCCTTTGCTC

ACCCCACTCGTGCCCACTCTGGTGCGGCAGCAGGATCAAAGGACTACGT

Comparação em bancos de dados disponíveis - BLAST

56

BLAST

(Basic Local Alignment Search Tool)

http://www.ncbi.nlm.nih.gov

• conjunto de programas que buscam por similaridade

entre seq no banco de dados.

• elaborados para explorar todas as seq possíveis no

banco de dados (ptn ou DNA)

• probabilidades definidas para uma interpretação

estatística da identidade

(Altschul et al., 1990)

Impacto dos Projetos Genoma

• Treinamento de cientistas e estudantes

em biologia molecular e genomica

• Avanços no conhecimento

• Aumento na qualidade científica

• Desenvolvimento de novas tecnologias

• Criação de novos negócios

A Era Pós-genômica

• Com o sequenciamento completo, precisa-se processar e relacionar os dados brutos e transformá-los em conhecimento

• Modelagem molecular:

– Computação gráfica

– Inteligência artificial

• Análise de Microarrays:

– Processamento de imagens

– Inteligência artificial

– Banco de dados

59

2002: Pat Brown

DNA chips: microarrays

60