Introdução a Bioinformática Curso de Verão 2011 · 2011-02-16 · desenvolvimento, se defender...
Transcript of Introdução a Bioinformática Curso de Verão 2011 · 2011-02-16 · desenvolvimento, se defender...
1
Introdução a Bioinformática – Curso de Verão 2011
Nivelamento na área de Biológicas
2 2
O que é genoma? • Um genoma é o DNA completo de um organismo, incluindo os genes.
Os genes levam a informação para produzir todas as proteínas
necessárias para todos os organismos. Estas proteínas determinam
como um organismo se parece, como pode ser seu crescimento e
desenvolvimento, se defender de infecções e doenças, e possivelmente
sobre seu comportamento.
• A molécula do DNA é composta por 4 bases: Adenina (A), Timina (T),
Citosina (C) e Guanina (G). Estas bases são repetidas muitas vezes no
genoma. A ordem dos As, Ts, Cs e Gs é crítico. A ordem destas letras
determinam se um organismo é um humano ou de outra espécie como
rato, chipanzé, etc.
• Esta é a razão estão muito interessados no seqüênciamento de
genomas. Comparar DNA de outros organismos com o humano e
entender a seqüência, irá ajudar os pesquisadores a aprender mais
sobre evolução e a vida humana.
3
4
Célula procariota (bactérias)
5
Células Eucarióticas
célula animal
célula vegetal
6
Genoma (DNA)
Gene
(informação genética)
RNAm
transcrição
tradução
Proteína (função)
www.cib.org.br
7
8
2003
1953
1953
2003
Abril de 1953: James Watson e Francis Crick descobrem a
estrutura de dupla hélice do DNA.
9
Nucleotídeos
• Base nitrogenada + Pentose + Fosfato
10
Ligação Fosfodiester Polaridade 5’ -> 3’ pH 7 = fosfatos c/ carga negativa neutralizados por interações iônicas com ptn, ions, poliaminas
11
Nucleotídeos
Base nitrogenadas
• Pirimidina: Timina (T), Uracil (U) e Citosina (C)
• Purina: Adenina (A) e Guanina (G)
12
13
Nucleotídeos e Ácidos Nucleicos
• DNA: Armazenamento da informacão genética – estabilidade
• RNA: várias funções – RNA ribossomal (rRNA) - componentes
estruturais de ribossomos – RNA mensageiro (mRNA) - intermediário – RNA transferência (tRNA) - moléculas
adaptadoras que traduzem informação do mRNA em aminoácidos
– snRNA, microRNA, etc
14
Organização dos genomas dos
Procariotos e dos Eucariotos
15
A molécula do DNA está organizada em estruturas
chamadas CROMOSSOMOS.
Bactérias e vírus = um único cromossomo
Organismos eucariotos = muitos cromossomos
ex: Levedura possui 16
milho possui 20
humanos possui 46
O tamanho da molécula do DNA é freqüentemente
muito maior que o compartimento que a contém.
Assim, o empacotamento do DNA no cromossomo.
precisa ser precisamente organizado
16
O superenrolamento do DNA
é importante para compactar
o DNA e assim caber dentro
da célula. Isto implica em um
alto grau de organização
estrutural para permitir
acesso da informação contida
no DNA para os processos de
replicação e transcrição.
17
Cromatina = DNA + proteína ( histonas e não-histônicas)
Estrutura de um nucleossomo
(150 a 250 pb de DNA
associados a 2 cópias das
proteínas chamadas de
histonas (H2A, H2B, H3 e H4)
e uma histona H1 externa
18
• Representação esquemática
do DNA cromossomico preso a
um scaffold nuclear.
• Cada dobra representa mais
uma compactação.
• Dentro dos loops estão genes
com funções relacionadas.
Microscopia eletrônica da estrutura
Compactação dos nucleossomos
19
Dogma Central da Genética
20
21
22
Replicação do DNA
23
Fragmento de Okazaki:
Procariotos: 1000 e 2000 nt
Eucariotos: 100 e 200 nt
24
A fita de DNA que
direciona a síntese da
molécula de mRNA
complementar é
chamada de fita molde
ou codificadora ou fita
antisenso.
A transcrição ocorre
no núcleo!!!!
Transcrição
25
26
27
Splicing Alternativo
28
29
Síntese de Proteínas
30
Síntese de Proteína:
31
32
33
34
36
Seqüênciamento de DNA
Foi desenvolvido após o conhecimento de poder separar
os fragmentos de DNA por tamanho
O método de seqüênciamento de DNA de Sanger:
ddNTP
37
ELETROFORESE
38
Tem a importância de produzir muitas cópias de um
Fragmento de DNA
Até 1980 o único método para produzir grandes quantidades
de DNA era inserindo fragmentos de DNA em bactérias e
selecionar aquelas contendo o fragmento isolados de muitas
colônias crescendo numa placa.
1985: Kary Mullis, desenvolveu a técnica do PCR.
PCR : Reação de Polimerase em Cadeia
39
Em 1985 Mullis
desenvolveu o
método de PCR.
40
41
Sequenciamento de DNA
Manual
Automático
43
Estratégias de Sequênciamento Completo
de Genomas Procariotos
44
45
Estratégias de Seqüenciamento Completo
(Shotgun de DNA Genômico)
1 a 2 kb
50 kb
50 kb
TGCCCCCAAAAGGGGG
ATGGGCCTTTG CTTTGCCCCCAAA
AAAGGGGGAAAAG
ATGGGCCTTTGCCCCCAAAAGGGGGAAAAG
1 a 2 kb
Gaps
DNA genômico
Seqüenciamento
completo
GGGAAAAGGGTACGCCGGGG
CCTGGGTTAGCTGCCTTTGC CTTTGCGGGTACGCCGGGGGAAAAG
Estratégias de Sequenciamento:
Genômico
• direto - biblioteca em cosmídeos - insertos de ~40kb
• randômico - bibliotecas em plasmídeos insertos entre 1-4kb
• biblioteca em fagos - insertos de ~20kb
• produtos de PCR
• digestão eletrônica x digestão em gel
PCR
47
“Expressed Sequence Tags”
(EST)
cana de açúcar, arroz, eucalipto, humano, etc
Exon 1 Exon 2 Exon 3 Intron 1 Intron 2 DNA extra gênico
Síntese de RNA
RNA primário
RNAm
Processamento
Transcriptoma: Estudo de
seqüências expressas (EST)
49
Bibliotecas de cDNA
RNA
Proteína
DNA
cDNA: ATGTACGGGCTAC-TTTTTTT
RNA: ATGTACGGGCTAC-AAAAAA
cDNA
50
3. Síntese de cDNA RNA m
AAAAAA
TTTTTT Not I
Síntese da Primeira fita
AAAAAA
TTTTTT Not I
Síntese da Segunda fita
AAAAAA
TTTTTT Not I
Adição do Adaptador SalI
AAAAAA
TTTTTT Not I
AAAAAA
TTTTTT Not I
Digestão com NotI
Sal I Sal I
Sal I
51
5. Ligação e Transformação
AAAAAA
TTTTTT Not I
Ligação no Plasmídio
Sal I Plasmídio Plasmídio
E coli
competente
52
6. Mini Prep
7. Seqüênciamento
cDNA
ACGTACGTACGTAC
TGCATGCATGCATG Primer
3’ 5’
3’
Plasmídio
53
Qualidade das seqüências
phred phrap consed
http://www.isrec.isb-sib.ch/DEA/module8/phredPhrap_slides/sld003.htm
54
Bioinformática
TATTATCGTATCCTGGTCATACCATTGA
TCGTATCCTGGTCATACCATTGACTGGCTATAACTGCCTAGCT
ATACCATTGACTGGCTATAACTGCCTAGCTCTTCGTAATCTAGTATTATATCG
TGCCTAGCTCTTCGTAATCTAGTATTATATCGCATATCGTCGATGT
GACTGGCTATAACTGCCTAGCTCTTCGTAATCTAGTATTATATCGCATATCGTCGAT
TATTATCGTATCCTGGTCATACCATTGACTGGCTATAACTGCCTAGCTCTTCGTAATCTAGTATTATATCGCATATCGTCGATGT
consenso
Códon de iniciação ATG, TTG e GTG
Stop Códon: TGA, TAG e TAA
Porcentagem de GC do genoma
Glimmer - RBSfinder
Phred/Phrap and Consed
ORFs
55
Suposta Função da
Proteína
Obtenção da
Seqüência de
Nucleotídeos
Obtenção da
Seqüência de
Aminoácido
Programas especiais que identificam seqüências de leitura aberta
(ORF) - Glimmer RBSfinder
atggaaactcgttactggtacgcctgcggtaccggtccggaattcccgggtcgacccacg
M E T R Y W Y A C G T G P E F P G R P T
cgtccggcgagttcttggttgacctcttcctcttcgaccacctcccaggctcttggtgta
R P A S S W L T S S S S T T S Q A L G V
gcttgccactctcaccaatcaagttttcatctctcatctcgacgttcagatcccaactgc
A C H S H Q S S F H L S S R R S D P N C
ctttcatccctttgctcaccccactcgtgcccactctggtgcggcagcaggatcaaagga
L S S L C S P H S C P L W C G S R I K G
ctacgt
L R
ATGGAAACTCGTTACTGGTACGCCTGCGGTACCGGTCCGGAATTCCCGG
TCGACCCACGCGTCCGGCGAGTTCTTGGTTGACCTCTTCCTCTTCGACC
ACCTCCCAGGCTCTTGGTGTAGCTTGCCACTCTCACCAATCAAGTTTTC
ATCTCTCATCTCGACGTTCAGATCCCAACTGCCTTTCATCCCTTTGCTC
ACCCCACTCGTGCCCACTCTGGTGCGGCAGCAGGATCAAAGGACTACGT
Comparação em bancos de dados disponíveis - BLAST
56
BLAST
(Basic Local Alignment Search Tool)
http://www.ncbi.nlm.nih.gov
• conjunto de programas que buscam por similaridade
entre seq no banco de dados.
• elaborados para explorar todas as seq possíveis no
banco de dados (ptn ou DNA)
• probabilidades definidas para uma interpretação
estatística da identidade
(Altschul et al., 1990)
Impacto dos Projetos Genoma
• Treinamento de cientistas e estudantes
em biologia molecular e genomica
• Avanços no conhecimento
• Aumento na qualidade científica
• Desenvolvimento de novas tecnologias
• Criação de novos negócios
A Era Pós-genômica
• Com o sequenciamento completo, precisa-se processar e relacionar os dados brutos e transformá-los em conhecimento
• Modelagem molecular:
– Computação gráfica
– Inteligência artificial
• Análise de Microarrays:
– Processamento de imagens
– Inteligência artificial
– Banco de dados
59
2002: Pat Brown
DNA chips: microarrays
60