Antônio Augusto Fonseca Júnior - perse.com.br€¦ · O formato digital é vendido na...

15
1 Guia Rápido de Bioinformática Antônio Augusto Fonseca Júnior

Transcript of Antônio Augusto Fonseca Júnior - perse.com.br€¦ · O formato digital é vendido na...

1

Guia Rápido de Bioinformática

Antônio Augusto Fonseca Júnior

2

Sobre o autor

Antônio Augusto Fonseca Júnior é farmacêutico formado pela Universidade Federal

de Minas Gerais, especialista em Bioética e Biotecnologia pela Universidade Federal de

Lavras, Mestre em Ciência Animal e Doutor em Ciência Animal pela Universidade Federal

de Minas Gerais. Já trabalhou como professor lecionando em disciplinas de

Microbiologia, Biologia Molecular, Bioinformática, Farmacologia e Genética. Atualmente

é responsável pelo Laboratório De Biologia Molecular do Laboratório Nacional

Agropecuário de Minas Gerais (Lanagro/MG) do Ministério da Agricultura, Pecuária e

Abastecimento.

3

Edições Edição 1

Implementação de dados básicos para projeto de primers, Blast e Filogenia

Edição 2

Dados se sequenciamento

Edição 3

Erros de sequenciamento

Edição 4

Melhoria dos protocolos para filogenia

Edição 5

Análise por Restrição enzimática

Edição 6

Noções de PCR e desenho de primers e sondas para PCR em tempo real

Edição 7

Análise de pressão seletiva e protocolo para Mr. Bayes

4

Formatos O Guia Rápido de Bioinformática existe em dois formatos:

O formato digital é vendido na Amazon.com.br. Caso encontre esse livro pirateado,

ajude o autor e adquira por um precinho camarada. Todas as atualizações do formato

digital são gratuitas. Para permitir uma atualização, simplesmente configure sua conta

na Amazon para permitir isso. Vá em Sua Conta → Gerencie seu dispositivo e conteúdo

→ Configurações → Atualização automática de ebooks.

O formato impresso pode ser encontrado em www.perse.com.br. Infelizmente ele é

atualizado com menor frequência e, por razões óbvias, as atualizações não são gratuitas.

Mantenho suas versões disponíveis apenas devido aos pedidos de vários professores de

bioinformática e algumas pessoas que preferem ter roteiros impressos.

5

Sumário Capítulo 1: A PCR ............................................................................................................ 7

Extração de Ácidos Nucleicos ...................................................................................... 8 Extração por Fenol/Clorofórmio/Álcool Isoamílico ................................................. 9

Extração por coluna de sílica .................................................................................. 13 A Teoria da PCR ......................................................................................................... 15

Eletroforese ............................................................................................................. 17 Capítulo 2: Sequenciamento de Sanger .......................................................................... 23

Introdução ................................................................................................................... 23 Resolução de Problemas ............................................................................................. 27

Análise do Scan ...................................................................................................... 27 Presença de Artefatos ............................................................................................. 28

Presença de picos sobrepostos ................................................................................ 30

Picos sobrepostos após homopolímeros ................................................................. 31 Sequência menor do que a esperada ....................................................................... 31

Sinal Fraco .............................................................................................................. 32 Falha no Sequenciamento ....................................................................................... 33

Capítulo 3: Análise de Eletroferogramas ........................................................................ 34

Introdução ................................................................................................................... 34 Roteiro ........................................................................................................................ 35

Capítulo 4: Bioedit .......................................................................................................... 39 Introdução ................................................................................................................... 39 Inserindo sequências ................................................................................................... 40

Criando os Arquivos em FASTA ........................................................................... 41

Atalhos de teclado interessantes ............................................................................. 41 Alinhamento no BioEdit ......................................................................................... 42 Outras opções .......................................................................................................... 45

Capítulo 5: Desenho de Primers ..................................................................................... 50

Introdução ................................................................................................................... 50

Parâmetros .................................................................................................................. 50 Alinhamento ........................................................................................................... 50 Desenho dos primers ............................................................................................... 51

Roteiro ........................................................................................................................ 52 Uso do Primer3 Plus ............................................................................................... 52 Verificando especificidade in silico ........................................................................ 54

Capítulo 6: Restrição Enzimática in silico ...................................................................... 57

Roteiro para restrição in silico .................................................................................... 59 Capítulo 7: GenBank ...................................................................................................... 61

Introdução ................................................................................................................... 61

Roteiro ........................................................................................................................ 62 Parte I - Nucleotídeos ............................................................................................. 62

6

Parte II - Número de Acesso ................................................................................... 64 Parte III - Genes ...................................................................................................... 68

Parte IV - Genomas ................................................................................................ 69 Capítulo 8: Blast ............................................................................................................. 71

Introdução ................................................................................................................... 71

Roteiro ............................................................................................................................ 78 Capítulo 9: Filogenia ...................................................................................................... 80

Introdução ................................................................................................................... 80 Escolha das Sequências .............................................................................................. 80

A Análise De Dados Da Filogenia .............................................................................. 82 Alinhamento ............................................................................................................... 82

Modelo de Substituição .............................................................................................. 83 Reconstrução da Árvore Filogenética ......................................................................... 86

Métodos de Distância ............................................................................................. 86

Métodos Cladísticos ................................................................................................ 88 Métodos Probabilísticos .......................................................................................... 89

Avaliação Estatística Da Árvore ................................................................................. 89 A Árvore ..................................................................................................................... 90

Enraizando Árvores ................................................................................................ 92

Utilizando o MEGA 6.06 ............................................................................................ 95 Criando os Arquivos em Fasta ................................................................................ 95

Recuperando Sequências ........................................................................................ 95 Encontrando o Melhor Modelo de Substituição ................................................... 100 Reconstrução da Árvore ....................................................................................... 101

Modificando a Árvore ........................................................................................... 103

Calculando Distâncias Genéticas .......................................................................... 105 Utilizando o Mr. Bayes ............................................................................................. 112

Roteiro .................................................................................................................. 112

Preparando uma corrida simples ........................................................................... 113 Capítulo 10: Pressão Seletiva ....................................................................................... 119

Utilizando o Selecton ................................................................................................ 120 Inserindo os Dados Iniciais ................................................................................... 120 Inserindo Opções Avançadas ................................................................................ 121

Resultados ............................................................................................................. 123

Referências ................................................................................................................... 126

7

Capítulo 1: A PCR

A versão original desse livro não tratava de uma das principais ferramentas do

laboratório de biologia molecular. O objetivo era voltar o livro principalmente para os

trabalhos de bioinformática, no entanto, o uso da PCR muito frequente para se gerar as

sequências de DNA e RNA que serão estudadas mais tarde. Esse capítulo pretende

resumir brevemente o que é a PCR e quais os passos necessários para executá-la.

Estudantes da área da biologia mais experientes no laboratório podem considerá-lo

desnecessário, mas aqueles que ainda estão no início da graduação ou vindos de outras

áreas sem currículo básico de biologia molecular podem necessitar da pequena revisão a

seguir.

PCR é uma sigla para Reação em Cadeia da Polimerase (Polymerase Chain Reaction).

A ideia é antiga, sendo original da década de 80 quando se percebeu que seria possível

gerar grandes quantidades de partes específicas do DNA a partir de uma enzima e de

reagentes que pudessem delimitar a região desejada. O objetivo dessa reação é,

portanto, gerar muitas cópias de uma molécula de uma maneira exponencial. Essas

cópias são de uma região específica e delimitada do DNA que será utilizado como molde.

A própria PCR é uma reação enzimática que ocorre dentro de um microtubo.

Geralmente o volume total não passa de 50 microlitros, sendo mais comum pode volta

de 20-25 microlitros. Além dos próprios eventos bioquímicos que ocorrem nesse tubo,

são necessárias ainda outras duas etapas. Antes de se adicionar todos os reagentes da

PCR no tubo, é necessário extrair o DNA da amostra a ser utilizada. Essa é uma etapa

essencial para o sucesso da reação. Finalizado esse processo, a amostra é adicionada ao

tubo. Feito isso, os resultados devem ser visualizados. A PCR convencional necessita de

ter os resultados da amplificação do DNA visualizados em um gel de agarose, enquanto

outros tipos como a PCR digital e a PCR em tempo real têm os resultados demonstrados

em computadores acoplados às máquinas.

8

Figura 1: Microtubos utilizados na PCR

Figura 2: Termocicladores. Esses são os equipamentos normalmente utilizados onde as

reações de PCR são colocadas para serem submetidas às variações de temperatura necessárias

para que a reação ocorra. Cada máquina pode realizar, em média, até 96 reações por vez, mas

existem outras com capacidades muito maiores como 384 reações.

Extração de Ácidos Nucleicos

A extração de ácidos nucleicos é a primeira etapa da PCR e deve ser praticamente

considerada como um conjunto com a reação tamanha a importância desse processo

para o sucesso do experimento. Diferentes amostras exigem diferentes extrações,

apesar de cada vez mais as empresas lançarem kits que funcionam em uma vasta gama

de tecidos ou células de microrganismos variados.

9

O tipo mais simples de extração é a fervura de colônias de bactérias para PCRs mais

simples que visam, por exemplo, apenas identificação genética da espécie pesquisada.

Uma simples colônia fervida a ponto de inativar a bactéria rende DNA suficiente para

muitas PCRs. Obviamente, o método varia conforme a espécie, mas existem processos

validados dessa extração seguida de PCR.

Outros exemplos de extração são descritos a seguir. Todas costumam passar por um

processo básico de preparação da amostra para quebra do tecido antes do início da

separação do DNA da porção proteica/lipídica. Existem métodos como a quebra física ao

se adicionar nitrogênio seguido de maceração ou a destruição completa do tecido em

equipamentos específicos para maceração. O método mais comum visto nos

laboratórios é o uso de Proteinase K. Essa enzima é uma protease de amplo espectro.

Devido à sua falta de especificidade ao clivar ligações peptídicas, pode ser utilizada em

diversos tecidos. A enzima tem preferência para digestão de proteínas a partir de

aminoácidos hidrofóbicos, sendo ativada pelo íon Ca2+. O pH ótimo é 8,0, porém ainda

age em uma faixa de 4,0 a 12,0. A utilização de um tampão adequado (30 mM EDTA, 30

mM Tris Cl; 800 mM cloreto de guanidina; 5% Tween 20; 0.5% Triton X-100) pode

aumentar em até 300% sua atividade.

Extração por Fenol/Clorofórmio/Álcool Isoamílico

A extração por Fenol/Clorofórmio/Álcool Isoamílico (F/C/A) já foi bastante comum

nos laboratórios, porém foi substituída por kits mais práticos. Suas vantagens são o

preço e a quantidade de ácidos nucleicos obtidos, porém o processo é trabalhoso, usa

reagentes tóxicos e está sujeito a contaminações por proteínas e sais.

A solução obtida após a digestão enzimática do tecido é adicionada a uma mistura

de fenol tamponado saturada (72% fenol, 28% água). A densidade dessa solução é um

pouco maior do que a da água, o que garante que, após a centrifugação, a fase lipídica e

10

proteica fique na parte inferior do tubo e a fase aquosa (contendo ácidos nucleicos) na

parte superior (Figura 3). Essas posições podem ser invertidas caso a solução aquosa

contenha quantidade muito grande de sais, o que alterará as densidades.

Figura 3: Solução da extração F/C/A após centrifugação. 1. Fase aquosa contendo ácidos

nucleicos. 2. Interfase contendo proteínas parcialmente desnaturadas, DNA (caso apenas RNA

esteja sendo extraído e o fenol esteja com pH mais ácido). 3. Fase orgânica com fenol, proteínas,

lipídeos.

O fenol misturado ao clorofórmio é melhor para a desnaturação de proteínas do que

qualquer um desses dois reagentes separados. O álcool isoamílico desfavorece a

formação de espuma. O uso de fenol puro também tem a desvantagem de reter parte

da solução aquosa (cerca de 15%). A presença do clorofórmio reduz esse efeito.

A separação das fases pela centrifugação ocorre devido à densidade diferente das

mesmas. A água tem densidade de 1.00 g/cm3, o fenol 1,07 g/cm3 e o clorofórmio 1,47

11

g/cm3. A presença do clorofórmio permite uma separação mais nítida das fases com

uma interfase.

O DNA tende a permanecer na fase aquosa por ser um polímero polar, pois a água é

mais polar do que a fase F/C/A. As proteínas possuem regiões hidrofóbicas e hidrofílicas.

As regiões hidrofóbicas interagirão com o fenol causando precipitação de formando uma

interfase esbranquiçada que nunca deve ser pipetada. Os lipídeos tenderão a

permanecer na fase F/C/A.

A permanência do DNA na fase aquosa depende do pH do fenol. Quando o pH está

entre 7,5-8,0, os fosfatos permanecerão com carga negativa. Caso o pH seja reduzido

(por volta de 4,0-5,0), as cargas negativas do DNA (principalmente fragmentos maiores)

serão diminuídas, causando sua precipitação para a interfase. Esse fenômeno pode ser

usado para a extração do RNA. Por ser mais ácido (e mais difícil de diminuir sua carga

negativa), o RNA ainda permanecerá na fase aquosa, livre de proteínas, DNA e outras

substâncias.

O DNA será posteriormente precipitado após lavagens com etanol para a remoção

de sais. A primeira lavagem ocorre com Etanol em alta concentração (95%) e na

presença de um sal. O etanol é muito menos polar do que a água. Adicioná-lo a solução

diminui a atração dos grupos fosfatos que permitem a solubilização do DNA. Assim o

DNA interagirá com o sal (como Na+, NH4+ ou Li+) também adicionado e tenderá a

precipitar. Em outra etapa, adiciona-se etanol 70% para precipitar o DNA ao mesmo

tempo em que se diminui a concentração de sais.

Cuidados na extração F/C/A

12

Cuidado se a solução fenólica estiver rosada, POIS é indicativo de

oxidação, o que pode quebrar o DNA e degradar o RNA. É preciso haver um

antioxidante para evitar que isso ocorra com frequência.

Sempre use luvas e jalecos.

O fenol é irritante para as mucosas e pode ser fatal se ingerido ou

inalado em grandes quantidades. Deve-se agir com a cautela adequada ao

utilizá-lo.

Dedique as pipetas exclusivamente para extração de DNA e RNA e não

as utilize no preparo do mix de PCR.

Protocolo simples de extração F/C/A

O protocolo a seguir é um método simples para se obter grandes quantidades de

DNA utilizando-se o método F/C/A. O padrão da metodologia é mais trabalhoso e

extenso, porém o descrito a seguir é bastante útil para obtenção rápida dos ácidos

nucleicos a partir de bactérias ou tecidos.

Reagentes

Tampão TE pH 8,0

Fenol tamponado

Solução F/C/A (50%/48%/2%) – utilizar fenol saturado pH 8,0.

Álcool etílico 95%

Álcool etílico 70%

Acetato de amônio 7,5 M

13

Protocolo

1. Adicionar ao tubo com solução de células lisadas volume igual de F/C/A.

2. Agite fortemente, preferencialmente utilizando um vórtex.

3. Centrifugar a temperatura por 5 min a 700 g.

4. Coletar a fase sobrenadante e transferir para outro tubo.

5. Adicionar o dobro de volume de álcool etílico 100% e metade do volume

de acetato de amônio 7,5 M.

6. Centrifugar a 90% da velocidade máxima da centrífuga.

7. Remover o sobrenadante gentilmente.

8. Adicionar 700 µL de álcool etílico 70%.

9. Centrifugar a 90% da velocidade máxima da centrífuga.

10. Remover o sobrenadante gentilmente.

11. Secar por dez minutos.

12. Ressuspender o pellet com TE pH 8,0.

Extração por coluna de sílica

As extrações por kits a base de centrifugações em colunas de sílica são comuns hoje

em dia. O método se baseia na ligação do ácido nucleicos à fase sólida de sílica seguida

de lavagens para limpeza de íons.

14

O processo é simples e rápido, ocorrendo em menos de quinze minutos

(dependendo da agilidade do operador e do número de amostras). Após a lise das

células, como explicado anteriormente, o material é adicionado a uma solução tampão

de ligação juntamente com etanol.

A mistura das células lisadas, etanol e solução de ligação será adicionada a um tubo

contendo uma fase sólida de sílica. O DNA é absorvido pela sílica quando está em

soluções com alta concentração de íons e pH ≤7. O sódio agirá como uma ponte que

atrai a carga negativa do fosfato do DNA, além de quebrar as ligações de hidrogênio na

água (Figura 4). O tubo será centrifugado e o material coletado será descartado.

A coluna de sílica conterá o DNA e será colocada em outro tubo (há a possibilidade

de se aproveitar o tubo anterior). Agora serão realizados dois processos de lavagem com

tampões específicos para retirar o excesso de sais (um inibidor de PCR). Ao final, convém

fazer centrifugar mais uma vez sem adição de tampão para terminar essa remoção. O

passo seguinte é adicionar a solução de eluição que aumentará o pH na sílica,

desprendendo o DNA para que seja coletado em um tubo próprio.

Figura 4: Coluna de sílica com representação da ponte de ligação dos íons de sódio entre a

sílica e o DNA. A sílica normalmente está ligada à água por pontes de hidrogênio, no entanto, em

altas concentrações iônicas, essa ligação é desestabilizada.

15

A Teoria da PCR

A técnica de PCR foi um dos grandes inventos da Biologia Molecular, transformando

os processos laboratoriais como poucas vezes ocorreu na história da ciência. É hoje uma

das mais utilizadas nas mais variadas áreas, desde a pesquisa a métodos de diagnóstico.

O fundamento da técnica é a amplificação específica e exponencial de regiões do

genoma ou de moléculas de RNA utilizando pares de iniciadores (primers) para delimitar

os pontos de interesse.

Os reagentes básicos de uma PCR são: DNA polimerase, dNTP (os quatro

nucleotídeos; adenina, citosina, timina, guanina), cloreto de magnésio (MgCl2),

iniciadores (oligonucleotídeos iniciadores ou primers), tampão, água e o DNA molde

obtido em processo de extração. Todos esses reagentes devem ser misturados em um

tubo para que a reação ocorra.

A DNA polimerase é a enzima responsável por catalisar a reação, adicionando

nucleotídeos à fita nascente de DNA. A mais conhecida e utilizada delas é a Taq

polimerase, derivada da bactéria Thermus aquaticus. Essa enzima é utilizada por ser

termoestável, isto é, resiste às altas temperaturas em que a PCR ocorre. Sem esta

estabilidade, seria necessário trocá-la a cada passo. É importante lembrar que a enzima

estabilidade da enzima ocorre por determinado tempo, ocorrendo desgaste durante o

processo.

Os dNTPs são os quatro nucleotídeos (adenina - dATP, citosina - dCTP, guanina -

dGTP e timina, dTTP) que serão utilizados no processo de formação da nova fita de

DNA. Deve haver cada um deles em solução e é importante que estejam sempre com os

fosfatos que serão utilizados como energia a ligação de um nucleotídeo a outro pela

DNA polimerase. O termo dNTP significa desoxinucleotídeo trifosfato. Dois desses três

fosfatos serão perdidos no processo de ligação de um nucleotídeo a outro realizado pela

DNA polimerase no momento de extensão da fita de DNA em formação.