Filogenia molecular, evolução e sistemática de Rhipsalis (Cactaceae)
Nada em Biologia faz sentido senão à luz da evolução. · Cactaceae Transferência ... História...
Transcript of Nada em Biologia faz sentido senão à luz da evolução. · Cactaceae Transferência ... História...
7/9/2013
1
Marcos T. Geraldo
ADAPTABILIDADE
Nada em Biologia faz sentido senão à luz da evolução.
Theodosius Dobzhansky (1973)
7/9/2013
2
Reconstrução das relações evolutivas
entre genes e espécies
Investigação das forças e mecanismos do
processo evolutivo
Processo de evolução
em moléculas de DNA,
RNA e proteínas
7/9/2013
3
Homologia
Similaridade por origem comum
CONCEITO QUALITATIVO (NÃO QUANTITATIVO)
70% de homologia X 70% de similaridade
7/9/2013
4
Mas....
Estruturas podem aparecer de forma independente
(convergência evolutiva)
Pode haver transferência genética horizontal
- de função (várias evidências)
- de sequência (ainda polêmico)
7/9/2013
5
Homologia x Analogia
Resultado de evolução convergente
Aves
Mamíferos
Endotermia
7/9/2013
6
Euphorbia ingens
Euphorbiaceae - caule suculento
- folhas modificadas em espinhos
Pachycereus pringlei
Cactaceae
Transferência genética horizontal
• originária de processos antigos de recombinação
ex: cloroplastos, mitocôndrias
• originária de processos mais recentes ex: infecção por retrovírus
7/9/2013
7
História evolutiva de um grupo de genes ou organismos
Principal objetivo
Descrever as relações evolutivas em termos de uma relação de ancestralidade comum
7/9/2013
8
http://www.pitt.edu/~mtraksel/index.html
http://tolweb.org/tree/
7/9/2013
9
http://itol.embl.de/
7/9/2013
10
O que gera a grande diversidade de
genes e espécies?
Um dos principais agentes é o evento de duplicação gênica
(backup)
Pressão seletiva diminui
Permite que uma (ou ambas) as cópias
sofram alterações sem redução do fitness
Duplicação Gênica
A grande diversidade morfológica e de espécies em eucariotos
Duplicação de genes, cromossomos ou genomas
Susumo Ohno (1970): livro Evolution by gene duplication
Principal fonte para surgimento de novos genes
7/9/2013
11
Crossing-over desigual
A partir de 3 processos principais:
Retrotransposição
Não-disjunção durante a meiose
Duplicação Gênica
Perda da cópia duplicada
Neofuncionalização
Destino das cópias duplicadas
7/9/2013
12
Subfuncionalização
Duplicação-Degeneração-Complementação (DDC)
Destino das cópias duplicadas
7/9/2013
13
7/9/2013
14
Importância evolutiva da duplicação em larga-escala:
significativo do material genético
chance de que novos genes surjam e adquiram novas funções
cordados vertebrados
gnatostomados teleósteos
surgimento
Duplicação Gênica
EVOLUÇÃO DE FAMÍLIAS DE GENES E
PROTEÍNAS
especiação cópias ortólogas
duplicação gênica
acúmulo independente
de alterações
cópias parálogas
acúmulo independente
de alterações
7/9/2013
15
Cópias
ortólogas
Cópias
parálogas
7/9/2013
16
Dados de sequências
Alinhamento das sequências
Método de análise filogenética
Cálculo da melhor árvore
Teste de confiabilidade
Bancos de dados
7/9/2013
17
DNA
Proteína
Apresenta algumas dificuldades:
Mais fácil e simples de visualizar
• Saturação da terceira base
• Fornece evidência de seleção ou neutralismo
Mais informativo em termos evolutivos:
• Localização de introns e exons
Mais informativo em termos de função:
• Cada aminoácido apresenta propriedades como
carga, tamanho...
Basic Local Alignment Search Tool
O que é? = é um algoritmo para acessar um
banco de dados e buscar sequências de
aminoácidos ou nucleotídeos que sejam
similares a uma sequência-alvo específica
Qual o objetivo do BLAST? = comparar
informações de sequências biológicas
primárias
www.ncbi.nlm.nih.gov/BLAST/
7/9/2013
18
Tipos de BLAST Query
(sequência-alvo)
Hits
(sequências
retornadas)
blastn Nucleotídeos Nucleotídeos
blastp Aminoácidos Aminoácidos
blastx Nucleotídeos
(6 matrizes de leitura) Aminoácidos
tblastn Aminoácidos Nucleotídeos
(6 matrizes de leitura)
tblastx Nucleotídeos
(6 matrizes de leitura) Nucleotídeos
(6 matrizes de leitura)
chance da similaridade
ser ao acaso
Valor de E
A similaridade entre as sequências se deve a processos biológicos -
evolutivos
7/9/2013
19
O que é? = um alinhamento de
sequências é uma forma de organizar
sequências primárias de DNA, RNA ou
proteínas
Por que alinhar? = identificar regiões
similares que possam ser consequência de
relações evolutivas/funcionais entre elas
Valor
Qualitativo Valor
Quantitativo
Homólogo Não-homólogo
Inferência
7/9/2013
20
2 sequências de um alinhamento
Compartilham ancestral comum
Discordâncias entre as sequências (mismatches)
Mutações pontuais
Espaços (gaps)
Inserções ou deleções (indels)
SE,
Métodos de alinhamento
• Clustal • Muscle • Probcons • MAFFT • T-Coffee • Etc…
7/9/2013
21
Formatos de arquivos...
...de sequências ...de árvores filogenéticas
FASTA (*.fasta)
PHYLIP (*.phy)
NEXUS (*.nex ou *.nxs)
CLUSTAL (*.aln)
NEXUS (*.nex ou *.nxs)
NEWICK (*.nwk)
7/9/2013
22
AAGCTTCATA
GAGCTTCACA
GTGCTTCACG
GTGCCTCACG
Out
A
B
C
Sítios invariáveis
Não informativos
Outgroup
Espécie A
Espécie B
Espécie C
AG
Out
A
B
C
TC
AAGCTTCATA
GAGCTTCACA
GTGCTTCACG GTGCCTCACG
Outgroup
Espécie A
Espécie B
Espécie C
7/9/2013
23
Out
A
B
C AT AG
AG TC
AAGCTTCATA
GAGCTTCACA
GTGCTTCACG
GTGCCTCACG
Outgroup
Espécie A
Espécie B
Espécie C
Out
A
B
C TC
AG TC
AT AG
AAGCTTCATA
GAGCTTCACA
GTGCTTCACG GTGCCTCACG
Outgroup
Espécie A
Espécie B
Espécie C
7/9/2013
24
Isto é ruim?
NÃO!
Genes/proteínas conservadas são utilizadas
para resolver relações filogenéticas antigas
Genes/proteínas com média ou alta variação
são utilizadas para resolver relações
filogenéticas recentes
Métodos de inferência filogenética
7/9/2013
25
Máxima Verossimilhança
• Uso de um modelo de evolução específico
• Cálculo da árvore que se encaixa no conjunto de dados
• Análise mais explícita das suposições feitas sobre a evolução das sequências
• Mais exigente computacionalmente
Métodos de inferência filogenética
Inferência Bayesiana
• Outro método de verossimilhança
• Uso de pressupostos (priors)
• Algoritmo MCMC (Markov Chain Monte Carlo) cálculos da distribuição de verossimilhança e da probabilidade posterior
• Alto tempo computacional
geração de um conjunto extenso de árvores
Métodos de inferência filogenética
7/9/2013
26
Exemplos:
7/9/2013
27
Máxima Verossimilhança e
Inferência Bayesiana
Necessitam de um modelo de
evolução/substituição
ModelTest ProtTest
modelos para nucleotídeos
modelos para aminoácidos
https://code.google.com/p/jmodeltest2/
7/9/2013
28
https://code.google.com/p/prottest3/
Testes de confiabilidade
Bootstrap
aLRT (aproximate likelihood ratio test)
Probabilidade posterior
tempo precisão
tempo precisão
INFERÊNCIA BAYESIANA
MÁXIMA VEROSSIMILHANÇA
7/9/2013
29
7/9/2013
30
Beauti & Beast
Inferência Bayesiana Gera arquivo (*.xml)
7/9/2013
31
7/9/2013
32
7/9/2013
33
http://www.phylo.org/portal2/login!input.action
7/9/2013
34
7/9/2013
35
Figtree http://tree.bio.ed.ac.uk/software/figtree/
http://mesquiteproject.org
7/9/2013
36
Variabilidade
pode ser
desvantajosa: pode ser eliminada (seleção negativa ou purificadora)
neutra: pode ou não se fixar
(deriva genética)
vantajosa: tem grande chance
de se fixar (seleção positiva)
Cálculo de
dN = número de mutações não-sinônimas
dS = número de mutações sinônimas
>1
=1
<1 Seleção negativa ou purificadora
Seleção neutra
Seleção positiva
dN dS
7/9/2013
37
Por exemplo:
dN/dS = 1,1 Seleção positiva???
Seleção neutra???
É preciso de algum teste estatístico
http://www.datamonkey.org/
7/9/2013
38
Como uma análise global pode ajudar?
Entender a evolução de uma família de genes e proteínas
Reunir um conjunto maior de dados para que as
inferências filogenéticas sejam mais robustas
Fazer uso de informações genômicas para suportar
inferências filogenéticas
7/9/2013
39
Banco de dados de família de proteínas
http://pfam.sanger.ac.uk/
7/9/2013
41
http://weizhong-lab.ucsd.edu/cd-hit/
7/9/2013
42
ANÁLISE DE SINTENIA
Análise de genes vizinhos a um gene em estudo
Blocos sintênicos se mantêm relativamente preservados
Gene X ? ? ? ? ? ?
7/9/2013
45
7/9/2013
46
7/9/2013
47
http://www.genomicus.biologie.ens.fr/genomicus-72.01/cgi-bin/search.pl
7/9/2013
48
7/9/2013
49
Estudo de caso:
7/9/2013
50
7/9/2013
51