Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las...

22
Alineamiento múltiple de secuencias Filogenias http://bioinfo2.ugr.es/ José L Oliver

Transcript of Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las...

Page 1: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

Alineamiento múltiple de secuencias

Filogenias

http://bioinfo2.ugr.es/ José L Oliver

Page 2: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

>Man

MENFPIVDMG KLNTEERKAT LDKMKDACEN WGFFELVNHG ISIELMDTVE KLTKEHYKKC MEQRFKEMVE SKGLEYVQSE

INDLDWESTF FLRHLPVSNI SEIPDLDQDY RKVMKEFAVK LEKLAEELLD YLCENLGLEK GYLKKVFYGS KGPNFGTKVS

NYPPCPKPEL IKGLRAHTDA GGNLLLFQDD KVSGLRLLKD DKWIDVPPMR HSIVINLGDQ LEVITSGKYK SVMHRVIAQT

DGARMSLASF YNPGDDALIS PAPTLVKENE TSEIYPKFVF DDYMKLYVGL KFQAKEPRFE AMKALSSVDV GPVVTA

>Rhesus

MEMDFPVINM NNLNGESRVS VLNQINDACE NWGFFELVNH GISHELMDKV EKLTKEHYRK CMEQRFKEMV ASKGLDSVET

EINDTDWEST FFLRHLPVSN MSEIGDLDEE YKKVMKEFAD ELEKLAEEVL DLLCENLGLE KGYLKKVFYG SKGPNFGTKV

SNYPPCPKPE LIKGLRAHTD AGGLILLFQD DKVSGLHVLK DGKWVDVPPM HHSIVINLGD QLEVITNGKY KSVMHRVIAQ

EDGNRMSIAS FYNPGNDAVI YPAPALVEGE QEKTKLYPKF VFDDYMKLYV GLKFQAKEPR FEAMKAMEST NLNMGPIATV

>Chimp

MENFPIVDMG KLNTEDRKST MELIKDACEN WGFFECVNHG ISIEMMDTVE KLTKEHYKKC MEQRFKEMVA TKGLECVQSE

IDDLDWESTF FLRHLPVSSI SEIPDLDDDY RKVMKEFALK LEELAEELLD LLCENLGLEK GYLKKAFYGS KGPNFGTKVS

NYPPCPKPEL IKGLRAHTDA GGIILLFQDD KVSGLQLLKD DQWIDVPPMR HSIVINLGDQ LEVITNGKYK SVMHRVIAQT

DGARMSIASF YNPGDDAVIS PASTLLKENE TSEVYPKFVF DDYMKLYMGL KFQAKEPRFE AMMKAMSSVK VGPVVSI

>Gorilla

MANFPVVDMG KLNTEERGTA MEMIKDACEN WGFFELVNHG ISIELMDTVE KLTKEHYKKT MEQRFKEMVA NKGLESVQSE

INDLDWESTF FLRHLPVSNV SENTDLDQDY RKIMKQFAEE LEKLAEHLLD LLCENLGLEK GYLKKVFYGS KGPNFGTKVS

NYPPCPTPDL IKGLRAHTDA GGIILLFQDD KVSGLQLLKD DQWIDVPPMR HSIVINLGDQ LEVITNGKYK SVMHRVIAQT

DGTRMSLASF YNPGDDAVIS PAPALVKESD ETSQVYPKFV FNDYMKLYAG LKFQAKEPRF EAMKAVSSVD VGAIATV

>Orangutan

MENFPIINLE NLNGDERAKT MEMIKDACEN WGFFELVNHG IPHEVMDTVE KLTKGHYKKC MEQRFKELVA SKGLEAVQAE

VTDLDWESTF FLRHLPTSNI SQVPDLDEEY REVMRDFAKR LEKLAEELLD LLCENLGLEK GYLKNAFYGS KGPNFGTKVS

NYPPCPKPDL IKGLRAHTDA GGIILLFQDD KVSGLQLLKD EQWIDVPPMR HSIVVNLGDQ LEVITNGKYK SVMHRVIAQT

DGTRMSLASF YNPGNDAVIY PAPSLIEESK QVYPKFVFDD YMKLYAGLKF QPKEPRFEAM KAMEANVELV DQIASA

Alineamiento múltiple

http://bioinfo2.ugr.es/ José L Oliver

Page 3: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

CLUSTAL W 1. Se alinean las secuencias

separadamente de dos en dos, obteniéndose una matriz de distancias por pares

2. Se deriva un árbol guía a partir de la matriz de distancias

3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía

4. Los gaps introducidos en las primeras etapas se respetan en etapas posteriores

Page 4: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

CLUSTAL W (1.82) multiple sequence alignment

Man MEN-FPIVDMGKLNTEERKATLDKMKDACENWGFFELVNHGISIELMDTVEKLTKEHYKK 59

Chimp MEN-FPIVDMGKLNTEDRKSTMELIKDACENWGFFECVNHGISIEMMDTVEKLTKEHYKK 59

Gorilla MAN-FPVVDMGKLNTEERGTAMEMIKDACENWGFFELVNHGISIELMDTVEKLTKEHYKK 59

Orangutan MEN-FPIINLENLNGDERAKTMEMIKDACENWGFFELVNHGIPHEVMDTVEKLTKGHYKK 59

Rhesus MEMDFPVINMNNLNGESRVSVLNQINDACENWGFFELVNHGISHELMDKVEKLTKEHYRK 60

* **:::: :** :.* .:: ::********** *****. *:**.****** **:*

Man CMEQRFKEMVESKGLEYVQSEINDLDWESTFFLRHLPVSNISEIPDLDQDYRKVMKEFAV 119

Chimp CMEQRFKEMVATKGLECVQSEIDDLDWESTFFLRHLPVSSISEIPDLDDDYRKVMKEFAL 119

Gorilla TMEQRFKEMVANKGLESVQSEINDLDWESTFFLRHLPVSNVSENTDLDQDYRKIMKQFAE 119

Orangutan CMEQRFKELVASKGLEAVQAEVTDLDWESTFFLRHLPTSNISQVPDLDEEYREVMRDFAK 119

Rhesus CMEQRFKEMVASKGLDSVETEINDTDWESTFFLRHLPVSNMSEIGDLDEEYKKVMKEFAD 120

*******:* .***: *::*: * ************.*.:*: ***::*:::*::**

Man KLEKLAEELLDYLCENLGLEKGYLKKVFYGSKGPNFGTKVSNYPPCPKPELIKGLRAHTD 179

Chimp KLEELAEELLDLLCENLGLEKGYLKKAFYGSKGPNFGTKVSNYPPCPKPELIKGLRAHTD 179

Gorilla ELEKLAEHLLDLLCENLGLEKGYLKKVFYGSKGPNFGTKVSNYPPCPTPDLIKGLRAHTD 179

Orangutan RLEKLAEELLDLLCENLGLEKGYLKNAFYGSKGPNFGTKVSNYPPCPKPDLIKGLRAHTD 179

Rhesus ELEKLAEEVLDLLCENLGLEKGYLKKVFYGSKGPNFGTKVSNYPPCPKPELIKGLRAHTD 180

.**:***.:** *************:.********************.*:**********

Man AGGNLLLFQDDKVSGLRLLKDDKWIDVPPMRHSIVINLGDQLEVITSGKYKSVMHRVIAQ 239

Chimp AGGIILLFQDDKVSGLQLLKDDQWIDVPPMRHSIVINLGDQLEVITNGKYKSVMHRVIAQ 239

Gorilla AGGIILLFQDDKVSGLQLLKDDQWIDVPPMRHSIVINLGDQLEVITNGKYKSVMHRVIAQ 239

Orangutan AGGIILLFQDDKVSGLQLLKDEQWIDVPPMRHSIVVNLGDQLEVITNGKYKSVMHRVIAQ 239

Rhesus AGGLILLFQDDKVSGLHVLKDGKWVDVPPMHHSIVINLGDQLEVITNGKYKSVMHRVIAQ 240

*** :***********::*** :*:*****:****:**********.*************

Man TDGARMSLASFYNPGDDALISPAPTLVKE-NETSEIYPKFVFDDYMKLYVGLKFQAKEPR 298

Chimp TDGARMSIASFYNPGDDAVISPASTLLKE-NETSEVYPKFVFDDYMKLYMGLKFQAKEPR 298

Gorilla TDGTRMSLASFYNPGDDAVISPAPALVKESDETSQVYPKFVFNDYMKLYAGLKFQAKEPR 299

Orangutan TDGTRMSLASFYNPGNDAVIYPAPSLIEE---SKQVYPKFVFDDYMKLYAGLKFQPKEPR 296

Rhesus EDGNRMSIASFYNPGNDAVIYPAPALVEGEQEKTKLYPKFVFDDYMKLYVGLKFQAKEPR 300

** ***:*******:**:* **.:*:: ..::******:****** *****.****

Man FEA-MKALSS--VDVGPVVTA 316

Chimp FEAMMKAMSS--VKVGPVVSI 317

Gorilla FEA-MKAVSS--VDVGAIATV 317

Orangutan FEA-MKAMEANVELVDQIASA 316

Rhesus FEA-MKAMESTNLNMGPIATV 320

*** ***:.: :. :.:

http://bioinfo2.ugr.es/ José L Oliver

Secuencia consenso

Page 5: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 6: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 7: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

Rooted trees with a time axis. Tree (a) can be converted to tree (b) by swinging around the horizontal branches like mobiles. Hence (a) and (b) are equivalent to one another.

http://bioinfo2.ugr.es/ José L Oliver

Page 8: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

A rooted tree with branches scaled according to the amount of evolutionary change.

http://bioinfo2.ugr.es/ José L Oliver

Page 9: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

The unrooted tree in (a) can be converted to the rooted trees in (b) and (c) by placing the root in different positions.

http://bioinfo2.ugr.es/ José L Oliver

Page 10: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 11: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

• Los árboles filogenéticos deben contener solo bifurcaciones

• Las trifurcaciones o multifurcaciones se deben generalmente a falta de resolución del método

Deben resolverse con más datos

http://bioinfo2.ugr.es/ José L Oliver

Page 12: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 13: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 14: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 15: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 16: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

Selección de las secuencias de partida:

• Ortólogas: ancestro común

• Que estén presentes en todas las especies del grupo de interés

• Ritmo evolutivo adecuado: ni muy alto ni muy bajo

Part of the alignment of the mitochondrial small subunit rRNA gene from primates, tree shrews, and rodents.

Se descartan los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 17: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 18: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 19: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

Bootstrapping

http://bioinfo2.ugr.es/ José L Oliver

Page 20: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver

Page 21: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

Copyright ©2002 The American Society of Biochemistry and Molecular Biology

FIG. 3. Sample output from Project 4. A, a portion of the multiple sequence alignment used for the analysis of phenylalanine hydroxylase generated by the program ClustalW. Swiss-Prot accession numbers for the sequences used in this exercise were as follows: P00439, Homo sapiens PAH; P04176, Rattus norvegicus PAH; P16331, Mus musculus PAH; P30967, Chromobacterium violaceum PAH; P43334, Pseudomonas aeruginosa PAH; P17276, Drosophila melanogaster PAH; P90925, Caenorhabditis elegans PAH; and 1PAH, the sequence from the crystallographic-solved PAH fragment from Rattus Norvegicus (13). B, structure of PAH in which the 100% conserved residues, identified through the sequence alignment in A, are shown in space-filling mode, whereas the remainder of the protein is shown as a backbone trace. C, overall statistics of the ClustalW alignment.

http://bioinfo2.ugr.es/ José L Oliver

Page 22: Filogenias - UGR · 2. Se deriva un árbol guía a partir de la matriz de distancias 3. Las secuencias se van alineando progresivamente de acuerdo con el árbol guía 4. Los gaps

http://bioinfo2.ugr.es/ José L Oliver