Introdução à Bioinformática Professores: Luciano Maia Antonio Costa de Oliveira Universidade...

Post on 07-Apr-2016

225 views 2 download

Transcript of Introdução à Bioinformática Professores: Luciano Maia Antonio Costa de Oliveira Universidade...

Introdução à Bioinformática

Professores:Luciano MaiaAntonio Costa de Oliveira

Universidade Federal de PelotasFaculdade de Agronomia Eliseu Maciel

Programa de Pós-Graduação em AgronomiaCENTRO DE GENOMICA E FITOMELHORAMENTO

ALINHAMENTO GLOBAL

Luciano Maia

GENOMA

GENE

RNA

PROTEÍNA

PARA TODAS ESTAS ESTRATÉGIAS SÓ EXISTE UM CAMINHO…

...O ALINHAMENTO E ENTRE SEQÜÊNCIAS ENTRE DNA, RNA e PROTEÍNAS

Comparação entre seqüências...

?

A função de distância d(x,y) pode ser entendida como o menor número de operações (inserção, remoção e/ou substituição) que sejam capazes de transformar a seqüência x na seqüência y.

(Levenshtein, 1966)

Comparação de Seqüências

Alinhamento de seqüências...

• distância de edição de Levenshtein– considera três operações de edição: InserçãoDeleção Substituição

• distância de edição de Damerau– considera quatro operações de edição: InserçãoDeleçãoSubstituição Transposição entre adjacentes

Duas das mais típicas distâncias de edição utilizadas

Alinhamento de seqüências...

Alinhamento de seqüências...

Não é tão simples...

ALGORITIMO INGÊNUO - Formula de Stirling20 AA

1.099.511.627.776 NUMERO DE OPERAÇOES A FAZER2.000.000.000 OPERACOES/SEGUNDO PARA COMPUTADOR EXEMPLO

550 TOTAL SEGUNDOS9,16 MINUTOS DE PROCESSAMENTO

l

21 AA

4.398.046.511.104 NUMERO DE OPERAÇOES A FAZER2.000.000.000 OPERACOES/SEGUNDO PARA COMPUTADOR EXEMPLO

2.199 TOTAL SEGUNDOS37 MINUTOS DE PROCESSAMENTO

0,03 DIAS

300 AA

4,15E+180 NUMERO DE OPERAÇOES A FAZER2.000.000.000 OPERACOES/SEGUNDO PARA COMPUTADOR EXEMPLO

2,07E+171 TOTAL SEGUNDOS3,46E+169 MINUTOS DE PROCESSAMENTO2,40E+166 DIAS6,58E+163 ANOS

Joel Pothier - Université Paris

Qual o caminho mais fácil??

Alinhamento de seqüências...

The Traveling Salesman Problem O caixeiro viajante

Alinhamento de seqüências...

Melhor solução computacional = Programação dinâmica

Técnica de programação aplicável quando um grande número de passos pode ser estruturado numa sucessão de cada um destes passos.

Um passo contém uma ou um número de soluções parciais.

Cada passo pode ser calculado por recorrência a um número fixo de soluções parciais de passos anteriores.

Programação dinâmica

A programação dinâmica é aplicável sempre que um grande espaço de procura pode ser estruturado numa successão de passos, de tal forma que:

• o passo inicial contém as soluções triviais dos sub-problemas;

• cada solução parcial num passo posterior pode ser calculada por recorrência a um número fixo de soluções parciais de passos anteriores;

• o passo final contém a solução global.

Programação dinâmica e recursividade

Algoritmo mais apropriado é:

DE MANEIRA SIMPLÓRIA: isso quer dizer….Dá o primeiro passo e ver o resultado dele…utiliza o resultado do primeiro passopara direcionar o segundo passo…utiliza o resultado do segundo passo para direcionaro terceiro passo…etc…

DINAMICA = FAZER UMA COISA DE CADA VEZ, MAs…FAZER TODAS

RECURSIVIDADE = OLHAR UM PASSO ANTEIOR COMO ORIENTAÇÃO PARA O PRÓXIMO

Algoritmos em bioinformática

Algoritmos exatospara um determinado esquema de “score”determinam o alinhamento correspondente ao “score optimo”

alinhamento global

Algoritmos heurísticosmétodos aproximados, não existe garantia de obter alinhamentocorrespondente ao “score optimo”

blast (não o alinhamento local, mas sim o programa BLAST!!!)

Algoritmos em bioinformática

E O QUE ISSO TEM A VER COM MINHAS SEQUENCIAS DE DNA???R: Diferentes problemas…diferentes soluções!

Procura Exaustiva (Exhaustive Search)Analisa todas as soluções; Algoritmos muito lentos,com aplicação a problemas de pequena dimensãoEx. Aplicação: DNA restriction mappingPesquisa de motivos

Algoritmos gananciosos (Greedy algorthms)Em cada interação, escolhe uma solução de acordo comum determinado critério, a solução “mais atractiva” nessa iteração. Não existegarantia de obter uma “boa” solução final!Ex. Aplicação: Rearranjamento de cromossomos

Programação Dinâmica (Dynamic Programming)Alinhamento GlobalAlinhamento Local

Divisão e Conquista (Divide-and-Conqer)Particiona o problema em subproblemas de menordimensão que consegue resolver. Combina as soluções dos subproblemaspara obter a solução do problema inicialEx: programa Blast (alinhamento local)

Algoritmos Aleatórios (Randomized Algrithms)Realizam escolhas aleatoriamente.Ex: Pesquisa de motivos (Gibbs Sampling)

Algoritmos em bioinformática

Alinhamento de seqüências...

QUERIDA ROSA VERMELHA

ESTAS DUAS FRASES SÃO PARECIDAS? ?

QUERO UM AMOROSO VERME

QUANTO ENTRE ELAS É PARECIDO?

1-QUERIDAROSAVERMELHA2-QUEROUMAMOROSOVERME

MUITO CUIDADO NOS ALINHAMENTOS

Comparação entre seqüências...

Alinhamento Global

Alinhamento de seqüências...

Alinhamento Local

VISÃO GERAL DIFERENÇAS ENTRE AS DUAS ABORDAGENS

COMPONENTES DE UM ALINHAMENTO

Alinhamento de seqüências...

A-----TCCGGAATGCG

ACGCGCTGGGGAAT-CG

>Seq1 ATCCGGAATGCG>Seq2 ACGCGCTGGGGAATCG

MATCH

GAP EXTENSION

GAP OPEN

GAP OPEN

MISMATCH

Identidade(Match): duas letras idênticas numa mesma posição no alinhamento

Substituição(Mismatch): duas letras diferentes numa mesma posição no alinhamento

InDel

Gap(buraco):GAP OPEN espaços únicos

ou consecutivos em entre duas seqüência (gap extension)

COMPONENTES DE UM ALINHAMENTO

Alinhamento de seqüências...

Por quê InDel????

Inserção ou deleção??

COMPONENTES DE UM ALINHAMENTO

Alinhamento de seqüências...

COMPONENTES DE UM ALINHAMENTO

Alinhamento de seqüências...

PAI

FILHO

ATCGGGTTAACCCMÃE ATCGGGTTAACCC

ATCG-GTTAACCC

NESTE CASO PODEMOS SABER QUE OS GENITORES CONTINHAM O NUCLEOTIDEO e NO FILHO ESTE NUCLEOTIDEO FOI PERDIDO.

(DELEÇÃO)

AVÓS ATCGGGTTAACCC

COMPONENTES DE UM ALINHAMENTO

Alinhamento de seqüências...

NESTE CASO PODEMOS SABER QUE OS GENITORES NÃO CONTINHAM O NUCLEOTIDEO e NO FILHO ESTE NUCLEOTIDEO FOI ADICIONADO.

(INSERÇÃO)

PAI

FILHO

ATCGTTAACCCMÃE ATCGTTAACCC

ATCGGGTTAACCC

AVÓS ATCGTTAACCC

Por quê InDel????

COMPONENTES DE UM ALINHAMENTO

Alinhamento de seqüências...

JOÃZINHO - Brasil

MARY - Inglaterra

ATCG TTAACCCATCGGGTTAACCC

NÃO TEMOS COMO SABER, QUEM GANHOU ou QUEM PERDEU!!!!

INDEL

COMPONENTES DE UM ALINHAMENTO

Alinhamento de seqüências...

ATCG TTAACCCATCGGGTTAACCC

NÃO TEMOS COMO SABER, QUEM GANHOU ou QUEM PERDEU!!!!

INDEL

COMPONENTES DE UM ALINHAMENTO

Alinhamento de seqüências...

ATCGGGTTAACCCATCGTTAACCC

AQUI PODEMOS VER QUE O HOMEM GANHOU 2 NUCLEOTIDEOS(INSERÇÃO)

ATCGTTAACCC

Alinhamento de seqüências...

ATCGGGTTAACCCATCGTGAACCC

SE NÃO CONHECEMOS O MODELO DE EVOLUÇÃONÃO PODEMOS DIZER SE É DELEÇÃO ou INSERÇÃO

ATCGTTAACCC

Por quê InDel????

VISÃO GERAL

Assim existem 4 possibilidades:

Inserção de uma base é contabilizada negativamente

Remoção de uma base é contabilizada negativamente

Substituição de uma base por outra contabilizada negativamente

Coincidência de bases é contabilizada positivamente

Alinhamento de seqüências...

ALINHAMENTO GLOBAL

Alinhamento Global

COMO É CONSTRUIDO UMAlinhamento Global ?

>> ALGOTIRIMO DE NEEDLEMAN e WUNSCH

Alinhamento Global: Algoritmo Needleman-Wunsh (1969)

Idéia: Construir um alinhamento, utilizando a cada passo as soluções obtidas anteriormente para o trecho da subseqüência já alinhada

• Constrói uma matriz M com índices i e j, um para cada seqüência

• O valor M(i,j) representa a melhor solução obtida pela funçãode mérito para o alinhamento de x1...i com y1...j

Alinhamento Global

Considere duas sequencias a serem alinhadas:

1)Dadas as sequencias:A = GGATCGAB = GAATTCAGTTA

j = tamanho de A ► 7i = tamanho de B ► 11

2)Criar matriz M com coordenadas X[j+1] e Y[i+1];

x

y

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

X

123456789

1011

Y

2)Criar matriz M com coordenadas X[j+1] e Y[i+1]

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X

1 G2 A3 A4 T5 T6 C7 A8 G9 T

10 T11 A

Y

A = GGATCGAB = GAATTCAGTTA

3) Preencher as posições da matriz (M) com as sequencias

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 02 A 03 A 04 T 05 T 06 C 07 A 08 G 09 T 0

10 T 011 A 0

Y

A = GGATCGAB = GAATTCAGTTA

4) Preencher as posições X-1 ate Xj e Y-1 ate Yj com valor nulo (0)

Alinhamento Global – Algoritmo de Needleman-Wunsch

Alinhamento Global – Algoritmo de Needleman-Wunsch

match +1 mismatch -1

Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL

5a) Preencher posiçoes da matriz

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 02 A 03 A 04 T 05 T 06 C 07 A 08 G 09 T 0

10 T 011 A 0

Y

1

G0 0

1 G 0

0 + 1 = 1

0 + 1 = 1

0 + 1 = 1

TESTAR SE1x = 1y 1x (G)= 1y (G)?

SIM Some 1 aos valores dos adjacentes

match +1 mismatch -1

Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL

5b) Preencher posiçoes da matriz

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 12 A 03 A 04 T 05 T 06 C 07 A 08 G 09 T 0

10 T 011 A 0

Y

1 2

G G0 0 0

1 G 0 12 A 0 1 - 1 = 0

0 - 1 = -1

0 - 1 = -1

TESTAR SE1x = 2y 1x (G)= 2y (A)?

NAOSOME -1 AOSADJACENTES

match +1 mismatch -1

Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL

5c) Preencher posiçoes da matriz

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 12 A 0 03 A 04 T 05 T 06 C 07 A 08 G 09 T 0

10 T 011 A 0

Y

1x (G)= 1y (G)?s

0 + 1 = 10 + 1 = 10 + 1 = 1

1x (G)= 2y (A) ?n

1 - 1 = 00 - 1 = -10 - 1 = -1

match +1 mismatch -1

Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL

5d) Preencher posiçoes da matriz

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 12 A 0 03 A 0 -14 T 0 -15 T 0 -16 C 0 -17 A 0 -18 G 0 19 T 0 0

10 T 0 -111 A 0 -1

Y

1x (G)= 1y (G)?s

0 + 1 = 10 + 1 = 10 + 1 = 1

1x (G)= 2y (A) ?n

1 - 1 = 00 - 1 = -10 - 1 = -1

1x (G)= 3y (A) ?n

0 - 1 = -10 - 1 = -10 - 1 = -1

1x (G)= 4y (T) ?n

-1 - 1 = -2 0 - 1 = -1 0 - 1 = -1

1x (G)= 5y (C) ?n

-1 - 1 = -2 0 - 1 = -1 0 - 1 = -1

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 02 A 0 0 1 3 2 1 0 23 A 0 -1 0 4 3 2 1 34 T 0 -1 -1 3 5 4 3 25 T 0 -1 -2 2 6 5 4 36 C 0 -1 -2 1 5 7 6 57 A 0 -1 -2 2 4 6 6 78 G 0 1 2 1 3 5 7 69 T 0 0 1 1 4 4 6 6

10 T 0 -1 0 0 5 4 5 511 A 0 -1 -1 1 4 4 4 6

Y

match +1 mismatch -1

5e) Preencher posiçoes da matriz

Alinhamento Global – Algoritmo de Needleman-Wunsch

TUDO CALCULADO……..

6) BACK-TRACKING caminhamento contrario buscando os maiores valores

Alinhamento Global – Algoritmo de Needleman-Wunsch

6) BACK-TRACKING – caminhamento contrario buscando os maiores valores

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 02 A 0 0 1 3 2 1 0 23 A 0 -1 0 4 3 2 1 34 T 0 -1 -1 3 5 4 3 25 T 0 -1 -2 2 6 5 4 36 C 0 -1 -2 1 5 7 6 57 A 0 -1 -2 2 4 6 6 78 G 0 1 2 1 3 5 7 69 T 0 0 1 1 4 4 6 6

10 T 0 -1 0 0 5 4 5 511 A 0 -1 -1 1 4 4 4 6

Y

SELECIONAR O MELHOR CAMINHAMENTOBACK TRACKING

6) BACK-TRACKING – caminhamento contrario buscando os maiores valores

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 02 A 0 0 1 3 2 1 0 23 A 0 -1 0 4 3 2 1 34 T 0 -1 -1 3 5 4 3 25 T 0 -1 -2 2 6 5 4 36 C 0 -1 -2 1 5 7 6 57 A 0 -1 -2 2 4 6 6 78 G 0 1 2 1 3 5 7 69 T 0 0 1 1 4 4 6 6

10 T 0 -1 0 0 5 4 5 511 A 0 -1 -1 1 4 4 4 6

Y

SE VALORES IGUAIS, SELECIONA A DIAGONAL

5

5

4

6) BACK-TRACKING – caminhamento contrario buscando os maiores valores

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 02 A 0 0 1 3 2 1 0 23 A 0 -1 0 4 3 2 1 34 T 0 -1 -1 3 5 4 3 25 T 0 -1 -2 2 6 5 4 36 C 0 -1 -2 1 5 7 6 57 A 0 -1 -2 2 4 6 6 78 G 0 1 2 1 3 5 7 69 T 0 0 1 1 4 4 6 6

10 T 0 -1 0 0 5 4 5 511 A 0 -1 -1 1 4 4 4 6

Y

SE VALORES IGUAIS, SELECIONA A DIAGONAL

6) BACK-TRACKING – caminhamento contrario buscando os maiores valores

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 02 A 0 0 1 3 2 1 0 23 A 0 -1 0 4 3 2 1 34 T 0 -1 -1 3 5 4 3 25 T 0 -1 -2 2 6 5 4 36 C 0 -1 -2 1 5 7 6 57 A 0 -1 -2 2 4 6 6 78 G 0 1 2 1 3 5 7 69 T 0 0 1 1 4 4 6 6

10 T 0 -1 0 0 5 4 5 511 A 0 -1 -1 1 4 4 4 6

Y

SE VALORES IGUAIS, SELECIONA A DIAGONAL

6

4

4

6) BACK-TRACKING – caminhamento contrario buscando os maiores valores

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 02 A 0 0 1 3 2 1 0 23 A 0 -1 0 4 3 2 1 34 T 0 -1 -1 3 5 4 3 25 T 0 -1 -2 2 6 5 4 36 C 0 -1 -2 1 5 7 6 57 A 0 -1 -2 2 4 6 6 78 G 0 1 2 1 3 5 7 69 T 0 0 1 1 4 4 6 6

10 T 0 -1 0 0 5 4 5 511 A 0 -1 -1 1 4 4 4 6

Y

SE VALORES IGUAIS, SELECIONA A DIAGONAL

6) BACK-TRACKING – caminhamento contrario buscando os maiores valores

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 02 A 0 0 1 3 2 1 0 23 A 0 -1 0 4 3 2 1 34 T 0 -1 -1 3 5 4 3 25 T 0 -1 -2 2 6 5 4 36 C 0 -1 -2 1 5 7 6 57 A 0 -1 -2 2 4 6 6 78 G 0 1 2 1 3 5 7 69 T 0 0 1 1 4 4 6 6

10 T 0 -1 0 0 5 4 5 511 A 0 -1 -1 1 4 4 4 6

Y

SELECIONAR O MELHOR CAMINHAMENTOBACK TRACKING

6) BACK-TRACKING – caminhamento contrario buscando os maiores valores

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 02 A 0 0 1 3 2 1 0 23 A 0 -1 0 4 3 2 1 34 T 0 -1 -1 3 5 4 3 25 T 0 -1 -2 2 6 5 4 36 C 0 -1 -2 1 5 7 6 57 A 0 -1 -2 2 4 6 6 78 G 0 1 2 1 3 5 7 69 T 0 0 1 1 4 4 6 6

10 T 0 -1 0 0 5 4 5 511 A 0 -1 -1 1 4 4 4 6

Y

SELECIONAR O MELHOR CAMINHAMENTOBACK TRACKING

7) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 02 A 0 0 1 3 2 1 0 23 A 0 -1 0 4 3 2 1 34 T 0 -1 -1 3 5 4 3 25 T 0 -1 -2 2 6 5 4 36 C 0 -1 -2 1 5 7 6 57 A 0 -1 -2 2 4 6 6 78 G 0 1 2 1 3 5 7 69 T 0 0 1 1 4 4 6 6

10 T 0 -1 0 0 5 4 5 511 A 0 -1 -1 1 4 4 4 6 A

Y

Trazer para Y’ as bases de Y

7) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 0 G2 A 0 0 1 3 2 1 0 2 A3 A 0 -1 0 4 3 2 1 3 A4 T 0 -1 -1 3 5 4 3 2 T5 T 0 -1 -2 2 6 5 4 3 T6 C 0 -1 -2 1 5 7 6 5 C7 A 0 -1 -2 2 4 6 6 7 A8 G 0 1 2 1 3 5 7 6 G9 T 0 0 1 1 4 4 6 6 T

10 T 0 -1 0 0 5 4 5 5 T11 A 0 -1 -1 1 4 4 4 6 A

Y

Trazer para Y’ as bases de Y

7) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 0 G2 A 0 0 1 3 2 1 0 2 A3 A 0 -1 0 4 3 2 1 3 A4 T 0 -1 -1 3 5 4 3 2 T5 T 0 -1 -2 2 6 5 4 3 T6 C 0 -1 -2 1 5 7 6 5 C7 A 0 -1 -2 2 4 6 6 7 A8 G 0 1 2 1 3 5 7 6 G9 T 0 0 1 1 4 4 6 6 T

10 T 0 -1 0 0 5 4 5 5 T11 A 0 -1 -1 1 4 4 4 6 A

Y

NESTE CASO? QDO DOIS PASSOS ACONTECEM NA MESMA LINHA

7) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0

1 G 0 1 2 1 0 -1 1 0 G2 A 0 0 1 3 2 1 0 2 A3 A 0 -1 0 4 3 2 1 3 A4 T 0 -1 -1 3 5 4 3 2 T5 T 0 -1 -2 2 6 5 4 3 T6 C 0 -1 -2 1 5 7 6 5 C7 A 0 -1 -2 2 4 6 6 7 A8 G 0 1 2 1 3 5 7 6 G9 T 0 0 1 1 4 4 6 6 T

10 T 0 -1 0 0 5 4 5 5 T11 A 0 -1 -1 1 4 4 4 6 A

Y

NESTE CASO? QDO DOIS PASSOS ACONTECEM NA MESMA LINHA

8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0 G

1 G 0 1 2 1 0 -1 1 0 -2 A 0 0 1 3 2 1 0 2 A3 A 0 -1 0 4 3 2 1 3 A4 T 0 -1 -1 3 5 4 3 2 T5 T 0 -1 -2 2 6 5 4 3 T6 C 0 -1 -2 1 5 7 6 5 C7 A 0 -1 -2 2 4 6 6 7 A8 G 0 1 2 1 3 5 7 6 G9 T 0 0 1 1 4 4 6 6 T

10 T 0 -1 0 0 5 4 5 5 T11 A 0 -1 -1 1 4 4 4 6 A

YNESTE CASO? QDO DOIS PASSOS ACONTECEM NA MESMA LINHAR: inserir um GAP…

8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0 G

1 G 0 1 2 1 0 -1 1 0 -2 A 0 0 1 3 2 1 0 2 A3 A 0 -1 0 4 3 2 1 3 A4 T 0 -1 -1 3 5 4 3 2 T5 T 0 -1 -2 2 6 5 4 3 T6 C 0 -1 -2 1 5 7 6 5 C7 A 0 -1 -2 2 4 6 6 7 A8 G 0 1 2 1 3 5 7 6 G9 T 0 0 1 1 4 4 6 6 T

10 T 0 -1 0 0 5 4 5 5 T11 A 0 -1 -1 1 4 4 4 6 A A

Y

Finalmente, fazer o alinhamento…SOBREPOR DUAS SEQUENCIAS…

8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0 G

1 G 0 1 2 1 0 -1 1 0 -2 A 0 0 1 3 2 1 0 2 A3 A 0 -1 0 4 3 2 1 3 A4 T 0 -1 -1 3 5 4 3 2 T5 T 0 -1 -2 2 6 5 4 3 T6 C 0 -1 -2 1 5 7 6 5 C7 A 0 -1 -2 2 4 6 6 7 A8 G 0 1 2 1 3 5 7 6 G9 T 0 0 1 1 4 4 6 6 T

10 T 0 -1 0 0 5 4 5 5 T G11 A 0 -1 -1 1 4 4 4 6 A A

Y

8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0 G

1 G 0 1 2 1 0 -1 1 0 -2 A 0 0 1 3 2 1 0 2 A3 A 0 -1 0 4 3 2 1 3 A4 T 0 -1 -1 3 5 4 3 2 T5 T 0 -1 -2 2 6 5 4 3 T6 C 0 -1 -2 1 5 7 6 5 C7 A 0 -1 -2 2 4 6 6 7 A8 G 0 1 2 1 3 5 7 6 G9 T 0 0 1 1 4 4 6 6 T G

10 T 0 -1 0 0 5 4 5 5 T -11 A 0 -1 -1 1 4 4 4 6 A A

Y

8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0 G

1 G 0 1 2 1 0 -1 1 0 -2 A 0 0 1 3 2 1 0 2 A3 A 0 -1 0 4 3 2 1 3 A4 T 0 -1 -1 3 5 4 3 2 T5 T 0 -1 -2 2 6 5 4 3 T6 C 0 -1 -2 1 5 7 6 5 C7 A 0 -1 -2 2 4 6 6 7 A8 G 0 1 2 1 3 5 7 6 G G9 T 0 0 1 1 4 4 6 6 T -

10 T 0 -1 0 0 5 4 5 5 T -11 A 0 -1 -1 1 4 4 4 6 A A

Y

8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0 G G

1 G 0 1 2 1 0 -1 1 0 - G2 A 0 0 1 3 2 1 0 2 A A3 A 0 -1 0 4 3 2 1 3 A -4 T 0 -1 -1 3 5 4 3 2 T T5 T 0 -1 -2 2 6 5 4 3 T -6 C 0 -1 -2 1 5 7 6 5 C C7 A 0 -1 -2 2 4 6 6 7 A -8 G 0 1 2 1 3 5 7 6 G G9 T 0 0 1 1 4 4 6 6 T -

10 T 0 -1 0 0 5 4 5 5 T -11 A 0 -1 -1 1 4 4 4 6 A A

Y

1 2 3 4 5 6 7 8 9 10 11 12X G - A A T T C A G T T AY G G A - T - C - G - - A

RESULTADO

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0 G G

1 G 0 1 2 1 0 -1 1 0 - G2 A 0 0 1 3 2 1 0 2 A A3 A 0 -1 0 4 3 2 1 3 A -4 T 0 -1 -1 3 5 4 3 2 T T5 T 0 -1 -2 2 6 5 4 3 T -6 C 0 -1 -2 1 5 7 6 5 C C7 A 0 -1 -2 2 4 6 6 7 A -8 G 0 1 2 1 3 5 7 6 G G9 T 0 0 1 1 4 4 6 6 T -

10 T 0 -1 0 0 5 4 5 5 T -11 A 0 -1 -1 1 4 4 4 6 A A

Y

1 2 3 4 5 6 7 8 9 10 11 12X G - A A T T C A G T T AY G G A - T - C - G - - A

RESULTADO

Tamanho = 12Match = 6IDENTIDADE = 6/12 = 50

Alinhamento Global – Algoritmo de Needleman-Wunsch

1 2 3 4 5 6 7

G G A T C G A X0 0 0 0 0 0 0 0 G G

1 G 0 1 2 1 0 -1 1 0 - G2 A 0 0 1 3 2 1 0 2 A A3 A 0 -1 0 4 3 2 1 3 A -4 T 0 -1 -1 3 5 4 3 2 T T5 T 0 -1 -2 2 6 5 4 3 T -6 C 0 -1 -2 1 5 7 6 5 C C7 A 0 -1 -2 2 4 6 6 7 A -8 G 0 1 2 1 3 5 7 6 G G9 T 0 0 1 1 4 4 6 6 T -

10 T 0 -1 0 0 5 4 5 5 T -11 A 0 -1 -1 1 4 4 4 6 A A

Y

DANDO VALORES (PESO)Score de um Alinhamento

G A - C G G A T T A G G A T C G G A A T A G

score = [(9 ·1)+ (1·(-1) )+ (1·(-2) ]= 6

match 1*9mismatch -1*1gap -2*1

Alinhamento Global – Algoritmo de Needleman-Wunsch

Alinhamento Global – Algoritmo de Needleman-Wunsch

G A - - - - C G G A T T A G G A T T T T C G G A A T A G

match 1 * 9mismatch -1 * 1gap -2 * 1gapextension -0.5 * 4

score = [(9 *1)+ (1*(-1) )+ (1*(-2)) + 4*(-0.5)]= 4

Score de um Alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch

OS PROGAMAS POSSIBILITAM MAIS DE UM ALINHAMENTO!!!

http://www.ebi.ac.uk/help/formats.html

LETRAS (CARACTERES)???CORES?

CONSENSUS SYMBOLS:

* = means that the residues or nucleotides in that column are identical in all sequences in the alignment.

: = conserved

. = semi-conserved

http://www.ebi.ac.uk/help/formats.html

AVFPMILW RED small, hydrophobic, aromatic DE BLUE acidic RK MAGENTA basic. STYHCNGQ GREEN hydroxyl, amine, amide, basic

* = identical: = conserved. = semi-conserved

AVFPMILW RED DE BLUERK MAGENTA STYHCNGQ GREEN

lucianoc.maia@gmail.com

???!!!!