Máxima Verossimilhança

Post on 24-Feb-2016

51 views 0 download

description

Máxima Verossimilhança. Almir R. Pepato. O velho problema. Máxima Verossimilhança. O conceito de verossimilhança refere-se a situações em que a partir de um conjunto de dados D , uma decisão deve ser tomada a respeito de explicações alternativas a seu respeito. - PowerPoint PPT Presentation

Transcript of Máxima Verossimilhança

Máxima Verossimilhança

Almir R. Pepato

O velho problema...

Máxima VerossimilhançaO conceito de verossimilhança refere-se a situações em que a partir de um conjunto de dados D, uma decisão deve ser tomada a respeito de explicações alternativas a seu respeito.

No caso das inferências filogenéticas temos um modelo composto pela topologia, comprimento de ramos e parâmetros do modelo de substituição.

Assinalando valores a esses elementos do modelo podemos computar a probabilidade dos dados sob cada um desses valores e escolher os valores mais plausíveis.

REPARE QUE EM NENHUM MOMENTO A VALIDADE DO MODELO É QUESTIONADA.

Ronald Fisher

A história começa com o Teorema de Bayes...

Isso incomodava Fisher!

A história começa com o Teorema de Bayes...Como funciona:Há dois sapos de origami, Joe e Herman. Por experiências anteriores sabe-se que Joe cai 60% das vezes em pé, enquanto Herman cai apenas 20% das vezes. O nome dos sapos foi apagado. Como podemos inferir qual é Joe apenas fazendo-os saltar?

Primeiro lançamento, caiu em pé:

A história começa com o Teorema de Bayes...

Segundo lançamento, caiu em pé:

Terceiro lançamento, caiu de costas:

A história começa com o Teorema de Bayes...

Isso incomodava Fisher!

Para eliminar esse incômodo: Se os dados forem robustos isso...

É muito maior que isso!

Máxima VerossimilhançaExemplo simples:

N=100; Caras=21 ; Coroas= 79.

O modelo estabelece apenas que com alguma probabilidade , caras aparecem quando a moeda é lançada e que cada resultado é independente dos demais.

A probabilidade de obtermos exatamente H =h caras a partir de n lançamentos é de:

Isso pode ser lido de duas maneiras:

A- Se é conhecido, então podemos computar a probabilidade de que h= 0, 1, 2, ...n.B- Caso contrário a PROBABILIDADE em questão pode ser tratada como uma função de n e h!

Máxima Verossimilhança

Obviamente o valor é 21/100. Mas podemos calcular isso analiticamente! Só para mostrar que sabemos cálculo!

Para facilitar vamos transformar tudo em logaritmos, assim ao invés multiplicações teremos somas.

Como sabemos, temos que calcular a derivada da função acima:

Só para lembrar :

Máxima VerossimilhançaMas o que nos interessa mesmo é poder comparar duas hipóteses.

Por exemplo: segundo a nossa função, a verossimilhança de que a moeda seja não-viciada é de:

Comparado à nosso valor máximo (0,21) temos que é 6 x 107 mais verossímil que a probabilidade que produziu os dados seja θ= 0,21 que θ= 0,5.

X

Recordando: Modelos de substituição

Para os JC69, temos:

Máxima Verossimilhança1- Cada posição no alinhamento evolui de maneira independente:

2- Cada ramo de uma filogenia evolui de maneira independente dos demais:

Máxima Verossimilhança

Muita conta!

22n-2 cenários

Máxima Verossimilhança

Se o modelo é reversível podemos enraizar em qualquer lugar.

Máxima Verossimilhança

Essa expressão terá 256 termos (22(5)-2 )

O que pode ser rearranjado como:

HÁ! ISSO É O MESMO QUE SEGUIR A ÁRVORE DAS FOLHAS PARA A RAIZ!

Máxima Verossimilhança

Verossimilhança da árvore:

Resolução do exemplo numérico

0100

0010

0100

0100

Resolução do exemplo numérico

0100

0010

0100

0100

0.000970.028280.028280.00097

Resolução do exemplo numérico

0100

0010

0100

0100

0.000970.028280.028280.00097

0.0000026

Resolução do exemplo numérico

0100

0010

0100

0100

0.000970.028280.028280.00097

0.0000026 0.0218338

Resolução do exemplo numérico

0100

0010

0100

0100

0.000970.028280.028280.00097

0.0000026 0.02183380.0000259

Resolução do exemplo numérico

0100

0010

0100

0100

0.000970.028280.028280.00097

0.0000026 0.02183380.00002590.0000026

Resolução do exemplo numérico

0100

0010

0100

0100

0.000970.028280.028280.00097

0.0000026 0.02183380.00002590.0000026

Os dados são informativos?“Likelihood-mapping Analysis”

Sinal em forma de árvore: 1,2,3

Sinal em forma de rede (parcialmente resolvido): 4,5,6.

Sinal em estrela: 7

Os dados são informativos?

No estudo citado, a maior parte dos pontos está próximo ao centro dos triângulos, mostrando que os dados são incapazes de resolver o problema.