A aplicação de Modelos de cadeias de Markov Não-Homogéneas ...gi3ceaul.fc.ul.pt/Ericeira...

24
Enquadramento Objectivos Estado da arte Modelo proposto Os dados Resultados preliminares Pr´ oximos passos A aplica¸ ao de Modelos de cadeias de Markov ao-Homog´ eneas escondidas ` a vigilˆ ancia epidemiol´ogicadas´ ındroma gripal Baltazar Nunes 1 Isabel Nat´ ario 2 M. Luc´ ılia Carvalho 3 1 Departamento de Epidemiologia, Instituto Nacional de Sa´ ude Dr. Ricardo Jorge 2 Departamento de Matem´ atica, Faculdade de Ciˆ encias e Tecnologia (UNL); CEAUL 3 Departamento de Estat´ ıstica e Investiga¸ ao Operacional, Faculdade de Ciˆ encias (UL); CEAUL February 19, 2010 Baltazar Nunes, Isabel Nat´ ario, M. Luc´ ılia Carvalho A aplica¸ ao de Modelos de cadeias de Markov N˜ ao-Homog´ eneas e

Transcript of A aplicação de Modelos de cadeias de Markov Não-Homogéneas ...gi3ceaul.fc.ul.pt/Ericeira...

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

A aplicacao de Modelos de cadeias de Markov

Nao-Homogeneas escondidas a vigilancia

epidemiologica da sındroma gripal

Baltazar Nunes1 Isabel Natario2 M. Lucılia Carvalho 3

1Departamento de Epidemiologia, Instituto Nacional de Saude Dr. Ricardo Jorge

2Departamento de Matematica, Faculdade de Ciencias e Tecnologia (UNL);CEAUL 3Departamento de Estatıstica e Investigacao Operacional, Faculdade de

Ciencias (UL); CEAUL

February 19, 2010

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

A gripe e o seu impacto

1 As epidemias de gripe encontram-se associadas a excessos de consultasmedicas, urgencias, hospitalizacoes e obitos, que em algumas situacoeslevam a disrupcoes do funcionamento dos servicos de saude;

2 Para uma resposta mais adequada dos servicos de saude publica eorganizacao dos servicos de saude seria importante identificar:

o inıcio da epidemia (do perıodo epidemico);

a semana em que o pico de incidencia e atingido (assim comodas consultas/urgencias, hospitalizacoes e obitos);

a magnitude esperada do impacto da epidemia.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Vigilancia epidemiologica da gripe

Actualmente o Sistema de Vigilancia Integrada Clınica e Laboratorial da Gripe(INSA) publica semanalmente a 4a feira a nıvel europeu (European InfluenzaSurveillance Network) e a 5a feira a nıvel nacional, relativamente a semanaanterior:

1 A taxa de consultas por sındroma gripal por 100.000 utentes - RedeMedicos Sentinela;

2 O numero de casos de sındroma gripal positivos para o vırus influenza esua tipificacao (B,A(H3N2),A(H1N1) e A(H1N1)v) - Rede MedicosSentinela e Urgencias Sentinela;

3 E classifica a actividade gripal de acordo com a intensidade, em baixa,moderada e alta; a tendencia crescente, decrescente ou estavel edistribuicao geografica em casos esporadicos, surtos locais, regional oudisseminada.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Objectivos

Construir um modelo estatıstico que com base nas varias fontes deinformacao existentes em Portugal consiga:

1 Prever e identificar o inıcio do perıodo epidemico;

2 Prever a trajectoria da curva epidemica nas semanas seguintes(1 ou 2 semanas):

intensidade (ou magnitude) da epidemia;

a duracao do perıodo epidemico;

semana de incidencia maxima (pico da epidemia);

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Estado da arte

Metodo Objectivo Referencia

Regressao 1 Serfling 1963; Nunes et al 2002;Cowling 2006

ARIMA 1 Choi and Thacker 1981; Cowling2006

CUSUM 1 Cowling 2006Hidden Markov Models 1 Strat e Carat 1999; Rath et al

2003; Martinez-Beneito et al 2008

State Space Models 1 Zhou, T et al 2008Nao parametricos 1,2 Viboud C et al 2003; Andersson 2008Bayesian Networks 2 Sebastiani et al 2006

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Estado da arte - Cadeias de Markov escondidas

Yt representa a taxa de incidencia de sındroma gripal nasemana t;

A cada Yt esta associado uma variavel St nao observada quedetermina a distribuicao de Yt ;

St e uma cadeia de Markov homogenea com 2 estados(0=nao epidemico e 1=epidemico) com as probabilidades detransicao estacionarias:

γi ,j = P [St = j |St−1 = i ]

com i , j = 0, 1

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Estado da arte - Cadeias de Markov escondidas

Strat e Carrat 1999

Yt |St = i ∼ N(µi,t , σi)

µi,t = αi + δi t + β1,i sin(2π

52) + β2,i cos(

52), i = 0, 1

Rath et al.2003

Yt |St = 0 ∼ Exp(α)i .i .d .

Yt |St = 1 ∼ N(µ, σ)i .i .d .

Martınez-Beneito et al.2008

Zt,a = Yt,a − Yt−1,a,

onde a representa a epoca de gripe

Zt,a|St,a = 0 ∼ N(0, σ0,a)

Zt,a|St,a = 1 ∼ N(ρzt−1,a, σ1,a) − AR(1)

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Estado da arte - Cadeias de Markov escondidas

Modelo Estimacao Comentarios

Strat e Carat 1999 SAEM (aproxi-macao estocasticado algoritmo EM)

Assume a independencia de Yt tantono estado epidemico como no naoepidemico; Considera que Yt temuma distribuicao Normal que podeassumir valores inferiores a zero.

Rath et al. algoritmo EM(Baum-Welch)

Assume a independencia de Yt tantono estado epidemico como no naoepidemico; Considera que Yt temuma distribuicao Exponencial no es-tado nao epidemico para que a in-cidencia nao assuma valores nega-tivos.

Martınez-Beneito et al. Gibbs samplingMCMC (WinBUGS)

Modela as diferencas de ordem 1pois Yt nao e estacionario; Mode-la a nao independencia no estadoepidemico com um AR(1).

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Caracterısticas do novo modelo

Equacoes diferentes para perıodo epidemico e nao epidemico,com inclusao de diferentes auto-correlacoes, periodicidade eseries temporais exogenas;

Permitir que a matriz de probabilidades de transicao entre osestados seja dependente do tempo atraves de variaveisexogenas;

Definir estrategias para a previsao a curto prazo (1 a 2semanas) de Yt (prevendo a trajectoria da incidencia) e de St

(prevendo as probabilidades de transicao).

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Modelo proposto

A taxa de incidencia na semana t e definida por:

yt =

{

µ0 + ϕ0yt−1 + β1 cos(2πt52 ) + β2 sin(2πt

52 ) + et,0 St = 0µ1 + ϕ1yt−1 + θxt + et,1 St = 1

onde et,i ∼ N(0, τi ) e t = 1, ...,T com a restricao deidentificabilidade τ0 > τ1

o estado nao epidemico e descrito por uma componenteAR(1) e uma funcao cıclica de perıodo 52 semanas;

o estado epidemico e descrito por uma combinacao linear deuma componente AR(1) e da taxa de incidencia de SG nogrupo etario 0-4 anos - xt .

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Modelo proposto

Os estados de actividade gripal nao observados St sao modeladospor uma cadeia de Markov Nao-homogenea com dois estados,cujas probabilidades de transicao sao dependentes do tempo:

γti ,j = P(St = i/St−1 = j) i , j ∈ {0, 1}

com a matriz de probabilidades de transicao:

Γt =

γt0,0 γt

0,1

γt1,0 γt

1,1

onde γt0,0 = 1 − γt

0,1 e γt1,1 = 1 − γt

1,0.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Modelo proposto

No modelo proposto por Paroli e Spezia 2008 as probabilidades detransicao sao modeladas por intermedio de uma funcao logit deuma variavel exogena zt :

logit(γt0,1) = ln

(

γt0,1/γ

t0,0

)

= α0,1,0 + α0,1,1zt

logit(γt1,0) = ln

(

γt1,0/γ

t1,1

)

= α1,0,0 + α1,0,1zt

γt0,1 = exp(α0,1,0 + α0,1,1zt)/(1 + exp(α0,1,0 + α0,1,1zt))

γt1,0 = exp(α1,0,0 + α1,0,1zt)/(1 + exp(α1,0,0 + α1,0,1zt))

Na proposta actual zt e o numero de casos de sındroma gripalconfirmados para o vırus influenza na semana t.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Estimacao dos parametros do modelo

A inferencia sobre os parametros do modeloΨ = (µ, τ,R , θ, β, α, sT )′ sera obtida por metodologias deestatıstica Bayesiana, com aplicacao do algoritmo MCMC. Onde:

µµµ = (µ0, µ1);

τττ = (τ0, τ1) sobre a restricao τ0 > τ1;

RRR = (R0, R1) onde Ri = ln(

1+ϕi

1−ϕi

)

;

θ parametro de regressao associado a variavel exogena xt ;

βββ = (β1, β2)′ parametros da regressao cıclica;

ααα = (α0,1α0,1α0,1,α1,0α1,0α1,0)′ onde α0,1α0,1α0,1 = (α0,1,0, α0,1,1)

′ e α1,0α1,0α1,0 = (α1,0,0, α1,0,1)′

sTsTsT = (s1, ..., st , ..., sT )′ e a sequencia de estados da actividade gripalescondidos.

a distribuicao inicial e fixa em δ = (1/2, 1/2)

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Estimacao dos parametros do modelo

As distribuicoes a priori escolhidas para os parametros:

µi ∼ N(µM ;σ2M) for i ∈ {0, 1};

τi ∼ Gamma(αΣ;βΣ), sobre a restricao τ0 > τ1;

Ri ∼ N(µR ;σ2R) for i ∈ {0, 1};

θ ∼ N(µθ;σ2θ);

(β1, β2) ∼ N(µB ; ΣB);

(α0,1,0, α0,1,1) ∼ N(µA; ΣA);

(α1,0,0, α1,0,1) ∼ N(µA; ΣA).

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Estimacao dos parametros do modelo

Distribuicao a posteriori Ψ:

Π(

ΨΨΨ|yTyT

yT , y0,XXX ,VVV ,ZZZ , δ

)

= f(

µµµ,τττ,RRR, θ,βββ,ααα,sTsT

sT |yTy

Ty

T , y0,XXX ,VVV ,ZZZ , δ)

∝ f(

yTyT

yT |µµµ,τττ ,RRR, θ,βββ,ααα,sTs

TsT ,XXX ,VVV , y0

)

f(

sTsT

sT |ααα,ZZZ , δ

)

p(µµµ)p(τττ)p(RRR)p(δ)p(βββ)p(ααα)

onde,

yTyTyT = (y1, ..., yt , ..., yT )′ e o vector das taxas de incidencia e y0 as taxasiniciais para o AR(1);

XXX = (x1, ..., xt , ..., xT )′ e o vector da variavel exogena taxa de incidenciano grupo etario 0-4 anos;

VVV = (v1, v2) onde v1 = (cos(2π/52), ..., cos(2πt/52), ..., cos(2πT/52))′ ev2 = (sin(2π/52), ..., sin(2πt/52), ..., sin(2πT/52))′ periodicidades;

ZZZ = (z1, ..., zt , ..., zT )′ e o vector da variavel exogena numero de casos deSG positivos para influenza.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Estimacao dos parametros do modelo

A verosimilhanca de yT factorizada e dada por :

f(

yTyT

yT |µµµ,τττ ,RRR, θ,βββ,ααα,sTs

TsT ,XXX ,VVV , y0

)

=T

t=1

f(yt |yt−1,µµµ,τττ ,RRR, θ,βββ, st ,XXX ,VVV , y0)

Onde,f(yt |yt−1,µµµ,τττ,RRR, θ,βββ, st ,XXX ,VVV , y0) =

=

τ0

2πexp

{

−τ0

2

(

yt − µ0 − ϕ0yt−1 − β1 cos(2πt

52) − β2 sin(

2πt

52)

)2}

se st = 0;

=

τ1

2πexp

{

−τ1

2(yt − µ1 − ϕ1yt−1 − θxt)

2}

se st = 1.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Estimacao dos parametros do modelo

Finalmente a distribuicao conjunta da sequencia de estados de actividade gripale dada por:

f(sT|α, Z, δ) = δs1

T∏

t=2

γtst−1,st

Onde,

δ = (1/2, 1/2)

γt0,0 = 1/(1 + exp(α0,1,0 + α0,1,1zt))

γt0,1 = exp(α0,1,0 + α0,1,1zt)/(1 + exp(α0,1,0 + α0,1,1zt))

γt1,1 = 1/(1 + exp(α1,0,0 + α1,0,1zt))

γt1,0 = exp(α1,0,0 + α1,0,1zt)/(1 + exp(α1,0,0 + α1,0,1zt))

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Algoritmo MCMC

Tomemos Ψk−1 =(

µk−1, τ (k−1),Rk−1, θk−1, βk−1, αk−1, sT (k−1))′

obtido na iteracao k − 1

a sequencia dos estados sT (k) e gerada pelo algoritmo forwardfiltering - backward sampling (ff-bs) Chib 1996;

os parametros τk0 e τk

1 sao gerados de forma independente de umadistribuicao Gama condicional completa, sujeita a restricao τk

0 > τk1

que e conseguida pela aplicacao da constrained permutationsampling Fruhwirth-Schnatter, 2001;

os parametros µk0 e µk

1 sao gerados de forma independente de umadistribuicao Normal condicional completa;

os parametros Rk0 e Rk

1 sao gerados de forma independente de umpasseio e aleatorio e aceites com base numa probabilidade deaceitacao;

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Algoritmo MCMC

o parametro θk e gerado de forma independente de uma distribuicaoNormal condicional completa;

os parametros (βk1 , βk

2 ) sao gerados de forma independente de umadistribuicao Normal Multivariada condicional completa;

os parametros (αk0,1,0, α

k0,1,1) (αk

1,0,0, αk1,0,1) sao gerados de forma

independente de passeio aleatorio multivariado que sao aceites combase numa probabilidade de aceitacao.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

0 100 200 300 400 500

050

150

250

semanas

Taxa

de

inci

dênc

ia

0 100 200 300 400 500

010

020

030

0

semanas

Taxa

de

inci

dênc

ia 0

−4

anos

0 100 200 300 400 500

020

6010

0

semanas

caso

s po

sitiv

os in

fluen

za

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

azul nao-epidemica (P < 0.5) vermelho epidemica (P > 0.5)

0 100 200 300 400 500

050

150

250

semanas

Taxa

de

inci

dênc

ia

0 100 200 300 400 500

0.0

0.4

0.8

semanas

Pro

b. e

stad

o ep

idém

ico

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

Proximos passos

Procurar metodologias alternativas a apresentada no artigoParoli e Spezia 2008 para a estimacao dos parametros;

Explorar a estrutura do modelo: usar a serie Zt = Yt − Yt−1,necessidade de periodicidades, outras variaveis exogenas(temperatura, humidade absoluta, etc) a diferentes lags;

Desenvolver metodologia para a predicao da taxa deincidencia Yt e dos estados futuros de actividade gripal St.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

References

Serfling RE.Methods for Current Statistical Analysis of Excess MortalityPneumonia-Influenza Deaths. Public Heath Reports 1963; 78 6: 494-506.

Cowling BJ, Wong IL, Ho LI, Riley S and Leung GM. Methods for monitoringinfluenza surveillance data. International Journal of Epidemiology 2006.

Choi K and Thacker SB.An evaluation of influenza mortality surveillance1962-1979. American Journal of Epidemiology 1981; 113 3: 215-216.

Strat L, Carrat F. Monitoring epidemiologic surveillance data using HiddenMarkov Chains models. Statistics in Medicine 1999; 18 3463-3478.

Rath TM, Carreras M, Sebastiani P. Automated Detection of InfluenzaEpidemics. University of Massachusetts 2003.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas

EnquadramentoObjectivos

Estado da arteModelo proposto

Os dadosResultados preliminares

Proximos passos

References

Martınez-Beneito MA, Conesa D, Lopez-Quilez A, Lopez-Maside A. BayesianMarkov switching models for the early detection of influenza epidemics.Statistics in Medicine 2008; 27 4455-4468.

Zhou T, Shumway R. One-step approximations for detecting regime changes inthe state space model with application to the influenza data. Computational

Statistics and Data Analysis 2008; 52 2277-2291.

Viboud C, Boelle PY, Carrat F, Valleron AJ, Flahault A. OPrediction of theSpread of Influenza Epidemics by the Method of Analogues. American Journal

of Epidemiology 2003; 158 996-1006.

Anderson E, Bock D, Frisen M. Modelling influenza incidence for the propose ofon-line monitoring. Statistical Methods in Medical Research 2008; 17 421.

Sebastiani P, Mandl KD, Szolovits P, Kohane IS, Ramoni F. A Bayesiandynamic model for influenza. Statistics in Medicine 2006; 25 1803-1816.

Baltazar Nunes, Isabel Natario, M. Lucılia Carvalho A aplicacao de Modelos de cadeias de Markov Nao-Homogeneas escondidas