Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse....

14
Análise de Sobrevida Tania Guillén de Torres Rejane Sobrino Pinheiro Universidade Federal do Rio de Janeiro NESC- Mestrado em Epidemiologia e Bioestatística Disciplina: Análise de Regressão em Saúde Análise de sobrevida Definições: Tipo de estudo estudos de coorte ou ensaios clínicos Variável resposta tempo transcorrido entre a entrada do indivíduo no estudo e a ocorrência de um evento a ser relacionado com a exposição ou tratamento. Evento (falha ) pode ser doença, morte, cura etc. Tempo de sobrevida: Medido para cada indivíduo, desde sua entrada no estudo até a ocorrência do "evento" (falha). Indivíduos podem entrar no estudo em qualquer período durante o tempo do estudo. Tempo pode ser medido em qualquer unidade dias, semanas, meses, etc. Análise de sobrevida Tempo até a ocorrência do evento Métodos especiais de análise Distribuição dos tempos não é gaussiana Dados com censura Nesta seção serão apresentadas técnicas de analise de tempos de sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia. Tempo, em anos, até a ocorrência de doença coronariana, numa corte de indivíduos sem doença. Tempo, em anos, até a morte numa população de idosos (>60 anos) Tempo (meses) até morte em pacientes transplantados. Observação: É possível avaliar simultaneamente a ocorrência de vários desfechos num único desenho de estudo, por exemplo mortes por Câncer em mulheres (Ca. de colo uterino, Ca. Mama, etc.). Podem ser abordados como um problema de Riscos Competitivos, porem este tópico não faz parte da disciplina.

Transcript of Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse....

Page 1: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Análise de Sobrevida

Tania Guillén de TorresRejane Sobrino Pinheiro

Universidade Federal do Rio de JaneiroNESC- Mestrado em Epidemiologia e BioestatísticaDisciplina: Análise de Regressão em Saúde

Análise de sobrevidaDefinições:

� Tipo de estudo � estudos de coorte ou ensaios clínicos

� Variável resposta � tempo transcorrido entre a entrada do indivíduo no estudo e a ocorrência de um evento a ser relacionado com a exposição ou tratamento.

� Evento (falha ) � pode ser doença, morte, cura etc.

� Tempo de sobrevida:

� Medido para cada indivíduo, desde sua entrada no estudo até a ocorrência do "evento" (falha).

� Indivíduos podem entrar no estudo em qualquer período durante o tempo do estudo.

� Tempo pode ser medido em qualquer unidade

� dias, semanas, meses, etc.

Análise de sobrevida

� Tempo até a ocorrência do evento

� Métodos especiais de análise

� Distribuição dos tempos não é gaussiana

� Dados com censura

Nesta seção serão apresentadas técnicas de analise de tempos de sobrevida para o caso de um único desfecho de interesse.

Exemplos de aplicação:

� Tempo de remissão, em semanas, para pacientes com Leucemia.

� Tempo, em anos, até a ocorrência de doença coronariana, numa corte de indivíduos sem doença.

� Tempo, em anos, até a morte numa população de idosos (>60 anos)

� Tempo (meses) até morte em pacientes transplantados.

Observação:

É possível avaliar simultaneamente a ocorrência de vários desfechos num único desenho de estudo, por exemplo mortes por Câncer em mulheres (Ca. de colo uterino, Ca. Mama, etc.). Podem ser abordados como um problema de Riscos Competitivos, porem este tópico não faz parte da disciplina.

Page 2: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Dado censurado:

� Indivíduo não sofre o "evento" durante o período de estudo, de modo que o tempo exato de sobrevida não é conhecido.

� Censura devida a:

� O indivíduo não experimenta o evento antes do fim do estudo (estudo termina antes da ocorrência do evento)

� Perda defollow-up (seguimento) durante o período do estudo

� Saída do estudo por causa de óbito (por outra causa), ou por outra razão (reação adversa à droga)

� Indivíduos podem entrar no estudo em qualquer instante depois do início do estudo e pode ser censurado em qualquer instante de tempo durante o estudo.

Pacientes de Leucemia em remissão

�Início doestudo

Fim doestudo

××××

Censura

Tempo de sobrevida censurado, observado no estudo

Tempo de sobrevida verdadeiro

Dados censurados Exemplo: Leucemia

� Comparar os tempos de remissão, de um grupo de pacientes com leucemia tratados com a droga 6-mercaptopurine com os tempos de remissão de um grupo controle não tratado.

� Desfecho (evento) � recidiva (recaída)

� Tempo de sobrevida � número de semanas em remissão

Grupo controle:

1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23

Grupo tratado:

6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*

* = follow-up incompleto (censura)

Page 3: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Interpretação:6* � indivíduo ainda em remissão

depois de 6 semanas no estudo, e não observado após este tempo.

6 � indivíduos conhecidos como em remissão por 6 semanas, mas tiveram recaída entre a 6a. e a 7a. semanas.

Observar:� Nenhuma censura no grupo

controle (todos "falharam")� Parece que o tempo de sobrevida

é maior para os do grupo tratado

Grupo tratado:

6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*

1: Controle 2:TratamentoObs Tempo recidiva Grupo Obs Tempo recidiva Grupo

1 1 1 1 22 6 0 22 1 1 1 23 6 1 23 2 1 1 24 6 1 24 2 1 1 25 6 1 25 3 1 1 26 7 1 26 4 1 1 27 9 0 27 4 1 1 28 10 0 28 5 1 1 29 10 1 29 5 1 1 30 11 0 2

10 8 1 1 31 13 1 211 8 1 1 32 16 1 212 8 1 1 33 17 0 213 8 1 1 34 19 0 214 11 1 1 35 20 0 215 11 1 1 36 22 1 216 12 1 1 37 23 1 217 12 1 1 38 25 0 218 15 1 1 39 32 0 219 17 1 1 40 32 0 220 22 1 1 41 34 0 221 23 1 1 42 35 0 2

Como comparar os tempos:

� Média ou mediana do tempo de remissão para cada grupo, ignorando a condição de censura ( ttrt = 17,1 e tcontrole= 8,7 )

Problema: tempos censurados podem enviesar os resultados

Alternativas:

1. Excluir tempos censurados

� Tempo de sobrevida pelo tratamento muito baixo, por excluir os tempos de remissão mais longos (subestimar).

2. Incluir tempos censurados

� Ignorar a diferença entre evento e censura. Indivíduos com os tempos de sobrevida censurados tem atualmente tempos de sobrevida maiores do que as semanas representadas no estudo

Stata:

1 – Abrir o banco

File � Open.. � diretório � banco. use “C:\Data\leucemia.dta"

. desc

Contains data from E:\Regressao\Sobrevida\AulaPratica\ Bancos\leucemia.dtaobs: 42

vars: 4 11 Nov 2009 10:20size: 336 (99.9% of memory free)

--------------------------------------------------- --------------------------storage display value

variable name type format label varia ble label--------------------------------------------------- --------------------------obs byte %8.0g Obstempo byte %8.0g Tempo ate a recaidarecidiva byte %8.0g recidiva Retor no da doencagrupo byte %8.0g grp Grupos de com paracao--------------------------------------------------- --------------------------Sorted by:

2 - Declarar um banco para Análise de Sobrevida

Statistics���� Survival analysis ���� Setups & utilities���� Declare data to be survival-time data

Stata:

Comando “stset vartempo varcensura”

���� Declara o banco como sendo um banco com tempos de s obrevida

Page 4: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Stata:

. stset tempo, failure(recidiva==1)

failure event: recidiva == 1obs. time interval: (0, tempo]

exit on or before: failure

--------------------------------------------------- ---------------------------42 total obs.

0 exclusions--------------------------------------------------- ---------------------------

42 obs. remaining, representing30 failures in single record/single failure data

541 total analysis time at risk, at risk from t = 0earliest observed entry t = 0

last observed exit t = 35

Função de sobrevida:

T � variável aleatória � tempo de sobrevida de um indivíduot � qualquer valor de interesse para a variável aleatória T

Ex: Se estamos interessados em avaliar se uma pessoa sobrevive mais de 5 anos após submeter-se a tratamento para câncer

A função de sobrevida dá a probabilidade de uma pessoa viver mais do que um tempo específico t = 5.

Isto é, S(T) dá a probabilidade de um indivíduo sobreviver além do tempo t (probabilidade de uma variável aleatória T exceder um determinado valor especificado (t).

S(t) = P(T > t)

S(5) = P(T > 5)

Teoricamente, como t varia de 0 a ∞, a função de sobrevida decai.

Se não houver censura:

A função é decrescente, ou seja, os valores de S(t) decrescem à medida que t cresce.

Para t = 0 � S(t) = = S(0) = 1

Para t = ∞ � S(t) = 0

0 ≤ S(t) ≤ 1

indivíduos de totalN

tque do mais amsobreviver que indivíduos de N)(

°°=tS

0 ∞

S(t)

1

Sempredecrescente

Grupo controle (nenhuma censura):

1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23

381.0218

)10( ==S

N° sobreviventes além de 10 semanas

Probabilidade de sobrevida além de 10 semanas

N° total de indivíduos

048.021

1)22( ==S

N° sobreviventes além de 22 semanas

Probabilidade de sobrevida além de 22 semanas

N° total de indivíduos

Page 5: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Probabilidade de sobrevida para o grupo controle:

t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23mt = n° de falhas no instante t.

n tinstante no tessobreviven de N

)(°=tS

t m t m t a cum u la d a S ( t ) 0 0 0 (2 1 -0 ) /2 1 = 2 1 /2 1 = 1 .0 0 1 2 2 (2 1 -2 ) /2 1 = 1 9 /2 1 = 0 .9 1 2 2 4 (2 1 -4 ) /2 1 = 1 7 /2 1 = 0 .8 1 3 1 5 (2 1 -5 ) /2 1 = 1 6 /2 1 = 0 .7 6 4 2 7 (2 1 -7 ) /2 1 = 1 4 /2 1 = 0 .6 7 5 2 9 (2 1 -9 ) /2 1 = 1 2 /2 1 = 0 .5 7 8 4 1 3 (2 1 -1 3 ) /2 1 = 8 /2 1 = 0 .3 8

1 1 2 1 5 (2 1 -1 5 ) /2 1 = 6 /2 1 = 0 .2 9 1 2 2 1 7 (2 1 -1 7 ) /2 1 = 4 /2 1 = 0 .1 9 1 5 1 1 8 (2 1 -1 8 ) /2 1 = 3 /2 1 = 0 .1 4 1 7 1 1 9 (2 1 -1 9 ) /2 1 = 2 /2 1 = 0 .1 0 2 2 1 2 0 (2 1 -2 0 ) /2 1 = 1 /2 1 = 0 .0 5 2 3 1 2 1 (2 1 -2 1 ) /2 1 = 0 /2 1 = 0 .0 0

t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23

21S1

(19)

D1(2)

P(S1)=19/21

P(D1)=2/21

S2(17)

D2(2)

17/19

2/19

S3(16)

D3(1)

16/17

1/17

S4(15)

D4(2)

14/16

2/16

•••

0.67 21

14

16

14

17

16

19

17

21

19 S(4)

0.76 21

16

17

16

19

17

21

19 S(3)

0.8121

17

19

17

21

19 S(2)

0.91 21

19

21

191 S(1)

1.00 21

0-21 S(0)

==×××=

==××=

==×=

==×=

==

P(S4) = P(S1)×P(S2| S1)×P(S3| S2∩ S1) ×P(S4| S1∩ S2∩ S3)

Probabilidade de sobrevida para o grupo controle:

P(S2| S1)

Curva de sobrevida:

É a representação gráfica da Função de sobrevida S(t) no eixo vertical vs. os tempos de sobrevida (t) no eixo horizontal

0.00

0.25

0.50

0.75

1.00

0 5 10 15 20 25analysis time

Kaplan-Meier survival estimateS(t)

(t)

Função de Hazard (risco)� Densidade instantânea de incidência

Taxa de falha condicional

� Taxa de falha instantânea (falha durante um intervalo de tempo

bem pequeno de amplitude ∆t, dado que um indivíduo tenha

sobrevivido até o início do intervalo) / ∆t).

Função de Hazard:

tinstante no tessobreviven Nº

t)t(t, intervalo no tempode unidadepor morreram que indivíduos de Nº)(

∆+=th

t

tTttTtPth

t ∆>∆+<<=

→∆

]|)([lim)(

0

Risco instantâneo

Page 6: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Exemplo:

h(t) para dados de leucemia (grupo tratado), com ∆t = 1

6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*

143.0213

)6( ==h

n° de recidivas no instante de tempo 6

n° sob risco no início do intervalo de tempo 6

059.0171

)7( ==h

n° de recidivas no instante de tempo 7

n° sob risco no início do intervalo de tempo 7

Stata:

Statistics ���� Survival analysis ���� Summary statistics, test, & tables ���� Summarize survival-time data

. stsum

failure _d: recidiva == 1analysis time _t: tempo

| incidence no. of |------ Survival time ---- -|| time at risk rate subjects 25% 50% 75%

---------+----------------------------------------- ----------------------------total | 541 .0554529 42 6 12 23

. stsum, by(trtment)

failure _d: relapse == 1analysis time _t: weeks

| incidence no. of |------ Survival time ---- -|trtment | time at risk rate subjects 25% 50% 75%---------+----------------------------------------- ----------------------------

0:stand | 182 .1153846 21 4 8 121:trt | 359 .0250696 21 13 23 .

---------+----------------------------------------- ----------------------------total | 541 .0554529 42 6 12 23

Calcular o hazard - Risco instantâneo dos tempos Função de Hazard acumuladaGraphics ���� Survival analysis graphs

���� Survivor & cumulative hazard functions

Page 7: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

. sts graph failure _d: relapse == 0 1analysis time _t: weeks

. sts graph, by( trtment)failure _d: relapse == 0 1analysis time _t: weeks

0.00

0.25

0.50

0.75

1.00

0 10 20 30 40analysis time

Kaplan-Meier survival estimate

0.00

0.25

0.50

0.75

1.00

0 10 20 30 40analysis time

trtment = 0:stand trtment = 1:trt

Kaplan-Meier survival estimates, by trtment

Função de Hazard acumuladaGraphics ���� Survival analysis graphs

���� Survivor & cumulative hazard functions

Função de Hazard acumulada

. sts graph, by(grupo) na

failure _d: recidiva == 1analysis time _t: tempo

0.0

01.

00

2.0

03.

00

4.0

0

0 10 20 30 40analysis time

grupo = Controle grupo = Tratamento

Nelson-Aalen cumulative hazard estimates, by grupo

Page 8: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Função de sobrevida - dados censurados

S(t) pode ser derivada de uma função h(t) para dados censurados

S(0) = 1 - h(0)S(1) = [1-h(0)] x [1 - h(1)]S(2) = [1-h(0)] x [1 - h(1)] x [1 - h(2)]

S(t) = [1-h(0)] x [1 - h(1)] x ... x [1 - h(t)]

Ou:

S(0) = 1 - h(0)S(1) = S(0) x [1 - h(1)]S(2) = S(1) x [1 - h(2)]S(3) = S(2) x [1 - h(3)]

S(t) = S(t-1) x [1 - h(t)]

d6(3)

C6(1)

S6(17)

21d7(1)

C7(0)

S7(16)

d10(1)

C10(2)

S10(13) ���

P(S7| S6)

16/17

3/21

1/17

1/16

Função de sobrevida - dados censurados

0.806 )17

1-(1 )

21

31(1 S(7)

0.86 )21

31(1 S(6)

1.00 21

0-21 S(0)

=×−×=

=−×=

==

Exemplo:Grupo tratado: 6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*

[1-2) = 1 semana a < 2 semanasnt = sob risco; mt = recidivas; qt = censuradoSomente tem-se que calcular S(t) p/ valores de t onde 1 ou + falhas ocorram (mt).

t j nj mj qj H(t) = mt S(t) = S(t-1) x [1 – h(t)] [0-1) 21 0 0 0 / 21 = .000 1.0 x [ 1 – 0] = 1.00 [1-2) 21 0 0 0 / 21 = .000 1.0 x [ 1 – 0] = 1.00 [6-7) 21 3 1 3 / 21 = .143 1.0 x [ 1 – 0.143] = 0.857 [7-8) 17 1 0 1 / 17 = .059 .857 x [1 - .059] = .806 [8-9) 16 0 0 0 / 16 = .000 .806 x [1 – 0] = .806 [9-10) 16 0 1 0 / 16 = .000 .806 x [1 – 0] = .806 [10-11) 15 1 1 1 / 15 = .067 .806 x [1 – 0.067] = .752 [13-14) 12 1 0 1 / 12 = .083 .752 x [1 - .083] = .690 [16-17) 11 1 0 1 / 11 = .091 .690 x [1 - .091] = .627 [22-23) 7 1 0 1 / 7 = .143 .627 x [1 - .143] = .537 [23-24) 6 1 0 1 / 6 = .167 .537 x [1 - .167] = .447 [24-25) 5 0 0 0 / 5 = .000 .447 x [1 – 0] = .447 [35-36) 1 0 1 0 / 1 = .000 .447 x [1 – 0] = .447

0.00

0.25

0.50

0.75

1.00

0 10 20 30 40analysis time

Kaplan-Meier survival estimate

As probabilidades acumuladas de sobrevida nos períodos são:

P(S ao 1º ano) = P(S 1) = 0,87P(S ao 2º ano) = P(S 1)*P(S2/ S1) = 0,67P(S ao 3º ano) = P(S 1)*P(S2/ S1)* P(S3/ S1∩∩∩∩ S2)

= 0,60

1

0.6

0.67

0.87

0.6

0.7

0.8

0.9

1

0 1 2 3

11

0.6

0.67

0.87

0.92

0.71

0.77

0.5

0.6

0.7

0.8

0.9

1

0 1 2 3

Método de Kaplan-MeierChama-se de tabela de vidaa uma tabela de probabilidades de sobrevivência acumuladas no período estudado e de curva de sobrevida ao gráfico destas probabilidades versus o tempo de sobrevivência.

Page 9: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Tabelas de Vida

� Tempos de sobrevida agrupados em intervalos.

� Kaplan-Meier é uma versão modificada da tabela de vida

� KM usa tempos exatos de "falha" ou intervalos de tempo curtos

� KM tem poucos ou nenhum empate nos tempos de "falha"

Stata:

Statistics ���� Survival analysis ���� Summary statistics, test, & tables ���� Life tables for survival data

. ltable tempo recidiva, survival

Interval Total Deaths Lost Survival Error [95% Conf. Int.]1 2 42 2 0 0.9524 0.0329 0.8227 0.98792 3 40 2 0 0.9048 0.0453 0.7658 0.96313 4 38 1 0 0.8810 0.0500 0.7373 0.94864 5 37 2 0 0.8333 0.0575 0.6819 0.91685 6 35 2 0 0.7857 0.0633 0.6286 0.88226 7 33 3 1 0.7132 0.0700 0.5505 0.82587 8 29 1 0 0.6886 0.0717 0.5247 0.80598 9 28 4 0 0.5902 0.0765 0.4258 0.72219 10 24 0 1 0.5902 0.0765 0.4258 0.722110 11 23 1 1 0.5640 0.0775 0.3999 0.699111 12 21 2 1 0.5090 0.0791 0.3464 0.650412 13 18 2 0 0.4524 0.0798 0.2934 0.598713 14 16 1 0 0.4241 0.0796 0.2679 0.572115 16 15 1 0 0.3959 0.0792 0.2430 0.545016 17 14 1 0 0.3676 0.0784 0.2187 0.517417 18 13 1 1 0.3382 0.0775 0.1939 0.488419 20 11 0 1 0.3382 0.0775 0.1939 0.488420 21 10 0 1 0.3382 0.0775 0.1939 0.488422 23 9 2 0 0.2630 0.0763 0.1294 0.418023 24 7 2 0 0.1879 0.0706 0.0744 0.341025 26 5 0 1 0.1879 0.0706 0.0744 0.341032 33 4 0 2 0.1879 0.0706 0.0744 0.341034 35 2 0 1 0.1879 0.0706 0.0744 0.341035 36 1 0 1 0.1879 0.0706 0.0744 0.3410

. ltable tempo recidiva, survival by(grupo)

Beg. Std.Interval Total Deaths Lost Survival Erro r [95% Conf. Int.]

--------------------------------------------------- ----------------------------Controle

1 2 21 2 0 0.9048 0.0 641 0.6700 0.97532 3 19 2 0 0.8095 0.0 857 0.5689 0.92393 4 17 1 0 0.7619 0.0 929 0.5194 0.89334 5 16 2 0 0.6667 0.1 029 0.4254 0.82505 6 14 2 0 0.5714 0.1 080 0.3380 0.74928 9 12 4 0 0.3810 0.1 060 0.1831 0.5778

11 12 8 2 0 0.2857 0. 0986 0.1166 0.481812 13 6 2 0 0.1905 0. 0857 0.0595 0.377415 16 4 1 0 0.1429 0. 0764 0.0357 0.321217 18 3 1 0 0.0952 0. 0641 0.0163 0.261222 23 2 1 0 0.0476 0. 0465 0.0033 0.197023 24 1 1 0 0.0000 . . .

Tratamento6 7 21 3 1 0.8537 0.0 781 0.6119 0.95037 8 17 1 0 0.8034 0.0 882 0.5573 0.92139 10 16 0 1 0.8034 0.0 882 0.5573 0.9213

10 11 15 1 1 0.7480 0. 0980 0.4952 0.887011 12 13 0 1 0.7480 0. 0980 0.4952 0.887013 14 12 1 0 0.6857 0. 1078 0.4257 0.846416 17 11 1 0 0.6234 0. 1146 0.3631 0.802117 18 10 0 1 0.6234 0. 1146 0.3631 0.802119 20 9 0 1 0.6234 0. 1146 0.3631 0.802120 21 8 0 1 0.6234 0. 1146 0.3631 0.802122 23 7 1 0 0.5343 0. 1283 0.2651 0.743923 24 6 1 0 0.4453 0. 1343 0.1864 0.677325 26 5 0 1 0.4453 0. 1343 0.1864 0.677332 33 4 0 2 0.4453 0. 1343 0.1864 0.677334 35 2 0 1 0.4453 0. 1343 0.1864 0.677335 36 1 0 1 0.4453 0. 1343 0.1864 0.6773

--------------------------------------------------- ----------------------------

Page 10: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Teste Log Rank� Compara 2 ou mais curvas de sobrevida (H0 � as curvas são "as

mesmas")� Ordena os tempo de "falhas" dos indivíduos em 2 (ou mais)

grupos e atribui postos� O número esperado de falhas é calculado para cada intervalo para

cada grupo� Calcula um χ2 entre as falhas esperadas vs falhas observadas.� Assume intervalo de tempo pequeno (ex: 1 dia ou 1 "falha").

( ) χ 2

)1(22

2

~)(

22log−−

=−−

GEOEO

Varrankdoaestatístic

( ) ( )∑=

−=−k

jjj emEO

12222

Onde:

k = número de tempos de falha diferentesG = número de grupos diferente

G = 2 grupos

Teste Log Rank

Statistics ���� Survival analysis ���� Summary statistics, test, & tables ���� Test equality of survivor functions

Teste Log Rank

Exemplo (usando o Stata):. sts test grupo, logrank

failure _d: recidiva == 1analysis time _t: tempo

Log-rank test for equality of survivor functions

| Events Eventsgrupo | observed expected-----------+-------------------------Controle | 21 10.75Tratamento | 9 19.25-----------+-------------------------Total | 30 30.00

chi2(1) = 16.79Pr>chi2 = 0.0000

. sts test trtment, petofailure _d: relapse == 1

analysis time _t: weeks

Peto-Peto test for equality of survivor functions

| Events Events Sum oftrtment | observed expected ranks--------+--------------------------------------0:stand | 21 10.75 6.36220951:trt | 9 19.25 -6.3622095--------+--------------------------------------Total | 30 30.00 0

chi2(1) = 14.08Pr>chi2 = 0.0002

Teste Log Rank

Exemplo (usando o Stata):. sts test lgwbccat, logrank

failure _d: relapse == 1analysis time _t: weeks

Log-rank test for equality of survivor functions

| Events Eventslgwbccat | observed expected---------+-------------------------Low | 4 13.06Medium | 10 10.72:High | 16 6.21---------+-------------------------Total | 30 30.00

chi2(2) = 26.39Pr>chi2 = 0.0000

. sts test lgwbccat, peto

failure _d: relapse == 1analysis time _t: weeks

Peto-Peto test for equality of survivor functions

| Events Events Sum oflgwbccat | observed expected ranks---------+--------------------------------------Low | 4 13.06 -5.4643843Medium | 10 10.72 -1.2203977:High | 16 6.21 6.6847821---------+--------------------------------------Total | 30 30.00 0

chi2(2) = 21.37Pr>chi2 = 0.0000

0.00

0.25

0.50

0.75

1.00

0 10 20 30 40analysis time

lgwbccat = Low lgwbccat = Mediumlgwbccat = :High

Kaplan-Meier survival estimates, by lgwbccat

Page 11: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Exemplo:Sobrevida de mulheres com câncer cervical após a data do diagnóstico

Tabelas de vida

Função de Hazard(Método atuarial):

Estágio I:

nt = sob risco; mt = mortes ; qt = censuras

intervalo) no censuras de (No.21

tinstante no tessobreviven No.

intervalo no tempode unidadepor morrem que indivíduos de No.)(

−=th

Page 12: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Análise de sobrevida - Modelagem

� Como ajustar as curvas de sobrevida do grupo de tratados (expostos) para um ou mais fatores (confundidores)?

1 confundidor:

1. Categorizar e comparar as curvas de sobrevida.Exemplo: tratamento = 1 e idade > 55

tratamento = 1 e idade ≤ 55tratamento = 0 e idade > 55tratamento = 0 e idade ≤ 55

2. Categorizar e usar o teste log rank.3. Usar um modelo matemático (existem vários)

Mais de 1 confundidor:Modelagem matemática é a escolha mais razoável.

Regressão de Cox

Modela os dados usando o hazard ¨força de morbidade ou

mortalidade instantânea¨

Pressuposto:

•Para qualquer tempo t, o hazard entre aqueles expostos a certo

fator de risco [h1(t)] é múltiplo de algum hazard de referência

[h0(t)] (o hazard entre os não expostos)

h1(t) = h0(t) * B

h1(t) = h0(t) * e b ehh b

t

tHR ==

)(

)(

0

1 Log(HR) = b�

Modelo e Pressupostos

Modelo de Hazard Proporcional de Cox

Seja o conjunto de variáveis explanatórias: X = (X1, X2, ..., Xp)

h(t,X) = função de hazard para uma pessoa com um conjunto de X's

h0(t) = função de hazard base ou basal

h0(t) = não é conhecida no modelo de Cox

Observação:log odds basal não é conhecido na regressão logística para estudos caso controle).

∑= ii XethXth β)(),( 0

Informação geral:

� Modelo de Cox ou de Hazard proporcional é chamado de modelo não paramétrico (ou semi-paramétrico) porque as distribuições subjacentes não são conhecidas

� Alternativa de modelo paramétrico é correta, quando h0(t) é conhecida.

Ex: exponencial, Weibull, Gompertz, etc.

� Modelo paramétrico é preferível se o modelo correto a ser usado é conhecido

� Modelo de Cox dá aproximadamente a mesma resposta do modelo paramétrico (robusto).

� Modelo de Cox é o mais comumente utilizado

Page 13: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Variáveis no modelo de Cox:

� Variável dependente � tempo (até ocorrência do evento ou censura)� Variável evento � 1 = evento

0 = censura� X1, X2, ..., Xp

E's � exposição (ões)V's � confundidores potenciaisW's � modificadores de efeito potenciais

Exemplo:

Obs: Não há intercepto

)] x () x ()()(log)([

02121)(),( idadetrtwbctrtidadewbcctrtmentethXth δδγγβ ++++=

Vantagens do modelo de Cox:

� Útil para avaliar o efeito das variáveis explanatórias

� Variáveis explanatórias podem ser contínuas ou categóricas

� Pode incluir dados censurados

� Não é necessário conhecimento da distribuição da função de hazard subjacente (basal)

� sempre ≥ 0 (apropriado para uma taxa)

� Fornece mais informação do que o modelo logístico, particularmente para eventos não raros e/ou longos tempos de seguimento.

∑ ii Xe β

Razão de Hazard

Caso simples: 1 fator de risco

trtment: 1 = tratamento experimental0 = tratamento padrão

h(t,X) = h0(t)eβ(trtment)

trtment = 1: h(t,trtment) = h0(t)eβ(1)

trtment = 0: h(t,trtment) = h0(t)eβ(0)

βββ

β

eeeth

eth

th

thHRHazarddeRazão ==== − )01(

)0(

0

)1(

0

)()(

)0,()1,(

)(

Razão de Hazard

Caso simples: 1 covariável

age: X1 = 50X2 = 50

h(t,X) = h0(t)eβ(age)

age = 50: h(t,age) = h0(t)eβ(50)

age = 60: h(t,age) = h0(t)eβ(60)

10*)5060()50(

0

)60(0

)(

)(

)0,(

)1,()( ββ

β

βee

eth

eth

th

thHRHazarddeRazão ==== −

Page 14: Análise de Sobrevida - IESC/UFRJ · sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia.

Caso multivariado: (Varias variáveis independentes)

X* = conjunto de X's para uma pessoaX = conjunto de X's para outra pessoa

Observação:análoga à regressão logística, mas possui uma razão de densidade incidência instantânea em vez de log odds

∑ −== )(

0

0*

),(*),(

iii XXeXth

XthHR β

)](...)()([ *2

*221

*11 kkk XXXXXXeHR −++−+−= βββ

Variável Coeficiente b1 Hazard Ratio Sexo (masc=1, fem=0) 1.2669 3.55 Fumo (sim=1, não=0) 0.6803 1.97 Idade55 (idade≥55=1, Idade<55=0)

0.1391 1.15

Hipertensão (sim=1, não=0) 0.5030 1.65 Hipercolesterolemia (sim=1, não=0)

0.4552 1.58

Obesidade (sim=1, não=0) 0.1876 1.21

Resultado da Regressão de coxdos preditores da incidência de doença coronariana, 3597 indivíduos entre 45 e 65 anos, 1987 a 1994. Washington1

Semelhanças:� CHD é uma doença relativamente rara OR ≈ HR� As perdas de follow-up e a distribuição dos tempos até a

ocorrência do evento são provavelmente não diferenciais entre os grupos (os vieses tendem a cancelar)